Grupo brasileiro ajuda a recuperar textos de quase 2 mil anos dados como perdidos em biblioteca soterrada pelo Vesúvio; equipe é segundo lugar em desafio mundial
Imagem produzida durante o processo de recuperação de textos em papiros carbonizados pelo vulcão Vesúvio. Desde a descoberta, diversas máquinas e produtos químicos foram testados, o que destruiu parte do material. A técnica de desembrulhar virtualmente transforma a estrutura geométrica em imagens planas. O desafio era treinar uma inteligência artificial capaz de identificar as letras não visíveis a olho nu – Imagem: Reprodução/X/Nat Friedman
Mais recentemente, métodos não invasivos, com raios-x, têm sido usados para obter imagens dos rolos de papiro. Infelizmente, as torções internas e a falta de contraste da tinta de composição a base de carvão dificultam o reconhecimento do que está escrito. Além de estarem queimados, as folhas podem estar petrificadas e, eventualmente, conter outros imprevistos como a umidade.
Rolo de papiro sendo digitalizado – Imagem: Vesuvius Challenge
O princípio básico do desembrulhamento virtual de pergaminhos – Vídeo: VisCente
Planta da Vila dos Papiros feita em 1908. O local ficou soterrado a 20 metros até descoberta no século 18 – Imagem: Charles Waldstei
A coleção provavelmente pertenceu a Lúcio Calpúrnio Pisão Cesonino, pai da terceira e última esposa do ditador romano Júlio César. O acervo encontrado possui centenas de rolos de papiro, de onde já foram revelados pequenos trechos de textos do materialista grego Epicuro e dos seguidores de sua tradição filosófica, os epicuristas.
A biblioteca teria sido danificada em um terremoto no ano de 62 d.C. e pelas altas temperaturas da erupção 17 anos depois. A disposição do material encontrado indica que o vulcão explodiu antes do término das reformas do primeiro desastre. “Quando os exploradores encontraram a biblioteca, não sabiam que eram papiros, acharam que eram gravetos carbonizados”, conta Elian, cujos mestrado em física computacional no IFSC deve se concentrar no uso de inteligência artificial para leitura de material arqueológico.
“Como a lava e a carbonização fundiram os papiros, algumas partes ficam muito juntas e não é possível desenrolar as folhas do jeito certo, porque outra folha que está grudada atrás e outra na frente”, detalha o pesquisador.
Um dos rolos de papiro escaneados pela equipe do desafio aberto de programação – Foto: Vesuvius Challenge
Pergaminho encontrado em sítio arqueológico israelense, cuja leitura em 2015 revelou parte do Levítico, terceiro livro da Bíblia Hebraica – Foto: Autoridade de Antiguidades de Israel/Wikimedia Commons/CC 3.0
A técnica de desembrulhar virtualmente textos antigos através de tomografia computadorizada foi desenvolvida pela primeira vez para recuperar um texto das ruínas de uma antiga sinagoga. Em 2015, o professor Brent Seales, da Universidade de Kentucky, recuperou o pergaminho que havia sido encontrado queimado e esmagado em 1970 no sítio arqueológico de Ein Gedi, em Israel. Após a leitura, descobriu-se que o rolo continha um texto da Bíblia Hebraica que compõe também o Antigo Testamento cristão.
A primeira etapa consiste em transformar a estrutura geométrica dos rolos em imagens de superfícies planas. A diferença é que, enquanto o livro hebraico era escrito em tinta metálica, o acervo de Herculano foi escrito com tinta a base de carbono, muito mais difícil de ser detectada. “Nós basicamente não conseguimos olhar e saber exatamente o que está acontecendo nessa tomografia”, relata Elian, responsável por recrutar a equipe brasileira para o Vesuvius Challenge.
O desafio, lançado em em 15 de março de 2023, era encontrar uma forma de reconhecer 5% do texto de ao menos uma das quatro tomografias computadorizadas de rolos de papiro obtidas pelo acelerador de partículas britânico Diamond Light Source. Para isso, o professor Seales se juntou aos investidores Nat Friedman e Daniel Gross que ofereceram os prêmios em dinheiro. Anteriormente, os financiadores ofereceram US$ 100 mil para uma competição semelhante com um fragmento de papiro bem menor e cujo texto já era conhecido.
Após meses observando as imagens dos papiros, o físico Casey Handmer conseguiu encontrar o primeiro sinal de tinta: um padrão de rachadura que formava letras. Posteriormente, esse indício foi usado por outros entusiastas, que ensinaram uma inteligência artificial a reconhecer esse padrão a fim de encontrar as primeiras palavras. No entanto, esses sinais de tinta são mais visíveis somente em um dos quatro rolos de papiro disponibilizados.
Além de usar essas descobertas para treinar um algoritmo capaz de desvendar o restante do texto, o time liderado pelos pesquisadores da USP contou com o olhar afiado dos colaboradores. “O aprendizado da rede neural era reforçado por tentativas humanas de tentar entender os padrões”, reforça o professor Odemir Bruno. Rede neural é o nome que se dá a um tipo de inteligência artificial inspirada na arquitetura do cérebro humano e usada para reconhecer padrões de maneira automática.
Enquanto os demais times usaram técnicas para fracionar as imagens em várias regiões durante todo o processo, o modelo brasileiro considerou apenas pequenos quadrados no centro das letras que certamente possuíam tinta, praticamente ignorando as bordas. Para isso, eles adaptaram um modelo matemático da epidemiologia conhecido como SIR. “A rede neural tentava predizer somente se aquele quadradinho teria tinta ou não. Isso dava um resultado bem grosseiro, mas era um resultado muito bom”. Após essa etapa, a imagem era enviada para um programa semelhante ao das outras equipes, de segmentação, porém já alcançando um resultado mais limpo.
Etapa 1
Imagem de um segmento obtido por tomografia computadorizada – Imagem: Vesuvius Challenge
Etapa 2
Detecção de tinta em fragmento destacado por feita Stephen Parsons, aluno de pós-graduação do professor Seales – Imagem: Vesuvius Challenge
Etapa 3
Padrão de rachadura encontrado por Casey Handmer. Na figura, possivelmente um η (eta) ou π (pi) – Imagem: Casey Handmer
Etapa 4
Animação demonstrando o método desenvolvido pelos pesquisadores da USP para detectar onde havia vestígios de tinta – Imagem: Vesuvius Challenge
Como todos os competidores escolheram o mesmo rolo para trabalhar, apenas um pequeno trecho de um único rolo escaneado foi desvendado. Os primeiros colocados se destacaram por conseguir um resultado mais legível que os demais.
No entanto, as outras transcrições também contribuíram para consertar alguns equívocos obtidos pela que foi vencedora. A ideia central é que as estratégias sejam posteriormente combinadas para as próximas leituras.
“Ciência não é um esporte. Não estamos aqui numa olimpíada ou algo do tipo. A ciência é colaborativa”, comenta Odemir Bruno.
Uma grande parte da biblioteca ainda não foi escavada e a estimativa é que existam cerca de outros 2 mil rolos que podem ser encontrados no mesmo local. “Uma das expectativas com esse desafio é que as escavações sejam retomadas”, diz Leonardo. A próxima fase do concurso recebeu doações de empresários como Elon Musk, que somam hoje mais de US$ 3 milhões.
Além de Odemir Bruno, Elian e Leonardo, também compuseram a equipe premiada Raí Fernando Dal Prá, estudante de Ciências de Computação do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, João Vitor Brentigani Torezan, estudante de Física do IFSC, Daniel Baldin Franceschini, mestrando em Engenharia Química na Universidade Federal do Rio Grande do Sul (UFRGS), Bruno Pereira Kellm, estudante de Enfermagem da Universidade do Norte do Paraná (Unopar), Marcelo Soccol Gris e o americano Sean Johnson. O projeto está disponível na plataforma Git Hub.
Mais informações: e-mails elianrafaeldp@usp.br, com Elian Rafael Dal Prá; scabini@ifsc.usp.br, com Leonardo Scabini; e bruno@ifsc.usp.br, com Odemir Martinez Bruno
Texto: Ivan Conterno – Estagiário sob orientação de Fabiana Mariz e Luiza Caires
Arte: Carolina Borin – Estagiária sob supervisão de Moisés Dorado
Por Jornal da USP