Decifrando os papiros carbonizados pelo vulcão Vesúvio com inteligência artificial

Grupo brasileiro ajuda a recuperar textos de quase 2 mil anos dados como perdidos em biblioteca soterrada pelo Vesúvio; equipe é segundo lugar em desafio mundial

Imagem produzida durante o processo de recuperação de textos em papiros carbonizados pelo vulcão Vesúvio. Desde a descoberta, diversas máquinas e produtos químicos foram testados, o que destruiu parte do material. A técnica de desembrulhar virtualmente transforma a estrutura geométrica em imagens planas. O desafio era treinar uma inteligência artificial capaz de identificar as letras não visíveis a olho nu – Imagem: Reprodução/X/Nat Friedman

Um grupo de pesquisadores brasileiros, da USP e de outras universidades, conquistou o segundo lugar no Vesuvius Challenge, competição internacional para decifrar papiros carbonizados pela erupção do Vesúvio há quase 2 mil anos. Liderado por Odemir Martinez Bruno, Elian Rafael Dal Prá e Leonardo Scabini, do Grupo de Computação Científica do IFSC, o time empatou com outros dois projetos e recebeu US$ 50.000 dos patrocinadores.

Como os rolos petrificados não podem ser desenrolados sem serem destruídos, uma nova técnica de tomografias computadorizadas de alta resolução escaneou camada por camada. Mesmo assim, a olho nu não é possível reconhecer letras nas imagens das folhas queimadas há milhares de anos. O desafio consistia, então, em treinar uma inteligência artificial capaz de identificar pequenos padrões rachaduras que indicassem onde haveria tinta. O diferencial da equipe brasileira foi introduzir no programa uma equação usada na biologia para prever a evolução de uma epidemia, o que tornou o reconhecimento mais rápido.

O trio formado pelo estudante americano Luke Farritor, o suíço Julian Schilliger e o pesquisador alemão Youssef Nader ficou em primeiro lugar e recebeu US$ 700 mil. Todos os envolvidos colaboraram de diferentes formas para obter a transcrição final de um texto escrito pelo filósofo Filodemo, nascido no território da atual Jordânia em 110 a.C e que viveu na Roma Antiga.

Odemir Martinez Bruno – Foto: Lattes

Em conversa com o Jornal da USP, os pesquisadores confessaram que a premiação foi uma surpresa e que isso revela o potencial da ciência brasileira.

“Há 30 ou 40 anos atrás, esse era um material dado como perdido”, enfatiza Odemir Bruno, professor do Departamento de Física e Ciência dos Materiais no IFSC. Como foram carbonizados pelo calor da erupção, os rolos de papiro são extremamente frágeis. Desde a descoberta, há quase três séculos, diversas máquinas e produtos químicos foram testados para abrir fisicamente os rolos, o que destruiu parte do material. Mesmo assim, cerca de 800 papéis conhecidos estão preservados, aguardando o dia de serem desvendados.

Mais recentemente, métodos não invasivos, com raios-x, têm sido usados para obter imagens dos rolos de papiro. Infelizmente, as torções internas e a falta de contraste da tinta de composição a base de carvão dificultam o reconhecimento do que está escrito. Além de estarem queimados, as folhas podem estar petrificadas e, eventualmente, conter outros imprevistos como a umidade.

Elian Rafael Dal Prá – Foto: Arquivo pessoal

Para Leonardo Scabini, pesquisador do Instituto de Física de São Carlos (IFSC) da USP, o desafio extrapola a computação, já que tem potencial para revolucionar os estudos sobre história e literatura antigas. “Existem vários outros papiros. Isso pode mais do que dobrar o nosso corpus de conhecimento da literatura antiga”.

A preservação desse tipo de material, que se deteriora com a umidade, é algo extremamente raro. A ironia, segundo o professor, é que foi justamente a erupção que permitiu o acesso a esse acervo nos dias de hoje. “O fato de existir uma biblioteca inteiramente preservada como essa, o que é inédito, também se dá por ela ter sido soterrada pelas cinzas do vulcão, enquanto o material de outros sítios arqueológicos que não foram soterrados foi deteriorado ou saqueado”.

 

Rolo de papiro sendo digitalizado – Imagem: Vesuvius Challenge

O princípio básico do desembrulhamento virtual de pergaminhos – Vídeo: VisCente

 

Planta da Vila dos Papiros feita em 1908. O local ficou soterrado a 20 metros até descoberta no século 18 – Imagem: Charles Waldstei

A história perdida

No dia 24 de agosto 79 d.C, o Vulcão Vesúvio explodiu, destruindo as cidades romanas de Pompeia e Herculano. Essa última abrigava uma casa de campo com uma biblioteca repleta de manuscritos de filosofia, conhecida hoje como a Vila dos Papiros, por conta do material encontrado durante as escavações ainda no século 18.

A coleção provavelmente pertenceu a Lúcio Calpúrnio Pisão Cesonino, pai da terceira e última esposa do ditador romano Júlio César. O acervo encontrado possui centenas de rolos de papiro, de onde já foram revelados pequenos trechos de textos do materialista grego Epicuro e dos seguidores de sua tradição filosófica, os epicuristas.

Getty Villa, museu construído pelo magnata Jean Paul Getty Sr., cujo projeto pretendia ser uma réplica da Vila dos Papiros de Herculano – Foto: Bobak Ha’Eri/Wikimedia Commons/CC-By-SA-3.0

A coleção provavelmente pertenceu a Lúcio Calpúrnio Pisão Cesonino, pai da terceira e última esposa do ditador romano Júlio César. O acervo encontrado possui centenas de rolos de papiro, de onde já foram revelados pequenos trechos de textos do materialista grego Epicuro e dos seguidores de sua tradição filosófica, os epicuristas.

A biblioteca teria sido danificada em um terremoto no ano de 62 d.C. e pelas altas temperaturas da erupção 17 anos depois. A disposição do material encontrado indica que o vulcão explodiu antes do término das reformas do primeiro desastre. “Quando os exploradores encontraram a biblioteca, não sabiam que eram papiros, acharam que eram gravetos carbonizados”, conta Elian, cujos mestrado em física computacional no IFSC deve se concentrar no uso de inteligência artificial para leitura de material arqueológico.

“Como a lava e a carbonização fundiram os papiros, algumas partes ficam muito juntas e não é possível desenrolar as folhas do jeito certo, porque outra folha que está grudada atrás e outra na frente”, detalha o pesquisador.

Um dos rolos de papiro escaneados pela equipe do desafio aberto de programação – Foto: Vesuvius Challenge

 

Novos textos da Antiguidade

Até então, alguns poucos poemas de Filodemo eram conhecidos, mas nada se sabia de sua produção filosófica. Embora Epicuro seja amplamente mencionado por pensadores durante séculos, pouco material dessa corrente filosófica chegou aos dias de hoje. Fábio Paifer Cairolli, doutor em Letras Clássicas pela USP e professor da Universidade Federal do Paraná (UFPR), explica que o epicurismo era materialista, se opondo à existência de deuses, seres sobrenaturais e espaços alternativos metafísicos que interferissem no mundo. “Se nós morremos com a matéria física do nosso corpo, a prioridade do nosso lugar do mundo é completamente diferente”.

Fábio Paiger - Foto: Arquivo Pessoal

Fábio Paiger – Foto: Arquivo pessoal

A filosofia era uma atividade bastante difundida na vida da elite romana e ocupava grande parte das tarefas hoje atribuídas à ciência. “A filosofia antiga tentou explicar a realidade e, de alguma forma, tentou ajudar o indivíduo a entender como ele poderia ser feliz e como poderia se entender nesse espaço que é o mundo”.

Em contraste com outras vertentes da filosofia antiga, a alma não existia para o epicurismo. Isso pode explicar o sucesso dessa linha de pensamento na Antiguidade e porque ela foi esquecida nos séculos seguintes, com o crescimento do cristianismo. “Por ser algo que combate o pensamento religioso, em um sentido amplo, obviamente foi alvo de perseguição. Isso fez com que o material deixasse de ser copiado e de ser objeto de uma manutenção ao longo dos séculos”.

 

Tecnologia a serviço da filosofia

Pergaminho encontrado em sítio arqueológico israelense, cuja leitura em 2015 revelou parte do Levítico, terceiro livro da Bíblia Hebraica – Foto: Autoridade de Antiguidades de Israel/Wikimedia Commons/CC 3.0

A técnica de desembrulhar virtualmente textos antigos através de tomografia computadorizada foi desenvolvida pela primeira vez para recuperar um texto das ruínas de uma antiga sinagoga. Em 2015, o professor Brent Seales, da Universidade de Kentucky, recuperou o pergaminho que havia sido encontrado queimado e esmagado em 1970 no sítio arqueológico de Ein Gedi, em Israel. Após a leitura, descobriu-se que o rolo continha um texto da Bíblia Hebraica que compõe também o Antigo Testamento cristão.

A primeira etapa consiste em transformar a estrutura geométrica dos rolos em imagens de superfícies planas. A diferença é que, enquanto o livro hebraico era escrito em tinta metálica, o acervo de Herculano foi escrito com tinta a base de carbono, muito mais difícil de ser detectada. “Nós basicamente não conseguimos olhar e saber exatamente o que está acontecendo nessa tomografia”, relata Elian, responsável por recrutar a equipe brasileira para o Vesuvius Challenge.

O desafio, lançado em em 15 de março de 2023, era encontrar uma forma de reconhecer 5% do texto de ao menos uma das quatro tomografias computadorizadas de rolos de papiro obtidas pelo acelerador de partículas britânico Diamond Light Source. Para isso, o professor Seales se juntou aos investidores Nat Friedman e Daniel Gross que ofereceram os prêmios em dinheiro. Anteriormente, os financiadores ofereceram US$ 100 mil para uma competição semelhante com um fragmento de papiro bem menor e cujo texto já era conhecido.

Após meses observando as imagens dos papiros, o físico Casey Handmer conseguiu encontrar o primeiro sinal de tinta: um padrão de rachadura que formava letras. Posteriormente, esse indício foi usado por outros entusiastas, que ensinaram uma inteligência artificial a reconhecer esse padrão a fim de encontrar as primeiras palavras. No entanto, esses sinais de tinta são mais visíveis somente em um dos quatro rolos de papiro disponibilizados.

Além de usar essas descobertas para treinar um algoritmo capaz de desvendar o restante do texto, o time liderado pelos pesquisadores da USP contou com o olhar afiado dos colaboradores. “O aprendizado da rede neural era reforçado por tentativas humanas de tentar entender os padrões”, reforça o professor Odemir Bruno. Rede neural é o nome que se dá a um tipo de inteligência artificial inspirada na arquitetura do cérebro humano e usada para reconhecer padrões de maneira automática.

Enquanto os demais times usaram técnicas para fracionar as imagens em várias regiões durante todo o processo, o modelo brasileiro considerou apenas pequenos quadrados no centro das letras que certamente possuíam tinta, praticamente ignorando as bordas. Para isso, eles adaptaram um modelo matemático da epidemiologia conhecido como SIR. “A rede neural tentava predizer somente se aquele quadradinho teria tinta ou não. Isso dava um resultado bem grosseiro, mas era um resultado muito bom”. Após essa etapa, a imagem era enviada para um programa semelhante ao das outras equipes, de segmentação, porém já alcançando um resultado mais limpo.

Etapa 1

Imagem de um segmento obtido por tomografia computadorizada – Imagem: Vesuvius Challenge

Etapa 2

Detecção de tinta em fragmento destacado por feita Stephen Parsons, aluno de pós-graduação do professor Seales – Imagem: Vesuvius Challenge

Etapa 3

Padrão de rachadura encontrado por Casey Handmer. Na figura, possivelmente um η (eta) ou π (pi) - Imagem: Casey Handmer

Padrão de rachadura encontrado por Casey Handmer. Na figura, possivelmente um η (eta) ou π (pi) – Imagem: Casey Handmer

Etapa 4

Animação demonstrando o método desenvolvido pelos pesquisadores da USP para detectar onde havia vestígios de tinta – Imagem: Vesuvius Challenge

Como todos os competidores escolheram o mesmo rolo para trabalhar, apenas um pequeno trecho de um único rolo escaneado foi desvendado. Os primeiros colocados se destacaram por conseguir um resultado mais legível que os demais.

No entanto, as outras transcrições também contribuíram para consertar alguns equívocos obtidos pela que foi vencedora. A ideia central é que as estratégias sejam posteriormente combinadas para as próximas leituras.

“Ciência não é um esporte. Não estamos aqui numa olimpíada ou algo do tipo. A ciência é colaborativa”, comenta Odemir Bruno.

 

Passado promissor

Leonardo Scabini – Foto: Lattes

A meta para o próximo ano é tentar decifrar 90% dos quatro papiros e conseguir dinheiro para, em cinco anos, concluir a leitura dos 800 rolos já recuperados. Segundo o professor do IFSC, os avanços obtidos podem atrair mais investimentos e recursos para as pesquisas. “Esse processo de escanear os papiros, da forma como foi feito, é muito caro. Como foi oferecida uma esperança que de fato tenha um conteúdo que pode ser lido, talvez sejam criadas técnicas de tomografia mais arrojadas que revelem mais dados”.

O professor destaca que, embora a inteligência artificial às vezes seja apresentada como vilã, ela tem potencial para revolucionar várias áreas da ciência. “Ela é uma revolução científica e nós devemos, ao invés de temê-la, usá-la para finalidades que sejam benéficas para a humanidade.”

Uma grande parte da biblioteca ainda não foi escavada e a estimativa é que existam cerca de outros 2 mil rolos que podem ser encontrados no mesmo local. “Uma das expectativas com esse desafio é que as escavações sejam retomadas”, diz Leonardo. A próxima fase do concurso recebeu doações de empresários como Elon Musk, que somam hoje mais de US$ 3 milhões.

Além de Odemir Bruno, Elian e Leonardo, também compuseram a equipe premiada Raí Fernando Dal Prá, estudante de Ciências de Computação do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, João Vitor Brentigani Torezan, estudante de Física do IFSC, Daniel Baldin Franceschini, mestrando em Engenharia Química na Universidade Federal do Rio Grande do Sul (UFRGS), Bruno Pereira Kellm, estudante de Enfermagem da Universidade do Norte do Paraná (Unopar), Marcelo Soccol Gris e o americano Sean Johnson. O projeto está disponível na plataforma Git Hub.

Mais informações: e-mails elianrafaeldp@usp.br, com Elian Rafael Dal Prá; scabini@ifsc.usp.br, com Leonardo Scabini; e bruno@ifsc.usp.br, com Odemir Martinez Bruno

 

Texto: Ivan Conterno – Estagiário sob orientação de Fabiana Mariz e Luiza Caires
Arte: Carolina Borin – Estagiária sob supervisão de Moisés Dorado

Por Jornal da USP

VEJA TAMBÉM ...