Premiada como melhor trabalho acadêmico no Latin American Symposium on Digital Government, a pesquisa envolveu o treinamento de um Grande Modelo de Linguagem (LLM) para auxiliar na análise anonimizada de processos jurídicos, garantindo soberania digital.
Um artigo produzido por pesquisadores do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos, acaba de conquistar o prêmio de melhor trabalho apresentado durante o Latin American Symposium on Digital Government (LASDiGov), evento internacional da área de computação. O grupo de cientistas desenvolveu uma solução inovadora usando inteligência artificial (IA) para o setor público, capaz de preservar a privacidade de dados sensíveis presentes em processos jurídicos, por exemplo, e operar com eficiência mesmo em computadores comuns.
O trabalho premiado, intitulado LLM4Gov: A Privacy-Preserving Approach to Teacher-Student Fine-Tuning of Distilled LLMs for the Public Sector (ou, em tradução livre, LLM4Gov: Uma Abordagem de Preservação de Privacidade no Ajuste Fino de Grandes Modelos de Linguagem Destilados para o Setor Público no Contexto Professor-Aluno), apresenta o LLM4Gov, um grande modelo de língua (ou, com a sigla em inglês, LLM) treinado para garantir a segurança e anonimidade de dados confidenciais presentes em documentos judiciais, que dessa maneira, não precisam sair do ambiente controlado pelo próprio órgão público que os detém.
A solução utiliza uma técnica conhecida como teacher-student (professor-estudante). Nela, um modelo de linguagem maior e mais complexo, chamado de professor, treina um segundo modelo, o aluno, que por sua vez é menor, com menos parâmetros, porém mais eficiente e que necessita de menos recursos para funcionar. Combinado ao método de destilação, que possibilita remover informação menos relevante de um modelo para economizar recursos, o LLM aluno treinado reduz drasticamente seu tamanho e consumo de recursos computacionais. O resultado é um modelo de IA poderoso, porém compacto e de código aberto, que pode ser executado localmente em máquinas com capacidade limitada, eliminando a necessidade de enviar informações para servidores externos ou infraestruturas proprietárias, que podem ser custosas e, em sua maioria, localizadas no exterior, garantindo a seguridade e soberania dos dados brasileiros.
O desenvolvimento da ferramenta LLM4Gov se deu dentro de um projeto, financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), denominado Agents4Gov, cuja missão é desenvolver soluções de IA especificamente voltadas para órgãos públicos brasileiros e organizações que lidam com informações sensíveis. O foco principal é criar e adaptar modelos que possam ser executados localmente ou sob controle interno rigoroso, garantindo privacidade, segurança de dados e conformidade com legislações rigorosas como a Lei Geral de Proteção de Dados (LGPD) brasileira e o Regulamento Geral sobre a Proteção de Dados (GDPR) europeu.
O trabalho é assinado pelos pesquisadores Ricardo Marcacini, Jorge Carlos Valverde-Rebaza, Brucce Neves Santos e Solange Rezende, todos do ICMC, e por Marcelo A. S. Turine (Faculdade de Computação da Universidade Federal de Mato Grosso do Sul – UFMS) e Silvio Levcovitz (Procuradoria-Geral da Fazenda Nacional – PGFN).
O projeto Agents4Gov já estabeleceu parcerias importantes, trabalhando em soluções com a PGFN e a Secretaria da Fazenda do Estado do Rio Grande do Sul (SEFAZ-RS). Mais recentemente, iniciou um trabalho em conjunto com a Universidade Federal de Mato Grosso do Sul (UFMS) e a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), no âmbito do Observatório da Agenda Nacional de Formação de Pessoal de Nível Superior.
O prêmio conquistado consagra não apenas a excelência técnica do artigo apresentado, mas também a relevância prática do LLM4Gov. Ele representa um avanço significativo na busca por tecnologias de IA de alto desempenho que respeitem a soberania e a privacidade dos dados públicos, aumentando a agilidade de processos importantes para a população de maneira segura.
O artigo premiado pode ser acessado na plataforma SBC: https://sol.sbc.org.br/index.php/wcge/article/view/36338. A premiação ocorreu dia 24 de julho de 2025, na cidade de Maceió (AL).
Observação: este projeto faz parte de resultado de auxílio FAPESP, financiado pelo Programa de Pesquisa em Políticas Públicas (PPPP), processo número 23/10100-4.
Texto: Marcos Vinícius Ribeiro Ferreira, colaborador do projeto
Mais informações
Saiba mais sobre o projeto:
https://bv.fapesp.br/pt/auxilios/114631/desenvolvimento-de-grandes-modelos-de-lingua-para-aplicacoes-no-dominio-juridico/
Acesse o artigo premiado: https://sol.sbc.org.br/index.php/wcge/article/view/36338