Enxergar nitidamente o que está acontecendo no interior dos seres vivos e identificar as principais substâncias relacionadas aos processos biológicos pode significar um importante passo rumo ao tratamento de diversas doenças que desafiam os cientistas, tal como o câncer
O doutorando Henry está desde março no Canadá, participando de um programa de intercâmbio
na Faculdade de Ciências de Computação da Universidade de Dalhousie, na cidade de Halifax
na Faculdade de Ciências de Computação da Universidade de Dalhousie, na cidade de Halifax
Ao mesmo tempo em que surge uma nova era de exploração espacial, este início do século XXI é marcado também pelo nascimento de uma nova era de investigação do interior do corpo humano. Nesse caso, em vez da ciência remeter nosso olhar para além do planeta, a ideia é lançá-lo para dentro de nós e enxergar de perto genes, proteínas e as inúmeras relações estabelecidas entre as moléculas que nos habitam.
Esse é um dos objetivos dos cientistas que atuam no campo da biologia molecular. Para eles, cada ser vivo é como um gigantesco quebra-cabeça, com inúmeras moléculas se encaixando para construir a vida. Nos últimos anos, diversos estudos estão sendo realizados para rastrear uma ampla gama de interações físicas, genéticas e químicas, o que trouxe novas perspectivas para os biólogos, ávidos por encontrar pistas sobre o papel de genes e proteínas e por entender como são os processos que acontecem no interior dos seres vivos. Essas pistas podem facilitar o encontro de potenciais alvos para, por exemplo, o desenvolvimento de novos tratamentos terapêuticos.
O problema é que visualizar parcial ou totalmente o emaranhado de peças desse quebra-cabeça é cada vez mais desafiador. A cada novo estudo os biólogos encontram mais e mais pistas e, conforme os métodos científicos e os equipamentos evoluem, vão sendo gerados milhares de dados. É aí que a computação entra em cena para exercer um papel fundamental: contribuir para a separação, a análise e a visualização adequada desses dados. “Há uma carência de ferramentas computacionais para a biologia”, esclarece a professora Rosane Minghim, do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos.
Uma das ferramentas desenvolvidas sob supervisão da professora em parceria com mais quatro pesquisadores brasileiros está sendo empregada por diversos biólogos mundo afora. Participaram do desenvolvimento da solução os pesquisadores Henry Heberle, doutorando no ICMC; Guilherme Telles, professor do Instituto de Computação da UNICAMP; Gabriela Meirelles, do Laboratório Nacional de Biociências; e Felipe da Silva, da Embrapa Informática Agropecuária (Campinas).
O grupo foi responsável por criar o InteractiVenn, uma ferramenta gratuita e aberta, disponível na web, destinada a facilitar a visualização de conjuntos, com design visual e funcionalidades projetados para se adequar às atividades que os biólogos realizam. Por meio do InteractiVenn, um biólogo consegue enxergar com facilidade as relações estabelecidas entre conjuntos de genes, moléculas, proteínas, o que contribui para identificar similaridades e diferenças dentro do corpo humano.
De onde vem – Se você cursou o ensino médio, deve se lembrar de um método de organização de conjuntos ensinado nas aulas de matemática para agrupar elementos de vários conjuntos dentro de figuras geométricas: o diagrama de Venn. Nesse diagrama, note que as relações de união e de intersecção entre os conjuntos ficam evidentes (veja a imagem 1).
Quando há apenas três conjuntos, é fácil visualizar as relações entre eles por meio do diagrama de Venn
Imagine a confusão que surge quando você precisa comparar conjuntos e realizar operações de união entre eles usando o diagrama de Venn. Por exemplo: para comparar três conjuntos (A, B, C), temos um diagrama com três círculos. Você identifica uma forte ligação entre A e B e quer comparar a união desses dois conjuntos (A e B) contra C. É necessário, então, criar um novo diagrama, formado por dois círculos. Provavelmente, esse novo desenho do diagrama faria você se esquecer da configuração inicial dos conjuntos. Pense, agora, em como o diagrama se torna complexo à medida em que o número de conjuntos aumenta, principalmente quando levamos em consideração as possíveis combinações desses múltiplos conjuntos.
Foi a partir da constatação dessa dificuldade que nasceu a ideia do InteractiVenn, uma ferramenta flexível que se baseia no diagrama de Venn, possibilitando a qualquer pesquisador visualizar, de maneira fácil e clara, até seis conjuntos simultaneamente, executando operações de união entre eles, e mantendo o formato geométrico do diagrama mesmo depois de realizarmos as intersecções (veja imagem 2).
Não é por acaso que, de acordo com a plataforma Web of Science, o artigo sobre o InteractiVenn (InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams), publicado em 2015 na revista BMC Bioinformatics, contabiliza mais de 90 citações, ocupando posição de destaque em âmbito internacional, desde meados de 2017, entre os trabalhos mais citados no campo das ciências de computação.
Nas imagens geradas por meio do InteractiVenn, é fácil visualizar os seis conjuntos genômicos da banana.
No nível 0 (imagem F), vê-se apenas a união de todos os conjuntos.
À medida que a ferramenta apresenta a delimitação de cada conjunto, é possível enxergar também as interseções entre eles. O esquema apresentado em “A” corresponde a uma árvore (filogenética) que guia o processo de união entre os conjuntos.
As subfiguras seguintes correspondem aos níveis dessa árvore.
No nível 0 (imagem F), vê-se apenas a união de todos os conjuntos.
À medida que a ferramenta apresenta a delimitação de cada conjunto, é possível enxergar também as interseções entre eles. O esquema apresentado em “A” corresponde a uma árvore (filogenética) que guia o processo de união entre os conjuntos.
As subfiguras seguintes correspondem aos níveis dessa árvore.
Ver para conhecer – O doutorando Henry Heberle conta que, inicialmente, foi difícil entender porque uma ferramenta como o InteractiVenn poderia ser tão importante para os biólogos: “Para quem trabalha na área de computação, um diagrama de Venn é um conceito muito básico. Mas à medida que fui interagindo com os biólogos, percebi o quanto eles necessitavam visualizar mais facilmente as interações entre conjuntos e o quanto um projeto com essa finalidade era importante”.
Estabelecer esse encontro científico entre a biologia e a computação não costuma ser sempre uma tarefa fácil. As expectativas dos pesquisadores dos dois campos do conhecimento precisam estar alinhadas. Se a ferramenta de que os biólogos precisam não demandar nenhum desafio científico ou tecnológico, a parceria não será produtiva para os cientistas da computação. Por outro lado, os cientistas da computação devem construir ferramentas acessíveis aos biólogos. Henry não teve dificuldade em construir as pontes entre esses dois lados. Quando ingressou no curso de Ciências de Computação no ICMC, onde também fez mestrado, ele já adorava biologia, pensava até em cursar biotecnologia. “O Henry conseguiu enxergar como o biólogo queria ver os dados na tela do computador”, revela a professora Rosane.
Segundo ela, essa habilidade para compreender a demanda do outro campo do conhecimento é um diferencial importante para quem atua na computação. O interessante é que, depois de trabalhar no projeto do InteractiVenn, Henry passou a gostar ainda mais de biologia e prosseguiu na construção de mais uma ferramenta de visualização para facilitar a vida dos biólogos. Foi assim que nasceu o CellNetVis, desenvolvido juntamente com a professora Rosane, Guilherme Telles, Gabriela Meirelles e Marcelo Carazzolle, do Instituto de Biologia da UNICAMP.
No caso do CellNetVis, o objetivo é propiciar aos biólogos visualizar a interação das moléculas no interior das células. É como se o pesquisador estivesse, agora, munido de uma poderosa máquina fotográfica computacional, mas que – diferentemente dos microscópios – não demanda a utilização de uma lente para captação da imagem. No CellNetVis, basta o pesquisador inserir os dados coletadas durante sua pesquisa. Por exemplo, o biólogo que está estudando as proteínas presentes nas células em certo estágio de desenvolvimento de um tipo de câncer insere esses dados na ferramenta e, automaticamente, eles são compilados pelo computador e apresentados por meio de uma imagem.
Cada ponto da imagem corresponde a uma proteína e as retas que as conectam representam as relações que as proteínas estabelecem entre si. “As proteínas têm interações: uma ativa a outra, uma se junta a outra para formar um complexo, uma transforma um pigmento verde em amarelo, outra transforma amarelo em vermelho”, explica Henry. Para simplificar, ele cita como exemplo os pimentões, que podem ser verdes, amarelos e vermelhos. “Há diversos tipos de interações entre as proteínas, formando vias metabólicas, formando o sistema biomolecular. Essas interações também podem representar uma informação mais genérica. Por exemplo, se duas proteínas participam de um mesmo processo biológico, elas poderiam ser conectadas numa estrutura de rede. Por conta disso, os diversos tipos de interações podem formar diferentes tipos de redes”, completa o pesquisador.
Dessa forma, nas imagens produzidas por meio do CellNetVis, os biólogos conseguem enxergar um mapa mostrando a atuação das proteínas. Tal como os antigos navegantes que, em suas incursões pelo mar desconhecido, eram guiados pelo posicionamento das estrelas no céu, os biólogos são, agora, guiados pelas imagens que surgem no computador. Esses mapas dão indícios sobre os caminhos que devem ser percorridos ao longo da jornada de pesquisa. Mais um exemplo: se as proteínas presentes em uma célula cancerígena se concentram no núcleo, é provável que estejam relacionadas a processos de replicação celular, já que isso costuma acontecer no núcleo. Por outro lado, se as proteínas aparecem predominantemente na membrana celular, é possível que tenham papel relevante no transporte de moléculas ou no estabelecimento de relações entre o meio extracelular e o meio intracelular. Uma das vantagens do CellNetVis é exatamente propiciar que o biólogo visualize e explore, de maneira flexível, as relações entre a localização celular e as funções das proteínas. Por meio de filtros e interações com o gráfico, o usuário consegue obter diversas configurações para uma mesma rede.
“Uma visualização adequada dos dados é crucial para a compreensão dessas redes, uma vez que as vias estão relacionadas a funções que ocorrem em regiões específicas da célula”, conta Guilherme. “O avanço da ciência biológica caminha nessa direção: tentar explicar, com mais precisão, porque os processos ocorrem de determinada forma. Se você souber por que eles acontecem e como, conseguirá interferir, quer seja para inibi-los, para acelerá-los ou, ainda, para introduzir novos processos”, adiciona o professor da Unicamp.
O trabalho apresentando a ferramenta CellNetVis (CellNetVis: a web tool for visualization of biological networks using force-directed layout constrained by cellular componentes) foi premiado como melhor artigo no simpósio BioVis, que aconteceu durante o maior evento de biologia computacional do mundo, a Conferência Internacional da Sociedade de Biologia Computacional, realizada em Praga, na República Tcheca, no ano passado.
A imagem do CellNetVis mostra a célula e os locais em que as proteínas estão presentes:
os pontos representam as proteínas e as linhas mostram as relações estabelecidas entre elas
os pontos representam as proteínas e as linhas mostram as relações estabelecidas entre elas
Ver para confirmar – Outro papel fundamental da visualização computacional é propiciar a confirmação das hipóteses levantadas pelos pesquisadores durante suas investigações. Guilherme explica que os métodos utilizados para a identificação das proteínas que atuam nos processos biológicos resultam atualmente em listas com milhares de proteínas. Nesse sentido, um dos desafios é reduzir esse conjunto a fim de viabilizar a realização de futuros experimentos apenas com aquelas que têm maior potencial de serem as protagonistas dos processos. Diversas técnicas são empregadas para encontrar quais proteínas são protagonistas, mas é difícil discernir a confiabilidade dos resultados. Assim, usar o computador para visualizar a rede das relações entre as proteínas pode ajudar os pesquisadores a confirmarem se as técnicas foram apropriadas.
Guilherme, Henry, Rosane e mais 19 pesquisadores são autores de outro artigo (Integrative analysis to select cancer candidate biomarkers to targeted validation) apresentando os resultados de uma pesquisa que analisou três métodos para selecionar proteínas. Nesse caso, o objetivo era construir um ranking de proteínas, identificando quais teriam maior probabilidade de exercer papel relevante nos processos que ocorrem nas células cancerígenas (carcinoma e melanoma). A visualização da rede de interações das proteínas contribuiu para os pesquisadores confirmarem os processos e interações envolvidas entre as proteínas identificadas por meio do ranking.
Mas por que encontrar essa lista de proteínas é tão importante para a busca de tratamentos mais eficazes contra o câncer? Ora, as proteínas funcionam tal como outros biomarcadores amplamente conhecidos: por exemplo, a temperatura do corpo é um biomarcador da febre; já os índices de colesterol indicam maior ou menor risco para ocorrência de doenças do coração. Da mesma forma, a presença e/ou a ausência de certas proteínas nas células pode ser um indicativo relevante para a ocorrência de câncer.
É por isso que a visualização computacional tem potencial para ser uma forte aliada na luta contra as doenças: suas ferramentas têm o poder de transformar o modo como os pesquisadores enxergam seus dados e conduzem seus experimentos. “A visualização ajuda a confirmar o esperado e a descobrir o inesperado”, conclui a professora Rosane.
Texto: Denise Casatti – Assessoria de Comunicação ICMC/USP
Mais informações
Site da ferramenta InteractiVenn: http://www.interactivenn.net/
Site da ferramenta CellNetVis: http://bioinfo03.ibi.unicamp.br/lnbio/IIS2/cellnetvis/
Links para os artigos citados na reportagem
1. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams:
2. CellNetVis: a web tool for visualization of biological networks using force-directed layout constrained by cellular componentes:
3. Integrative analysis to select cancer candidate biomarkers to targeted validation:
Contato com a imprensa
Assessoria de Comunicação do ICMC: (16) 3373.9666
E-mail: comunica@icmc.usp.br