IA genESOM gera dados sintéticos para reduzir testes em animais

Dra. Mariana Filipa Sequeira • May 21, 2026 03:43

Os estudos pré-clínicos de medicamentos colocam frequentemente os investigadores perante um exercício difícil de equilíbrio. Por motivos éticos, os cientistas procuram recorrer ao menor número possível de animais.

O problema é que, quando as experiências com ratos ficam demasiado pequenas, a estatística começa a deixar de ser fiável. Efeitos reais do tratamento acabam por se perder no meio do ruído.

Agora, uma equipa de investigadores na Alemanha afirma ter encontrado uma forma de contornar esse impasse. Desenvolveram um sistema de IA que cria dados sintéticos realistas, concebidos para ajudar a reduzir a experimentação animal.

O modelo foi pensado para recuperar sinais que se perdem em estudos subdimensionados, mantendo simultaneamente os falsos positivos sob controlo.

O dilema no laboratório

Por razões éticas, os testes pré-clínicos devem usar o menor número de animais possível, sem comprometer a fiabilidade dos resultados.

O entrave é que amostras pequenas, muitas vezes, não permitem obter uma conclusão utilizável - a variabilidade entre ratos mascara aquilo que o fármaco está, de facto, a fazer.

Foi a partir desta vertente matemática que Jörn Lötsch, cientista de dados e farmacologista clínico na Universidade Goethe de Frankfurt, se juntou a Alfred Ultsch, cientista de computação na Universidade Philipps de Marburgo.

Nenhum dos dois conduz experiências com animais. Ambos passaram anos a trabalhar no mesmo problema de base: extrair um sinal limpo de conjuntos de dados demasiado pequenos para suportarem conclusões sólidas.

Ensinar padrões de ratos à IA genESOM

A dupla criou o genESOM e treinou-o com dados reais de ratos fornecidos pelo Instituto Fraunhofer de Medicina Translacional e Farmacologia.

A ideia por trás do sistema é fácil de enunciar, mas muito mais difícil de executar.

Trata-se de uma IA generativa assente em milhares de neurónios artificiais, que se organizam para reproduzir a estrutura de um conjunto de dados - uma abordagem conhecida como mapa auto-organizável.

Depois de aprender essa estrutura, o sistema consegue gerar novos pontos de dados que se enquadram nela.

A maioria dos métodos generativos faz aprendizagem e geração numa única passagem. Lötsch e Ultsch optaram, de forma deliberada, por separar estes dois momentos - primeiro aprender e só depois sintetizar.

Manter os resultados fiáveis

Os métodos generativos trazem um risco bem identificado: tendem a amplificar o que observam. Um desvio aleatório pode regressar duplicado ou triplicado e tornar-se suficientemente forte para um teste estatístico o interpretar como um verdadeiro efeito do tratamento.

Esse fenómeno chama-se inflação do erro e conduz a falsos positivos indistinguíveis de resultados reais. O genESOM incorpora uma protecção interna contra esse problema.

Antes de criar novos pontos, a equipa introduz um sinal de erro artificial, intencional. À medida que se acumulam pontos adicionais, os investigadores monitorizam o crescimento desse sinal inserido.

Quando a inflação ultrapassa um limiar, o modelo pára. O ponto de paragem é determinado pelos próprios dados, e não por uma estimativa do investigador sobre quando deve terminar.

Menos animais, resultados iguais

A equipa avaliou o método num estudo pré-clínico sobre esclerose múltipla. No trabalho original, 26 ratos foram distribuídos por três grupos de tratamento para testar um fármaco experimental.

Para simular uma experiência menor, Lötsch e Ultsch reduziram o conjunto de dados para 18 animais, com seis ratos por grupo. Nesse conjunto reduzido, todos os efeitos de tratamento anteriormente detectados desapareceram.

Os testes estatísticos não encontraram qualquer resultado. Nem mesmo ferramentas de aprendizagem automática conseguiram distinguir entre os três grupos de tratamento. O sinal tinha sido engolido pelo ruído.

De seguida, os investigadores aplicaram o genESOM ao conjunto mais pequeno. Todos os efeitos observados na experiência original com 26 animais reapareceram com a mesma intensidade.

Não surgiram novos falsos positivos. O sinal manteve-se preservado.

A aprendizagem profunda ficou aquém

Outras abordagens de IA falharam na mesma prova. Redes complexas de aprendizagem profunda - do tipo que domina as manchetes sobre IA generativa - não conseguiram reproduzir, a partir do conjunto de dados reduzido, os efeitos de tratamento originais.

Esses modelos geraram pontos de dados com aspecto plausível. Contudo, as estruturas que produziram já não conseguiam transportar o sinal do tratamento através dos testes estatísticos.

Os mapas auto-organizáveis são anteriores às actuais redes de aprendizagem profunda. Projectam os dados numa grelha estruturada, preservando as relações entre os pontos de dados.

Em conjuntos pequenos e desorganizados, esta abordagem mais antiga tem sucesso onde métodos mais vistosos ficam pelo caminho.

A IA não resolve tudo

O método não consegue salvar uma experiência que já começou demasiado “magro”. Se um estudo arranca com três ratos por grupo, o genESOM não tem estrutura suficiente para aprender.

Se os números forem reduzidos em excesso, a amplificação tende a reforçar sobretudo variação aleatória - transformando uma experiência pequena e ruidosa numa experiência maior, mas igualmente ruidosa.

“Se forem incluídos poucos animais numa experiência e esse número for depois simplesmente complementado com IA generativa, a experiência pode rapidamente tornar-se cientificamente inútil devido à amplificação de resultados aleatórios”, disse Lötsch.

A solução é real, mas tem limites. Em vários conjuntos de dados que a equipa analisou, a redução consistente situa-se entre 30 e 50 por cento.

Essa redução de 30 a 50 por cento aplica-se a estudos exploratórios com animais - não a ensaios confirmatórios nem a investigação em humanos, onde vigem critérios diferentes sobre o que constitui dados adequados.

O método também foi validado apenas com um número limitado de conjuntos de dados animais, e ainda não se sabe com que consistência funcionará em diferentes áreas de investigação.

O futuro da experimentação animal

No desenvolvimento de medicamentos, entre um terço e metade dos ratos usados em estudos de fase inicial poderão, em teoria, ser substituídos por pontos de dados computados que se comportem como medições reais.

“Com o genESOM, podemos dar um contributo importante para reduzir o número de experiências com animais em grandes áreas da investigação pré-clínica”, disse Lötsch.

Até este estudo, ninguém tinha demonstrado que um modelo generativo pudesse compensar ratos em falta sem inflacionar falsos positivos. O sistema genESOM parece fazer precisamente isso - e, além disso, sabe quando deve parar.

O que muda é a matemática por trás das experiências exploratórias.

Os laboratórios poderão conseguir planear estudos iniciais mais pequenos, recuperar padrões relevantes a partir de dados limitados e diminuir o número de animais necessário para chegar a conclusões úteis.