Um modelo de IA pode prever as doenças que você terá em 20 anos.

No mundo da prevenção e da medicina personalizada, a capacidade de prever a possibilidade de uma doença se desenvolver com bastante antecedência, mesmo com décadas de antecedência, é fundamental, a fim de abordar os processos que a causariam muito antes que ela começasse a causar danos. Isso é o que parece ser possível graças à inteligência artificial, de acordo com um estudo publicado hoje na revista Nature .
Ao longo da vida, começamos a nos sentir bem com mais frequência, ocasionalmente adoecemos e, com o tempo, doenças crônicas começam a aparecer. Esses padrões afetam cada indivíduo de forma diferente, dependendo da hereditariedade, estilo de vida ou status socioeconômico . Para compreender completamente a saúde de uma pessoa e avaliar os riscos que a aguardam no futuro, não basta simplesmente considerar os diagnósticos isolados que ela recebeu ao longo da vida; é necessário entender a evolução de cada pessoa, entender as doenças que sofreu e entender como elas se influenciam mutuamente, tanto para promover mudanças específicas no estilo de vida quanto para recomendar exames diagnósticos que monitorem doenças específicas com maior probabilidade de aparecimento.
Hoje, um grupo de pesquisadores do Instituto Europeu de Bioinformática, do DKFZ (Centro Alemão de Pesquisa do Câncer) e de diversas instituições dinamarquesas propõe aplicar a mesma tecnologia que alimenta grandes modelos de linguagem — como o ChatGPT — para aprender e prever a história natural de mais de mil doenças simultaneamente. O modelo resultante, denominado Delphi-2M, é capaz de identificar padrões de doenças a partir de históricos médicos, fatores de estilo de vida e condições de saúde preexistentes.
“A descoberta mais inesperada foi que o modelo consegue prever mais de 1.000 doenças. Esperávamos que funcionasse para algumas, mas falhasse para muitas outras. Isso mostra o quão interconectadas muitas doenças estão e destaca a necessidade de investigar os mecanismos subjacentes que as conectam”, explica Moritz Gerstung , diretor da Divisão de Inteligência Artificial em Oncologia do DKFZ e coautor do estudo, sobre os resultados.
O algoritmo foi treinado com dados de 400.000 pessoas no Reino Unido e validado com registros de quase dois milhões de pacientes na Dinamarca, e é capaz de projetar trajetórias de saúde, tanto em nível populacional quanto individual, por até duas décadas.
Assim como as previsões meteorológicas, este modelo não oferece certezas, mas sim probabilidades. Em vez de prever exatamente o que acontecerá com uma pessoa específica em um determinado momento, ele calcula a probabilidade de ela sofrer de certas doenças ao longo de um período específico. Assim como no caso do clima, previsões de curto prazo são mais confiáveis do que aquelas que tentam prever um futuro mais distante. Ao calcular se alguém sofrerá um ataque cardíaco nos próximos 10 anos, o modelo acerta cerca de sete em cada dez. Quando o período de tempo é estendido para duas décadas, a taxa de precisão cai para 14%, ligeiramente superior aos 12% alcançados quando a idade e o sexo são conhecidos.
Continuando com o caso de ataques cardíacos, de acordo com o modelo, na coorte do Biobank do Reino Unido, homens entre 60 e 65 anos podem ter um risco anual de 4 em 10.000 a 1 em 100, dependendo de seu histórico médico e hábitos de vida. Nas mulheres, o risco médio é menor, mas a dispersão das probabilidades é semelhante. Mais importante ainda, ao comparar as previsões do modelo com dados reais do Biobank não utilizados no treinamento, constatou-se que os riscos calculados correspondiam à incidência observada de casos em diferentes faixas etárias e sexos. Isso demonstra que as estimativas refletem com precisão as tendências populacionais reais.
O Delphi-2M alcança precisão comparável aos melhores modelos específicos para doenças como demência ou infarto do miocárdio, e supera algoritmos de predição de mortalidade. Somente no caso do diabetes um marcador de exame de sangue (hemoglobina glicada HbA1c) permanece mais confiável. Além disso, o estudo identificou doenças que aumentam o risco de outras doenças, como transtornos mentais ou alguns tumores do sistema reprodutor feminino.
Em relação à possibilidade de que o conhecimento com tanta antecedência sobre doenças que são apenas uma possibilidade possa nos transformar em pacientes preventivos, Gerstung acredita que mais estudos são necessários para considerar como esse conhecimento pode beneficiar os pacientes. Isso exigiria que potenciais aplicações da IA como assistente médico "sejam testadas em ensaios clínicos randomizados, nos quais um grupo recebe consultas médicas com suporte de IA e outro grupo sem. Após um período de acompanhamento, será avaliado se o grupo assistido por IA obteve maiores benefícios em comparação com as consultas tradicionais", ressalta. "Isso também poderia incluir avaliações subjetivas do bem-estar das pessoas para avaliar os efeitos emocionais de saber ou não sobre seus riscos", conclui.
Sobre os potenciais riscos de uma ferramenta de previsão de saúde tão poderosa, como a discriminação por parte das seguradoras de pacientes com riscos que os tornam pouco interessantes como clientes, Guillermo Lazcoz, membro do Comitê de Ética em Pesquisa do Instituto de Saúde Carlos III, acredita que a aplicação da IA ao processamento de grandes bancos de dados de saúde adiciona “outra camada de risco àquelas que já conhecíamos ”, como esses dados acabarem nas mãos de um banco que os utiliza para determinar, antes de conceder um empréstimo, se o cliente tem probabilidade de contrair algum tipo de câncer ou ter um ataque cardíaco.
“A IA pode identificar uma pessoa a partir de dados que deveriam ser anônimos, o que exige novas medidas de proteção”, continua Lazcoz. Para implementar essas medidas, “na Europa, estão sendo desenvolvidos espaços seguros de processamento de dados, onde os dados não trafegam e o acesso a terceiros é limitado em tempo e finalidade”, explica. Por fim, ele alerta que falar de organizações como o UK Biobank, usado no estudo publicado hoje na Nature , que tem controles rígidos, não é o mesmo que falar de empresas como a 23andMe, onde é possível analisar o DNA de alguém para descobrir sua ancestralidade e que já esteve envolvida em escândalos por questões de proteção de dados.
Mikel Recuero, pesquisador da Universidade do País Basco (EHU) e advogado especializado em proteção de dados, concorda que, pelo menos em nível europeu, existem muitas camadas de controle que buscam impedir o uso indevido de dados biomédicos. "O acesso aos biobancos já implica um filtro ético inicial, pois os pesquisadores devem justificar a finalidade científica de sua solicitação e não podem usar amostras para fins espúrios", ressalta. "Além disso, existem controles de proteção de dados: se a informação for identificável, a regulamentação exige que seu uso seja restrito aos fins autorizados, evitando, por exemplo, aplicações em seguros ou bancos", acrescenta.
Nesse sentido, "a nova regulamentação do Espaço Europeu de Dados de Saúde reforça essa lógica ao proibir expressamente decisões comerciais — como a alteração de prêmios de seguro — com base em informações genéticas", afirma. "Embora os riscos nunca desapareçam completamente, existem mecanismos sucessivos (éticos, regulatórios, legais) que atuam preventivamente, limitando as possibilidades de discriminação e exigindo a comprovação de um benefício social para cada projeto que utilize esses dados", conclui.
Modelos como o GPT-4 e o Gemini aprendem a linguagem como uma sequência de palavras. Eles preveem a próxima palavra com base no contexto, e os pesquisadores encontraram uma analogia com a saúde. O histórico médico de uma pessoa também pode ser entendido como uma sequência de eventos — diagnósticos, fatores de risco, hábitos de vida — que seguem uma ordem temporal para fazer previsões.
Por enquanto, o modelo precisa ser aprimorado para ser útil no gerenciamento da saúde de pacientes reais, mas já é uma ferramenta útil para entender melhor como as doenças se desenvolvem e progridem, ou para avaliar os efeitos do estilo de vida ou de doenças passadas no risco de doenças futuras.
Um dos aspectos mais inovadores do trabalho é a capacidade do Delphi de gerar dados sintéticos de saúde. A partir de informações parciais, o modelo consegue imaginar trajetórias completas que mantêm as mesmas propriedades estatísticas dos dados reais, mas sem corresponder a nenhuma pessoa em particular. Isso protege a privacidade do paciente, já que os dados não podem ser vinculados a indivíduos reais, e permite que outros modelos de IA sejam treinados sem a necessidade de acesso a dados clínicos sensíveis. Isso poderia, por exemplo, calcular o que poderia acontecer com a saúde da população se a obesidade aumentasse em 5%.
Já existem algoritmos que preveem o risco de certas doenças, como doenças cardíacas ou câncer de mama, mas essa abordagem não aborda a verdadeira complexidade da saúde humana, onde múltiplas doenças frequentemente coexistem e se influenciam mutuamente. Em sociedades cada vez mais envelhecidas, a capacidade de prever a carga de muitas doenças e elaborar políticas e investimentos para preveni-las e nos preparar para elas será crucial.
EL PAÍS