Meteorologia

  • 17 NOVEMBRO 2024
Tempo
--º
MIN --º MÁX --º

Edição

Algoritmos falham ao tentar prever trajetória de vida de indivíduos

Os resultados do trabalho de Salganik e seus colegas, publicados na revista científica PNAS, vêm da análise de uma pesquisa de longo prazo sobre o desenvolvimento infantil em famílias americanas de baixa renda

Algoritmos falham ao tentar prever trajetória de vida de indivíduos
Notícias ao Minuto Brasil

05:11 - 28/09/20 por Folhapress

Tech CIÊNCIA-PESQUISA

SÃO PAULO, SP (FOLHAPRESS) - Algoritmos de computador ditam cada vez mais as recomendações de filmes, séries e livros que as pessoas recebem na internet, mas ainda estão muito distantes da capacidade de predizer a trajetória de vida de indivíduos, mesmo quando abastecidos com grande quantidade de dados. No maior estudo já feito sobre o tema, modelos de inteligência artificial foram só um pouco melhores do que uma simples média ao tentar "prever o futuro".

"É possível que, com mais dados ou tipos diferentes de dados, as previsões poderiam ser mais precisas. Mas acho que ninguém sabe se isso é verdade neste momento", diz o coordenador do estudo, Matthew Salganik, do Departamento de Sociologia da Universidade de Princeton (EUA).

"Meu palpite é que, quando se tenta fazer predições de longo prazo sobre situações importantes da vida, sempre haverá alguns limites para a previsibilidade."

Os resultados do trabalho de Salganik e seus colegas, publicados na revista científica PNAS, vêm da análise de uma pesquisa de longo prazo sobre o desenvolvimento infantil em famílias americanas de baixa renda. Esse levantamento acompanhou 4.242 famílias que tiveram filhos por volta do ano 2000, recolhendo informações sobre essas crianças e seu entorno em seis momentos, que vão do nascimento aos 15 anos de idade.

Para cada uma dessas famílias, entrevistas feitas com mães, pais, professores e a própria criança permitiram que se formasse um banco de dados com mais de 12 mil variáveis. A proposta do grupo de Salganik era tentar usar essa massa de informações para prever o que aconteceria com as crianças conforme elas passassem dos nove para os 15 anos de idade (a última fase da pesquisa).

Com esse objetivo, o pesquisador reuniu 160 equipes diferentes de especialistas, que podiam usar diferentes metodologias de inteligência artificial para "prever o futuro". A ideia era avaliar o potencial do chamado aprendizado de máquina, no qual, em vez de testar ideias sobre como um fenômeno acontece, o programa de computador simplesmente recebe o máximo possível de informações disponíveis sobre aquele fenômeno e tenta encontrar, nessa massa de dados, os padrões que explicam seu funcionamento.

Por exemplo, o criador do algoritmo pode rotular uma grande quantidade de textos como sendo escritos em português e espanhol e determinar que o computador identifique padrões que separem os textos escritos numa língua dos escritos em outra. Com base nisso, o algoritmo "treinado" poderia determinar em que língua foi escrito um novo texto que ele receber.

Os diferentes modelos de aprendizado de máquina tinham que tentar "adivinhar" o que aconteceria com um pequeno conjunto de variáveis, no qual estavam incluídos coisas como a média de notas de cada criança na escola, a situação profissional de seus pais ou cuidadores e a queda ou aumento da renda em cada família.

Para atingir esse objetivo, os sistemas receberam mais uma colher de chá: foram "treinados" com metade da amostra de famílias. Ou seja, no começo do estudo, eles já "sabiam" como 50% das crianças estudadas tinha se saído dos nove aos 15 anos. O desafio era usar essas informações, bem como o resto dos dados, para prever como as demais crianças evoluiriam, em nível individual.

Não deu muito certo. Numa escala usada pelos pesquisadores, que vai de 0 (previsões que equivalem à média dos dados usados para "treinar" o sistema) e 1 (previsões totalmente precisas), os algoritmos com maior sucesso tiraram "notas" entre 0,2 e 0,05. Foi um resultado apenas ligeiramente melhor que o obtido por um modelo matemático simples, feito "no braço" e usando apenas quatro variáveis, entre as mais de 12 mil disponíveis na pesquisa original.

"Ainda bem que não deu certo", brinca Fernando Osório, professor do ICMC-USP (Instituto de Ciências Matemáticas e de Computação da USP) e pesquisador da área de inteligência artificial. "A gente vê algoritmos fazendo coisas muito legais, diagnosticando câncer ou Covid-19 dando um show no ser humano, e esquece que são coisas muito pontuais. Talvez máquinas conseguissem fazer previsões a curto e médio prazo em sistemas dinâmicos, porém estáveis. Mas, quando estamos falando de seis anos da vida de uma pessoa, temos sistemas muito instáveis e sujeitos a muitas variáveis externas e eventos imprevistos."

É possível comparar a natureza desse tipo de trajetória individual com a previsão do tempo, por exemplo. Ambas as coisas têm em comum a dificuldade de chegar a determinada "granularidade" dos dados, diz ele. "Ou seja, você consegue dizer 'amanhã vai chover em São Carlos', mas aí a chuva cai num bairro e não cai no outro. Imagine como é prever não só o bairro, mas a casa exata onde a chuva vai cair", compara.

Para o pesquisador, é preciso levar em conta ainda as implicações sociais de tentar alcançar esse nível de determinismo em análises do desenvolvimento humano.

"É algo que deveria fazer com que os responsáveis por políticas públicas pensem com cuidado sobre o uso de previsões, mesmo as baseadas em muitos dado e aprendizado de máquina complicado, para tomar decisões que envolvam pessoas", diz Salganik. "Além disso, como cientistas, um de nossos objetivos pode ser a compreensão das fontes dessa complexidade."

Campo obrigatório