O Último Exame da Humanidade: inteligência artificial posta à prova

  • Diogo Caetano
  • 21 Outubro 2025

Como deverá posicionar-se a sociedade perante um futuro em que a IA ultrapassa já a maioria dos indivíduos em tarefas complexas?

Nos últimos meses, o debate sobre o impacto da inteligência artificial (IA) intensificou-se em Portugal, refletindo uma preocupação crescente em torno das transformações profundas que estas tecnologias estão a provocar no trabalho, na educação e na produção de conhecimento.

Esta discussão decorre num contexto marcado por iniciativas internacionais que procuram avaliar de forma sistemática o desempenho da IA em domínios tradicionalmente reservados a especialistas humanos.

Um dos exemplos mais relevantes é o projeto Humanity’s Last Exam, desenvolvido pelo Center for AI Safety, uma organização norte-americana dedicada à avaliação independente do progresso da IA.

O objetivo foi testar até que ponto modelos generalistas conseguem superar humanos em áreas técnicas e científicas. Para tal, foi lançado um apelo global à comunidade científica e técnica, convidando especialistas de múltiplas áreas a submeter perguntas complexas representativas do seu trabalho, posteriormente respondidas por grupos humanos e por modelos de última geração, incluindo GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, O1-preview e O1-mini.

A iniciativa surgiu da constatação de que muitos conjuntos de dados utilizados para avaliar modelos de linguagem deixaram de constituir um desafio real, uma vez que sistemas recentes ultrapassam já os 90% de sucesso em testes anteriormente exigentes.

Para criar uma nova métrica de dificuldade, foi lançado um desafio aberto à comunidade científica e técnica internacional, ao qual responderam mais de mil especialistas de todo o mundo. A partir deste esforço coletivo, foram selecionadas 2.500 perguntas originais, abrangendo dezenas de áreas do conhecimento, todas elas revistas de forma rigorosa para assegurar precisão, clareza e impossibilidade de resolução por simples pesquisa.

Exigiam conhecimentos ao nível de mestrado, doutoramento ou superior — um patamar que menos de 1% da população mundial atinge. No momento da publicação, o desempenho máximo obtido por qualquer modelo rondava os 20% de acerto. Cerca de seis meses depois, novos sistemas como Grok-4 e GPT-5 atingiram aproximadamente 25%, demonstrando que este exame funciona como uma régua sensível de progresso, capaz de captar avanços graduais mas consistentes.

Investigadores do INESC-MN estiveram entre os participantes, contribuindo com perguntas nas áreas da eletrónica, física e fotónica. No total, sete perguntas submetidas por esta equipa foram aceites, por terem conseguido ultrapassar a filtragem inicial feita pelos cinco modelos de referência.

Esta taxa de aceitação ilustra bem o grau de dificuldade envolvido: perguntas concebidas para exigir raciocínio especializado foram, em muitos casos, respondidas corretamente pelos modelos, revelando a sua maturidade técnica e a rapidez da sua evolução. A formulação de questões verdadeiramente desafiantes mostrou exigir níveis elevados de criatividade e rigor, comparáveis ao trabalho desenvolvido em contextos académicos avançados.

Esta realidade levanta uma questão central: como deverá posicionar-se a sociedade perante um futuro em que a IA ultrapassa já a maioria dos indivíduos em tarefas complexas? Vários especialistas defendem que o valor humano residirá cada vez mais na compreensão profunda dos fundamentos científicos, na capacidade de articulação interdisciplinar e na supervisão responsável de sistemas tecnológicos avançados.

Para estudantes e jovens profissionais, isto poderá significar a necessidade de investir mais em competências de integração, visão sistémica e pensamento crítico, do que no domínio isolado de tarefas técnicas que poderão ser rapidamente automatizadas.

A forma como se distribuem os investimentos em formação e qualificação será determinante. Se a IA já supera a maioria dos humanos na execução de tarefas técnicas e especializadas, o valor acrescentado passará para competências que permitam estruturar problemas, integrar áreas de conhecimento e supervisionar sistemas complexos. Isto implica reforçar a formação em fundamentos científicos e matemáticos, pensamento crítico, modelação de sistemas e competências de interface entre tecnologia e sociedade — áreas menos suscetíveis de rápida automatização.

Para empresas e governos, isto traduz-se numa mudança de foco: menos ênfase na transmissão de competências técnicas que podem ser replicadas por modelos e mais na criação de perfis capazes de liderar, integrar e contextualizar tecnologias avançadas.

Esta evolução poderá também alterar de forma significativa a dinâmica do empreendedorismo tecnológico. À medida que os modelos de IA assumem tarefas especializadas de elevado nível, torna-se mais fácil lançar projetos complexos sem que as equipas fundadoras dominem profundamente todos os domínios científicos ou de engenharia envolvidos.

Isto poderá reduzir barreiras à entrada e permitir o aparecimento de novas empresas tecnológicas com equipas mais pequenas e ágeis, focadas na integração, conceção de produtos e estratégia, em vez de dependerem de largas equipas multidisciplinares desde o início.

O Humanity’s Last Exam evidencia, assim, que entrámos numa nova fase de relação entre humanos e máquinas. A inteligência artificial promete ampliar a criatividade, acelerar descobertas e contribuir para enfrentar desafios globais. Porém, levanta igualmente riscos, ao deslocar funções humanas centrais e criar novas formas de dependência tecnológica.

Para países como Portugal, este cenário representa simultaneamente um desafio e uma oportunidade. A rapidez da transformação tecnológica exige que universidades, empresas e decisores políticos repensem prioridades de formação e investimento, de forma a posicionar talento e inovação num contexto global em rápida mutação. O futuro dependerá menos da capacidade isolada das máquinas e mais da forma como a sociedade escolher integrar este poder nos seus sistemas económicos, científicos e sociais.

  • Diogo Caetano
  • Investigador no INESC-MN

Assine o ECO Premium

No momento em que a informação é mais importante do que nunca, apoie o jornalismo independente e rigoroso.

De que forma? Assine o ECO Premium e tenha acesso a notícias exclusivas, à opinião que conta, às reportagens e especiais que mostram o outro lado da história.

Esta assinatura é uma forma de apoiar o ECO e os seus jornalistas. A nossa contrapartida é o jornalismo independente, rigoroso e credível.

Comentários ({{ total }})

O Último Exame da Humanidade: inteligência artificial posta à prova

Respostas a {{ screenParentAuthor }} ({{ totalReplies }})

{{ noCommentsLabel }}

Ainda ninguém comentou este artigo.

Promova a discussão dando a sua opinião