GPT-4.5 ainda falha em 37% dos casos, mas mostra avanços significativos
O modelo de inteligência artificial GPT-4.5, desenvolvido pela OpenAI, ainda fornece informações imprecisas em 37% das vezes, de acordo com os resultados do benchmark SimpleQA. Este fenômeno, conhecido como “alucinações de IA”, ocorre mesmo em consultas simples, sem mencionar pesquisas mais complexas.
Apesar disso, o GPT-4.5 é considerado um dos modelos mais avançados nesse aspecto, já que seus concorrentes apresentam resultados confiáveis em apenas 35% dos casos. Houve progresso na redução dessas alucinações, considerando que a versão anterior, GPT-4o, cometia erros em 61% das vezes.
No entanto, especialistas do setor acreditam que o ritmo de desenvolvimento é lento. Eles argumentam que atualizações superficiais provavelmente não resolverão o problema em um prazo razoável, e que abordagens fundamentalmente diferentes são necessárias para um avanço significativo.
Recentemente, o CEO da Microsoft, Satya Nadella, comentou que ainda é cedo para comparar a implementação da IA com a revolução industrial do século XIX. Ele sugere que a indústria de IA só poderá ser considerada sólida quando representar pelo menos 10% da economia global.