Alors que l’O1 était un progrès technologique important, le GPT-5 est, surtout, un produit raffiné. Lors d’un point de presse, Sam Altman a comparé GPT-5 aux écrans rétiniens d’Apple, et c’est une analogie appropriée, mais peut-être pas dans la façon dont il le voulait. Comme un écran net sans précédent, le GPT-5 offrira une expérience utilisateur plus confortable et sans problème. Ce n’est pas rien, mais il vient bien en dessous de l’avenir transformateur de l’IA qu’Altman a passé une grande partie de l’année écoulée. Dans le briefing, Altman GPT-5 a qualifié une étape importante le long du chemin vers l’AGI “ou l’intelligence générale artificielle, et peut-être qu’il a droit mais si c’est le cas, c’est un très petit pas.
Prenez la démo des capacités du modèle qu’Openai a montré que Ma revue technologique Avant la version. Yann Dubois, une avance après une formation à OpenAI, a demandé à GPT-5 de concevoir une application Web qui aiderait son partenaire à apprendre le français afin qu’elle puisse plus facilement communiquer avec sa famille. Le modèle a fait un travail admirable pour suivre ses instructions et a créé une application attrayante et amicale. Mais quand j’ai donné à GPT-4O une invite presque identique, elle a produit une application avec exactement la même fonctionnalité. La seule différence est qu’elle n’était pas si esthétiquement attrayante.
Certaines des autres améliorations des expériences utilisateur sont plus complètes. Le fait que le modèle plutôt que l’utilisateur choisit de savoir s’il faut utiliser la résonance pour chaque enquête supprime un point de douleur majeur, en particulier pour les utilisateurs qui ne suivent pas les progrès de LLM.
Et selon Altman, le GPT-5 justifie beaucoup plus rapidement que les modèles O-Series. Le fait qu’OpenAI le libère aux utilisateurs non payants suggère qu’il est également moins cher pour l’entreprise. C’est un gros problème: exécuter des modèles puissants à bon marché et rapide est un problème difficile et c’est la clé pour réduire l’impact environnemental de l’AIS.
OpenAI a également pris des mesures pour atténuer les hallucinations, qui ont été un mal de tête soutenu. Les évaluations d’OpenAI suggèrent que les modèles GPT-5 sont significativement moins susceptibles de faire des affirmations incorrectes que leurs modèles prédécesseurs, O3 et GPT-4O. Si ces progrès tiennent pour le contrôle, il peut aider à ouvrir la voie à des agents plus fiables et fiables. “L’hallucination peut provoquer de véritables questions de sécurité et de sécurité”, explique Dawn Song, professeur d’informatique à l’UC Berkeley. Par exemple, un agent qui hallucine les packs de logiciels peut télécharger du code malveillant sur l’appareil d’un utilisateur.
Le GPT-5 a réalisé les derniers arts sur plusieurs repères, notamment un test des compétences d’agent et des évaluations de codage SWE-BENCH et Aider Polyglot. Mais selon Clémentine Fourrier, un chercheur de l’IA chez l’entreprise HuggingFace, ces évaluations approchent de la saturation, ce qui signifie que les modèles actuels ont atteint près des performances maximales.
“C’est essentiellement comme regarder les performances d’un lycée sur des problèmes moyens”, dit-elle. “Si le lycée échoue, cela vous dit quelque chose, mais si vous réussissez, cela ne vous en dit pas grand-chose.” Fourrier a déclaré qu’elle serait impressionnée si le système obtenait un score de 80% ou 85% sur le SWE-Bench mais il n’a réussi que 74,9%.
En fin de compte, le message des titre d’OpenAI est que GPT-5 se sent mieux à utiliser. “Les vibbs de ce modèle sont vraiment bons, et je pense que les gens le ressentiront vraiment, en particulier les gens moyens qui n’ont pas passé leur temps à penser aux modèles”, a déclaré Nick Turley, responsable de Chatgpt.
Cependant, les vibrations à elles seules ne mèneront pas à l’avenir automatisé promis par Altman. Le raisonnement ressemblait à un grand pas en avant sur le chemin d’Agi. Nous attendons toujours le prochain.