Openai lance le raisonnement LLM que vous pouvez télécharger et fine -tune

Une femme noire est assise sur son ordinateur à son bureau chez elle pendant qu'elle note

Les modèles d’IA «à poids ouvert» permettent aux chercheurs d’effectuer une formation personnalisée ou d’étudier comment les informations sont représentées dans leur réseau neuronal. Crédit: Getty

OpenAI a lancé un modèle grand langage (LLM) qui est à la hauteur du nom de l’entreprise. Connu sous le nom de GPT-ASS, il s’agit de la première intelligence artificielle (AI) de «raisonnement» de l’entreprise à poids ouvert, ce qui signifie que les chercheurs pourront le télécharger et le personnaliser.

L’entreprise basée à San Francisco, en Californie, a détaillé le système en un Articles de blog Et un Description technique Le 5 août. Sur certaines tâches, GPT-OS fonctionne presque aussi bien que les modèles les plus avancés de l’entreprise. LLM est disponible en deux tailles, qui peuvent être exécutées localement et hors ligne – les plus petites sur un seul ordinateur portable – plutôt que de nécessiter un cloud computing ou une interface en ligne. Cela signifie qu’ils peuvent être utilisés pour analyser – ou être formés sur des données sensibles qui ne peuvent pas être transférées en dehors d’un réseau donné.

“Je suis très excité”, explique Simon Frieder, mathématicien et informaticien à l’Université d’Oxford, au Royaume-Uni. “La concurrence entre les grands modèles de langue est déjà solide, ce qui rendra la concurrence encore plus difficile qui profite à l’ensemble de la communauté de recherche.”

La sortie de GPT-ESS arrive à une époque où de puissants modèles ouverts de sociétés chinoises, tels que Deepseek basée à Hangzhou et de Moonshot IA basée à Pékin, gagnent une traction parmi les chercheurs. Les modèles ouverts chinois fonctionnent déjà mieux que les États-Unis, comme Lama (de Meta, basé à Menlo Park, en Californie) et est également prêt à les dépasser en termes de nombre de téléchargements, selon Une analyse de Nathan LambertUn chercheur à l’apprentissage automatique à l’Allen Institute for IA à Seattle, Washington, qui a été réalisé avant la sortie de GPT-OS.

Le mois dernier, l’administration du président américain Donald Trump a souligné que les modèles d’IA étaient “importants pour la recherche universitaire” dans son plan d’action de l’IA. La décision d’Openai de lancer un modèle ouvert est en préparation depuis longtemps et n’est pas une réponse au succès des modèles chinois, a déclaré Greg Brockman, l’un des fondateurs de l’entreprise qui s’est entretenu avec des journalistes avant la sortie de GPT-ESS. “Ce n’était jamais une chose que nous ne ferions pas”, a-t-il ajouté.

Tous les modèles viennent avec un biais afin que la diversité de leurs créateurs soit bénéfique pour les utilisateurs, explique Frieder. “Avoir un nouveau modèle de prêtre de haut niveau d’une entreprise occidentale est un pas vers le lissage des règles du jeu quant aux entreprises qui dominent l’espace du modèle ouvert”, dit-il.

Math Whiz

Jusqu’à présent, Openai a largement publié des modèles propriétaires où l’exception est GPT-2, un LLM 2019 publié par la société trois ans avant de lancer son chatbot populaire Chatgpt.

Les derniers modèles ouverts sont des «pilotes de tuyaux» formés pour produire une sortie à l’aide d’un processus étape par étape qui imite les réservoirs. Les modèles de raisonnement précédents, tels que OpenAIS O3, ont été trouvés pour exceller dans les problèmes des sciences et des mathématiques. En plus de les utiliser pour écrire du code informatique et examiner la littérature scientifique, les chercheurs expérimentent l’utilisation de LLM tels que les «co-scientifiques» de l’IA dans l’espoir d’accélérer la recherche.

Dans les performances, les modèles ouverts d’Openai semblent être proches du plus avancé de l’entreprise, l’accès aux paiements à l’AIS – les plus grandes différences sont les plus petites tailles des modèles ouverts et les leurs ne sont que du texte (ils ne gèrent pas les images ou la vidéo). GPT-ESS peut parcourir Internet, effectuer du code et exploiter des logiciels, et il dépasse les modèles ouverts de la même manière sur les tâches de raisonnement, indique la société.

Au Benchmark AIME 2025, comme les tâches sont de résoudre des problèmes mathématiques difficiles, les modèles GPT-OSS sont meilleurs que les meilleurs modèles ouverts existants, tels que Deepseeks R1, et l’un des deux est en même temps que les principaux concurrents ouverts pour le dernier examen de l’humanité, un test de 3000 questions qui couvre les connaissances d’experts à travers les sujets.

(Presque) vraiment ouvert

Leave a Reply

Your email address will not be published. Required fields are marked *