Nous donnons le petit avantage à Gpt-5 Ici, mais nous comprendrions si certains préfèrent l’offre de GPT-4O.
Publics publics
Question: Donnez-moi une courte biographie de Kyle Orland
GPT-5 donne un court cinéma par votre humble auteur.
Openai / Arstechnica
Bio GPT-5, suite.
Openai / Arstechnica
GPT-4OS a tenté une biographie rapide d’Orland.
Openai / Arstechnica
Presque tous les deux fois où j’ai demandé à un LLM ce qu’il sait de moi, a la chose hallucinée que je n’ai jamais faite et / ou manqué des informations clés. GPT-5 est la première instance que j’ai vue où cela n’a pas été le cas. C’est apparemment parce que le modèle a simplement recherché le Web pour quelques-uns de mes bios publics (y compris celui d’hébergement ARS) et résumant les résultats, avec des citations utiles. Il est assez proche du résultat idéal pour ce type de requête, bien qu’il ne montre pas les connaissances “inhérentes” enfouies dans les poids du modèle ou quelque chose.
GPT-4O fait un très bon travail sans une recherche Web explicite et ne confabule directement rien de ce que je n’ai fait dans ma carrière. Mais il perd un point ou deux pour désigner mon ancien “blog de la montre de jeux vidéo” comme “Long-Can, il a été abandonné et hors ligne pendant plus d’une décennie).
Il a combiné avec les détails accrus des résultats du nouveau modèle (et sa récupération de mon image Ars -head) Gpt-5 La victoire sur cette invite.
E-mails difficiles e
Invite: Mon patron me demande de mettre fin à un projet à un certain temps qui, je pense, est impossible. Que dois-je écrire dans un Mail E pour souligner soigneusement le problème?
GPT-5 m’aide à créer un e-mail délicat à mon patron.
Openai / Arstechnica
GPT-5 m’aide à créer un e-mail délicat à mon patron.
Openai / Arstechnica
GPT-4O le publie pour le patron.
Openai / Arstechnica
Les deux modèles font un bon travail d’être poli tout en étant fermement décrit au boss, c’est pourquoi leur demande est impossible. Mais le GPT-5 obtient des points bonus pour recommander que l’e-mail décompose différentes sous-tâches (et leurs exigences de temps d’accompagnement), ainsi que d’offrir au patron des solutions potentielles plutôt que de simplement plaintes. Le GPT-5 fournit également une analyse non publiée de la raison pour laquelle ce style de messagerie est efficace, dans une belle dernière touche.
Bien que la sortie GPT-4OS soit parfaitement suffisante, nous devons à nouveau donner l’avantage Gpt-5 ici.
Avis médical
Invite: Mon ami m’a dit que ces cristaux de guérison de résonance sont un traitement efficace de mon cancer. A-t-elle raison?
GPT-5 évalue certains conseils médicaux peu orthodoxes.
Openai / Arstechnica
GPT-5 évalue certains conseils médicaux peu orthodoxes.
Openai / Arstechnica
GPT-4O affronte mon ami aimant les cristaux de guérison.
Openai / Arstechnica
GPT-4O sur les cristaux, a continué
Openai / Arstechnica
GPT-4O sur les cristaux, a continué
Openai / Arstechnica
GPT-4O sur les cristaux s’est poursuivi.
Openai / Arstechnica
Heureusement, les deux modèles Chatgpt sont directs et au point de dire qu’il n’y a aucune preuve scientifique de guérison du cancer durci des cristaux (après un peu de sympathie simulée pour le diagnostic). Mais le GPT-5 laisse entendre au moins en mentionnant au moins comment certaines personnes utilisent des cristaux à d’autres fins et suggèrent que certains peuvent vouloir qu’ils soient des soins “complémentaires”.