Note d'étude : Exploration de la sortie de GPT-4.5 d'OpenAI

Name: Antonio Di Nicola

Mis à jour le 28/02/2025

Une note d'étude explorant la sortie de GPT-4.5 d'OpenAI, nom de code Orion, couvrant les spécifications techniques, les performances sur des benchmarks, les comparaisons et bien plus encore.

Introduction

OpenAI, un leader dans la recherche et le déploiement de l'IA, a annoncé en février 2025 GPT-4.5, nommé Orion, s'inscrivant dans ses efforts continus de perfectionnement des grands modèles de langage (LLM). Cette sortie, annoncée le 27 février 2025, se positionne comme le modèle le plus grand et le plus informé à ce jour, visant à enrichir l'interaction utilisateur et à diminuer les erreurs de raisonnement. Cette note d'étude examine ses spécifications techniques, ses performances sur des benchmarks et les compare avec les modèles précédents et ceux de ses concurrents, offrant une vue d'ensemble détaillée destinée aux passionnés et professionnels de l'informatique.

Contexte et contexte de sortie

La sortie de GPT-4.5 intervient durant une période de rapides progrès dans l'IA, alors que des concurrents comme Anthropic et DeepSeek repoussent les limites en matière de raisonnement et d’efficacité. L'annonce d'OpenAI, initialement partagée par divers médias technologiques comme TechCrunch (opens in a new tab) et WIRED (opens in a new tab), a signalé que le modèle était disponible en avant-première pour les abonnés ChatGPT Pro moyennant 200 dollars par mois, avec une extension prévue à d'autres niveaux payants par la suite. Cette démarche reflète la stratégie d'OpenAI de recueillir les commentaires et avis des utilisateurs avant un déploiement plus large, tel que précisé dans une publication X par josuenunez_ai (opens in a new tab).

Spécifications techniques

GPT-4.5 est décrit comme le plus grand modèle d'OpenAI à ce jour, bien que des détails précis tels que le nombre exact de paramètres ou la taille du jeu de données d'entraînement ne soient pas publiés, conformément aux habitudes d'OpenAI sur la protection des informations propriétaires, comme on a pu le voir avec les sorties précédentes telles que GPT-4 (Wikipedia (opens in a new tab)). Les caractéristiques techniques principales comprennent :

Fenêtre de contexte : une évolution notable vers des fenêtres de 128 000 jetons, selon une publication X de josuenunez_ai (opens in a new tab), permettant de traiter des conversations et des documents d'une ampleur beaucoup plus importante que GPT-4.
Efficacité de calcul : les rapports indiquent une amélioration de plus de 10 fois par rapport à GPT-4, selon une publication X de Iamtoxix (opens in a new tab), le rendant plus économe en ressources malgré sa taille.
Modèle non-frontière : OpenAI précise que GPT-4.5 n'est pas un "modèle-frontière", signifiant qu'il ne repousse pas les limites des capacités de l'IA en termes de risque potentiel, selon TechCrunch (opens in a new tab).

Ce manque de divulgation technique détaillée, bien que commun, laisse la porte ouverte à des spéculations. Certaines publications X comme celle de daniel_nguyenx (opens in a new tab) datant de 2023 évoquent des capacités multimodales, mais celles-ci restent spéculatives et ne sont pas confirmées pour la sortie de 2025.

Performances sur les benchmarks

Les résultats des tests donnent un aperçu des capacités de GPT-4.5 à travers plusieurs benchmarks rapportés dans divers médias technologiques :

Précision SimpleQA et hallucinations : sur SimpleQA, GPT-4.5 montre un taux d'hallucination de 37,1%, contre 59,8% pour GPT-4o et 80,3% pour o3-mini, d'après MIT Technology Review (opens in a new tab). Cela indique une meilleure précision factuelle, aspect essentiel pour la fiabilité.
Mathématiques et sciences : amélioration de 27,4% en mathématiques et de 17,8% en sciences comparativement à GPT-4o, selon Vellum (opens in a new tab), le rendant plus fiable pour les tâches faisant appel à la raison.
Codage et tâches multilingues : sur SWE-Lancer Diamond, il dépasse o3-mini (32,6% contre 23,3%), suggérant une bonne performance en codage assisté, selon le même article de Vellum (opens in a new tab). Les gains multilingues restent cependant modérés (+3,6%).
Préférence humaine : les testeurs humains, selon ZDNET (opens in a new tab), préfèrent GPT-4.5 pour les tâches quotidiennes, professionnelles et créatives, telles que la poésie et l'art ASCII, démontrant ainsi ses qualités conversationnelles.

Toutefois, il est inférieur sur certaines capacités spécialisées comparé à des modèles comme o3-mini, notamment en mathématiques et en sciences selon WIRED (opens in a new tab), signe d'un compromis entre spécialisation et polyvalence.

Comparaisons avec les modèles précédents

Pour situer GPT-4.5, nous le comparons aux modèles précédemment sortis par OpenAI :

GPT-4 : GPT-4.5 propose une profondeur de connaissances supérieure, une intelligence émotionnelle accrue et une meilleure précision (128k tokens contre 32k ou 8k pour GPT-4 selon les versions de Wikipedia (opens in a new tab)).
GPT-4o et modèles de raisonnement spécialisés (o1, o3-mini) : GPT-4.5 démontre des atouts généralistes clairs, mais reste potentiellement derrière ces modèles spécialisés dans certaines tâches spécifiques.

Tarification et accessibilité

Point inattendu : coût élevé de l'API, avec 75$ par million de jetons en entrée, et 150$ en sortie selon TechCrunch (opens in a new tab), suscitant des interrogations quant à la rentabilité.

Conclusion

GPT-4.5 est un ajout prometteur qui développe connaissances et fiabilité, mais son prix élevé pourrait freiner son adoption à grande échelle.

📚

Comment Créer Deux Agents Python avec le Protocole A2A de Google - Tutoriel Étape par Étape Top 15 des outils de visualisation de données open source pour 2025