Skip to content
Umfragehinweis: Erkundung von OpenAIs GPT-4.5-Veröffentlichung

Umfragehinweis: Erkundung von OpenAIs GPT-4.5-Veröffentlichung

Updated on

Eine Umfrage, welche sich mit OpenAIs GPT-4.5-Veröffentlichung, Codename Orion, beschäftigt und technische Spezifikationen, Benchmark-Leistungen, Vergleiche und mehr behandelt.

Einleitung

OpenAI, ein führendes Unternehmen im Bereich KI-Forschung und -Einsatz, veröffentlichte im Februar 2025 GPT-4.5, Codename Orion, als Teil ihrer fortlaufenden Bemühungen zur Weiterentwicklung großer Sprachmodelle (LLMs). Diese Veröffentlichung, angekündigt am 27. Februar 2025, gilt als das bisher größte und wissensreichste Modell und zielt darauf ab, Benutzerinteraktionen zu verbessern und Ungenauigkeiten zu reduzieren. Diese Umfrage beschäftigt sich mit den technischen Spezifikationen, Benchmark-Leistungen und Vergleichen mit früheren Modellen sowie Wettbewerbern und bietet einen umfassenden Überblick für technisch interessierte Leser und Fachleute.

Hintergrund und Kontext der Veröffentlichung

Die Einführung von GPT-4.5 findet in einer Zeit statt, in der Fortschritte im Bereich KI rasant voranschreiten und Wettbewerber wie Anthropic und DeepSeek Grenzen der logischen Schlussfolgerungen und der Effizienz verschieben. OpenAIs Ankündigung, zunächst durch verschiedene Technik-Nachrichtenquellen wie TechCrunch (opens in a new tab) und WIRED (opens in a new tab) verbreitet, hebt hervor, dass das Modell zunächst als Forschungsvorschau für ChatGPT Pro-Abonnenten zu einem monatlichen Preis von 200$ bereitgestellt wird, wobei die Freischaltung für andere bezahlte Stufen folgen soll. Diese Strategie spiegelt OpenAIs Wunsch wider, Benutzerfeedback zu sammeln, bevor eine breitere Bereitstellung erfolgt, wie in einem X-Beitrag von josuenunez_ai (opens in a new tab) erwähnt wurde.

Technische Spezifikationen

GPT-4.5 wird als OpenAIs bisher größtes Modell beschrieben, wobei jedoch spezifische Details wie Parameteranzahl und Trainingsdatensatzgröße nicht öffentlich bekanntgegeben werden, was der bisherigen Vorgehensweise von OpenAI entspricht, proprietäre Informationen zu schützen, wie zuvor bei GPT-4 (Wikipedia (opens in a new tab)). Wichtige technische Merkmale sind:

  • Kontextfenster: Eine deutliche Erweiterung auf 128.000 Token, wie in einem X-Beitrag von josuenunez_ai (opens in a new tab) erwähnt, ermöglicht die Bearbeitung ausgedehnter Gespräche und Dokumente und übertrifft damit deutlich GPT-4.
  • Rechnerische Effizienz: Berichten zufolge eine mehr als zehnfache Verbesserung gegenüber GPT-4, gemäß X-Beitrag von Iamtoxix (opens in a new tab), macht es trotz seiner Größe ressourceneffizienter.
  • Nicht-Frontier-Modell: OpenAI stellte heraus, dass GPT-4.5 kein sogenanntes Frontier-Modell ist, also keine neuen Grenzbereiche der KI-Risiken erschließt, dies berichtete TechCrunch (opens in a new tab).

Diese mangelnde Offenlegung spezifischer technischer Details lässt Raum für Spekulationen, einschließlich eines X-Beitrags von daniel_nguyenx (opens in a new tab) aus 2023 über multi-modale Fähigkeiten, welche jedoch spekulativ und nicht bestätigt sind.

Benchmark-Leistungen

Benchmark-Resultate bieten Einsichten in Fähigkeiten von GPT-4.5, wobei mehrere Tests über Technik-Plattformen verteilt berichtet wurden:

  • SimpleQA Genauigkeit und Halluzination: Bei SimpleQA zeigt GPT-4.5 eine deutlich reduzierte Halluzinationsrate von 37,1%, verglichen mit 59,8% bei GPT-4o und 80,3% bei o3-mini, wie die MIT Technology Review (opens in a new tab) berichtete.
  • Mathematik und Naturwissenschaften: Verbesserungen von 27,4% in Mathematik und 17,8% in Wissenschaft im Vergleich zu GPT-4o (Vellum (opens in a new tab)), zeigen bessere Zuverlässigkeit bei faktenbasierten Aufgaben.
  • Codierung und mehrsprachige Aufgaben: Auf SWE-Lancer Diamond übertrifft GPT-4.5 das o3-mini (32,6% vs. 23,3%), was auf eine starke Leistung bei Programmieraufgaben hinweist (Vellum (opens in a new tab)). Die multilinguale Leistung verbessert sich zudem moderat um 3,6%.
  • Menschliche Präferenz: Laut ZDNET (opens in a new tab) bevorzugten Nutzer GPT-4.5 bei alltäglichen, beruflichen und kreativen Aufgaben, einschließlich Gedichten und ASCII-Kunst.

Doch bei speziellen logischen Aufgaben schneidet GPT-4.5 schlechter ab als spezialisierte Modelle wie das o3-mini, insbesondere bei Mathematik und Naturwissenschaften (WIRED (opens in a new tab)).

Vergleiche zu vorherigen Modellen

Ein kurzer Vergleich mit früheren OpenAI-Produkten zeigt:

Vergleiche mit Wettbewerbern

Im Vergleich mit Anthropic Claude oder Google Gemini sind detaillierte Vergleiche nur begrenzt vorhanden, GPT-4.5 punktet insbesondere bei textlastigen Aufgaben.

Preis und Zugriff

Die API ist mit 75$ pro Million Eingabetoken und 150$ pro Million Ausgabetoken teurer als GPT-4o mit 2,50$ bzw. 10$, wie von TechCrunch (opens in a new tab) berichtet wurde.

Fazit

GPT-4.5 ist ein leistungsstarkes Modell mit Stärken im allgemein breiten Einsatz, steht aber vor Herausforderungen bezüglich hohem Kostenfaktor. Die langfristige Bewertung bleibt abzuwarten.

📚