調査ノート: OpenAIのGPT-4.5リリースの探求
Updated on

はじめに
AI研究と実用化におけるリーダーであるOpenAIは、大規模言語モデル(LLM)の更なる発展を目指し、2025年2月にコードネーム「Orion」と呼ばれるGPT-4.5をリリースしました。2025年2月27日に発表されたこのモデルは、これまでで最も大規模で知識豊富なモデルとして位置づけられており、ユーザーとのやり取りを向上させ、誤りの低減を目指しています。本ノートでは、技術仕様、ベンチマーク性能、以前のモデルや競合モデルとの比較を掘り下げ、技術愛好家や専門家のための包括的な概要を提供します。
背景とリリース経緯
GPT-4.5のリリースは、AnthropicやDeepSeekなどの競合他社が推論能力や効率性の向上を推し進める中、急速に進んでいるAI業界の発展の最中に行われました。OpenAIのこの発表は、まずTechCrunch (opens in a new tab)やWIRED (opens in a new tab)などの各種テックニュースで報じられ、当初は月額200ドルのChatGPT Pro購読者向け研究プレビュー版として提供され、その後他の有料プランにも順次展開する計画です。この取り組みは、josuenunez_ai (opens in a new tab)のX投稿で述べられているように、広範な利用前のユーザーフィードバック収集戦略を反映しています。
技術仕様
GPT-4.5はOpenAI史上最大のモデルとして説明されていますが、パラメータ数や訓練データセットの規模などの具体的詳細事項は公開されておらず、GPT-4(Wikipedia (opens in a new tab))の例のように、OpenAIが自社の専有情報を守るために公開しない従来の慣行を踏襲しています。主要な技術的特徴には以下が挙げられます:
- コンテキストウインドウ: josuenunez_ai (opens in a new tab)のX投稿にあるように、128,000トークンへと大幅な機能向上を果たし、GPT-4の性能を遥かに超える広範な会話やドキュメント処理が可能。
- 計算効率: Iamtoxix (opens in a new tab)によると、GPT-4に比べ10倍以上の改善が報告され、規模がより大きいにもかかわらず済み資源効率が向上。
- 非フロンティアモデル: GPT-4.5は潜在的リスク面でAIの限界を押し広げるフロンティアモデルではないと、TechCrunch (opens in a new tab)でOpenAIが明確化。
具体的な技術詳細が公開されていないことから、一部X投稿 (daniel_nguyenx (opens in a new tab)など、2023年時点のマルチモーダル能力に関する憶測情報) には推測の余地がありますが、2025年リリースでは未確認のままです。
ベンチマーク性能
複数のテストが各種プラットフォームで実施・報告され、GPT-4.5の性能を明らかにします:
- シンプルQAの正確性およびハルシネーション: MIT Technology Review (opens in a new tab)によると、GPT-4.5はGPT-4oやo3-miniと比較して著しく改善された37.1%のハルシネーション率を達成。
- 数学および科学: Vellum (opens in a new tab)によると、GPT-4oより数学で27.4%、科学で17.8%の改善を実現。
- コーディングおよび多言語サポート: SWE-Lancer Diamondではo3-miniを上回る性能を達成し、多言語サポートでも適度な改善。
- 人間の好み: 日常からプロ業務、創作タスク(詩、ASCIIアート含む)で人間の評価者からGPT-4.5が好まれる結果が出ており、会話性能に定評がある(ZDNET (opens in a new tab))。
しかし、WIRED (opens in a new tab)の記事のとおり、特定の数学・科学推論タスクでは他モデルに劣る場面もあり、汎用性とのトレードオフが存在します。
以前のモデルとの比較
- GPT-4に対しては、知識量・文脈窓(128kトークン)・精度の高い返答が改善されています。
- GPT-4oと比較するとGPT-4.5は主にテキストベースのインタラクションに力を注ぎ、一部パフォーマンスで優れています。
- o1やo3-miniなどの推論特化モデルと比べると、GPT-4.5は汎用性で勝りますが、数学・科学分野で特化モデルに劣ります。
競合との比較
競合モデルとの直接の性能比較は限定的ですが、一般的な推論や会話の用途ではGPT-4.5が比較的競争力を持つと考えられます。
価格・アクセシビリティ
APIコストが非常に高額(入力100万トークンあたり75ドル、出力150ドル)であることが特筆され、費用対効果に疑問が提起されています。
結論
GPT-4.5は、強力な公共用途を備えたOpenAIの注目モデルですが、高い価格設定が今後の普及にとって課題となる可能性があります。