オープンAI、次世代モデル「GPT-5.6」を限定プレビュー 段階公開へ
オープンAI(OpenAI)は2026年6月26日、次世代モデル群「GPT-5.6」シリーズの限定プレビューを開始したと発表した。フラッグシップに位置づける「ソル(Sol)」、日常業務向けに性能と価格のバランスを取った「テラ(Terra)」、高速かつ低価格の「ルナ(Luna)」という3つのモデルで構成される。テラは前世代の「GPT-5.5」と肩を並べる性能を保ちながら価格を半分に抑え、ルナは同社の最低価格帯にあたる位置づけとなる。
米政府の要請受け限定パートナーから段階的に提供
今回のプレビューは、米国政府との継続的な協議を踏まえ、政府に参加状況を共有した少数の信頼できるパートナーおよび組織に限って始められた。提供経路はAPI(アプリケーション・プログラミング・インターフェース)と、同社の開発支援サービス「コーデックス(Codex)」の2つに絞られ、対話型サービス「チャットGPT(ChatGPT)」はプレビュー期間中の対象には含まれない。オープンAIは数週間以内にチャットGPT、コーデックス、APIを通じた一般提供へ移行する計画を示しているが、具体的な開始日は明らかにしていない。
Photo by Werckmeister/ Adobe Stock
オープンAIは公式ブログのなかで、政府の関与を前提としたアクセス管理の仕組みを長期的な標準とすることには否定的な立場も明らかにしている。利用者や開発者、サイバー防御の実務者から最先端の道具を遠ざける結果になりかねないためだ。今回の限定運用は、サイバー分野の大統領令にもとづく評価枠組みづくりと、将来のモデル公開に向けた再現可能な手続きを政権側と整備するまでの短期的な措置と位置づけている。
コーディング、生物学、サイバーセキュリティ大幅改善
性能面では、コーディング、生物学、サイバーセキュリティの3分野で大幅な改善が示された。コマンドライン環境での長期的な作業を評価する社外指標「ターミナルベンチ2.1」では、ソルが最高水準を更新し、複数の補助エージェントを並列に動かして複雑な処理を加速する「ウルトラ」モード構成で91.9%のスコアを記録した。ゲノム解析や定量生物学の長期タスクを測る「ジーンベンチv1」では、前世代のGPT-5.5より少ない出力で上回る結果を示している。サイバーセキュリティ向けの「エクスプロイトベンチ」では、上位モデル「ミトス・プレビュー」と同等の成績を、およそ3分の1の出力量で達成した。
GPT-5.6世代では、深い推論を行うための新しい「マックス」モードに加え、複数の補助エージェントを連携させる「ウルトラ」モードを導入した。単一エージェントでは難しい長期的な作業を、より短時間で処理できるようにする狙いがある。
「高」評価のリスクに多層型の安全対策で対応
能力の向上に合わせ、安全対策も拡充された。オープンAIが公開したGPT-5.6プレビューのシステムカードによれば、ソル、テラ、ルナの3モデルはいずれも、同社の「準備フレームワーク(Preparedness Framework)」上、サイバーセキュリティおよび生物・化学リスクで「高(High)」と評価された。一方で最上位の「重大(Critical)」閾値には達していない。ウェブブラウザの「クロミウム」と「ファイアフォックス」を対象とした評価では、脆弱性やエクスプロイトの構成要素は特定できたものの、テスト条件下で完全な攻撃連鎖を自律的に構築するには至らなかったとしている。
安全対策は多層構造を採用した。モデル自体への安全訓練に加え、生成中に出力を監視するサイバー・生物分野のリアルタイム分類器、アカウント単位での会話レビュー、用途や顧客に応じたアクセス権限の差別化を組み合わせている。オープンAIはこれらを「単一の防御策では適応的な悪用に対応できない」との認識のもとに設計したと説明する。汎用的な脱獄手法の発見を目的とした自動レッドチーム演習には、画像処理半導体(GPU)の「エヌビディアA100」相当の処理時間で70万時間を超える計算資源を投入したほか、外部の人間専門家による評価も並行して継続している。
価格は3モデルで明確に差別化、7月には高速版も
価格は100万トークンあたりで設定され、ソルが入力5ドル(約805円)・出力30ドル(約4,830円)、テラが入力2.50ドル(約400円)・出力15ドル(約2,415円)、ルナが入力1ドル(約161円)・出力6ドル(約966円)となる。GPT-5.6世代からは、開発者がプロンプトの一部を一時保存して再利用する「プロンプトキャッシュ」の仕様も見直され、開発者が任意の区切り位置を指定できるようになるほか、最短30分のキャッシュ保持に対応する。キャッシュ書き込みは未キャッシュ入力料金の1.25倍で課金され、キャッシュ読み取りには引き続き9割の割引が適用される。
オープンAIはあわせて、半導体ベンダーのセレブラス(Cerebras)と連携し、2026年7月にソルを最大毎秒750トークンの処理速度で提供する計画も明らかにした。容量確保の都合から、当初は一部の顧客に限定される見通しだ。
今回の限定プレビューは、悪用抑止策の有効性だけでなく、正当な用途に対する妨げの有無を検証する期間としても位置づけられている。コードレビューや脆弱性調査、パッチ開発、防御テストといった作業を阻害しない運用設計が、一般提供開始までの主要な調整課題となる。
※円換算は2026年6月26日時点の為替レート(1ドル=約161円)に基づく概算値。