AIニュース3行まとめ
2026年4月23日 20:00

GPT-5.5安全評価:生物・サイバー高リスク判定

GPT-5.5 System Card

3行まとめ

  • 生物・サイバー分野で「高」能力と安全評価
  • 史上最強の安全策セットで本番リリース
  • 幻覚23%減、SWE-Bench Pro 58.6%達成

詳細

概要

OpenAIは2026年4月23日、新モデル「GPT-5.5」のリリースに合わせてSystem Cardを公開した。本文書はPreparedness Frameworkに基づく安全評価の詳細を開示するもので、約200社の早期アクセスパートナーからのフィードバックを経て策定された。GPT-5.5はPlus・Pro・Business・EnterpriseユーザーのChatGPTおよびCodexで順次利用可能となっている。

安全性評価

Preparedness Frameworkによる評価では、生物・化学分野とサイバーセキュリティ分野でいずれも「高(High)」能力と判定された。生物脅威については外部評価機関SecureBioが「高リスクなプロンプトを認識して実践的な支援を拒否した」と報告した。サイバー分野ではCyber Rangeの合格率が93.33%(前バージョンGPT-5.4の73.33%から上昇)を記録したが、ゼロデイ脆弱性の自律的な悪用は確認されておらず、「Critical(重大)」には達していない。

安全策と性能改善

本リリースではOpenAI史上最強の安全策セットが適用され、生物・サイバー分野それぞれに専用の制限が設けられている。モデル性能も向上し、個別の事実の正確性は前バージョン比23%改善、幻覚を含む回答は3%減少した。コーディング評価SWE-Bench Proでは58.6%を達成し、エージェント型タスクへの対応能力が強化されている。

なぜ重要か

OpenAIの最新主力モデルが生物・サイバー分野で高能力と判定され、史上最強の安全策が適用された。AI活用企業はリスク管理方針の見直し材料として活用できる。

元記事を読む — OpenAI Blog

人気記事

GPT-5.5安全評価:生物・サイバー高リスク判定 | AIニュース3行まとめ