2026年4月23日 20:00
GPT-5.5安全評価:生物・サイバー高リスク判定
GPT-5.5 System Card
3行まとめ
- •生物・サイバー分野で「高」能力と安全評価
- •史上最強の安全策セットで本番リリース
- •幻覚23%減、SWE-Bench Pro 58.6%達成
詳細
概要
OpenAIは2026年4月23日、新モデル「GPT-5.5」のリリースに合わせてSystem Cardを公開した。本文書はPreparedness Frameworkに基づく安全評価の詳細を開示するもので、約200社の早期アクセスパートナーからのフィードバックを経て策定された。GPT-5.5はPlus・Pro・Business・EnterpriseユーザーのChatGPTおよびCodexで順次利用可能となっている。
安全性評価
Preparedness Frameworkによる評価では、生物・化学分野とサイバーセキュリティ分野でいずれも「高(High)」能力と判定された。生物脅威については外部評価機関SecureBioが「高リスクなプロンプトを認識して実践的な支援を拒否した」と報告した。サイバー分野ではCyber Rangeの合格率が93.33%(前バージョンGPT-5.4の73.33%から上昇)を記録したが、ゼロデイ脆弱性の自律的な悪用は確認されておらず、「Critical(重大)」には達していない。
安全策と性能改善
本リリースではOpenAI史上最強の安全策セットが適用され、生物・サイバー分野それぞれに専用の制限が設けられている。モデル性能も向上し、個別の事実の正確性は前バージョン比23%改善、幻覚を含む回答は3%減少した。コーディング評価SWE-Bench Proでは58.6%を達成し、エージェント型タスクへの対応能力が強化されている。
なぜ重要か
OpenAIの最新主力モデルが生物・サイバー分野で高能力と判定され、史上最強の安全策が適用された。AI活用企業はリスク管理方針の見直し材料として活用できる。
元記事を読む — OpenAI Blog