2026年4月23日 20:00

GPT-5.5安全評価：生物・サイバー高リスク判定

GPT-5.5 System Card

3行まとめ

•生物・サイバー分野で「高」能力と安全評価
•史上最強の安全策セットで本番リリース
•幻覚23%減、SWE-Bench Pro 58.6%達成

詳細

概要

OpenAIは2026年4月23日、新モデル「GPT-5.5」のリリースに合わせてSystem Cardを公開した。本文書はPreparedness Frameworkに基づく安全評価の詳細を開示するもので、約200社の早期アクセスパートナーからのフィードバックを経て策定された。GPT-5.5はPlus・Pro・Business・EnterpriseユーザーのChatGPTおよびCodexで順次利用可能となっている。

安全性評価

Preparedness Frameworkによる評価では、生物・化学分野とサイバーセキュリティ分野でいずれも「高（High）」能力と判定された。生物脅威については外部評価機関SecureBioが「高リスクなプロンプトを認識して実践的な支援を拒否した」と報告した。サイバー分野ではCyber Rangeの合格率が93.33%（前バージョンGPT-5.4の73.33%から上昇）を記録したが、ゼロデイ脆弱性の自律的な悪用は確認されておらず、「Critical（重大）」には達していない。

安全策と性能改善

本リリースではOpenAI史上最強の安全策セットが適用され、生物・サイバー分野それぞれに専用の制限が設けられている。モデル性能も向上し、個別の事実の正確性は前バージョン比23%改善、幻覚を含む回答は3%減少した。コーディング評価SWE-Bench Proでは58.6%を達成し、エージェント型タスクへの対応能力が強化されている。

なぜ重要か

OpenAIの最新主力モデルが生物・サイバー分野で高能力と判定され、史上最強の安全策が適用された。AI活用企業はリスク管理方針の見直し材料として活用できる。

OpenAI セキュリティ・プライバシーコーディングアップデート研究・論文

元記事を読む — OpenAI Blog

GPT-5.5安全評価：生物・サイバー高リスク判定

3行まとめ

詳細

概要

安全性評価

安全策と性能改善

なぜ重要か

人気記事