2026年4月22日 19:00
Responses APIがWebSocketで高速化
Speeding up agentic workflows with WebSockets in the Responses API
3行まとめ
- •OpenAIがResponses APIにWebSocket対応を追加
- •接続スコープキャッシュでAPIオーバーヘッドを削減
- •Codexエージェントループのレイテンシが改善
詳細
背景
OpenAIはCodexエージェントの開発において、従来のHTTP接続方式がエージェント型ワークフローに与えるオーバーヘッドを詳細に分析した。エージェントループでは複数のAPIコールが連続して発生するため、リクエストごとに接続を確立するHTTPの仕組みがボトルネックになりやすい。接続の確立・終了にかかるコストが積み重なることで、エージェント全体の応答時間に悪影響を及ぼしていた。
内容
この課題を解決するため、OpenAIはResponses APIにWebSocket対応を追加した。WebSocketは一度確立した持続的な接続をそのまま維持するため、リクエストごとの接続コストを大幅に削減できる。さらに接続スコープのキャッシュ機能を導入し、同一接続内で使用するコンテキスト・設定・トークンを再利用可能にした。これにより、複数ステップのエージェントループ全体のAPIオーバーヘッドが低減し、モデルのレイテンシが改善された。
今後の影響
Codexをはじめとするエージェント型AIシステムにとって、この改善は応答速度の向上に直結する。開発者はWebSocket接続と接続スコープキャッシュを組み合わせることで、より低レイテンシかつ効率的なAIエージェントを実装できる。OpenAIはこの技術的知見をブログで公開しており、Responses APIを使ったエージェント開発者が実装に応用できる具体的な最適化手法が示された。
なぜ重要か
OpenAIがResponses APIにWebSocket対応と接続スコープキャッシュを追加し、エージェントループの通信コストとレイテンシを削減した。
元記事を読む — OpenAI Blog