4日前アモデイCEO、AIに航空機並み安全審査を提言•アモデイCEOがAI政策エッセイを公開•フロンティアAIに航空機並み審査義務を提言•失業悪化に備える経済政策案も公表Anthropic法規制・ルールAIの安全性続きを読む →
5月7日Anthropic研究:価値観の理由を先に学ぶとAIの準拠性が向上•価値観の理由を先に学習させると準拠性が向上•未知の状況でも価値観に沿った判断が可能に•Anthropicフェローズプログラムの研究成果AnthropicAIの安全性研究・論文続きを読む →
5月1日GoodfireがLLMデバッグツール「Silico」を公開•Goodfire、LLM可視化ツール「Silico」公開•訓練中にリアルタイムでパラメータを調整可能•AIの透明性確保と安全性向上に向けた取り組みが前進新サービス研究・論文AIの安全性続きを読む →