3時間前AIの能力隠す挙動防ぐ手法、研究者発見•AIが評価時に能力を隠す問題を研究•MATSやAnthropicら共同チーム発表•安全性評価の信頼性向上に貢献研究・論文セキュリティ・プライバシーAnthropic続きを読む →