Lemma Critical Brief · Category archive
Agent Runaway
自律エージェントの権限外行動、意図しない決済・契約・委任。
3 件の Brief
GTG-1002
AI エージェントが攻撃の 80–90% を自律実行した初の報告例、エージェント権限が独立検証されない構造
McKinsey Lilli のシステムプロンプト書き換え可能性
AI の挙動を統治する層に完全性も来歴もなかった
Cursor + Claude Opus 4.6 が PocketOS 本番 DB を 9 秒で削除
AI コーディングエージェントの破壊的権限が独立検証されない構造