Lemma Critical Brief · Category archive
エージェント暴走
自律エージェントの権限外行動、意図しない決済・契約・委任。
5 件の Brief
自律 AI ワーム
実行時に攻撃戦略を生成する脅威モデル
GTG-1002
AI エージェントが攻撃の 80–90% を自律実行した初の報告例、エージェント権限が独立検証されない構造
hackerbot-claw による初の AI 対 AI 攻撃
リポジトリの CLAUDE.md を書き換え、防御側 AI エージェントの指示を乗っ取ろうとした
McKinsey Lilli のシステムプロンプト書き換え可能性
AI の挙動を統治する層に完全性も来歴もなかった
Cursor + Claude Opus 4.6 が PocketOS 本番 DB を 9 秒で削除
AI コーディングエージェントの破壊的権限が独立検証されない構造