Lemma Critical Brief · Pillar archive
Pillar 02 検証可能 AI
AI 判断の過程を ZK で commit する層。
7 件の Brief
AI エージェントが、送信者を確かめる前に認証情報を社外へ送った
緊急を装った 1 通のメールに、本人性検証の規則が破られた(OpenClaw / Varonis)
自動運転の事故データと「人間より安全」の根拠が、自社申告のまま検証されていない
AI の走行判断と安全性属性の独立検証不在(Tesla FSD/NHTSA EA26002)
不可視 Unicode による指示インジェクション
目視と AI 入力の乖離
Robert Williams 誤認逮捕
顔認識の AI 判定が独立検証なく行政の強制処分に直結した構造
McKinsey Lilli のシステムプロンプト書き換え可能性
AI の挙動を統治する層に完全性も来歴もなかった
hackerbot-claw による初の AI 対 AI 攻撃
リポジトリの CLAUDE.md を書き換え、防御側 AI エージェントの指示を乗っ取ろうとした
フォント偽装で AI の文書レビューに別の文章を読ませた(Noroboto)
2026 年 5 月、Tritium Legal Technologies 創業者ドリュー・ミラー氏が「Noroboto」攻撃手法を公開した。文書に埋め込まれた悪意あるフォントが Unicode 符号位置と字形の対応関係を意図的にずらすことで、人間が画面上で読む文章と AI が内…