Fable 5・Kimi・Opus 4.8 ほか最新AI 6種を「攻撃役」に。企業システムが受ける攻撃を再現し、何が破られ、何を守れたかを測定しました。
AI を「攻撃役」とし、低権限のアカウントだけを渡して、5種類の攻撃シナリオをシステムにぶつけました。狙いは、企業システムが現実に晒される攻撃の再現です。手口の詳細は伏せ、何を狙ったかだけを示します。
低権限から、機密の顧客データの取得を狙う。
操作の痕跡を消す・書き換える。
侵入後、暗号化データの復号を狙う。
検知を避けて不正送金を通す。
承認フローのなりすまし突破。
横軸は、攻撃が成功(目標達成)したシナリオ数(攻撃成功率 ASR に相当)です。
能力が上がるほど、攻撃はより巧妙に、より深く通った。最強モデルは 5/5 を突破し、脆弱な経路は特定の1社ではなく、フロンティア全体に共通する構造的なリスクでした。「高性能を選べば安全」も「安全機能つきなら安全」も、データに裏切られています。そして——攻撃に使う AI を選ぶのは攻撃者であり、守る側ではありません。だから守りは、どのモデルかに依存できません。
拒否は、安全ではない。 安全訓練は偶発的な悪用を抑えても、保証ではありません。
モデルを選んでも、守れない。
守るのは、実行の前に止める層です。
多くの企業が入れている古典的な防御を、AI エージェントは自律的にすり抜けました。シナリオごとに「従来の防御」と「AI がどう破ったか」を並べます。
読みどころ — 右列「AI がどう破るか」を上から眺めるだけで、古典的な防御が次々と抜かれていくのが分かります。
古典的な防御は、AI には突破可能。
ソーシャルエンジニアリングに至っては、守る概念すら存在しない。
差はモデルではなく、証明層の有無でした(SECURE モード)。高リスク操作の前に「誰が・どの権限で・どのデータに」の証明を要求し、無ければ送信される前に止めます(fail-closed)。これが Lemma の役割です。
AIエージェントが、御社の API を攻撃してくる。
実行の前に証明を要求する層を入れれば、止まる。
突破はすべて、AI が鍵や認証情報を昇格させて起きました。Lemma はサーバー側に、証明の層を一枚差します。高リスク操作の前に「誰が・どの権限で・どのデータに」を証明として要求し、範囲外は実行前に止める(fail-closed)。既存のサーバー/API に、大改修なしで。
承認・送金は、従来防御機構そのものが無かった領域です。Lemma は送金・承認に数学的な承認証明を要求し、範囲外は実行前に止めます。
攻撃に証明ゲートを重ねると、結果はこう変わります。
初期表示は「Lemma あり」——全モデル・全シナリオが、実行前にブロック。トグルを「証明なし」に戻すと、同じ表が突破(赤)だらけに変わります。違いは、Lemma の有無だけ。
今回の攻撃シナリオを御社のシステムに合わせて実施し(セキュリティ評価)、サーバー側のどこに証明ゲートを差すべきかをご提案します。まず30分のディスカバリーコールから。機微なデータの開示は不要です。
Discovery Callを予約する → プランを見る →Lemma について詳しく知りたい方は ホワイトペーパー をお役立てください。
対象システムと要件を確認。機微なデータの開示は不要です。
検証環境に、Lemma の証明ゲートを最小構成で差し込みます。
攻撃シナリオで、証明なし/ありの差を実測。効果を数字で確認。
結果をもとに、組み込み範囲と本番への道筋を確定します。
主張ではなく測定です。コードは公開しており、同じ環境で誰でも再実行できます。
403