ミュトス

ミュトス

Mythos

Anthropic が 2026 年 4 月 7 日に開始した Project Glasswing で限定提供されたフロンティアモデル Claude Mythos Preview。ゼロデイ脆弱性の自動発見から攻撃経路構築までを単一エージェント内で完結させる能力を持つ。「Mythos 級」とは、この能力カテゴリそのものを指す。

定義

ミュトスは、Anthropic が Project Glasswing (2026 年 4 月 7 日開始) で AWS・Apple・Cisco・Google・Microsoft・Cloudflare などに防御目的で限定提供しているフロンティアモデルの名称である。ゼロデイ脆弱性の自動発見、exploit chain の構築、標的環境への適応までを、人間オペレータを介さずに同一エージェント内で完結させる能力を持つ点で、従来の AI 支援ツールとは質的に異なる。

デュアルユース性が中心問題となる。防御目的で構成された能力は、構造的に攻撃側にも等価である。2026 年 4 月、米財務省と FRB は大手銀行 CEO を緊急招集。日本では 4 月 24 日に金融庁が同様の会合を開き、5 月 12〜21 日には首相指示・関係省庁会議・総務相による電気通信事業者横断会合と、十日間で AI サイバー対策が階段を一気に下りた (詳細: 検証可能 AI と金融エージェント)。「Mythos 級攻撃」は、これら一連の対応を駆動した能力カテゴリを指す呼称として定着した。

重要なのは、自動化された攻撃には帰属痕跡 (attribution residue) が薄いことである。検出ツールの信頼度スコア — 例えば「99.7 % の確率で異常」— は規制報告や行政手続き、訴訟で「許可されていない権限行使があった」と立証する材料にはならない (詳細: 検出は証明ではない)。事前に証明可能な来歴と判断検証層を持つことが、事後の判断再現と説明責任を担保する唯一の経路となる。

Lemma での実装

Lemma Critical は、電力・水道・交通・製造業など重要インフラ事業者を対象に、AI が下した判断を SCADA/ICS 制御層に届く前に独立検証する pre-execution attestation を提供する。AI の判断結果ではなく判断過程そのものを、commit 前にゼロ知識証明で「暗号的に有効 ≠ 意味的に正しい」を遮断する設計を採る。

ドメイン固有のビジネスルール — 設備の安全上限、規制要件、運用 SLA — をカスタム ZK サーキットとして固定し、AI 判断がこれを満たすかを実行前に証明する。Mythos 級攻撃に内在するプロンプトインジェクションやデータポイズニング、敵対的入力は、commit 前の検証段階で fail する。判断が制御層に到達する前に止まる点が、検出型防御との構造的な違いである。

委任グラフ — 誰が・何を・どこまで AI に許可したか — もコミットメントとして固定される。事故後の事後検証や規制報告で、AI 判断と委任関係を 6 ヶ月後でも再現できる。コンプライアンスグレードの監査証跡として、Mythos 級時代の防御線が成立する。

定義

Lemma での実装

Mythos 級攻撃の前に、AI 判断を遮断する。