TL;DR

ここ数週間、金融業界の信頼インフラを巡って 3 つの独立した動きが同時に走っている — Anthropic による業務 AI の中核浸透、米欧日 3 ジオの規制当局による AI 判断の説明責任議論、DeFi クロスチェーン・ブリッジの大規模流出事案。表面的には別々の話題に見えるが、並べると、ひとつの形が繰り返し現れる。境界をまたぐ意思決定で「暗号学的に正しい」と「意味的に正しい」が分離する、という形である。Lemma はその分離を埋めるレイヤー — pre-execution attestation(コミット前検証)— を作っており、直近 2 週間で、誰でも動作確認できるリファレンス実装を 2 本、公開している。

暗号学的に正しい ≠ 意味的に正しい。

▸ 業務 AI が金融機関の中核に到達した瞬間

ここ数日、Anthropic 社が金融サービス向けの AI エージェント展開を一気に加速させた。ピッチブック作成、KYC スクリーニング、クレジットメモ起草、決算レビュー、月次決算など、金融機関の中核業務を対象とした 10 種のエージェント・テンプレートが、Claude Cowork、Claude Code、そして Claude Managed Agents 上で動くリファレンス・アーキテクチャとして公開されている。Microsoft 365(Excel・PowerPoint・Word)にも組み込まれ、Moody's をはじめとする金融データプロバイダとの連携も同時に発表された。金融特化のサービス展開と並行して、大規模な投資・パートナーシップ枠組みも組み立てられている。

エージェントが pitchbook を組み、KYC ファイルを判定し、月次決算を回すという運用が、本格的に始まろうとしている。

ここで CISO、IT 責任者、リスク管理責任者にとっての論点を整理したい。業務 AI 化の議論が一段加速したことで、もう一つの問いが同じ重さで立ち上がっているからだ。エージェントが書類を起こし、判定を下し、決算を閉じるとき、半年後・1 年後の検査や訴訟で 「あの判定は、どのデータを参照し、どのルールを適用し、どのモデル世代が下したのか」を再現可能な形で答えられるか。これは AI 採用と必ず並行して立ち上がる質問になる。

▸ 3 つの動きが同時に走っている

少し視野を広げて見ると、ここ数週間、金融業界の信頼インフラを巡って、複数の独立した動きが同時に走っている。Anthropic の一連の動きはその一つだが、隣接して動いているものを見ておくと、論点の輪郭が立ち上がる。

規制・政策当局の動きとしては、Anthropic 製の攻撃 AI モデル「Mythos」を契機に、米財務省・FRB が大手銀行 CEO を緊急招集、Anthropic 自身も米欧主要金融機関に限定提供する Project Glasswing を立ち上げた。日本でも 4 月 24 日に片山金融担当相が日銀・3 メガバンク・全銀協・JPX を集めた緊急会合を開催し、「日本版 Project Glasswing」設置の議論も始まっている。米国(財務省・FRB)、欧州(Glasswing の限定提供圏)、日本(金融担当相 × 日銀 × 銀行業界)— AI 判断の説明責任をどう制度化するかが、3 ジオの規制当局で同時に俎上に乗っている。

DeFi 領域の動きとしては、複数のクロスチェーン・ブリッジエクスプロイト事案が報告された。なかでも Kelp DAO / rsETH の事案では、約 $292M が 1-of-1 DVN 構成下で 46 分以内に流出している。これらの攻撃で使われたトランザクションは、いずれも暗号学的にはすべて有効だった。鍵漏洩でもバグでもない。受信側が「そのトランザクションが本当にそこから来たのか」を検証する手段を持たないまま処理を確定させたため、検知時点では既に資産が動いていた。

そして Anthropic の動向。業務 AI 化が金融機関の中核ワークフローに本格的に入ろうとしている。

▸ ひとつの形が繰り返し現れる

これら 3 つの動きは、表面的には別々の話題に見える。並べて見ると、ひとつの形が繰り返し現れる。境界をまたぐ意思決定で「暗号学的に正しい」と「意味的に正しい」が分離する — この形が、3 つの動きのどれにも現れている。業務 AI が金融機関の判断を下す境界、攻撃 AI と防御 AI が出会う境界、ブリッジを介した資産の移転が起きる境界。どの境界でも、署名は通る、でも中身は違う、という事態が起きる。形式の正しさと意味の正当性は、どの境界でも別の話になる。

事後に追跡し、事後に凍結し、事後に説明する。これらの仕事は重要で、業界は長年それに投資してきた。それでも、コミットの瞬間そのものに「これは本当に正当な状態遷移か」を受信側が独立に検証する層は、ずっと薄いままだった。今、業務 AI 化の波が金融機関の中核に到達しようとしているタイミングで、この層の不在が同時に意味を持ち始めている。

▸ Lemma Oracle が何を作っているか

この層の不在を、私たちは構造的な問題として捉えている。Lemma Oracle が何をするツールかを、その問題に対する仮説と実装として、できるだけ短く説明したい。

Lemma は、AI が業務上の判断を下すとき、また異なるシステム間で状態が遷移するとき、その判断・遷移の 来歴(誰が/どのデータを/どのルールで/どのモデルで)を改ざん不可能な形で残し、受信側がコミット前に独立検証できる インフラである。技術的には零知識証明(ZK 証明)と暗号学的なコミットメント、オンチェーンの永続化を組み合わせている。

金融サービスの文脈で何ができるかを具体的に言うと、たとえばこうなる。

私たちはこのレイヤー全体を pre-execution attestation(コミット前検証) と呼んでいる。EDR や SIEM が「止める・見る」レイヤーで、フォレンジクスや SOC が「事後追跡する」レイヤーだとすれば、これは 「コミット前に検証する」レイヤー である。役割が異なるので既存ツールと競合せず、両方が揃って初めてレジリエンスが成立する。

直近 2 週間で、私たちは 2 本のリファレンス実装を公開している。

Trust402(4/28 公開) — x402 決済プロトコル上にエージェント間の支払いと ZK 属性証明を統合したリファレンス。Base Sepolia 上で npm i @lemmaoracle/sdk から動かせる。

example-origin(4/30 公開) — ブリッジ/LRT 文脈の Kelp DAO / rsETH シナリオで、コミット前検証のエンドツーエンドのパイプラインを動かすリファレンス。Poseidon over BN254 + Groth16 の ZK 証明を実プルーフ生成で走らせる。pnpm demo で 5 分以内に検証パイプラインを体験できる。

両方ともコードと、設計判断を解説したエッセイがセットで公開されている。リンクは末尾に。

▸ 3 つの動きを横断して残るもの

3 つの動きを横断して、命題はひとつに収斂する。Anthropic の一連の動向は、業務の AI 化が普及段階に入る合図である。同時に、AI 判断の来歴を制度的・技術的に整える必要性が、同じ動きの中から浮かび上がっている。

AI モデルは半年で世代交代する。Mythos の次は半年後に必ず来る。一方、判断の来歴を残す検証規格は、標準化されれば次のモデルにも持ち越せる。これが、業務 AI 化を一過性の流行ではなく、十年単位の制度的資産として根付かせる条件である。

Models change. Proofs remain. — モデルは変わる、証跡は残る。

▸ Resources

金融機関 CISO・IT 責任者、規制対応担当、x402 / MCP / agent commerce builder の方へ、3 つの具体的な次のステップ:

Built for decisions that matter.