検証可能AI

プロヴナンス

Provenance — 来歴証明

データ・モデル・判断がいつ・誰によって・何を入力として生成されたかを、改ざん不能に追跡・検証する仕組み。検証可能 AI の入力層であり、Lemma の中核柱の一つ。

定義

プロヴナンス (来歴) は、あるオブジェクトが「どこから来て」「どのような変換を経たか」を示す関係グラフを指す。概念モデルとしては W3C PROV (PROV-DM / PROV-O) が標準化されており、entity (対象) / activity (操作) / agent (実行者) の三項を時間順に結ぶ。

ドメインごとに具体化された標準が並走する。メディア領域では C2PA がコンテンツ来歴 (撮影・編集・AI 生成) の署名チェーンを定義する。ソフトウェア領域では SLSA がビルド来歴を、SCITT が透明性ログを規定する。AI 領域では学習データ・モデル・推論履歴の来歴を一貫して扱う標準がまだ確立しておらず、ここに検証可能 AI が入る。

重要なのは、プロヴナンスが「記録」ではなく「証明可能な来歴」であることだ。単なるログは事後に書き換え可能であり、規制上・法的に意味を持たない。来歴の各段階を コミットメント と署名で固定し、暗号的に一意に紐づけることで、はじめて第三者検証に耐える。

Lemma Oracle での実装

Lemma は来歴を docHash + メタデータ・コミットメントの組として固定する。docHash は文書のバイト列ダイジェスト、メタデータは時刻・著作者・直前来歴へのリンクを含む。チェーン全体が単一のハッシュに収束し、後段の ゼロ知識証明 でその存在のみを公開できる。

選択的開示 を組み合わせることで、来歴の全段階を相手に渡さず、必要な属性 (例: 「製造業者は EU 域内」「データ取得日が規制発効後」) だけを取り出して証明できる。GDPR・営業秘密・国家機密を保ったまま規制適合を成立させる経路はここから生まれる。

Lemma Civic では行政データ、Lemma Critical では製造業のサプライチェーン部品、Lemma Compliance では顧客属性、検証可能 AI 領域では RAG が参照する文書群に対して、同一の来歴インフラを適用する。

始める

来歴を、組織横断の事実にする。