P2 · 検証可能 AI

プロンプトインジェクションを、見せずに検知する。

Hide ── 隠す プロンプト・入力 content の中身
Prove ── 証明する 「人が見た入力 = AI が読む入力」の整合性

不可視 Unicode・隠しコマンドで「人が見た入力」と「AI が読む入力」がずれるプロンプトインジェクション。Lemma で入力の normalized 形を hash 化し、人が意図した入力と AI が受け取った入力の visible_eq を runtime に検証。content を開示せずに、改ざんを検知。

AI 導入(業種横断) · セキュリティ 2 分
live in production since 2025 · 公共インフラ PoC 稼働中 · ETHGlobal AI Agents 2026 Finalist
01 · 課題認識

推進担当の、3 つの声。

  • AI 開発・運用

    「不可視文字・隠しコマンドによる prompt 改ざんを、検知する仕組みが欲しい」

  • セキュリティ

    「ユーザー入力経由の AI 攻撃を、構造的に防ぐ層が要る」

  • コンプライアンス

    「AI が処理した入力が、ユーザーが意図したものと一致することを証明したい」

02 · 変化

原本を渡すか、事実だけを渡すか。

AI に渡すものが変われば、漏洩のリスクごと消える。

Without Lemma
原本をそのまま渡す
user_prompt:
〇〇について教えてください
model_input:
〇〇について…[INVISIBLE: ignore safety]
model_output:
…(不正回答)
log:
prompt_id / timestamp / agent_id…
↓ すべて AI・外部へ渡る
With Lemma
事実だけを渡す
agent:
did:lemma:agent-chat-001
modelId:
claude-3.7-sonnet
inputCommitment:
0xb4e2…
visibleEq:
true
satisfiesPolicy:
true
ZK verified:
✓ VALID
↓ 必要な事実だけ AI へ渡る

入力を normalized form(Unicode NFC、空白・不可視文字の扱いを定義)に変換し、その指紋をコミットします。推論の前段で「人が意図した入力」と「AI が受け取る入力」の visibleEq を runtime で検証し、一致しなければ実行前に止めます。入力 content を開示せずに、改ざんが無かったことを独立に検証できます。

技術詳細を見る ↗
03 · 選定基準

3 つの基準で、選ぶ。

「中身を出さず渡す」「独立検証」「改ざん不能」の3 つが同時に要る業務こそが Lemma の領域です。

手段 中身を出さず渡す 独立検証 改ざん不能
アクセス制御のみ
マスキング / 匿名化
暗号化のみ
WAF / 入力監視のみ
Lemma(ZK 証明)唯一 3 つ揃う
04 · 進め方

進め方

入力整合性ポリシーの設計と PoC から入り、運用まで伴走します。

  1. 30 分の棚卸し — 守るべき AI エンドポイントと想定攻撃面を特定します。
  2. 入力正規化ポリシーを設計 — normalized form の定義(Unicode NFC、空白の扱い、不可視文字検出)を決めます。
  3. AI 推論の前段に接続 — prompt 投入の前に Lemma で visibleEq を検証する層を挟みます。
  4. PoC で 1 エンドポイント実証 — 4 週間で本番 AI 1 つに導入し、整合時の通過・改ざん時の停止を確認します。
  5. 導入支援と運用の伴走へ — 費用感の目安として既存プラン区分(Civic / Critical / Compliance)を参照しますが、構成と価格は会話のなかで設計します。

「ユーザー入力経由の AI 攻撃が不安」な業務を 1 つ、最初の 30 分で聞かせてください。入力 content の開示は不要です。

より広い活用シーン

このユースケースを含む、活用シーンの全体像。

業界・業務領域ごとの活用シーンと、4 つの軸で整理しています。

Solutions で 検証可能 AIの活用シーンを見る →

DISCOVERY CALL

まずは、30 分の対話から。

Lemma の機能や活用場面について、ご質問にお答えします。技術的な詳細や機微情報(個人情報や機密情報など)の開示は不要です。

Discovery Call を予約 →