Lemma Critical Brief · No. 011

SynthID 透かしのリバースエンジニアリング

AI 生成コンテンツの来歴標識が統計的に剥がせる構造

Pillar 01 · 来歴証明 Data Provenance AI Decision Integrity
事案日
2026-03-05
公開日
2026-05-31
発行
Lemma Critical Team
関連 Pack
Pack AIncident Response

TL;DR

2026 年 3 月、独立研究者 Alosh Denny が、Google DeepMind の AI 生成画像向け透かし SynthID を reverse-engineering し、手法と実装を GitHub に公開した。攻撃はニューラルネットも proprietary access も使わず、123,000 枚の Gemini 生成画像に対する 2 次元フーリエ変換と位相コヒーレンス解析(phase-shift attack)のみで、透かしエネルギーの 約 91% を除去しながら画質をほぼ維持した(PSNR 43.5 dB / SSIM 0.997、解像度非依存)。これは特定組織への攻撃ではなくセキュリティ研究の実証だが、AI 生成コンテンツの来歴を「成果物に埋め込む標識」として担保する設計が、標識自体を統計的に剥離・偽造され得るという構造を露呈した。本 Brief は Pillar 01(来歴証明)の観点から、透かし(detection 的マーキング)と暗号的来歴証明の橋渡し不能性を扱う。


事案概要

  • 対象システム: Google DeepMind SynthID(AI 生成画像に不可視透かしを埋め込み、検出 API で AI 生成か否かを判定する仕組み。Gemini 生成画像が対象)
  • 実証者: Alosh Denny(独立研究者)
  • 公表形態: 手法・コード・結果を GitHub(aloshdenny/reverse-SynthID)で公開。テキスト版検出を対象とする reverse-SynthID-text も併存。技術コミュニティ(Hacker News 等)で議論
  • 時期: 2026-03-05(公開 disclosure、Medium 「How to Reverse SynthID (legally😉)」公開時点。GitHub 初コミットは 2025-12-15、Hacker News 議論は 2026-04-11 前後)
  • 手法: ニューラルネット不使用・proprietary access 不使用。123,000 枚の Gemini 生成画像を用い、SynthID が固定 carrier 周波数を一定位相で符号化する性質を観測。多数画像を平均して透かしの周波数領域シグネチャ(鍵に相当するパターン)を抽出し、phase-shift attack で当該周波数を狙って無効化
  • 結果: 透かしエネルギーの約 91% を除去、画質はほぼ無損(PSNR 43.5 dB / SSIM 0.997)、任意解像度の Gemini 画像で再現
  • 性質: 攻撃 incident(被害組織・被害額のある事案)ではなく、来歴標識の構造的限界を示すセキュリティ研究の実証

タイムライン

  • 2025-12-15: Alosh Denny が GitHub repo aloshdenny/reverse-SynthID を非公開で立ち上げ(dev 開始)
  • 2026-03-05: Medium 「How to Reverse SynthID (legally😉)」で reverse-engineering 手法を公開 disclosure
  • 2026-04-11 前後: Hacker News(item 47709130)で議論拡大、技術コミュニティ横断で関心が広がる
  • 2026-04 以降: 同手法を踏まえた SynthID 透かし bypass ツールの存在が一般メディアでも報道(MediaNama 等)
  • 2026-08-02: EU AI Act の AI 生成コンテンツ透かし義務(透明性要件)適用開始予定。透かしが規制要件化する局面と、透かしの剥離可能性が実証された局面が重なる

事象連鎖(手法の分解)

  1. 観測(Observation): SynthID が画像群に対し固定 carrier 周波数を一定位相で符号化していることを特定。透かしが出力間で一貫しているため、複数画像にわたり共通の周波数領域シグネチャが現れる
  2. 鍵抽出(Key extraction): 多数の Gemini 生成画像(実証では 123,000 枚)のノイズを平均し、共通パターン=透かしのシグネチャを分離。proprietary access なしに「鍵に相当するもの」を統計的に復元
  3. 除去(Removal): phase-shift attack により、透かしが存在する特定周波数を狙って位相を操作し、標識を無効化。画質に視認可能な損傷を与えずに透かしエネルギーの約 91% を除去
  4. 偽造可能性(Forging surface): 透かしのシグネチャが復元される以上、除去の逆操作——非 AI 生成コンテンツへの透かし注入(misattribution)——も同じ原理で成立し得る。透かしの「有無」が真正性の判定基準である限り、両方向の改ざんが脅威になる

構造的論点

本事案は Pillar 01(来歴証明)の data-provenance カテゴリに属する。中心的な失敗 primitive は、AI 生成コンテンツの来歴が「成果物そのものに埋め込まれた標識」として担保されており、その標識が成果物と同じ統計的特性を持つために、外部から観測・抽出・除去・偽造され得る点にある。来歴の主張(この画像は AI 生成である / ない)が、それを独立検証する別系統の証明と切り離されている。secondary に ai-decision-integrity を併記し、AI 出力の検証可能性(Pillar 02)との straddle を記録する。

本事案は、Brief 008(Discord scraping)に続く「攻撃 incident ではない信頼層リスク事象」の事例である(Methodology の射程拡張に基づく)。Brief 008 が公開 API + ToS を通じた訓練データの来歴の問題を扱ったのに対し、本事案は AI 生成 出力 の来歴標識の問題を扱う。両者は「データ / コンテンツの来歴が、それを検証する独立 layer を欠く」という構造で同根。Brief 005(Noroboto、フォント偽装による AI 文書レビューの誤誘導)とも、コンテンツの真正性の主張が独立検証されないという論点で隣接する。前者は AI への入力、本事案は AI からの出力という対称性を持つ。


Detection 層では届かない構造的 gap

透かしと、その検出 API は、AI 生成コンテンツのラベリング・コンテンツモデレーション・初期スクリーニングに有用であり、本 Brief がその役割を否定するものではない。大規模に「AI 生成らしさ」を判定する層として、透かしは実務的な価値を持つ。

一方で、透かしは標識を成果物の内部に埋め込む detection 的アプローチであり、標識が成果物と同じ信号空間に存在する以上、十分な観測量があれば統計的に分離・除去・偽造され得る。本事案はその構造を実証した。受信側が「この画像は本当に当該モデルが生成したものか」を判定する基準が透かしの有無である限り、攻撃者は除去(来歴の消去)と注入(来歴の偽造)の双方を行える。規制報告・訴訟・コンテンツ真正性の立証で「透かしが無い = 非 AI 生成」「透かしが有る = 当該モデル生成」と扱うことは、独立した証跡を伴わない。学術側でも汎用的な透かし除去・偽造攻撃(例: USENIX Security 2025 の UnMarker、arXiv の Warfare)が 2023–2026 年に相次いで示されており、本事案は孤立した事例ではない。

事前証明(pre-execution / pre-distribution attestation)は、コンテンツの来歴を成果物に埋め込む標識ではなく、生成主体が「この成果物は正規の origin によって生成された」ことを独立検証可能な暗号証明(署名付き manifest や ZK origin proof)として付与し、受信側が proof を検証する設計を採る。proof は成果物の信号空間の外側にあり、統計的平均化で抽出できる「埋め込み標識」ではない。透かし(detection)と暗号的来歴(proof)は代替ではなく 補完 の関係にある(検出と事前証明の thesis は 「AI 時代のサイバー防衛に残された、最後の層」(Lemma、2026-05)を参照)。


対応経緯と業界動向

  • Google DeepMind: SynthID は AI 生成コンテンツの識別を目的とした透かし技術として提供されている。本事案を受けた公式 statement は公式チャネル(blog / press release)から独立に確認できなかった。一部の二次報道(techbuzz.ai、stork.ai 等)は The Verge を典拠として Google が SynthID 侵害認識を否定したと記述するが、典拠記事を本 Brief で独立確認できないため確定情報としては扱わない。透かしの堅牢性をめぐる議論への DeepMind の関与は今後の論点
  • 規制動向: EU AI Act は AI 生成コンテンツへの透かし / 透明性要件を 2026-08-02 から適用予定。透かしが規制上の必須要件になる局面と、透かしの剥離・偽造可能性が実証された局面が重なり、「透かしを義務化すれば来歴が担保される」という前提自体が問われている。AI 画像生成器のうち十分な透かしを実装しているのは一部にとどまるとの学術報告もある
  • 学術動向: 生成コンテンツ向け透かしへの攻撃研究が 2025–2026 年に増加。UnMarker(USENIX Security 2025)は防御的透かしへの汎用攻撃を初めて提示したとされ、本事案はこの流れの中の具体的実証に位置づく

「AI 生成コンテンツの来歴をどの層で担保するか」は、透かしの規制要件化と剥離可能性の実証が同時に進む中で、業界横断の論点として顕在化している。


Lemma による分析

本事案で露呈した構造的 gap(来歴を成果物に埋め込む標識は、成果物と同じ信号空間に存在するため統計的に剥離・偽造され得る)に対して、Lemma は、コンテンツの来歴を埋め込み標識ではなく、生成主体による独立検証可能な暗号証明として固定する設計を提示している。来歴の証明は成果物の信号空間の外側に置かれ、平均化や周波数操作で抽出できる「鍵」を成果物内に残さない。標識が剥がされても、proof は別系統で「この成果物は正規の origin の下で生成された / 生成されていない」を告げる構造である。設計の詳細は 「2026 年のブリッジ事象が示しているもの — 来歴証明というカテゴリについて」(Lemma、2026-04)および 「Proof-as-Auth: 鍵を一度も送らずにサインインする」(Lemma、2026-05)、リファレンス実装は verifiable-origin proof sample(GitHub)を参照のこと。


Sources

Cite this Brief

この Brief を引用する

Lemma Critical Team. (2026).
"SynthID 透かしのリバースエンジニアリング — AI 生成コンテンツの来歴標識が統計的に剥がせる構造".
Lemma Critical Brief No.011. Lemma / FRAME00, Inc.
https://lemma.frame00.com/ja/critical/briefs/011-synthid-watermark-reverse-engineering/

Brief 配布について

Lemma Critical Brief は Lemma が発行する threat intelligence brief です。本資料は公開情報の構造化分析であり、特定の組織への監査・診断・推奨ではありません。意思決定の参考として用いる場合は、貴組織の Lemma Critical 担当に直接ご相談ください。