家庭のテレビが、AI 学習向けスクレイピングの中継ノードにされていた(Bright Data SDK)

収集データと中継トラフィックの出所・同意が、独立検証されない構造(Include Security)

事案日
2026-06-05
公開日
2026-06-16
発行
Lemma Critical Team
関連 Pack
Pack AIncident Response

TL;DR

リビングのスマートテレビは、たいてい電源が入りっぱなしで、速い回線につながり、使い放題で、誰も画面を見ていない時間が長い——AI 学習用データの収集にとって、これ以上ない中継拠点になる。2026 年 6 月、研究者(Include Security と独立研究者 Buchodi)は、データ事業者 Bright Data が無料アプリに組み込む SDK をリバースエンジニアリングし、その SDK が常時稼働のスマートテレビを含む機器を、Web スクレイピングのトラフィックを中継する exit node に変えていることを示した。スクレイピングは Bright Data の顧客の IP ではなく、家庭の IP から出ていく。Bright Data は「世界最大級の住宅用プロキシ網(4 億超の住宅 IP を広告)」を運営し、その一部を「同意に基づく 1.5 億超の IP プール」として、無料アプリ内のオプトイン画面の背後で供給する。だが解析によれば、オプトイン画面の表示と SDK が実際に許す挙動は一致せず(ある Roku アプリは「ときどき」と表示しつつ、SDK 設定は月 200GB まで許容)、中継ジョブを運ぶ通信は実質的な認証を欠き、iOS では設定済みの VPN を迂回する。本事案を Pillar 01(来歴証明)の観点から、AI 学習に向かう収集データと、その中継トラフィックの出所・同意が、収集の時点で独立検証されない構造として分析する。本 Brief は個々の主体の非難を目的とせず、来歴と同意の検証不在という構造を扱う。Brief 008(公開≠同意)・036(学習データに混入した個人情報)・011(来歴標識)に連なる。


事案概要

  • 何が示されたか: 研究者が、Bright Data が消費者向けアプリに組み込む iOS SDK をリバースエンジニアリングし、機器(常時稼働のスマートテレビを含む)を、Bright Data が AI 業界向けに販売する Web スクレイピング事業の exit node に変える仕組みを文書化した
  • 公開: 2026-06-05、Include Security と独立研究者 Buchodi。スマートテレビという切り口は 2026-02 に Lowpass(The Verge が配信)が先行し、本件はその技術的解析にあたる
  • 事業の構図: Bright Data は Luminati の後継。広告上 4 億超の住宅 IP を擁する住宅用プロキシ網を運営し、その供給の一部が、無料アプリ内のオプトイン画面の背後で配布されるこの SDK 由来(「同意に基づく 1.5 億超の IP」と説明)
  • 核心のリスク: 乗っ取られたアカウントや盗まれたデータが主眼ではない。家庭の回線と帯域が、第三者のスクレイピング基盤として使われること、そして AI 学習へ向かうデータが、その出所と同意を独立検証されないまま収集されることにある
  • 検証された技術的弱点:
    • 中継ジョブを運ぶピア通信に実質的な認証がない(「多くのマルウェアより弱い」と評される)。解析対象は iOS の brdsdk.framework v1.532.120、30 日間の TLS インターセプトによる観測を含む
    • iOS では、そのトラフィックが設定済みの VPN を迂回し、通常のアプリ監視ツールに多くが現れない。バッテリーが低くない限り、視聴中・通話中も背景で中継を続ける
    • 同意の落差: オプトイン画面の表示と SDK が許す挙動が一致しない。Roku アプリ Petflix は「ときどき」利用すると表示する一方、SDK 設定は月 200GB まで許容(ウズベキスタン・オマーンなど一部の国では上限がさらに高い)。SDK は同一事業者のアプリを動かす本人のスマートフォンと PC を 1 ユーザーとして束ねうる

タイムライン

  • 2015: Bright Data の前身 Luminati(Hola VPN 由来)が、無料ユーザーの帯域を exit node として 1GB あたり 20 ドルで販売していたことが指摘される(同一モデルの起点)
  • 2025-10: Krebs on Security が、Aisuru 等のボットネット由来プロキシが大規模な AI データ収集を支えていると報告(機器を乗っ取る側)
  • 2026-01: Google が犯罪的プロキシ網 IPIDEA を解体
  • 2026-02: Lowpass(The Verge 配信)がスマートテレビの切り口を先行報道
  • 2026-06-05: Include Security と Buchodi が iOS SDK の技術的解析を公開
  • その後: Google・Amazon・Roku が背景プロキシ SDK を制限し、Bright Data は当該プラットフォームから撤退。ただし Samsung の Tizen と LG の webOS は引き続き対象として掲載

注: スマートテレビへの到達は、Bright Data のプラットフォーム対応・公開パートナー一覧・先行報道に基づく(最深の技術的証拠は iOS SDK のもの)。Bright Data はパートナー一覧を公開するが、研究者は「一覧掲載は過去に協業した事実を示すのみで、当該アプリが現時点で SDK を含むとは限らない」と注意を促している。本文は個別アプリの断定をしない。


事象連鎖:収集データと中継の出所・同意が検証されないまま

本事象は、AI 学習に向かう収集データと、その中継トラフィックの出所・同意が、収集の時点で独立検証されないことに起因する。経路は以下の通り。

  1. 同意の取得: 無料アプリのオプトイン画面で、機器と回線を「ときどき」使うといった表示のもとに同意が取られる。表示の粒度と、SDK が実際に許す挙動(月 200GB 等)は一致しない
  2. 中継ノード化: アプリ起動時、SDK が Bright Data のサーバーに接続し、十分な確認のないまま指示を受け取る。以後サーバーは、家庭の回線を使って他サイトのページを取得させられる
  3. 検証不能な中継トラフィック: 中継ジョブを運ぶ通信は実質的な認証を欠き、iOS では VPN を迂回し、監視ツールに現れにくい。トラフィックの出所(この機器は真に同意した中継か)は外部から独立に確かめられない
  4. AI 学習への供給: 住宅 IP 由来のスクレイピング結果が、AI 業界向けのデータとして供給される。収集されたデータの出所・同意(誰の何を、どの同意のもとで集めたか)は、受け手の側で独立検証されない
  5. 事後の制限: プラットフォーム各社が背景プロキシ SDK を制限し、研究者が遮断手段(DNS レベルのブロック等)を示す。これは収集と中継が動いた後に作動する事後の系列である

構造的論点

本事象は Pillar 01(来歴証明)の data-provenance カテゴリに属し、secondary に training-data-provenance(AI 学習データの来歴)を併記する。中心的な失敗 primitive は、AI 学習へ向かう収集データと、その収集を担う中継トラフィックの出所・同意が、収集の時点で独立検証可能な証跡として固定されていない点にある。同意は「ときどき使う」という表示として取られるが、SDK の実挙動(月 200GB の中継)とは結びつかず、同意の属性が実際の行動に対して検証できない。

本事案は Brief 008(公開 API 経由の Discord スクレイピングが AI 学習データとして再配布される)と同型で、「公開・同意の体裁」と「独立検証可能な来歴」が切り離されている構造である。008 が「公開=同意ではない」、本事案が「オプトインの表示=実挙動への同意ではない」という、同じ thesis の別断面にあたる。Brief 036(128 億枚の AI 学習データにパスポート・履歴書・顔が混入し、収集の時点で来歴と同意が検証されていなかった)とは、収集時点の来歴検証不在という primitive で直接つながる。Brief 011(AI 生成物の来歴標識が剥がせる)とは、来歴が独立検証可能な形で固定されない点で連なる。

本事案が際立たせるのは、収集インフラの来歴という層である。データの中身だけでなく、「そのデータがどの IP から・どの同意のもとで・どの経路で集められたか」という収集の来歴が検証されないとき、住宅 IP は本人の知らないうちに第三者のスクレイピング基盤になり、AI 学習データはその出所を問われないまま流通する。事後の遮断やプラットフォーム制限は、来歴を行動の前に固定する層とは別系統である。


検出と証明の落差

研究者によるリバースエンジニアリング、DNS レベルの遮断手段の提示、プラットフォーム各社による背景プロキシ SDK の制限は、被害の可視化と抑止に不可欠であり、本 Brief がその役割を否定するものではない。技術的解析と遮断は、家庭の機器が中継に使われる事態への重要な歯止めである。

一方で、検出は「この中継トラフィックは、真に同意した出所から発しているか」「この AI 学習データは、検証可能な来歴と同意のもとで収集されたか」を、収集の時点で独立に立証する材料にはならない。住宅 IP からのスクレイピングは、ふつうの家庭利用と区別がつきにくく(だからこそ datacenter IP を弾く対策を回避できる)、収集されたデータの出所も受け手の側からは見えない。事後に遮断アドレスを示せても、すでに動いた中継と流通したデータの来歴は遡って固定できない。欠けていたのは、「この中継は同意した機器に由来し、このデータはこの出所・同意のもとで収集された」ことを、収集の時点で独立検証可能な証跡に固定する仕組みであり、これは事後の遮断・制限とは別系統である。

事前証明(pre-execution attestation)の発想は、データ収集を「事後に出所を推測する」から「収集の時点で、出所と同意を独立検証可能な証跡にバインドする」へ反転させる。中継トラフィックを、真に同意した機器の証明に紐付け、収集データをその出所・同意の来歴にバインドすれば、来歴・同意の証明を欠くデータは、AI 学習へ取り込む前に検証で弾ける。収集インフラの検出(detection 的な「どの機器が中継しているか」)と来歴の証明(「このデータはどの出所・同意のもとで集められたと独立検証できるか」)は代替ではなく 補完 の関係にある(検出と事前証明の thesis は 「AI 時代のサイバー防衛に残された、最後の層」(Lemma、2026-05)、行為の時点で来歴を独立検証する考え方は 「Proof-as-Auth: 鍵を一度も送らずにサインインする」(Lemma、2026-05)を参照)。


対応経緯と業界動向

  • プラットフォーム / 事業者: Google・Amazon・Roku が背景プロキシ SDK を制限し、Bright Data は当該プラットフォームから撤退(Samsung Tizen・LG webOS は引き続き掲載)。研究者は DNS レベルの遮断手段を提示。ただしモバイル回線ではオフィス Wi-Fi を迂回するため、ネットワーク遮断だけでは捕捉しきれない
  • 同意の意味の論点: 機器を乗っ取るボットネット型プロキシ(Aisuru・IPIDEA 等)と、オプトイン同意を掲げる事業者型プロキシの違いは「同意」にあるが、表示と実挙動が一致しないとき、その同意が実質的かは未決の問いとして残る
  • 業界横断の論点: anti-bot 対策が datacenter IP を弾くため、AI スクレイピングは住宅回線へ移っている。収集データの出所・同意と、収集インフラ(中継トラフィック)の来歴を、収集の時点で独立検証する要請が、AI 学習データのサプライチェーン全体で浮上している

収集データと収集インフラの来歴・同意を、収集の時点で独立検証する層の不在は、特定の事業者の問題ではなく、AI 学習データを扱う組織横断の課題として残っている。


Lemma による分析

本事象で露呈した落差(AI 学習へ向かう収集データと中継トラフィックの出所・同意が、収集の時点で独立検証されない)に対して、Lemma は、データとその収集経路を、収集の時点で独立検証可能な暗号証明として来歴にバインドする設計を提示している。

  • 収集データの来歴バインド: AI 学習へ取り込むデータを docHash でその出所・収集経路に来歴バインドし、「このデータはどの出所・どの同意のもとで収集されたか」を独立検証可能にする
  • 同意属性の証明: 「ときどき使う」といった表示ではなく、実際の収集・中継挙動に対して検証可能な同意属性を、収集の時点で証跡化する。表示と実挙動の乖離を、同意の検証で塞ぐ
  • 来歴なきデータのゲート: AI 学習・流通への取り込みを、出所・同意の独立検証可能な証明を満たした場合に限る設計を志向する。来歴・同意の証明を欠くデータは、取り込みの前に弾かれる
  • 選択的開示: 個人の機器・行動の詳細を出さずに、「このデータは検証可能な出所・同意のもとで収集された」ことだけを最小開示し、来歴検証とプライバシー保護を両立する

これにより、収集の時点で固定された証明が、「この学習データは、検証可能な出所と同意のもとで集められたか」を、事後の遮断・制限に依存せず独立検証可能なトレイルとして機能させる。検出(事後の解析・遮断・プラットフォーム制限)は被害の是正に、事前証明(収集時点の来歴・同意の独立検証)は AI 学習データの信頼確立に、それぞれ相補的に働く。設計と適用範囲は、Pillar 01 — 来歴証明 および ユースケース一覧 を参照のこと。


Sources


Brief 配布について

Lemma Critical Brief は Lemma が発行する脅威インテリジェンス・ブリーフです。本資料は公開情報の構造化分析であり、特定の組織への監査・診断・推奨ではありません。意思決定の参考として用いる場合は、貴組織の Lemma Critical 担当に直接ご相談ください。

Discovery Call → ホワイトペーパー → ✉️ ニュースレター →


(c) 2026 FRAME00, INC. — Built for decisions that matter.

Lemma Critical Monthly

実際に起きたリスク事案の構造分析(Critical Brief)を軸に、検出の先に必要な「証明」への視点を月 1 回お届け。

ニュースレターを購読
Cite this Brief

この Brief を引用する

Lemma Critical Team. (2026).
"家庭のテレビが、AI 学習向けスクレイピングの中継ノードにされていた(Bright Data SDK) — 収集データと中継トラフィックの出所・同意が、独立検証されない構造(Include Security)".
Lemma Critical Brief No.063. Lemma / FRAME00, Inc.
https://lemma.frame00.com/ja/critical/briefs/063-smart-tv-residential-proxy-ai-scraping/