コンテンツに移動
Transform with Google Cloud

クラウドとその影響: インターネット検閲データは変革の時代へ

2023年12月4日
https://storage.googleapis.com/gweb-cloudblog-publish/images/GettyImages-172400662.max-2600x2600.jpg
Google Cloud Japan Team

Censored Planet Observatory、検閲データの分析方法をより有益なものに変換

※この投稿は米国時間 2023 年 10 月 27 日に、Google Cloud blog に投稿されたものの抄訳です。

インターネット アクセスが世界中で普及するに従い、政府機関はそのようなアクセスのコントロールを求めるようになりました。かつては抑圧的な政権のものだった戦術が、意外な国々でも実施されています。たとえばイタリアでは、無料電子書籍ウェブサイト Project Gutenberg へのアクセスを政府がブロックしています。

イタリア政府は、『ロミオとジュリエット』、『白鯨』、『眺めのいい部屋』など 70,000 冊のデジタル版書籍の無償提供に反対しています。インターネット上のコンテンツを政府がどのようにブロックしているかを測定し追跡しているミシガン大学の研究者チーム Censored Planet Observatory によると、これはインターネット検閲に該当します。Censored Planet はそのデータを取得し、Google の Jigsaw と連携して、Google Cloud インフラストラクチャを活用することで、処理されたデータを探索するための公開ダッシュボードを提供しています。

Jigsaw のエンジニアリング マネージャー Vinicius Fortuna によると、目標は、検閲データにアクセスしやすくし、役立つものにすることです。「情報がどのようにコントロールされているのかを知ることは、社会の発展に役立ちます。政府機関の透明性を当てにするだけでは不十分です」と Fortuna は言います。「私たちは、研究者がこうした公開データセットを利用して行動を起こせるよう支援しています。」

インターネットを検閲したいという衝動の高まりは、活動家やジャーナリストだけにとっての問題ではなく、インターネット検閲が最も予期されないような国においても、あらゆる組織、企業、業界全体に影響を及ぼすおそれがあります。インターネット検閲の経済的な影響を見積もるのは難しいことですが、インターネット モニタリング組織 Netblocks のツールに基づいた少なくとも 1 つの推計によると、インターネットの途絶や制限が世界経済にもたらした損失は、2019 年以降 440 億ドルを超えています

インターネット検閲はもともと選挙などの政治イベントを中心に行われていましたが、Censored Planet、Open Observatory of Network Interference(OONI)、Internet SocietyAccessNow など、インターネット検閲を監視している組織の活動により、政府機関が医療、教育、商業などのトピックへのインターネット アクセスを制限するために検閲手法を利用し始めていることが判明しました。たとえばトルクメニスタンでは、ウェブホストおよびインフラストラクチャ プロバイダの CloudFlare を政府がブロックしているため、全ウェブサイトの約 20% にアクセスできません。

クラウドで進化する検閲データ分析術

2011 年の「アラブの春」の時点で、インターネット検閲に関する測定値を収集する唯一の手段は、非常に手間のかかるプロセスでした。研究者は、関連データを研究者のサーバーと共有するためのアプリを参加者にインストールしてもらう必要がありました。アナリストは、具体的にどのウェブサイトが検閲されたのか、またはインターネット アクセス全体がブロックされているかどうかを詳しく把握しようと考え、同じ国の多くのユーザーのデータを比較しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Censored_Planet_dashboard_screenshot.max-1100x1100.png
Censored Planet Dashboard について詳しくは、こちらの動画をご覧ください。

「何年も前に、政情不安時の政府機関による検閲に関して信頼性の高いスケーラブルなデータを持つことの価値が、誰の目にも明らかになりました。誰がどのようにブロックされているのかを知りたいと考えました」と語るのは、Censored Planet の創設者でもあるディレクターの Roya Ensafi 氏です。ボランティアに参加してもらうには負担の大きい手作業のプロセスが必要であり、組織がデータを得る上で頼りにしているボランティアを、投獄や身体的危害というリスクにさらすおそれもありました。

Ensafi 氏は「友人や家族にリスクを負わせるのは気が進みませんでした」と言います。「そこで、10 年にわたる研究の過程で、データ収集のためのリスクの少ないアプローチを開発しました。」Censored Planet とその協力者が開発したいずれのリモート測定手法についても、収集するデータの量が(場合によっては指数関数的に)増えました。Censored Planet は現在、200 以上の国で複数のリモート測定手法を使用して検閲データを収集しており、データ量は過去 6 年間で 80 テラバイトを超えました。

イランでは、事実に即した測定を電話で行うのは難しく、危険でした。しかし今では、どのサイトが機能しないのかは除外し、特定の国で何がブロックされているか、またはその国で具体的な変化があったかどうかといった質問に取り組めるようになりました。これは、サイトをブロックしている政府や ISP に圧力をかける際に役立つ可能性があります。

Jigsaw 検閲測定担当リード エンジニア, Sarah Laplante

「妨害を検出すること」を「検閲に対する洞察」へと発展させるには処理能力が必要だと、Ensafi 氏は言います。Censored Planet は収集したデータの分析方法を考え直す必要がありましたが、小規模な研究所としては、長期的なインフラストラクチャに焦点を当てる能力には限界がありました。

Ensafi 氏は「データが多すぎてユーザーの役に立ちませんでした」と言います。「分析情報を抽出し、検閲の分析を民主化しようと考えました。そこで重要な役割を果たしたのが Jigsaw です。」

クラウド コンピューティングの台頭により、Censored Planet は Jigsaw と連携して Censored Planet Dashboard を開発できました。これによりユーザーは縦断的な検閲データを探索し、検閲者の行動や検閲イベントを迅速に把握することができます。また、Censored Planet はインターネット検閲に関する分析が 2011 年以降どのように変化したのかについてのレポートを 2 月に発表しました。

「イランでは、事実に即した測定を電話で行うのは難しく、危険でした」と語るのは、Jigsaw の検閲測定担当リード エンジニア、Sarah Laplante です。「今では、どのサイトが機能しないのかは除外し、特定の国で何がブロックされているか、またはその国で具体的な変化があったかどうかといった質問に取り組めるようになりました。これは、サイトをブロックしている政府や ISP に圧力をかける際に役立つ可能性があります。」

アクセスが検閲されていると感じたインターネット ユーザーが回避ツールを使用する機会も生まれています。たとえば Jigsaw のオープンソース ツール Outline を使用すると、誰でもバーチャル プライベート ネットワークを設定し、自由でオープンなインターネットへのアクセスを共有することができます。

このようなデータを処理できる唯一の方法は、Google Cloud と処理クラウドです。当時はリソースを Google Cloud や他の Google サービスで管理していましたが、私たちのミッションは Jigsaw と相性が良いことがわかりました。よりオープンな連携を実現するには、Google Cloud が適していました。

Censored Planet 創設者 / ディレクター, Roya Ensafi 氏

Censored Planet はウェブサイトの削除やデバイス上の検閲は追跡していませんが、それでもネットワーク レベルの検閲は追跡しているため、豊富な情報が得られています。検閲のシグナルとデータがさらに詳細になり、クラウド テクノロジーが成熟したため、Censored Planet はミッションを変更することになりました。

2018 年に設立された当時、Censored Planet はウェブサイトがブロックされているかどうかに注力していました。今では次のレベルの質問に対する答えを求めています。つまり、サイトはなぜブロックされたのか?どのようにブロックされたのか?いつブロックされたのか?これまでにもブロックされたことがあるのか?誰がブロックしたのか?ということです。研究者にとって重要なことは、これらに対する答えを、検索可能で一般的にアクセスできる単一の分析プラットフォームから得られるようにすることです。

「私たちの連携は、検閲データの分析の流れを一変させました」と Ensafi 氏は言います。「このデータを処理できる唯一の方法は、Google Cloud と処理クラウドです。当時はリソースを Google Cloud や他の Google サービスで管理していましたが、私たちのミッションは Jigsaw と相性が良いことがわかりました。よりオープンな連携を実現するには、Google Cloud の方が適していました。」

データを掘り下げて知見を深める

インターネット検閲の支配下にあるとき、企業は自社のウェブサイトやサービスに何が起きているのかを測定し、そのデータを検閲モニタリング組織に提供することで、なぜブロックしているのか、また、どのようにブロックしているのかを知ることができます。しかし企業にとってのインターネット検閲分析の有用性は、すぐにわかるものではないでしょう。「そこで威力を発揮するのが新しいデータ分析手法です」と語るのは、OONI のリサーチおよびパートナーシップ担当ディレクターであり、 Censored Planet の積極的な協力者である Maria Xynou 氏です。

「長期的な測定範囲は、時間の経過とともにどのような種類のデータが検閲されるかを理解するのに役立ち、検閲が発生する政治的環境を理解するのにも役立ちます」と Xynou 氏は言います。「OONI の目標は、インターネット上で検閲されたコンテンツの歴史的なアーカイブを後世に残すことです。しかし、測定需要の増大に対応するためにインフラストラクチャを拡大し、データをリアルタイムで公開する必要もあります。」

インターネット検閲を監視し暴露する際の課題として、検閲者は目的を達成するためにさまざまな技術を利用できる、ということが挙げられます。デジタルのモグラたたきゲームのように、使用されている検閲技術が多いほど、検閲データの複数のストリームを正確に分析するのが難しくなります。

このようなデータを処理できる唯一の方法は、Google Cloud と処理クラウドです。当時はリソースを Google Cloud や他の Google サービスで管理していましたが、私たちのミッションは Jigsaw と相性が良いことがわかりました。よりオープンな連携を実現するには、Google Cloud の方が適していました。

Jigsaw エンジニアリング マネージャー, Vinicius Fortuna

追跡の新しい取り組みには、世界中で TLS ミドルボックスの導入を検討することが含まれます、と Xynou 氏は言います。また、ML を活用した新しい分析技術が役に立つと期待しています。

Xynou 氏は「ML を利用した新しい分析プロセスを開発しており、さまざまな異常や、そうした異常の可能性を集計しています」と言います。「最新の試験運用によって、正確性の大幅な向上も見られます。」

Jigsaw の Fortuna も同意見です。「検閲データの分析方法を変えているところです」と Fortuna は言います。「サイトがブロックされているかどうかという問いから、もっと有益なものへとシフトしています。」

インターネットの自由とテクノロジーのコミュニティに参加している 60 を超える組織が、調査や支援活動のために Censored Planet のデータへのアクセスをリクエストしています。Censored Planet は合法的なコンテンツ管理を考慮しており、マルウェアの検出や保護者による使用制限など、場合によってはコントロールが必要になることもありますが、インターネット検閲があらゆる場所で増えていることは明らかです。

Xynou 氏は「Censored Planet のデータを他のインターネット検閲に関する組織のデータと組み合わせて実施した調査で、インターネット検閲が世界的な問題であることが証明されました」と言います。

「10 年前は主に中国とイランが検閲を行っていました。今では、なんらかの形でインターネット検閲に関わっていない国は世界のどこにもありません。」

- Google Cloud、セキュリティ編集者 Seth Rosenblatt

投稿先