コンテンツに移動
Google Cloud

機密データ保護に有用な DLP API の新機能

2017年11月7日
Google Cloud Japan Team

機密性の高いデータや法規制を受けているデータに携わっている方なら、その内容をセキュアに保護することがいかに難しいかはよくご存じでしょう。今年 3 月にベータ リリースされた Data Loss Prevention(DLP)API は、クレジット カード番号、氏名、国民識別番号といった 50 種以上の機密データをすばやく見つけて保護するのに役に立ちます。

この投稿では、私たちが先ごろアナウンスした、機密データの保護に有用な DLP API の新機能(リダクション、マスキング、トークン化など)を紹介します。

個人データを非特定化するこれらの新しい機能を使用すれば、意図せぬ形で漏洩するリスクを抑えながら機密データを利用しやすくなります。多くの大企業がそうであるように、最小特権の原則もしくは “need-to-know” の原則(認められたビジネス プロセスで必要最小限のデータだけを利用、参照すること)に従っている会社では、本番アプリケーションやデータ ワークフローでこれらの原則を徹底させるのに DLP API が一役買います。

DLP は API として提供されるため、ほぼあらゆるデータ ソースやストレージ システムに適用可能です。また、Google Cloud StorageCloud DatastoreBigQuery の大規模データセットのスキャンをネイティブでサポートし、スケーリングします。

弊社のセキュリティ ソリューションでは、複数のクラウド データ ストアやメール ソースに格納された文書やイメージを、Google Cloud の DLP API によってスキャンし分類しています。これにより、データ管理やリスク緩和に効果的な分類、リダクションなどのセキュリティ機能をお客様に提供できるようになりました。Google のインテリジェントな DLP のおかげで、私たちは高品質なサービスをお客様に提供して差別化を図り、ビジネスの拡大に成功したのです。

Sateesh Narahari 氏、ManagedMethods の製品担当 VP

DLP API の新しい非特定化ツール

データを非特定化すると、個人の特定につながる情報がデータセットから取り除かれ、ほかのデータを個人と結びつけにくくなり、漏洩のリスクが低減されます。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/image40nwu.GIF
DLP API を使えば、構造化と非構造化の両方のデータに含まれる機密要素を分類、マスキングできる

DLP API はこのたび、多彩なデータ変形オプションをサポートするようになりました。

リダクションとサプレッション

リダクションとサプレッションは、データセットから値またはレコード全体を取り除きます。

たとえば、顧客サポート UI を使用するサポート担当者に、トラブルの解決とは関係のない識別情報の詳細を知られたくないときは、それらの値をリダクションによって取り除くことができます。また、大規模な人口動向を分析している場合に、ユニークな人口層や珍しい属性のレコードをサプレッション(隠蔽)することで、特殊な人口層が分析対象に含まれるリスクを減らせます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/DnGf50SH4CmjJnPB8WCuPJr2vIKOyEoPaB4NBqopc1nJ.max-700x700.PNG
DLP API は、名前、社会保障番号、電話番号、メール アドレスを識別してリダクションできる

部分マスキング

部分マスキングは、米国における電話番号の末尾 7 桁など、機密情報の一部を見えなくするものです。次の例では、10 桁の電話番号のうち、部分マスキングによって市外局番だけが表示されています。

https://storage.googleapis.com/gweb-cloudblog-publish/images/scDhdTLrUqw2dxbbuAqWTGxl0UT6hbzF4toE1O8GE08A.max-700x700.PNG

トークン化(セキュア ハッシング)

トークン化(セキュア ハッシングとも呼ばれます)は、識別情報そのものをトークンと呼ばれる情報に置き換えます。レコード識別子の保持やデータの結合が必要なときでも、そのために機密データの基本的な要素を明らかにしたくない場合にとても便利です。

トークンはキーによって生成され、機密データを復元できるようにも(同じキーを使います)、できないようにも(キーを残さないようにします)設定できます。

DLP API は次のようなトークン タイプをサポートします。

  • FPE(Format-Preserving Encryption : フォーマット保持暗号化): 同じ長さと文字セットでトークン化

https://storage.googleapis.com/gweb-cloudblog-publish/images/P0R8ROeeSpbdzuF16mFRG1_2cHUVTsgP292r8lm2059A.max-700x700.PNG

  • セキュアなキーベースのハッシュ : データ暗号化キーを使って生成された 32 バイトの 16 進文字列トークン

https://storage.googleapis.com/gweb-cloudblog-publish/images/pos5zaDKC0IJxWUG5LXZgiUZYxro1kxWYfM86Zhy5yf7.max-700x700.PNG

ダイナミック データ マスキング

DLP API は、さまざまな非特定化やマスキングのテクニックをリアルタイムで実行する、ダイナミック データ マスキング(DDM)と呼ばれる機能を備えています。この機能は、元データはそのままで、特定の従業員やユーザーにデータを見せるときだけマスクしたい場合に便利です。

たとえば、UI での表示ではデータをマスクしつつ、本来の個人識別情報(PII)をどうしても表示しなければならないときに特別な権限もしくは追加の監査ログを要求できます。そうすることで、デフォルトではユーザーの識別情報は表示せず、ビジネス上必要なときに限り表示することができます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/dHneFbHKYSoBugW52mrqGFtVS08BoAF6EhQMEXSbkR.max-1300x1300.PNG
DLP API を使えば、機密データをリアルタイムで非表示にできる

バケッティング、k- 匿名性、l- 多様性

DLP API は上記以外にも、データを変形しつつ、より理解しやすくする方法を提供しています。バケッティング、k- 匿名性、l- 多様性のテクニックの詳細は、こちらのドキュメントハウツー ガイドをご覧ください。

使ってみよう

新しい変形機能を備えた DLP API は、機密データの格納場所がどこであるかに関係なく、そのデータを分類して保護するのに役に立ちます。データの検出や分類用のツールは他にいくつもありますが、ビジネス ニーズや法的義務を 100 % 満足させられる保証はありません。

今すぐ DLP API を使ってみたい方は、こちらのクイックスタート ガイドをご覧ください。

* この投稿は米国時間 10 月 19 日、Product Manager である Scott Ellis によって投稿されたもの(投稿はこちら)の抄訳です。

- By Scott Ellis, Product Manager

投稿先