コンテンツに移動
デベロッパー

ダイバーシティ年次報告書を BigQuery の一般公開データセットとして提供開始

2022年7月28日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Screen_Shot_2022-06-27_at_2.29.50_PM.max-900x900.png
Google Cloud Japan Team

※この投稿は米国時間 2022 年 7 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。

2014 以降、テクノロジー企業はさまざまな指標を用いてダイバーシティにおける問題領域の特定、ベースラインの確立、有意義な成果の測定を行ってきました。また、ダイバーシティ年次報告書を通じてダイバーシティ、エクイティ、インクルージョン(DEI)のデータを直接公開しています。しかし、DEI に対する理解が徐々に変化することにより、各社のレポートの内容が分岐し、業界全体の状況に関するデータが分散化してしまいました。1 社のみのダイバーシティ データセットではテクノロジー企業における DEI の課題を解決できないため、データの分断は問題をもたらすことになります。こうした問題を回避するには、業界全体を対象とした体系的なソリューションを構築し、持続可能な変化を実現する必要があります。そのためには、DEI データに関する認識を統一し、テクノロジー企業間で DEI データを標準化、共有しなければなりません。

大半の企業が棒グラフや円グラフなどを使ってダイバーシティ データを公開することで、分析がやりにくくなっているという課題があります。そのため、研究者は現実に即した詳細なデータを簡単に取り込んだり、それぞれのニーズ(テクノロジー関連の役割とそれ以外の役割における雇用のトレンドの比較、経営陣におけるアジア人女性の割合など)に合わせてデータを集約、分析することができません。最新版のダイバーシティ年次報告書でも紹介しているとおり、テクノロジー業界全体を対象としたソリューションでなければ持続可能な変化は実現されず、こうした取り組みにおいて重要になるのがデータの透明性であることが外部調査によって明らかになっています。

Google のダイバーシティ年次報告書の一般公開データセットと BigQuery

5 月には、2022 年版のダイバーシティ年次報告書をリリースしました。この報告書には、経営陣を含めた、Google の従業員の内訳、雇用状況、離職に関する統計データが掲載されています。Google の雇用データを人種 / 民族、性別ごと、男女の割合でカテゴリ分けした時系列のインターセクショナルな雇用データは地域ごとに確認でき、他にもさまざまなデータがあります。このデータの透明性を改善し、分析に利用できるようにするための取り組みの一環として、Google Cloud の強力なデータ ウェアハウジング ツールである BigQuery の一般公開データセットとしてダイバーシティ年次報告書を追加しました。研究者、コミュニティ組織、業界グループにとって Google のデータはさらに使い勝手の良いものとなり、外部のベンチマークと比較することで Google の取り組みの進捗をコンテキスト化できるようになりました。

業界における先駆者のうちの 1 社として、このたび 2 年連続で Google のダイバーシティ データを BigQuery に公開できたことを光栄に思います。Google のデータセットは一般公開されており、Google が管理して費用も負担しているため、興味のある方であれば誰でも、Google Cloud 一般公開データセット プログラムを通じて、無料で BigQuery の高度な分析機能を利用できます。*

https://storage.googleapis.com/gweb-cloudblog-publish/images/Screen_Shot_2022-06-27_at_2.50.23_PM.max-2000x2000.png
BigQuery のダイバーシティ年次報告書の一般公開データセット(クリックして拡大)

有意義な結論に達するにはダイバーシティ データのコンテキスト化が必要

Google のダイバーシティ データセットは、ユーザーが自身のデータセットを Google の現在および過去のトレンドと比較するうえで役に立ちます。一方、DEI データは他の関連性の高いデータセットと併せて分析した場合にのみ威力を発揮します。たとえば、米国の国勢調査データや労働参加率、卒業率などの評価基準がなければ、黒人系の雇用が 8.8% から 9.4% へと増加したと結論付けてもほとんど意味がありません。関連する業界の DEI データや、人材と卒業生のプールなど、他の一般公開データセットを Google が BigQuery に用意しているのもこうした理由からです。こうした取り組みにより、ユーザーはサンプルクエリを実行して、Google の雇用状況と従業員の内訳を関連する業界(ソフトウェアメーカー、データ処理サービスなど)と比較できます。比較結果から、進捗が見られる領域と改善点をより深く把握してコンテキスト化できます。また、自社だけでなく、自社が属するコミュニティの DEI の取り組みにおいて力を発揮できる役割をより客観的に見極めることができます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Screen_Shot_2022-06-27_at_3.03.50_PM.max-2000x2000.png

Google の雇用状況と従業員の内訳を関連する業界と比較したサンプルクエリ(クリックして拡大)

インターセクショナリティ データと分解できるベースライン指標

職場では、従業員の層と特定のグループに存在している可能性がある不平等を理解するうえでインターセクショナリティ データがカギとなります。これには、人種、性別、LGBTQ(さまざまなレベルの不平等や差別を生み出している)などの社会的アイデンティティが共通する個人が含まれます。システムの真の健全性を診断し、DEI の現状の改善においてインターセクショナリティが果たす役割を深く理解するには、意味のある形で DEI データを分解できることが重要です。

Google のダイバーシティ年次報告書の一般公開データセットには、インターセクショナルな雇用データおよび従業員内訳データが含まれており、これはさらにテクノロジー、テクノロジー以外、経営陣ごとにカテゴリ分けされています。BigQuery の使い勝手の良いインターフェースでは、関連するパラメータの選択や、このデータと他の一般公開データセットや非公開データセットとの結合を簡単に実行して、さまざまな業界に対して Google のデータを意味のある形でコンテキスト化できます。データ サイエンティストから DEI スチュワードまで、誰でも Google Cloud Marketplace から一般公開データセットを起動して、データセットに対するクエリの実行を即座に開始できます。結果は LookerデータポータルTableau などのツールを使用して可視化できます。  

これは始まりにすぎません

DEI の取り組みが業界全体の取り組みへと進化を続けるなか、データの収集とレポートについて、業界全体で標準的な手法を推進していく必要があります。マクロの視点では、企業単位だけではなく、テクノロジー業界全体に真の改善をもたらす力がデータには秘められています。Google のデータセットとサンプル クエリが、研究者や個人がテクノロジー業界における DEI の旗振り役になるための出発点となり、問題の解決に適したデータをもたらすものとなれば幸いです。

脚注:

*BigQuery の 1 か月あたり 1 TB の無料処理枠を使い切った後にデータに対してクエリを実行した場合のみ、料金が発生します。各ユーザーには 1 か月あたり 1 TB の BigQuery の無料処理枠があり、この一般公開データセットへのクエリの実行にこの枠を使用できます。


- デベロッパー アドボケイト Stephanie Wong
- インサイト & インパクト担当グローバル責任者 James Heighington
投稿先