コンテンツに移動
データ分析

BigQuery に新たに 11 のチェーンを追加して、Google Cloud のブロックチェーン データの提供を強化

2023年10月11日
https://storage.googleapis.com/gweb-cloudblog-publish/images/image5_b8UnrYB.max-2000x2000.png
Google Cloud Japan Team

※この投稿は米国時間 2023 年 9 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

2018 年の初め、Google Cloud はコミュニティと協力し、BigQuery の一般公開データセットを通じてブロックチェーン データを誰でも利用できるように民主化しました。2019 年には、さらに 6 つのデータセットを追加しています。そしてこのたび、特に需要の高い 11 のブロックチェーンを BigQuery の一般公開データセットに追加(プレビュー版)したことをお知らせいたします。また、一般公開データセット プログラムの既存のデータセットにも改良を加えています。

これは、ブロックチェーン財団、Web3 分析会社、パートナー、デベロッパー、お客様から寄せられた、暗号通貨環境をより包括的に把握し、より多くのチェーンをクエリできるようにしたいというご要望に Google が応えたものです。ブロックチェーンの利用者は、複雑な質問に答えたり、「特定の 3 つのチェーンで今日作成された NFT の数は?」、「チェーン間のトランザクション手数料はどのように比較されているのか?」、「EVM の上位チェーンにアクティブ ウォレットはいくつあるのか?」といった主観的な問いを検証したりしたいと考えています。

BigQuery 経由でアクセス可能なより堅牢なチェーンのリストと、データへの新しいアクセス方法を手に入れることで、Web3 コミュニティはノードの運用やインデクサの維持にオーバーヘッドをかけることなく、このような質問に適切に答えられるようになります。また、オンチェーンのすべてのトランザクション履歴をオフチェーンでクエリして、ウォレット間での資産の流れ、最も人気のあるトークン、ユーザーがスマート コントラクトとやり取りする方法を理解することも可能となります。

チェーンの拡張

BigQuery の一般公開データセットに追加された需要の高い 11 のチェーンは次のとおりです。

  1. Avalanche
  2. Arbitrum
  3. Cronos
  4. Ethereum(Görli)
  5. Fantom(Opera)
  6. Near
  7. Optimism
  8. Polkadot
  9. Polygon Mainnet
  10. Polygon Mumbai
  11. Tron

また、デベロッパーがクエリできるように、オープンソースのブロックチェーン ETL データセットに Satoshis(sats)/ Ordinals を追加することで、既存の Bitcoin BigQuery データセットを改善しています。Ordinals とは、簡単に言えば sats に通し番号を付ける仕組みのことです。

Google Cloud のマネージド データセット

私たちは、ユーザーにさまざまなデータ オプションを提供したいと考えています。そのため、BigQuery のコミュニティが管理するデータセットに加え、追加機能を提供する Google Cloud のマネージド データセット(ファーストパーティ)も作成しています。たとえば、既存の Ethereum のコミュニティ データセット(crypto_ethereum)に加え、Google Cloud が管理する Ethereum データセット(goog_blockchain_ethereum_mainnet.us)も作成しています。これは、Ethereum に固有のデータモデル全体を表しており、イベントのキュレーションされたテーブルもあります。Ethereum に関するより豊富な分析が必要な場合は、派生データにアクセスすると、ウォレットの残高、特定のトークン(ERC20、ERC721、ERC1155)に関連するトランザクション、またはスマート コントラクトとのやり取りを簡単にクエリできます。

Google は、お客様や Web3 コミュニティのために、高速で信頼性に優れたエンタープライズ グレードの結果を提供することを目指しています。以下は、goog_blockchain_ethereum_mainnet.us データセットに対するクエリの例です。

「毎日(過去 7 日間)何件の ETH トランザクションが実行されているか?」を知りたいとします。

読み込んでいます...

https://storage.googleapis.com/gweb-cloudblog-publish/images/Untitled_presentation_2.max-1000x1000.png

上記の結果により、goog_ データセットを使用した方が高速でスロット時間の使用が少なく、処理されたバイト数においても競争力を維持していることがわかります。

より精度の高いデータ

私たちは、コミュニティの課題を理解するためにお客様やデベロッパーからフィードバックを収集し、特定のコインの価格をより正確に計算するには数値精度などの機能が重要であることを明確にできました。そこで、UNIT256 の統合と BIGNUMERIC1 のサポートを向上させるために UDF を提供して、ブロックチェーン データセットの精度を向上させています。これにより、ブロックチェーン データのより長い桁数を利用できるようになり、計算における丸め誤差を減少できます。

オンチェーン データをオフチェーンでアクセス可能に

現在、ブロックチェーン データに関心をお持ちのお客様は、まず適切なノードにアクセスし、次にデータをクエリ可能なデータモデルに変換するインデクサを開発し、維持する必要があります。そして、関心のあるプロトコルごとにこのプロセスを繰り返します。

Google のスケーラブルなデータ処理における深い専門知識を活用することで、オンチェーン データをオフチェーンでもアクセスできるようにして使用とコンポーザビリティを容易にし、デベロッパーがノードなしでブロックチェーン データにアクセスできるようにします。これにより、お客様が自身のデータにアクセスするのと同じくらい簡単にブロックチェーン データにアクセスできるようになります。また、チェーンデータとアプリケーション データを結合することで、ユーザーとビジネスの全体像を把握できます。

最後に、私たちはこのデータが LookerGoogle スプレッドシートなどの、他のエンドユーザー アプリケーションで使用されていることも確認しています。

連携して構築

過去 5 年間、私たちはブロックチェーンの一般公開データセットの提供を通じてコミュニティをサポートしてきました。今後も、コミュニティが所有するデータから、Google が管理する高品質な別のデータやリアルタイムのデータまで、さまざまなデータ オプションやユーザーの選択肢を提供し、このような取り組みを発展させていきます。また、デベロッパー向けに一般公開データの配布や、キュレーションされたフィードや分析情報のデータセットの収益化をお考えのパートナーの皆さまと連携できることを楽しみにしています。もちろん、Web3 独自のクラウドネイティブな配信やシンジケーション チャネルを構築したいスタートアップやデータ プロバイダとの提携も可能です。

BigQuery は、無料枠と使用量に応じた料金で使用を開始できます。BigQuery で利用可能な新しいチェーンに早期アクセスするには、web3-trustedtester-data@google.com にお問い合わせください。

1.32 論理バイト

-Web3 担当責任者 James Tromans

-Web3 プロダクト管理ディレクター Alberto Martin

投稿先