ETH 図書館における Apigee を利用したデータ資産一般公開の取り組み

Google Cloud Japan Team
※この投稿は米国時間 2023 年 7 月 25 日に、Google Cloud blog に投稿されたものの抄訳です。
編集者注: チューリッヒ工科大学図書館(ETH 図書館)は、知識の発展、研究や教育活動の支援、そして信頼される機関として、過去、現在、未来の世界を、利用者により深く理解してもらうことを目指しています。ETH 図書館はチューリッヒ工科大学の中央図書館で、同大学が保有するデータ、および他の社会・知識分野の情報に簡単にアクセスできる仕組みを提供しています。この記事では、ETH 図書館が Apigee を活用し、(オープン API のコンテキストで)API 管理を通して多様なデータを簡単に検索、アクセス、再利用できるようにして新たな価値創造の可能性を切り開いた事例を、Germano Giuliani 氏が解説します。
ETH 図書館の使命は、チューリッヒ工科大学をはじめとする世界中の他の大学の職員と学生、一般市民、そして研究開発に携わる企業が、必要な情報にアクセスできるようにすることです。私たちは ETH 図書館を、知識の生成と発展、そして社会における知識の伝達を実現するための、利用者中心の推進力であると位置づけています。
図書館は現在、利用者の変化する期待、技術的な発展、予算による制約、コンテンツやインフラストラクチャの費用増大など、さまざまな課題に直面しています。これらの課題に対処するためには、これまでとはまったく異なる新しい仕組みを取り入れることが求められます。そのための 1 つの方法として、「オープン」のパラダイム導入があります。このパラダイムに含まれるのが、該当するウェブ標準に従えば誰でも自由にコアサービスを利用できるようにするという考え方です。これを実現するには、新しいモダンな技術スタックを導入するとともに、新たな連携を構築する必要があります。
インターネットを通したデータや知識のやり取りは一般的なものとなりました。情報はオンラインで入手可能で、調査データはデジタル的に処理され、調査結果も電子的に公開されます。相互に連携したさまざまなサービスが登場し、人々はこれらのデータにいつでもアクセスできることを望むようになっています。
ETH 図書館は、未来志向の情報サービス、および利用者のニーズを考慮して利用者とともに開発したツールを通して、物理的な環境とデジタル環境のいずれにおいてもそれぞれの利用者に合ったパーソナルなワークスペースを作り上げることを目標としています。自然科学および技術分野のスイス最大の公立図書館として、そして自然科学およびエンジニアリング分野の情報の国内集積センターとして、常に移り変わるデジタル図書館に求められるニーズや、デジタル図書館にもたらされる新たなチャンスを積極的に取り込みつつ、将来にわたり常に時代に合った姿へと変わり続けるのが ETH 図書館です。
ネットワークで結ばれ、さまざまなデータや情報が統合されるとともに、利用者中心の視点で利用者のニーズを重視した、未来の図書館であり続けることが目標です。
ETH 図書館は、膨大な量の多様で価値の高いデータ(3,000 万冊以上の書籍、シリーズ、定期刊行物、書籍以外の資料、および数百テラバイトにおよぶデジタル レプリカまたはデジタルで制作された画像)を所有し、それらのデータへのアクセスを提供しています。このデータは書誌的メタデータの形式のほか、画像、PDF ドキュメント、その他さまざまなファイル形式のバイナリ ファイルとして提供されています。
これらのデータは、さまざまな技術スタックおよび多様なストレージ ソリューションを使用し、幅広い独自アプリケーションにわたって分散管理されています。現在のアプリケーション環境は、非常に接続性に乏しいものです。その原因としては、個々のアプリケーションが持つさまざまな業務上および技術的な要件に加え、ソフトウェア プロダクトの開発にこれまで使用されてきたプロセスが挙げられます。
すべてのアプリケーションは、ビジネスケースまたはサービス プロセスの要件を満たすことを目標として作成されています。そのために、使用されるソフトウェアの機能に最も適したデータ ストレージが選定されています。エクスポートの機能やインターフェースなど、さらなるデータの利用や再利用は設計時には考慮されていないことがほとんどです。各アプリケーション固有の形式と異なるデータ構造を使用してデータクエリを実行できるインターフェースが用意されていれば、まだ良い方でしょう。これにより、アプリケーションごとにデータサイロが生じてしまい、異なるアプリケーション間でデータを再利用したり、一貫性のある形式でデータを利用したりすることが困難となっています。
利用者のアクセスに 1 か所の窓口を用意
利用者の立場からこのサイロを打破するため、ETH 図書館は 2010 年に Knowledge Portal 検索ソリューションをリリースし、利用者が 1 か所の窓口を通してデータにアクセスできる仕組みを導入しました。この手法の効果は明らかとなり、2020 年 12 月に Knowledge Portal の後継としてリリースされた新しいクラウドベースの ETH Library @ swisscovery 検索ソリューションの中心的なアーキテクチャとしても使用されています。
Data as a Service
Data as a Service(DaaS)のイニシアチブは、ETH 図書館からアプリケーション間で共通して使用できる形でデータおよびデジタル リソースを提供し、広く一般にデータの処理や利用を促すための取り組みです。この取り組みは、オープンデータ コミュニティのデベロッパーに 1 か所のアクセス窓口を提供することにもつながります。これによりデベロッパーは、API ゲートウェイおよび関連するデベロッパー ポータルを通して、ETH 図書館のデータやリソースに簡単にアクセスできるようになります。
DaaS のイニシアチブの視点では、利用者にこれらのサービスの開発に対する関与を促し、共同制作者となってもらうことで、より簡単に革新的な新サービスの開発作業を進めることができます。
デジタル トランスフォーメーションの重要な特徴として、いつでもデジタル サービスを利用できるようにすること、そしてサービスやデータ間相互のネットワークを拡充することがあります。API、すなわちアプリケーション プログラミング インターフェースによる相互運用性は、デジタル トランスフォーメーションの重要な基盤です。これにより、組織間の関係性を新たに構築し、コミュニケーションを促進して、新たな価値を生み出すネットワークを作り上げることができます。
オープン API は、オープンなインターフェースを通して、フィルタリングされていない機械可読の電子データを誰でも利用できるようにすることを目指すコンセプトです。オープン API は無料で提供され、誰でも制限なく利用することができます。
新たな配信チャネルとしてのオープン API では、これまで図書館が保有していたものの、その存在をほとんどまたはまったく知られていなかったデータや、アクセスするのが困難だったデータが簡単に利用できるようになります。また、Linked Open Data に準拠したネットワーキング機能により、組織内外のパートナーがデータを検索、アクセス、再利用しやすくなります。さらに、デベロッパー向けのデベロッパー ポータルの構築、そして API 管理プロセスの導入により、持続性のあるオープン API エコシステムを確立できます。これにより、オープンデータ コミュニティにおけるイノベーション、コラボレーション、共創が促進されます。


モダンで未来志向の図書館の中核にあるのがデジタル トランスフォーメーションです。ETH 図書館でイノベーションや革新的なデジタル テクノロジーの活用を進めたいと考えているあらゆる活動領域について検討した結果、私たちのデジタル トランスフォーメーションには API が鍵であることがわかりました。API 管理のベスト プラクティスを導入することにより、デジタル サービスを(組織内外の)利用者およびデベロッパーにとって安定的で利用しやすいものへと生まれ変わらせ、パートナー エコシステムとの効果的なつながりを生み出し、革新的な新サービスを短時間で提供することができます。
Apigee により API をサービスとして提供し、ユーザーのニーズに応える
ETH 図書館は、アプリケーション環境全体で API を管理する中心的なプラットフォームとして Apigee を選びました。Herby、Google for Education、および Google Cloud パートナー Digital Schooling のサポートのもと、シンプルかつ手頃な価格での Apigee へのアクセスが実現しました。Apigee は、データを各種アプリケーションに統合するとともに、さまざまな種類のデータを結び付けるための技術的基盤となっています。このプラットフォームを開発し、拡大することで、インターフェースを通して ETH 図書館のデータリソースを利用できるようになるとともに、新たなアプリケーションを開発できるようになります。また、既存の利用者固有のアプリケーションを拡張することも可能です。
Apigee は、さまざまなシステムを結び付け、拡張し、統合するために不可欠な機能を備えています。API を通してさまざまなシステムを結び付けることは、組織と他の組織、組織とそのプロダクト、サービスとプロダクト、さらにはプロダクトと他のプロダクトを直接結び付けることにもつながります。Apigee に組み込みのデベロッパー ポータルおよび Google Firebase にホストされた公開 API の OpenAPI Swagger ドキュメントにより、組織内外のデベロッパーは簡単かつスムーズに開発作業に参加できます。この意味で、オープンデータのコンセプトは、Data as a Service のイニシアチブを背景とした手段の開発のための推進力して機能し、ETH 図書館にとっての戦略的重要性を有しています。


スクリーンショット。ETH 図書館作成
API 管理ソリューションの稼働は 2022 年 6 月に開始され、引き続きさらなるデータの提供を目指しています。現在、Apigee は、3,000 万冊以上の書籍、画像、シリーズ、定期刊行物、その他の資料を保有する ETH 図書館の検索 API の API プロキシ、そして Wikidata、metagrid.ch、DNB Entityfacts、QID および GND ID による beacon.findbuch 経由で Linked Open Data によるデータ拡充を利用している個人や組織の API に対する API プロキシを提供しています。また、ETHorama は、E-Pics、e-rara、E-Periodica、e-manuscripta、Research Collection などの ETH 図書館プラットフォームからデジタル化されたドキュメントへの Google マップをベースとしたアクセスを提供するサービスで、Apigee で開発された API プロキシへのクライアント アプリとして動作しています。
ぜひ ETH 図書館の新しいプラットフォームをお試しになり、ご自身のアプリケーションで ETH 図書館のデータを再利用してみてください。ご質問や詳細については、ETH 図書館 API チーム(api@library.ethz.ch)までお問い合わせください。
- ETH 図書館、検索および API 管理責任者、Germano Giuliani 氏



