射影クエリ

注: 新しいアプリケーションを作成する際は、NDB クライアント ライブラリを使用することを強くおすすめします。NDB クライアント ライブラリには、Memcache API によるエンティティの自動キャッシュなど、このクライアント ライブラリにはないメリットがあります。古い DB クライアント ライブラリを使用している場合は、DB から NDB への移行ガイドをお読みください。

ほとんどの Cloud Datastore クエリでは、エンティティ全体が結果として返されますが、多くの場合、アプリケーションが実際に必要としているのはエンティティのプロパティの一部分だけです。射影クエリを使用すると、エンティティのプロパティの中で本当に必要なものだけをクエリできるため、エンティティ全体を取得する場合よりもレイテンシとコストを低く抑えられます。

射影クエリは、次のような形式の SQL クエリと似ています。

SELECT name, email, phone FROM CUSTOMER

標準的なエンティティ クエリで使用できるフィルタリングや並べ替えの機能はすべて使用できます。制限事項については、以降で説明するとおりです。このクエリでは要約された結果が返されます。指定したプロパティ(この例では nameemailphone)だけに値が格納され、その他すべてのプロパティにはデータは格納されません。

Python での射影クエリの使用

projection は次のように指定します。射影クエリは QueryGqlQuery オブジェクトの両方でサポートされます。いずれのクラスでもこのインポートが必要です。

from google.appengine.ext import db

projection は次のように指定します:

proj = db.Query(entity_name, projection=('property_1', 'property_2','property_n'))

proj = db.GqlQuery("SELECT property_1, property_2, property_n FROM entity_name")

これらのクエリの結果は、標準的なエンティティのクエリの場合と同じように扱います(結果を反復処理する、など)。

次の例では、すべての EventLog エントリの titleread_pathdate_written プロパティをクエリし、date_written の昇順で並べ替えて、各プロパティの値をアプリケーション ログに書き込みます。

for proj in db.GqlQuery("SELECT title, read_path, date_written" +
                        "FROM EventLog" +
                        "ORDER BY date_written ASC"):
  logging.info(proj.title)
  logging.info(proj.read_path)
  logging.info(proj.date_written)

グループ化(試験運用)

射影クエリでは、distinct キーワードを使用できます。これを使用すると、完全に一意の結果のみが結果セットで返されます。つまり、プロジェクションされているプロパティについて同じ値を持つエンティティが複数存在する場合は、最初の結果だけが返されます。

query = db.Query(projection=['A', 'B'], distinct=True).filter('B >', 1).order('-B, A')

プロジェクションの制限

射影クエリには次のような制限があります。

  • インデックス付けされたプロパティだけを射影できる。

    インデックスに登録されていないプロパティでは、明示的にも暗黙的にも射影はサポートされません。長いテキスト文字列(Text)や長いバイト文字列(Blob)は、インデックスに登録されません。

  • 同じプロパティは複数回射影できない。

  • 等式(=)またはメンバー(IN)フィルタで参照されているプロパティは射影できない。

    例:

    SELECT A FROM kind WHERE B = 1
    

    は有効です(射影されたプロパティが等式フィルタで使用されていないため)。同様に、

    SELECT A FROM kind WHERE A > 1
    

    も有効です(等式フィルタではないため)。ただし、

    SELECT A FROM kind WHERE A = 1
    

    は無効です(射影されたプロパティが等式フィルタで使用されているため)。

  • 射影クエリから返された結果を Cloud Datastore に再保存することはできない。

    このようなクエリでは部分的に格納された結果しか返されないため、Cloud Datastore に書き戻すことはできません。

射影と複数の値を持つプロパティ

複数の値を持つプロパティを射影しても、そのプロパティのすべての値が格納されるわけではありません。代わりに、クエリに一致し、射影された値の一意の組み合わせごとにエンティティが個別に返されます。たとえば、複数の値を持つ 2 つのプロパティ AB が設定された Foo という種類のエンティティがあるとします。

entity = Foo(A=[1, 1, 2, 3], B=['x', 'y', 'x'])

この状況で、次の射影クエリを実行します。

SELECT A, B FROM Foo WHERE A < 3

この場合、次の値の組み合わせを持つ 4 つのエンティティが返されます。

A = 1B = 'x'
A = 1B = 'y'
A = 2B = 'x'
A = 2B = 'y'

エンティティに含まれる複数値プロパティの 1 つに値が指定されていない場合、インデックスに含まれるエントリが存在しないため、そのプロパティを含む射影クエリを実行しても、このようなエンティティから返される結果はありません。

射影のインデックス

射影クエリでは、射影で指定されているすべてのプロパティが Cloud Datastore のインデックスに含まれるようにする必要があります。App Engine 開発サーバーを使用すると、インデックス構成ファイル(index.yaml)で必要なインデックスが自動的に生成されます。このファイルはアプリケーションと一緒にアップロードされます。

必要なインデックスの数を最小限に抑える方法の 1 つとして、必ずしもすべてが必要でない場合であっても、同じ複数のプロパティを一貫して射影する方法があります。たとえば、次のクエリはそれぞれ個別のインデックスを必要とします。

SELECT A, B FROM Kind
SELECT A, B, C FROM Kind

ただし、C が必要でないときでもプロパティ ABC を常に射影する場合は、1 つのインデックスのみ必要になります。

射影のプロパティがクエリの別の部分に含まれていない場合、既存のクエリを射影クエリに変換する際に新しいインデックスを構築しなければならない場合があります。たとえば、次のような既存のクエリがあるとします。

SELECT * FROM Kind WHERE A > 1 ORDER BY A, B

必要なインデックスは次のとおりです。

Index(Kind, A, B)

このクエリを次のいずれかの射影クエリに変換します。

SELECT C FROM Kind WHERE A > 1 ORDER BY A, B
SELECT A, B, C FROM Kind WHERE A > 1 ORDER BY A, B

新しいプロパティ(C)が取り入れられるため、新しいインデックス Index(Kind, A, B, C) を作成する必要があります。次の射影クエリ

SELECT A, B FROM Kind WHERE A > 1 ORDER BY A, B

では、必要なインデックスに変化はありません。これは射影される A プロパティと B プロパティが既存のクエリにすでに含まれているためです。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Python 2 の App Engine スタンダード環境