색인 구성 파라미터

유사성 검색을 위한 색인을 구성하려면 다음 필드를 구성해야 합니다.

색인을 구성하는 방법에 대한 안내는 색인 매개변수 구성을 참조하세요.

필드
contentsDeltaUri

string

벡터 검색 Index의 콘텐츠를 삽입, 업데이트 또는 삭제할 수 있습니다. 문자열은 유효한 Cloud Storage 디렉터리 경로(예: gs://BUCKET_NAME/PATH_TO_INDEX_DIR/)여야 합니다.

IndexService.UpdateIndex를 호출할 때 이 필드를 설정하면 동일한 호출의 일부로 다른 Index 필드를 업데이트할 수 없습니다. 개별 데이터 파일을 구성하는 방법을 알아보세요.

isCompleteOverwrite

boolean

이 필드가 IndexService.UpdateIndex를 호출할 때 contentsDeltaUri와 함께 설정된 경우 Index의 기존 콘텐츠는 contentsDeltaUri의 데이터로 대체됩니다. 이 필드를 true로 설정하면 제공한 새 메타데이터 파일로 전체 색인을 완전히 덮어씁니다.

config

NearestNeighborSearchConfig

벡터 검색 구성 Index입니다.

NearestNeighborSearchConfig

필드
dimensions

int32

필수. 입력 벡터의 차원 수입니다. 밀집 임베딩에만 사용됩니다.

approximateNeighborsCount

int32

tree-AH 알고리즘을 사용하는 경우 필수입니다.

정확한 순서 변경이 수행되기 전에 유사 검색을 통해 찾을 이웃의 기본 개수입니다. 정확한 순서 변경은 유사 검색 알고리즘에서 반환하는 결과가 비용이 더 많이 드는 거리 계산을 이용해 재정렬되는 절차입니다.

ShardSize ShardSize

각 샤드의 크기. 색인이 크면 지정된 샤드 크기를 기준으로 샤딩됩니다. 서빙 중에 각 샤드는 별도의 노드에서 제공되며 독립적으로 확장됩니다.

distanceMeasureType

DistanceMeasureType

최근접 이웃 검색에 사용되는 거리 측정입니다.

featureNormType

FeatureNormType

각 벡터에서 수행될 정규화 유형입니다.

algorithmConfig oneOf:

벡터 검색에서 효율적인 검색에 사용하는 알고리즘의 구성입니다. 밀집 임베딩에만 사용됩니다.

  • TreeAhConfig: tree-AH 알고리즘을 사용하기 위한 구성 옵션입니다. 자세한 내용은 TensorFlow 추천자 및 벡터 검색으로 심층 검색 확장 블로그를 참조하세요.
  • BruteForceConfig: 이 옵션은 데이터베이스에서 각 쿼리의 표준 선형 검색을 구현합니다. 무차별 검색을 위해 구성할 필드가 없습니다. 이 알고리즘을 선택하려면 BruteForceConfig에 빈 객체를 전달합니다.

DistanceMeasureType

열거형
SQUARED_L2_DISTANCE 유클리드(L2) 거리
L1_DISTANCE 맨해튼(L1) 거리
DOT_PRODUCT_DISTANCE 기본값 스칼라곱의 음수로 정의됩니다.
COSINE_DISTANCE 코사인 거리입니다. 코사인 거리 대신 DOT_PRODUCT_Distance + UNIT_L2_NORM을 사용하는 것이 좋습니다. Google의 알고리즘은 DOT_PRODUCT 거리를 기준으로 최적화되었으며, UNIT_L2_NORM과 결합하면 코사인 거리와 동일한 순위 및 수학적 등가를 제공합니다.

ShardSize

열거형
SHARD_SIZE_SMALL 샤드당 2GiB
SHARD_SIZE_MEDIUM 샤드당 20GiB
SHARD_SIZE_LARGE 샤드당 50GiB

FeatureNormType

열거형
UNIT_L2_NORM 단위 L2 정규화 유형입니다.
NONE 기본값 지정된 정규화 유형이 없습니다.

TreeAhConfig

트리-AH 알고리즘에 선택할 수 있는 필드입니다.

필드
fractionLeafNodesToSearch double
쿼리를 검색할 수 있는 리프 노드의 기본 비율입니다. 범위는 0.0~1.0 미만이어야 합니다. 설정하지 않으면 기본값은 0.05입니다.
leafNodeEmbeddingCount int32
각 리프 노드의 임베딩 수입니다. 설정하지 않으면 기본값은 1000입니다.
leafNodesToSearchPercent int32
지원 중단됨, fractionLeafNodesToSearch를 사용하세요.

쿼리를 검색할 수 있는 리프 노드의 기본 비율입니다. 1~100 범위 내에 있어야 합니다. 설정되지 않으면 기본값은 10(즉, 10%)입니다.

BruteForceConfig

이 옵션은 데이터베이스에서 각 쿼리의 표준 선형 검색을 구현합니다. 무차별 검색을 위해 구성할 필드가 없습니다. 이 알고리즘을 선택하려면 BruteForceConfig의 빈 객체를 algorithmConfig에 전달합니다.