색인 구성 파라미터

유사성 검색을 위한 색인을 구성하려면 다음 필드를 구성해야 합니다.

색인을 구성하는 방법에 대한 안내는 색인 매개변수 구성을 참조하세요.

`NearestNeighborSearch`

필드

필드
`contentsDeltaUri`	`string` 벡터 검색 `Index`의 콘텐츠를 삽입, 업데이트 또는 삭제할 수 있습니다. 문자열은 유효한 Cloud Storage 디렉터리 경로(예: `gs://BUCKET_NAME/PATH_TO_INDEX_DIR/`)여야 합니다. `IndexService.UpdateIndex`를 호출할 때 이 필드를 설정하면 동일한 호출의 일부로 다른 `Index` 필드를 업데이트할 수 없습니다. 개별 데이터 파일을 구성하는 방법을 알아보세요.
`isCompleteOverwrite`	`boolean` 이 필드가 `IndexService.UpdateIndex`를 호출할 때 `contentsDeltaUri`와 함께 설정된 경우 `Index`의 기존 콘텐츠는 `contentsDeltaUri`의 데이터로 대체됩니다. 이 필드를 true로 설정하면 제공한 새 메타데이터 파일로 전체 색인을 완전히 덮어씁니다.
`config`	`NearestNeighborSearchConfig` 벡터 검색 구성 `Index`입니다.

contentsDeltaUri

string

벡터 검색 Index의 콘텐츠를 삽입, 업데이트 또는 삭제할 수 있습니다. 문자열은 유효한 Cloud Storage 디렉터리 경로(예: gs://BUCKET_NAME/PATH_TO_INDEX_DIR/)여야 합니다.

IndexService.UpdateIndex를 호출할 때 이 필드를 설정하면 동일한 호출의 일부로 다른 Index 필드를 업데이트할 수 없습니다. 개별 데이터 파일을 구성하는 방법을 알아보세요.

isCompleteOverwrite

boolean

이 필드가 IndexService.UpdateIndex를 호출할 때 contentsDeltaUri와 함께 설정된 경우 Index의 기존 콘텐츠는 contentsDeltaUri의 데이터로 대체됩니다. 이 필드를 true로 설정하면 제공한 새 메타데이터 파일로 전체 색인을 완전히 덮어씁니다.

config

NearestNeighborSearchConfig

벡터 검색 구성 Index입니다.

`NearestNeighborSearchConfig`

필드
`dimensions`	`int32` 필수 입력란입니다. 입력 벡터의 차원 수입니다. 밀집 임베딩에만 사용됩니다.
`approximateNeighborsCount`	`int32` tree-AH 알고리즘을 사용하는 경우 필수입니다. 정확한 순서 변경이 수행되기 전에 유사 검색을 통해 찾을 이웃의 기본 개수입니다. 정확한 순서 변경은 유사 검색 알고리즘에서 반환하는 결과가 비용이 더 많이 드는 거리 계산을 이용해 재정렬되는 절차입니다.
`ShardSize`	`ShardSize` 각 샤드의 크기. 색인이 크면 지정된 샤드 크기를 기준으로 샤딩됩니다. 서빙 중에 각 샤드는 별도의 노드에서 제공되며 독립적으로 확장됩니다.
`distanceMeasureType`	`DistanceMeasureType` 최근접 이웃 검색에 사용되는 거리 측정입니다.
`featureNormType`	`FeatureNormType` 각 벡터에서 수행될 정규화 유형입니다.
`algorithmConfig`	`oneOf:` `TreeAhConfig` `BruteForceConfig` 벡터 검색에서 효율적인 검색에 사용하는 알고리즘의 구성입니다. 밀집 임베딩에만 사용됩니다. `TreeAhConfig`: tree-AH 알고리즘을 사용하기 위한 구성 옵션입니다. 자세한 내용은 TensorFlow 추천자 및 벡터 검색으로 심층 검색 확장 블로그를 참조하세요. `BruteForceConfig`: 이 옵션은 데이터베이스에서 각 쿼리의 표준 선형 검색을 구현합니다. 무차별 검색을 위해 구성할 필드가 없습니다. 이 알고리즘을 선택하려면 `BruteForceConfig`에 빈 객체를 전달합니다.

`DistanceMeasureType`

열거형
`SQUARED_L2_DISTANCE`	유클리드(L₂) 거리
`L1_DISTANCE`	맨해튼(L₁) 거리
`DOT_PRODUCT_DISTANCE`	기본값 스칼라곱의 음수로 정의됩니다.
`COSINE_DISTANCE`	코사인 거리입니다. 코사인 거리 대신 DOT_PRODUCT_Distance + UNIT_L2_NORM을 사용하는 것이 좋습니다. Google의 알고리즘은 DOT_PRODUCT 거리를 기준으로 최적화되었으며, UNIT_L2_NORM과 결합하면 코사인 거리와 동일한 순위 및 수학적 등가를 제공합니다.

`ShardSize`

열거형
`SHARD_SIZE_SMALL`	샤드당 2GiB
`SHARD_SIZE_MEDIUM`	샤드당 20GiB
`SHARD_SIZE_LARGE`	샤드당 50GiB

`FeatureNormType`

열거형
`UNIT_L2_NORM`	단위 L2 정규화 유형입니다.
`NONE`	기본값 지정된 정규화 유형이 없습니다.

`TreeAhConfig`

트리-AH 알고리즘에 선택할 수 있는 필드입니다.

필드
`fractionLeafNodesToSearch`	`double`
	쿼리를 검색할 수 있는 리프 노드의 기본 비율입니다. 범위는 0.0~1.0 미만이어야 합니다. 설정하지 않으면 기본값은 0.05입니다.
`leafNodeEmbeddingCount`	`int32`
	각 리프 노드의 임베딩 수입니다. 설정하지 않으면 기본값은 1000입니다.
`leafNodesToSearchPercent`	`int32`
	지원 중단됨, `fractionLeafNodesToSearch`를 사용하세요. 쿼리를 검색할 수 있는 리프 노드의 기본 비율입니다. 1~100 범위 내에 있어야 합니다. 설정되지 않으면 기본값은 10(즉, 10%)입니다.

`BruteForceConfig`

이 옵션은 데이터베이스에서 각 쿼리의 표준 선형 검색을 구현합니다. 무차별 검색을 위해 구성할 필드가 없습니다. 이 알고리즘을 선택하려면 BruteForceConfig의 빈 객체를 algorithmConfig에 전달합니다.