패키지 google.cloud.healthcare.v1alpha2.dictation

색인

DictationService

의료 음성기록 요청을 처리하기 위한 서비스입니다. 음성기록 데이터는 데이터 세트의 다른 의료 형식과 함께 저장됩니다. 각 데이터 세트에는 0개 이상의 형식 데이터 저장소(예: dictation stores)가 있을 수 있습니다. 음성기록 오디오(Dictations)와 스크립트 결과(Notes)는 음성기록 저장소에 저장된 두 가지의 주요 데이터 유형입니다. SpeechConfigs는 자동 음성 인식에 사용되는 매개변수를 인코딩합니다.

CreateDictation

rpc CreateDictation(CreateDictationRequest) returns (Dictation)

Dictation 레코드를 만듭니다. 오디오 샘플을 유지합니다. 고유 ID가 이 서비스에 의해 각 객체에 할당되므로 동일한 오디오를 두 번 이상 표시하는 Dictation 객체를 만드는 것이 좋습니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

CreateDictationStore

rpc CreateDictationStore(CreateDictationStoreRequest) returns (DictationStore)

상위 데이터 세트 내에 새 Dictation store를 만듭니다. 기존 저장소와 동일한 ID로 음성기록 저장소를 만들려고 시도하면 ALREADY_EXISTS 오류와 함께 작업이 실패합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

CreateNote

rpc CreateNote(CreateNoteRequest) returns (Note)

Note를 만듭니다. 메모가 받아쓰기 저장소에 추가되고 받아쓰기와 연결됩니다. 메모는 부분적으로 채워질 수 있습니다. 결과는 UpdateNote를 호출한 후 나중에 입력할 수 있습니다. 하나 이상의 메모를 음성 인식 결과 또는 텍스트 변환가가 수행하는 수동 텍스트 변환을 나타내는 동일한 Dictation와 연결할 수 있습니다. 고유 ID가 이 서비스에 의해 각 객체에 할당되므로 동일한 콘텐츠로 메모 객체를 두 번 이상 만드는 것이 좋습니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

CreateSpeechConfig

rpc CreateSpeechConfig(CreateSpeechConfigRequest) returns (SpeechConfig)

SpeechConfig를 만듭니다. SpeechConfig가 음성기록 저장소에 추가되고 메모와 연결됩니다. SpeechConfig는 부분적으로 채워질 수 있습니다. 나중에 UpdateSpeechConfig를 호출하여 결과를 채울 수 있습니다. 고유 ID가 이 서비스에 의해 각 객체에 할당되므로 동일한 콘텐츠로 SpeechConfig 객체를 두 번 이상 만드는 것이 좋습니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

DeleteDictation

rpc DeleteDictation(DeleteDictationRequest) returns (Empty)

Dictation을 삭제하거나 존재하지 않는 경우 NOT_FOUND를 반환합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

DeleteDictationStore

rpc DeleteDictationStore(DeleteDictationStoreRequest) returns (Empty)

지정된 Dictation store를 삭제하고 그 안에 포함된 모든 음성기록을 삭제합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

DeleteNote

rpc DeleteNote(DeleteNoteRequest) returns (Empty)

기존 Note를 삭제합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

DeleteSpeechConfig

rpc DeleteSpeechConfig(DeleteSpeechConfigRequest) returns (Empty)

SpeechConfig를 삭제하거나 존재하지 않는 경우 NOT_FOUND를 반환합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

GetDictation

rpc GetDictation(GetDictationRequest) returns (Dictation)

Dictation을 가져옵니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

GetDictationStore

rpc GetDictationStore(GetDictationStoreRequest) returns (DictationStore)

지정된 Dictation store를 가져오거나 존재하지 않는 경우 NOT_FOUND를 반환합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

GetIamPolicy

rpc GetIamPolicy(GetIamPolicyRequest) returns (Policy)

리소스의 액세스 제어 정책을 가져옵니다. 리소스가 없으면 NOT_FOUND 오류를 반환합니다. 리소스가 존재하지만 설정된 정책이 없는 경우 빈 정책을 반환합니다.

승인을 처리하려면 지정된 리소스에 대한 Google IAM 권한 healthcare.DictationStores.getIamPolicy가 필요합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

GetNote

rpc GetNote(GetNoteRequest) returns (Note)

Note를 가져옵니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

GetSpeechConfig

rpc GetSpeechConfig(GetSpeechConfigRequest) returns (SpeechConfig)

SpeechConfig 구성을 가져옵니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

ListDictationStores

rpc ListDictationStores(ListDictationStoresRequest) returns (ListDictationStoresResponse)

지정된 데이터 세트의 Dictation stores를 나열합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

ListDictations

rpc ListDictations(ListDictationsRequest) returns (ListDictationsResponse)

지정된 Dictation storeDictations를 나열합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

ListNotes

rpc ListNotes(ListNotesRequest) returns (ListNotesResponse)

필터링을 지원하는 지정된 Dictation의 모든 Notes를 나열합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

ListSpeechConfigs

rpc ListSpeechConfigs(ListSpeechConfigsRequest) returns (ListSpeechConfigsResponse)

필터링을 지원하는 지정된 Dictation store의 모든 SpeechConfigs를 나열합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

Recognize

rpc Recognize(RecognizeRequest) returns (Operation)

비동기 음성 인식을 수행합니다. google.longrunning.Operations 인터페이스를 통해 결과를 수신합니다. RecognizeResponse 메시지가 포함된 Operation.error 또는 Operation.response를 반환합니다(해당 이름이 RecognizeResponse에 반환된 메모가 Dictation의 하위 항목인 경우). metadata 필드 유형은 OperationMetadata입니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

SetIamPolicy

rpc SetIamPolicy(SetIamPolicyRequest) returns (Policy)

리소스의 액세스 제어 정책을 설정합니다. 기존 정책을 대체합니다.

승인을 처리하려면 지정된 리소스에 대한 Google IAM 권한 healthcare.DictationStores.setIamPolicy가 필요합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

StreamingRecognize

rpc StreamingRecognize(StreamingRecognizeRequest) returns (StreamingRecognizeResponse)

클라이언트가 오디오를 보내는 동안 결과를 수신할 수 있도록 양방향 스트리밍 음성 인식을 수행합니다. gRPC API(REST 아님)를 통해서만 이 메서드를 사용할 수 있습니다. 이 메서드를 통해 전송된 오디오는 요청에 지정된 Dictation에 추가됩니다. 음성기록은 이 호출 전 어떤 오디오도 포함하지 않습니다. 음성기록을 만들 때 CreateDictationRequestaudio 필드를 지정하지 않으면 오디오가 없는 음성기록이 생성됩니다. 클라이언트로 전송된 인식 결과는 요청에 지정된 음성기록의 하위 항목인 Note에 저장됩니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

TestIamPermissions

rpc TestIamPermissions(TestIamPermissionsRequest) returns (TestIamPermissionsResponse)

지정된 리소스에 대해 호출자가 보유한 권한을 반환합니다. 리소스가 없는 경우 NOT_FOUND 오류가 아니라 빈 권한 집합을 반환합니다.

이 API를 호출하는데 필요한 권한은 없습니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

UpdateDictation

rpc UpdateDictation(UpdateDictationRequest) returns (Dictation)

Dictation을 업데이트합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

UpdateDictationStore

rpc UpdateDictationStore(UpdateDictationStoreRequest) returns (DictationStore)

지정된 Dictation store를 업데이트합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

UpdateNote

rpc UpdateNote(UpdateNoteRequest) returns (Note)

Note를 업데이트합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

UpdateSpeechConfig

rpc UpdateSpeechConfig(UpdateSpeechConfigRequest) returns (SpeechConfig)

SpeechConfig를 업데이트합니다.

승인 범위

다음 OAuth 범위 중 하나가 필요합니다.

  • https://www.googleapis.com/auth/cloud-healthcare
  • https://www.googleapis.com/auth/cloud-platform

자세한 내용은 인증 개요를 참조하세요.

CreateDictationRequest

오디오 샘플이 포함된 Dictation 레코드를 만들고 Dictation store에 추가합니다.

필드
parent

string

이 음성기록이 속한 음성기록 저장소의 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.create

dictation

Dictation

생성할 음성기록입니다.

return_mask

FieldMask

반환 마스크는 반환되는 음성기록 리소스에 적용됩니다. FieldMask 정의는 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf#fieldmask를 참조하세요.

CreateDictationStoreRequest

Dictation store를 만듭니다.

필드
parent

string

이 음성기록 저장소가 속한 데이터 세트의 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictationStores.create

dictation_store_id

string

생성 중인 음성기록 저장소의 ID입니다. 문자열은 다음 정규식 [\p{L}\p{N}_\-\.]{1,256}과 일치해야 합니다.

dictation_store

DictationStore

이 음성기록 저장소의 구성 정보입니다.

CreateNoteRequest

Note 레코드를 만들어 Dictation에 추가합니다.

필드
parent

string

이 메모가 속한 음성기록의 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.update

note

Note

생성할 메모입니다.

return_mask

FieldMask

업데이트 마스크는 반환되는 메모 리소스에 적용됩니다. FieldMask 정의는 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf#fieldmask를 참조하세요.

CreateSpeechConfigRequest

인식 구성을 포함하는 SpeechConfig 레코드를 만들고 이를 Dictation store에 추가합니다.

필드
parent

string

이 Speech_config가 속한 음성기록 저장소의 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.speechConfigs.create

speech_config

SpeechConfig

SpeechConfig

DeleteDictationRequest

지정된 Dictation store에서 Dictation을 삭제합니다.

필드
name

string

삭제할 음성기록의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.delete

DeleteDictationStoreRequest

지정된 Dictation store를 삭제합니다.

필드
name

string

삭제할 음성기록 저장소의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictationStores.delete

DeleteNoteRequest

지정된 Dictation에서 Note를 삭제합니다.

필드
name

string

삭제할 메모의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.update

DeleteSpeechConfigRequest

지정된 Dictation store에서 SpeechConfig 구성을 삭제합니다.

필드
name

string

삭제할 SpeechConfig 구성의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.speechConfigs.delete

음성기록

오디오 음성기록

필드
name

string

projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/dictationStores/{dictation_store_id}/dictations/{dictation_id} 형식의 음성기록의 리소스 이름입니다. 서버에서 할당됩니다.

audio

RecognitionAudio

GetDictation 응답으로 반환될 때 바이너리로 표현된 오디오 콘텐츠를 포함합니다. 오디오 필드는 CreateDictation 및 UpdateDictation 응답에 포함되지 않습니다.

create_time

Timestamp

출력 전용. 음성기록이 생성된 시간입니다.

DictationStore

음성기록, 메모, SpeechConfigs와 같은 다른 음성기록 관련 리소스를 저장할 수 있는 음성기록 저장소입니다.

필드
name

string

출력 전용. projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/dictationStores/{dictation_store_id} 형식의 음성기록 저장소 리소스 이름입니다.

pubsub_topic

string

음성기록 및 메모에 대한 변경사항 알림이 게시되는 Cloud Pub/Sub 주제입니다. PubsubMessage.Data는 음성기록 또는 메모 리소스 이름을 포함합니다. PubsubMessage.Attributes는 알림을 트리거한 작업을 기술하는 문자열이 있는 맵을 포함합니다(예: 'action':'CreateDictation'). 알림은 주제가 비어 있지 않을 때만 전송됩니다. 주제 이름은 범위가 프로젝트로 지정되어야 합니다. 이 API는 제공된 Cloud Pub/Sub 주제에 대해 게시자 권한을 가져야 합니다 적절한 권한이 없으면 알림을 전송하는 호출이 실패합니다. 클라이언트에서 제공됩니다.

labels

map<string, string>

음성기록 저장소를 구성하는 데 사용되는 사용자 제공 키-값 쌍입니다.

라벨 키의 길이는 1~63자(영문 기준)여야 하며 UTF-8 인코딩은 최대 128바이트여야 하고 다음 PCRE 정규 표현식을 준수해야 합니다. [\p{Ll}\p{Lo}][\p{Ll}\p{Lo}\p{N}_-]{0,62}

라벨값은 선택사항으로 길이는 1~63자(영문 기준)여야 하며 UTF-8 인코딩은 최대 128바이트여야 하고 다음 PCRE 정규 표현식을 준수해야 합니다. [\p{Ll}\p{Lo}\p{N}_-]{0,63}

특정 저장소와 연결할 수 있는 라벨은 64개 미만입니다.

GetDictationRequest

지정된 Dictation store에서 Dictation을 가져옵니다.

필드
name

string

검색할 음성기록의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.get

GetDictationStoreRequest

Dictation store를 가져옵니다.

필드
name

string

가져올 음성기록 저장소의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictationStores.get

GetNoteRequest

지정된 Dictation에서 Note를 가져옵니다.

필드
name

string

검색할 메모의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.get

GetSpeechConfigRequest

지정된 Dictation store에서 SpeechConfig 레코드를 가져옵니다.

필드
name

string

검색할 SpeechConfig 구성의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.speechConfigs.get

ListDictationStoresRequest

지정된 데이터 세트의 Dictation stores를 나열합니다.

필드
parent

string

데이터세트 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictationStores.list

page_size

int32

단일 응답으로 반환할 음성기록 저장소 수를 제한합니다. 0이면 기본 페이지 크기 100이 사용됩니다.

page_token

string

이전 목록 요청에서 반환된 next_page_token 값입니다(있는 경우).

filter

string

필터와 일치하는 저장소로 반환되는 저장소를 제한합니다. 구문: https://cloud.google.com/appengine/docs/standard/python/search/query_strings 라벨 필터링만 지원됩니다. 예: labels.key=value

ListDictationStoresResponse

지정된 데이터 세트의 Dictation stores를 나열합니다.

필드
dictation_stores[]

DictationStore

반환된 음성기록이 저장됩니다. 요청의 page_size 값보다 많은 음성기록 저장소가 될 수 없습니다.

next_page_token

string

결과의 다음 페이지를 검색하는 토큰으로 목록에 더 이상 결과가 없으면 비어 있습니다.

ListDictationsRequest

지정된 Dictation storeDictations를 나열합니다.

필드
parent

string

음성기록을 검색할 음성기록 저장소의 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.list

page_size

int32

단일 응답으로 반환할 음성기록 수를 제한합니다. 0이면 기본 페이지 크기 100이 사용됩니다.

page_token

string

이전 목록 요청에서 반환된 next_page_token 값입니다(있는 경우).

filter

string

필터와 일치하는 항목으로 음성기록을 제한합니다. 구문: https://cloud.google.com/appengine/docs/standard/python/search/query_strings 필터링에 사용할 수 있는 필드/함수: -use_for_speech_training

ListDictationsResponse

지정된 Dictation storeDictations를 나열합니다.

필드
dictation_names[]

string

반환된 음성기록 이름입니다. 요청의 page_size 값보다 큰 값은 없습니다.

next_page_token

string

결과의 다음 페이지를 검색하는 토큰으로 목록에 더 이상 결과가 없으면 비어 있습니다.

ListNotesRequest

지정된 DictationNotes를 나열합니다.

필드
parent

string

메모를 검색할 음성기록의 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.get

page_size

int32

단일 응답으로 반환할 메모 수를 제한합니다. 0이면 기본 페이지 크기 100이 사용됩니다.

page_token

string

이전 목록 요청에서 반환된 next_page_token 값입니다(있는 경우).

filter

string

필터와 일치하는 메모로 반환되는 메모를 제한합니다. 구문: https://cloud.google.com/appengine/docs/standard/python/search/query_strings 필터링에 사용 가능한 필드/함수: - type - origin - speech_config_name - speaker_external_id - speaker_human_name

ListNotesResponse

지정된 DictationNotes를 나열합니다.

필드
note_names[]

string

반환된 메모 이름입니다. 요청의 page_size 값보다 큰 값은 없습니다.

next_page_token

string

결과의 다음 페이지를 검색하는 토큰으로 목록에 더 이상 결과가 없으면 비어 있습니다.

ListSpeechConfigsRequest

지정된 Dictation storeSpeechConfigs를 나열합니다.

필드
parent

string

SpeechConfig를 검색할 음성기록 저장소의 이름입니다.

승인을 처리하려면 지정된 리소스 parent에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.speechConfigs.list

page_size

int32

단일 응답으로 반환할 SpeechConfig 수의 한도입니다. 0이면 기본 페이지 크기 100이 사용됩니다.

page_token

string

이전 목록 요청에서 반환된 next_page_token 값입니다(있는 경우).

filter

string

필터와 일치하는 것으로 반환되는 SpeechConfig를 제한합니다. 구문: https://cloud.google.com/appengine/docs/standard/python/search/query_strings 필터링에 사용할 수 있는 필드/함수: - speaker_external_id - speaker_human_name

ListSpeechConfigsResponse

지정된 Dictation storeSpeechConfigs를 나열합니다.

필드
speech_config_names[]

string

반환된 SpeechConfigs 이름입니다. 요청의 page_size 값보다 큰 값은 없습니다.

next_page_token

string

결과의 다음 페이지를 검색하는 토큰으로 목록에 더 이상 결과가 없으면 비어 있습니다.

참고

메모는 음성 인식 결과를 나타내거나 음성 인식 모델의 추가 학습 및 최종 수정 텍스트 변환의 저장을 용이하게 하기 위한 진실의 출처로 입력될 수 있습니다.

필드
name

string

projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/dictationStores/{dictation_store_id}/dictations/{dictation_id}/notes/{note_id} 형식으로 된 메모의 리소스 이름입니다. 서버에서 할당됩니다.

speech_config_name

string

SpeechConfig는 projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/dictationStores/{dictation_store_id}/speechConfigs/{speech_config_id} 형식의 메모를 생성하는 데 사용됩니다.

type

Type

메모 유형

origin

string

인식 결과의 출처(예: 특정 모델이 사용됨)

speech_recognition_results[]

SpeechRecognitionResult

대화에서 교대로 말하는 화자의 오디오 부분과 같이 오디오의 순차적 부분에 해당하는 텍스트 변환 결과의 순차적 목록입니다.

create_time

Timestamp

메모가 생성된 시간입니다. 서버에서 설정됩니다.

유형

메모 유형입니다.

열거형
TYPE_UNSPECIFIED 유형이 잘못되었거나 지정되지 않았습니다.
VERBATIM 음성기록 오디오의 '정답'으로 사용할 수 있는 말 그대로의 완전 메모입니다.
CORRECTION 인식에 대한 호출로 생성된 메모를 수정합니다.
DRAFT 최종 메모를 생성하기 전에 업데이트할 수 있는 초안 메모입니다.
FINAL 최종 승인된 메모
AUTO_RECOGNIZED 출력 전용. 인식에 대한 호출로 생성된 메모입니다. AUTO_RECOGNIZED 유형의 메모를 CreateNote로 만들 수 없습니다. AUTO_RECOGNIZED 유형의 메모는 UpdateNote로 업데이트할 수 없습니다. 메모는 AUTO_RECOGNIZED 유형을 만들기 위해 UpdateNote로 업데이트될 수 없습니다.

RecognitionAudio

RecognitionConfig에 지정된 인코딩으로 오디오 데이터를 포함합니다. content 또는 uri를 제공해야 합니다. 둘 다 지정하거나 아무 것도 지정하지 않으면 google.rpc.Code.INVALID_ARGUMENT가 반환됩니다. 오디오 한도를 참조하세요.

필드
통합 필드 audio_source. 인라인 콘텐츠 또는 Cloud Storage URI인 오디오 소스입니다. audio_source은 다음 중 하나여야 합니다.
content

bytes

RecognitionConfig에 지정된 대로 인코딩된 오디오 데이터 바이트입니다. 참고: JSON 표현은 base64를 사용하지만, 프로토콜 버퍼는 모든 bytes 필드와 마찬가지로 순수 바이너리 표현을 사용합니다.

uri

string

RecognitionConfig에 지정된 대로 오디오 데이터 바이트가 포함된 파일을 가리키는 URI입니다. 현재 Cloud Storage URI만 지원되며 gs://bucket_name/object_name 형식으로 지정해야 합니다(다른 URI 형식은 google.rpc.Code.INVALID_ARGUMENT 반환). 자세한 내용은 요청 URI를 참조하세요.

RecognitionConfig

인식기에 요청 처리 방식을 지정하는 정보를 제공합니다.

필드
encoding

AudioEncoding

모든 RecognitionAudio 메시지에서 전송된 오디오 데이터 인코딩 이 필드는 FLACWAV 오디오 파일에는 선택사항이고 다른 모든 오디오 형식에는 필수입니다. 자세한 내용은 AudioEncoding을 참조하세요.

sample_rate_hertz

int32

모든 RecognitionAudio 메시지에서 전송된 오디오 데이터의 샘플링 레이트(Hz)입니다. 유효한 값은 8,000~48,000이며 최적값은 16,000입니다. 최상의 결과를 얻으려면 오디오 소스의 샘플링 레이트를 16,000Hz로 설정하세요. 이 설정이 불가능하다면 다시 샘플링하지 말고 오디오 소스의 기본 샘플링 레이트를 사용하면 됩니다. 이 필드는 FLACWAV 오디오 파일에는 선택사항이고 다른 모든 오디오 형식에는 필수입니다. 자세한 내용은 AudioEncoding을 참조하세요.

audio_channel_count

int32

입력 오디오 데이터의 채널 수입니다. MULTI-CHANNEL 인식에만 이 값을 설정합니다. LINEAR16 및 FLAC의 유효한 값은 1-8입니다. OGG_OPUS의 유효한 값은 '1'-'254'입니다. MULAW, AMR, AMR_WB, SPEEX_WITH_HEADER_BYTE에 유효한 값은 1뿐입니다. 0이거나 생략된 경우 기본값은 단일 채널(모노)입니다. 참고: 기본적으로 첫 번째 채널만 인식됩니다. 각 채널에서 독립적인 인식을 수행하려면 enable_separate_recognition_per_channel을 'true'로 설정합니다.

enable_separate_recognition_per_channel

bool

각 채널을 별도로 인식하려면 이 값을 명시적으로 ‘true’로 설정해야 하고 audio_channel_count > 1이어야 합니다. 인식 결과에는 결과가 속한 채널을 나타내는 channel_tag 필드가 포함됩니다. true가 아니면 첫 번째 채널만 인식됩니다.

language_code

string

제공된 오디오의 언어로서 BCP-47 언어 태그입니다. 'en-US'를 예로 들 수 있습니다. 현재 지원되는 언어 코드 목록은 언어 지원을 참조하세요.

context_phrases[]

string

음성 인식에서 인식할 수 있도록 단어 및 구문 '힌트'가 포함된 문자열 목록입니다. 예를 들어 사용자가 특정 명령을 자주 사용하는 경우 해당 단어와 구문의 정확성을 높이는 데 사용할 수 있습니다. 인식기의 어휘에 단어를 추가하는 데 사용할 수도 있습니다.

model

string

특정 요청에 선택할 수 있는 모델입니다. 모델을 명시적으로 지정하지 않으면 기본값인 'default'가 사용됩니다.

AudioEncoding

요청에서 전송한 오디오 데이터의 인코딩입니다.

모든 인코딩은 단일 채널(모노) 오디오만 지원합니다.

최상의 결과를 얻으려면 오디오 소스를 무손실 인코딩(FLAC 또는 LINEAR16)으로 캡처하고 전송해야 합니다. 특히 주변 소음이 있는 경우 손실 코덱을 사용하여 오디오를 캡처하거나 전송하는 경우 음성 인식의 정확도가 떨어질 수 있습니다. 손실 코덱에는 MULAW, AMR, AMR_WB, OGG_OPUS, SPEEX_WITH_HEADER_BYTE 등이 있습니다.

FLACWAV 오디오 파일 형식에는 포함된 오디오 콘텐츠를 설명하는 헤더가 포함됩니다. LINEAR16 또는 MULAW 인코딩 오디오가 포함된 WAV 파일에 대한 인식을 요청할 수 있습니다. 요청에 FLAC 또는 WAV 오디오 파일 형식을 전송하는 경우 AudioEncoding를 지정할 필요가 없습니다. 오디오 인코딩 형식은 파일 헤더에서 결정됩니다. FLAC 또는 WAV 오디오를 보낼 때 AudioEncoding을 지정하는 경우 인코딩 구성은 오디오 헤더에 설명된 인코딩과 일치해야 합니다. 그렇지 않으면 요청은 google.rpc.Code.INVALID_ARGUMENT 오류 코드를 반환합니다.

열거형
ENCODING_UNSPECIFIED 지정되지 않음
LINEAR16 압축되지 않은 16비트 부호 Little Endian 샘플(리니어 PCM)입니다.
FLAC FLAC(무료 무손실 오디오 코덱)은 손실이 발생하지 않아 인식 성능이 저하되지 않고 필요한 대역폭이 LINEAR16의 약 절반에 불과하므로 이 인코딩이 권장됩니다. FLAC 스트림 인코딩은 16비트와 24비트 샘플을 지원하지만 STREAMINFO의 모든 필드가 지원되지는 않습니다.
MULAW G.711 PCMU/mu-law를 사용하여 14비트 오디오 샘플을 압축하는 8비트 샘플입니다.
AMR 적응형 다중 속도 협대역 코덱입니다. sample_rate_hertz는 8,000이어야 합니다.
AMR_WB 적응형 다중 속도 광대역 코덱입니다. sample_rate_hertz는 16,000이어야 합니다.
OGG_OPUS Ogg 컨테이너의 Opus 인코딩 오디오 프레임(OggOpus)입니다. sample_rate_hertz는 8,000, 12,000, 16,000, 24,000, 48,000 중 하나여야 합니다.
SPEEX_WITH_HEADER_BYTE 손실이 발생한 인코딩을 사용하지 않는 것이 좋습니다만, 매우 낮은 비트 전송률 인코딩이 필요한 경우 Speex 인코딩보다 OGG_OPUS를 사용하는 것이 좋습니다. Cloud Speech API에서 지원하는 Speex 인코딩에는 MIME 유형 audio/x-speex-with-header-byte의 경우와 같이 각 블록에 헤더 바이트가 있습니다. 이는 RFC 5574에 정의된 RTP Speex 인코딩의 변이입니다. 스트림은 RTP 패킷당 하나의 블록으로 연속된 블록입니다. 각 블록은 블록 길이가 바이트 단위로 포함된 바이트로 시작되며 RFC 5574에 지정된 정수 바이트 수(옥텟)로 패딩된 하나 이상의 Speex 데이터 프레임이 뒤따릅니다. 즉, 각 RTP 헤더는 블록 길이를 포함하는 단일 바이트로 바뀝니다. Speex 광대역만 지원되며, sample_rate_hertz는 16,000이어야 합니다.

RecognizeRequest

Dictation을 음성 인식 엔진으로 전송합니다. Note 레코드를 만들어 Dictation에 추가합니다.

필드
name

string

텍스트 변환할 음성기록의 리소스 이름입니다.

승인을 처리하려면 지정된 리소스 name에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.recognize

speech_config_name

string

인식 요청에 사용할 SpeechConfig 구성입니다. 음성 구성을 전체 REST 경로 projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/dictationStores/{dictation_store_id}/speechConfigs/{speech_config_id}로 제공해야 합니다.

승인을 처리하려면 지정된 리소스 speechConfigName에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.speechConfigs.get

enable_voice_actions

bool

인식 엔진이 음성 작업을 찾아야 하는지 여부를 결정합니다.

RecognizeResponse

Dictation에서 Recognize 메서드의 최종 응답입니다. 이 구조는 Recognize 실행의 세부 출력을 기술하기 위해 google.longrunning.Operation.result.response에 포함됩니다. 실행이 완료된 경우에만 포함됩니다.

필드
note_name

string

인식 호출에서 생성된 Note의 리소스 이름으로, projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/dictationStores/{dictation_store_id}/dictations/{dictation_id}/notes/{note_id} 형식입니다.

RecognizedAction

인식 중에 감지된 음성 작업입니다.

가능한 작업이 아래 테이블에 나열됩니다.

음성 작업RecognizedAction

텍스트 선택

예시: 환자에게 헤모글로빈 선택

{ "action_name": "TextSelection",
  "confidence": 1.0,
  "param_results": [
     { "parameter_name": "FromText",
       "value": "hemoglobin" },
     { "parameter_name": "ToText",
       "value": "patient" }
  ]
}

선택한 텍스트 삭제

예시: 선택 해제


{ "action_name": "RemoveSelection",
  "confidence": 1.0
}

마지막 발언 또는 현재 문장 삭제

예시: 실행 취소


{ "action_name": "Undo",
  "confidence": 0.8
}

새 줄 삽입

예시: 새 줄


{ "action_name": "NewLine",
  "confidence": 1.0
}

새 단락 삽입

예시: 새 단락


{ "action_name": "NewParagraph",
  "confidence": 1.0
}

이전 단어로 커서 이동

예시: 헤모글로빈 앞에 삽입


{ "action_name": "InsertAt",
  "confidence": 0.5,
  "param_results": [
     { "parameter_name": "InsertLocation",
       "value": "before" },
     { "parameter_name": "InsertTarget",
       "value": "hemoglobin" }
  ]
}

커서 이동

예시: 문장 끝으로 이동


{ "action_name": "MoveCursor",
  "confidence": 0.6,
  "param_results": [
     { "parameter_name": "MoveLocation",
       "value": "end" },
     { "parameter_name": "MoveTarget",
       "value": "sentence" }
  ]
}

커서가 있는 목록 만들기

예시: 번호 1 낮은 bp 삽입


{ "action_name": "CreateList",
  "confidence": 0.6,
  "param_results": [
     { "parameter_name": "ListNum",
       "value": "1" },
     { "parameter_name": "InsertText",
       "value": "low pb" }
  ]
}

필드
action_name

string

감지된 작업의 이름입니다.

confidence

float

신뢰도 추정치로서 0.0에서 1.0 사이입니다. 숫자가 클수록 지정된 음성 작업일 가능성이 높아집니다.

params[]

RecognizedActionParameter

감지된 작업의 매개변수 목록입니다.

RecognizedActionParameter

작업 매개변수를 나타냅니다.

필드
parameter_name

string

작업 매개변수의 이름입니다 (예시: FromText).

value

string

작업 매개변수의 값입니다 (예시: Foo).

SpeechConfig

학습 및 적용을 지원하는 구성 기록입니다. 실제 사람인 화자는 SpeechConfig 구성을 공유하거나 각각 별도의 구성을 보유할 수 있습니다.

필드
name

string

projects/{project_id}/locations/{location_id}/datasets/{dataset_id}/dictationStores/{dictation_store_id}/speechConfigs/{speech_config_id} 형식의 구성 리소스 이름입니다. 서버에서 할당됩니다.

recognition_config

RecognitionConfig

인식기에 요청 처리 방식을 지정하는 정보를 제공합니다.

speaker_external_id

string

특정 구성을 선택하는 데 사용할 수 있는 외부 시스템의 ID입니다.

speaker_human_name

string

제공된 사람의 이름입니다.

SpeechRecognitionResult

오디오의 일부분에 해당되는 음성 인식 결과입니다.

필드
transcript

string

출력 전용. 사용자가 말한 단어를 나타내는 스크립트 텍스트입니다.

confidence

float

출력 전용. 신뢰도 추정치로서 0.0에서 1.0 사이입니다. 숫자가 클수록 인식된 단어가 정확할 가능성이 높아집니다. 이 필드는 정확성이 보장되지 않으며 경우에 따라서는 제공되지 않을 수도 있습니다. 기본값 0.0은 confidence가 설정되지 않았음을 나타내는 센티널 값입니다.

words[]

WordInfo

출력 전용. 인식된 각 단어의 단어별 정보 목록입니다.

channel_tag

int32

다중 채널 오디오의 경우 해당 채널의 오디오를 인식한 결과에 해당하는 채널 번호입니다. audio_channel_count = N이라면 출력 값의 범위는 '1'~'N'입니다.

action

RecognizedAction

인식 중에 음성 작업이 감지되었습니다.

StreamingRecognitionResult

현재 처리 중인 오디오의 일부분에 해당하는 스트리밍 음성 인식 결과입니다.

필드
speech_recognition_result

SpeechRecognitionResult

출력 전용. 음성 인식의 증분 결과. is_finalfalse로 반환되는 한 결과는 계속 변경될 수 있습니다. 결과가 완전히 안정화되면 저장된 note 리소스에 결과가 추가되고 is_finaltrue로 설정됩니다.

is_final

bool

출력 전용. false이면 이 StreamingRecognitionResult는 변경될 수 있는 중간 결과를 나타냅니다. true이면 이번이 음성 서비스에서 이 특정 StreamingRecognitionResult를 최종적으로 반환할 때입니다. 인식기는 스크립트와 해당 오디오의 이 부분에 대해 더 이상 가설을 반환하지 않습니다.

stability

float

출력 전용. 인식기가 이 중간 결과에 대한 추측을 변경하지 않을 가능성에 대한 추정치입니다. 값의 범위는 0.0(완전히 불안정함)~1.0(완전히 안정적임)입니다. 이 필드는 중간 결과(is_final=false)에만 제공됩니다. 기본값 0.0은 stability가 설정되지 않았음을 나타내는 센티널 값입니다.

StreamingRecognizeRequest

[StreamingRecognize] [google.cloud.healthcare.v1alpha2.dictation.StreamingRecognize] 메서드에 대해 클라이언트에서 보낸 최상위 메시지입니다. 여러 StreamingRecognizeRequest 메시지가 전송됩니다. 첫 번째 메시지는 stream_setup_info 메시지를 포함해야 하며 audio_content 데이터를 포함해서는 안 됩니다. 이후의 모든 메시지는 audio_content 데이터를 포함해야 하며 stream_setup_info 메시지를 포함해서는 안 됩니다.

필드
통합 필드 streaming_request. 스트리밍 설정 정보 또는 오디오 콘텐츠인 스트리밍 요청입니다. streaming_request은 다음 중 하나여야 합니다.
stream_setup_info

RecognizeRequest

인식기에 요청 처리 방식을 지정하는 정보를 제공합니다. 첫 번째 StreamingRecognizeRequest 메시지는 stream_setup_info 메시지를 포함해야 합니다.

audio_content

bytes

인식할 오디오 데이터입니다. 오디오 데이터의 순차적 청크는 순차적 StreamingRecognizeRequest 메시지로 전송되어야 합니다. 첫 번째 StreamingRecognizeRequest 메시지는 audio_content 데이터를 포함하지 않아야 하며 모든 후속 StreamingRecognizeRequest 메시지는 audio_content 데이터를 포함해야 합니다. 오디오 바이트는 RecognizeRequest에 지정된 대로 인코딩되어야 합니다. 참고: 모든 bytes 필드와 마찬가지로 프로토콜 버퍼는 base64가 아닌 순수 바이너리 표현을 사용합니다. 오디오 한도를 참조하세요.

StreamingRecognizeResponse

StreamingRecognizeResponse는 [StreamingRecognize] [google.cloud.healthcare.v1alpha2.dictation.StreamingRecognize]에서 클라이언트로 반환하는 유일한 메시지입니다. 0개 이상의 StreamingRecognizeResponse 메시지가 클라이언트로 다시 스트리밍됩니다. 인식 가능한 오디오가 없고 single_utterance가 false로 설정되어 있으면 메시지가 클라이언트로 다시 스트리밍되지 않습니다.

다음은 오디오를 처리하는 동안 반환될 수 있는 일련의 StreamingRecognizeResponse 예시입니다.

  1. results { speech_recognition_result { transcript: "tube" } stability: 0.01 }

  2. results { speech_recognition_result { transcript: "to be a" } stability: 0.01 }

  3. results { speech_recognition_result { transcript: "to be" } stability: 0.9 } results { speech_recognition_result { transcript: " or not to be" } stability: 0.01 }

  4. results { speech_recognition_result { transcript: "to be or not to be" confidence: 0.92 } is_final: true }

  5. results { speech_recognition_result { transcript: " that's" } stability: 0.01 }

  6. results { speech_recognition_result { transcript: " that is" } stability: 0.9 } results { speech_recognition_result { transcript: " the question" } stability: 0.01 }

  7. results { speech_recognition_result { transcript: " that is the question" confidence: 0.98 } is_final: true }

참고

  • 위의 응답 중 is_final: true 필드로 표시된 두 응답(#4 및 #7)에만 최종 결과가 있습니다. 응답을 연결하면 전체 스크립트가 만들어집니다.

  • 다른 응답에는 중간 results가 포함됩니다. #3과 #6에는 두 개의 중간 results이 포함되어 있습니다. 첫 번째 부분은 안정성이 높고 변경될 가능성이 낮습니다. 두 번째 부분은 안정성이 낮으며 변경될 가능성이 매우 높습니다.

  • 위에 표시된 특정 stabilityconfidence 값은 참고용이며 실제 값은 다를 수 있습니다.

  • 각 응답에서 error, speech_event_type, 하나 이상의 반복되는 results 필드 중 하나만 설정됩니다.

필드
error

Status

출력 전용. 스트리밍 작업과 관련된 오류 상태입니다(있는 경우).

results[]

StreamingRecognitionResult

출력 전용. 반복되는 이 목록에는 현재 처리 중인 오디오의 연속 부분에 해당하는 0개 이상의 결과가 포함됩니다. 0개 이상의 is_final=true 결과(새로 결정된 부분)가 포함되며, 그 뒤에 0개 이상의 is_final=false 결과(중간 결과)가 나옵니다.

speech_event_type

SpeechEventType

출력 전용. 음성 이벤트 유형을 나타냅니다.

SpeechEventType

음성 이벤트 유형을 나타냅니다.

열거형
SPEECH_EVENT_TYPE_UNSPECIFIED 음성 이벤트가 지정되지 않았습니다.
END_OF_SINGLE_UTTERANCE 이 이벤트는 서버가 사용자 발화의 끝을 감지했으며 추가 발언을 기대하지 않음을 나타냅니다. 따라서 서버는 추가 오디오를 처리하지 않습니다. 하지만 나중에 추가 결과가 반환될 수 있습니다. 클라이언트는 추가 오디오 데이터 전송을 중단하고 gRPC 연결을 반쯤 닫은 후 서버가 gRPC 연결을 닫을 때까지 추가 결과를 기다려야 합니다. 이 이벤트는 single_utterancetrue로 설정된 경우에만 전송되며 다른 방식으로 사용되지 않습니다.

TrainingConsent

음성 인식을 향상시키기 위해 제공되는 동의 유형을 지정합니다.

열거형
ALLOW 학습에 동의합니다.
DISALLOW 학습에 동의하지 않습니다.

UpdateDictationRequest

지정된 Dictation 업데이트를 요청합니다.

필드
dictation

Dictation

서버의 리소스를 업데이트하는 음성기록 리소스입니다. update_mask에 나열된 필드만 필요하거나 적용됩니다.

승인을 처리하려면 지정된 리소스 dictation에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.update

update_mask

FieldMask

업데이트 마스크가 리소스에 적용됩니다. FieldMask 정의는 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf#fieldmask를 참조하세요.

UpdateDictationStoreRequest

Dictation store를 업데이트합니다.

필드
dictation_store

DictationStore

서버의 리소스를 업데이트하는 음성기록 저장소 리소스입니다. update_mask에 나열된 필드만 적용됩니다.

승인을 처리하려면 지정된 리소스 dictationStore에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictationStores.update

update_mask

FieldMask

업데이트 마스크가 리소스에 적용됩니다. FieldMask 정의는 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf#fieldmask를 참조하세요.

UpdateNoteRequest

지정된 Note 업데이트를 요청합니다(예시: SpeechConfig 업데이트).

필드
note

Note

서버의 리소스를 업데이트하는 메모 리소스입니다. update_mask에 나열된 필드만 필요하거나 적용됩니다. AUTO_RECOGNIZED 유형의 메모는 업데이트할 수 없습니다. 메모는 AUTO_RECOGNIZED 유형으로 업데이트할 수 없습니다.

승인을 처리하려면 지정된 리소스 note에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.dictations.update

update_mask

FieldMask

업데이트 마스크가 리소스에 적용됩니다. FieldMask 정의는 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf#fieldmask를 참조하세요.

UpdateSpeechConfigRequest

지정된 SpeechConfig 업데이트를 요청합니다(예시: 언어 업데이트).

필드
speech_config

SpeechConfig

서버의 리소스를 업데이트하는 SpeechConfig 리소스입니다. update_mask에 나열된 필드만 필요하거나 적용됩니다.

승인을 처리하려면 지정된 리소스 speechConfig에 대해 다음과 같은 Google IAM 권한이 필요합니다.

  • healthcare.speechConfigs.update

update_mask

FieldMask

업데이트 마스크가 리소스에 적용됩니다. FieldMask 정의는 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf#fieldmask를 참조하세요.

WordInfo

인식된 단어의 단어별 정보입니다.

필드
start_time_offset

Duration

출력 전용. 오디오 시작을 기준으로 발화 시작 시점의 시간 오프셋입니다. 이 필드는 enable_word_time_offsets=true인 경우에만 설정되며 최상위 가설에만 설정됩니다. 시험용 기능이며 시간 오프셋의 정확성은 일정하지 않을 수 있습니다.

end_time_offset

Duration

출력 전용. 오디오 시작을 기준으로 발화 끝 시점의 시간 오프셋입니다. 이 필드는 enable_word_time_offsets=true인 경우에만 설정되며 최상위 가설에만 설정됩니다. 시험용 기능이며 시간 오프셋의 정확성은 일정하지 않을 수 있습니다.

word

string

출력 전용. 이 정보 세트에 해당하는 단어입니다.

confidence

float

출력 전용. 신뢰도 추정치로서 0.0에서 1.0 사이입니다. 숫자가 클수록 인식된 단어가 정확할 가능성이 높아집니다. 이 필드는 정확성이 보장되지 않으며 경우에 따라서는 제공되지 않을 수도 있습니다. 기본값 0.0은 confidence가 설정되지 않았음을 나타내는 센티널 값입니다.