Esta página foi traduzida pela API Cloud Translation.

Criar um repositório de dados de pesquisa de saúde

Cuidado:

Restrições para a área da saúde: como cliente, você não pode usar os Serviços de IA generativa para fins clínicos (para fins de esclarecimento, pesquisas não clínicas, agendamento ou outras tarefas administrativas não são restritas), como substituto de orientação médica profissional ou de qualquer maneira que seja supervisionada ou exija autorização ou aprovação de qualquer autoridade reguladora aplicável. Para mais informações, consulte os Termos específicos do serviço.
Para fins de esclarecimento, no que diz respeito ao uso da Pesquisa da Vertex AI para recuperar e resumir informações médicas, a restrição de uso para fins clínicos significa a restrição de uso para fins de diagnóstico ou tratamento direto sem revisão por um profissional licenciado em conformidade com as leis e regulamentações aplicáveis.
A saída gerada nem sempre é totalmente confiável. Devido à natureza dos LLMs e da IA generativa, as saídas podem ter informações incorretas ou tendenciosas (por exemplo, estereótipos ou outros conteúdos nocivos) e precisam ser revisadas. Todos os resumos ou respostas devem ser considerados rascunho e não resultados finais.
O uso pretendido deste produto não é fornecer informações relacionadas à prevenção, diagnóstico ou tratamento de doenças. O produto não foi criado para responder a perguntas sobre recomendações de diagnóstico ou tratamento. O uso pretendido deste produto é recuperar e resumir informações médicas fornecidas por usuários.
Devido à limitação dos dados de teste, este produto pode ou não ser aplicável à faixa etária de 0 a 18 anos e à faixa etária de 85 anos ou mais. Portanto, ao analisar a saída gerada, os clientes precisam considerar a representatividade das subpopulações nos dados de origem.

Para pesquisar dados clínicos na Vertex AI para Pesquisa, siga um destes fluxos de trabalho:

Crie um repositório de dados de saúde, importe dados FHIR R4 para ele, conecte-o a um app de pesquisa de saúde e consulte os dados clínicos.
Crie um app de pesquisa de saúde, um repositório de dados de saúde e importe dados FHIR R4 para o repositório durante o processo de criação do app e consulte os dados clínicos. Para mais informações, consulte Criar um app de pesquisa de saúde.

Nesta página, descrevemos o primeiro método.

Sobre a frequência de importação de dados

É possível importar dados do FHIR R4 para um repositório de dados das seguintes maneiras:

Importação em lote: uma importação única. Os dados são importados para um repositório de dados em lotes. Para mais importações incrementais, consulte Atualizar dados de saúde.
Importação de streaming: uma importação de dados de streaming quase em tempo real. Todas as mudanças incrementais no repositório FHIR de origem são sincronizadas no repositório de dados da Vertex AI para Pesquisa. O streaming exige um conector de dados, que é um tipo de repositório de dados. Para criar um conector de dados, é preciso configurar uma coleta. Um conector de dados contém uma entidade, que também é uma instância de repositório de dados.

Você também pode pausar e retomar a transmissão e fazer uma sincronização manual sempre que necessário. Para mais informações, consulte Gerenciar um repositório de dados de pesquisa de saúde.

A taxa de transmissão de dados para um determinado projeto Google Cloud depende das seguintes cotas. Se você exceder a cota, poderá ter atrasos no streaming.
- O número de gravações pendentes de streaming do FHIR ou do BigQuery por minuto. Para mais informações, consulte Cotas e limites.
- O número de operações de leitura do FHIR por minuto por região. Para mais informações, consulte Cotas de FHIR da API Cloud Healthcare.

É possível selecionar a frequência de importação de dados no momento da criação do repositório de dados, mas não é possível mudar essa configuração depois.

Antes de começar

Antes de criar o repositório de dados de saúde e importar dados para ele, entenda o seguinte:

A relação entre apps e repositórios de dados para pesquisa de saúde. Para mais informações, consulte Sobre apps e repositórios de dados.
A preparação dos seus dados FHIR para ingestão.
A Vertex AI para Pesquisa na área da saúde oferece serviços de pesquisa apenas na multirregião dos EUA (us). Portanto, seu app de pesquisa e repositórios de dados de saúde precisam estar na multirregião us.
Se você estiver importando dados de saúde de um repositório de FHIR da API Cloud Healthcare em um projeto Google Cloud para um repositório de dados da Vertex AI Search em um projeto Google Cloud diferente e estiver usando o VPC Service Controls, os dois projetos precisarão estar no mesmo perímetro.

Criar um repositório de dados e importar seus dados

É possível criar um repositório de dados e importar seus dados do FHIR R4 no console doGoogle Cloud ou usando a API com as seguintes abordagens:

É possível criar um repositório de dados estático com uma importação em lote única. Para mais informações, consulte Criar um repositório de dados estáticos e realizar uma importação em lote única.
É possível criar um repositório de dados de streaming com as mudanças do seu repositório FHIR da API Cloud Healthcare transmitidas continuamente para o repositório de dados da Vertex AI Search. Para mais informações, consulte Criar um repositório de dados de streaming e configurar uma importação de streaming.

Permissões exigidas para a tarefa

Conceda os seguintes papéis do Identity and Access Management (IAM) à conta de serviço service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com no projeto que contém o repositório de dados do AI Applications:

Finalidade	Papéis
Para realizar uma importação em lote única de dados FHIR de armazenamentos FHIR na API Cloud Healthcare.	Usuário de jobs do BigQuery(`roles/bigquery.jobUser`) Editor de dados do BigQuery (`roles/bigquery.dataEditor`) Administrador de repositórios FHIR do Healthcare (`roles/healthcare.fhirStoreAdmin`)
Para realizar uma importação de streaming de dados FHIR de armazenamentos FHIR na API Cloud Healthcare no mesmo projeto Google Cloud .	Usuário de jobs do BigQuery(`roles/bigquery.jobUser`) Editor de dados do BigQuery (`roles/bigquery.dataEditor`) Administrador de repositórios FHIR do Healthcare (`roles/healthcare.fhirStoreAdmin`) Leitor de recursos FHIR do Healthcare (`roles/healthcare.fhirResourceReader`)
Para realizar uma importação de streaming de dados FHIR de armazenamentos FHIR na API Cloud Healthcare em um projeto Google Cloud diferente.	Usuário de jobs do BigQuery(`roles/bigquery.jobUser`) Editor de dados do BigQuery (`roles/bigquery.dataEditor`) Administrador de repositórios FHIR do Healthcare (`roles/healthcare.fhirStoreAdmin`) Leitor de recursos FHIR do Healthcare (`roles/healthcare.fhirResourceReader`)
Para importar dados FHIR que referenciam arquivos no Cloud Storage. Elas são concedidas por padrão se os arquivos referenciados estiverem no mesmo projeto Google Cloud que o app AI Applications.	Administrador de objetos do Storage (`roles/storage.objectAdmin`)
Para personalizar o esquema ao criar um repositório de dados e configurar a capacidade de indexação, pesquisa e recuperação de recursos e elementos do FHIR.	Administrador de objetos do Storage (`roles/storage.objectAdmin`)

Conceda os seguintes papéis do Identity and Access Management à conta de serviço service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com no projeto que contém o repositório de dados FHIR R4 da API Cloud Healthcare:

Finalidade	Papéis
Para realizar uma importação de streaming de dados FHIR de armazenamentos FHIR na API Cloud Healthcare em um projeto Google Cloud diferente.	Administrador de repositórios FHIR do Healthcare (`roles/healthcare.fhirStoreAdmin`) Leitor de recursos FHIR do Healthcare (`roles/healthcare.fhirResourceReader`)

Conceda os seguintes papéis do Identity and Access Management à conta de serviço service-SOURCE_PROJECT_NUMBER@gcp-sa-healthcare.iam.gserviceaccount.com no projeto que contém o repositório de dados FHIR R4 da API Cloud Healthcare:

Finalidade	Papéis
Para realizar uma importação de streaming de dados FHIR de armazenamentos FHIR na API Cloud Healthcare no mesmo projeto Google Cloud .	Usuário de jobs do BigQuery(`roles/bigquery.jobUser`) Editor de dados do BigQuery (`roles/bigquery.dataEditor`)
Para personalizar o esquema ao criar um repositório de dados e configurar a capacidade de indexação, pesquisa e recuperação de recursos e elementos do FHIR.	Administrador de objetos do Storage (`roles/storage.objectAdmin`)

Criar um repositório de dados estático e fazer uma importação em lote única

Esta seção descreve como criar um repositório de dados da Vertex AI para Pesquisa em que só é possível fazer importações em lote. Você pode importar dados em lote ao criar o repositório de dados e fazer importações incrementais em lote sempre que necessário.

Console

No console Google Cloud , acesse a página Aplicativos de IA.

Aplicativos de IA
No menu de navegação, selecione Repositório de dados.
Clique em Criar repositório de dados.
No painel Selecionar uma fonte de dados, escolha API Healthcare (FHIR) como sua fonte de dados.
Para importar dados do seu armazenamento FHIR, faça o seguinte:
- Selecione o armazenamento de FHIR na lista de armazenamentos disponíveis:
  1. Abra o campo Armazenamento FHIR.
  2. Nessa lista, selecione um conjunto de dados que esteja em um local permitido e um armazenamento de FHIR que use a versão R4 do FHIR.
- Insira o armazenamento FHIR manualmente:
  1. Abra o campo Armazenamento FHIR.
  2. Clique em Inserir armazenamento FHIR manualmente.
  3. Na caixa de diálogo Nome do armazenamento FHIR, insira o nome completo do armazenamento FHIR no seguinte formato:
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. Clique em Salvar.
Na seção Sincronização, selecione uma das seguintes opções: Essa seleção não pode ser alterada depois que o repositório de dados é criado.
- Única: para realizar uma importação única de dados em lote. Para mais importações incrementais, consulte Atualizar dados de saúde.
- Streaming: para importar dados de streaming quase em tempo real. Para transmitir dados, crie um conector de dados, que é um tipo de repositório de dados. Para configurar um repositório de dados de streaming usando a API REST, entre em contato com seu engenheiro de clientes.
Na seção Qual é o esquema para esses dados?, selecione uma destas opções:
- Esquema predefinido do Google: para manter as configurações de esquema definidas pelo Google, como indexação, capacidade de pesquisa e capacidade de recuperação, para os recursos e elementos FHIR compatíveis. Depois de selecionar essa opção, não será possível atualizar o esquema após criar o repositório de dados. Se quiser mudar o esquema depois da criação do repositório de dados, selecione a opção Esquema personalizado.
  1. Clique em Continuar.
  2. No campo Nome do repositório de dados, insira um nome para o repositório.
  3. Clique em Criar.
- Esquema personalizado: para definir suas próprias configurações de esquema, como indexação, capacidade de pesquisa e capacidade de recuperação, para os recursos e elementos FHIR compatíveis. Para configurar um esquema configurável, entre em contato com seu engenheiro de clientes.
  1. Clique em Continuar.
  2. Revise o esquema, expanda cada campo e edite as configurações.
  3. Clique em Adicionar novos campos para adicionar campos aos recursos FHIR compatíveis. Não é possível remover os campos fornecidos no esquema definido pelo Google.
  4. Clique em Continuar.
  5. No campo Nome do conector de dados, insira um nome para o conector.
  6. Clique em Criar.
Clique em Continuar.

REST

Crie um repositório de dados.
```
curl -X POST\
 -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
 -d '{
    "displayName": "DATA_STORE_DISPLAY_NAME",
    "industryVertical": "HEALTHCARE_FHIR",
    "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    "searchTier": "STANDARD",
    "searchAddOns": ["LLM"],
    "healthcareFhirConfig":
      {
        "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE
      }
}'
```
Substitua:
- PROJECT_ID: o ID do seu Google Cloud projeto.
- DATA_STORE_ID: o ID do repositório de dados da Vertex AI para Pesquisa que você quer criar. Esse ID só pode conter letras minúsculas, dígitos, sublinhados e hífens.
- DATA_STORE_DISPLAY_NAME: o nome de exibição do repositório de dados da Vertex AI para Pesquisa que você quer criar.
- CONFIGURABLE_SCHEMA_TRUE|FALSE: um booleano que, quando definido como true, permite configurar o esquema do repositório de dados usando o método schema.update.
Resposta

Você receberá uma resposta JSON semelhante a seguinte. Se o valor da chave done for true, isso indica que a operação para criar o repositório de dados foi concluída. Caso contrário, a operação de criação do repositório de dados não foi concluída.
```
{
  "name": "OPERATION_ID",
  "done": true
}
```
Se o armazenamento de FHIR de origem e o repositório de dados de destino da Vertex AI para Pesquisa estiverem no mesmo projeto Google Cloud , chame o seguinte método para realizar uma importação em lote única. Se eles não estiverem no mesmo projeto, vá para a próxima etapa.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
Substitua:
- PROJECT_ID: o ID do seu Google Cloud projeto.
- DATA_STORE_ID: o ID do repositório de dados da Vertex AI para Pesquisa.
- CLOUD_HEALTHCARE_DATASET_ID: o ID do conjunto de dados da API Cloud Healthcare que contém o armazenamento FHIR de origem.
- CLOUD_HEALTHCARE_DATASET_LOCATION: o local do conjunto de dados da API Cloud Healthcare que contém o armazenamento FHIR de origem.
- FHIR_STORE_ID: o ID do armazenamento FHIR R4 da API Cloud Healthcare.
Resposta

Você receberá uma resposta JSON semelhante a seguinte. A resposta contém um identificador para uma operação de longa duração. Operações de longa duração são retornadas quando as chamadas de método podem demorar um tempo significativo para serem concluídas. Anote o valor de IMPORT_OPERATION_ID. Você precisa desse valor para verificar o status da importação ou cancelar uma importação em lote em andamento.
```
  {
    "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
    }
  }
```
Se o repositório FHIR de origem e o repositório de dados de destino da Vertex AI Search estiverem em projetos Google Cloud diferentes, chame o método a seguir para realizar uma importação em lote única. Se eles estiverem no mesmo projeto, volte para a etapa anterior.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
Substitua:
- PROJECT_ID: o ID do projeto Google Cloud que contém o repositório de dados da Vertex AI para Pesquisa.
- DATA_STORE_ID: o ID do repositório de dados da Vertex AI para Pesquisa.
- SOURCE_PROJECT_ID: o ID do projeto Google Cloud que contém o conjunto de dados e o armazenamento FHIR da API Cloud Healthcare.
- CLOUD_HEALTHCARE_DATASET_ID: o ID do conjunto de dados da API Cloud Healthcare que contém o armazenamento FHIR de origem.
- CLOUD_HEALTHCARE_DATASET_LOCATION: o local do conjunto de dados da API Cloud Healthcare que contém o armazenamento FHIR de origem.
- FHIR_STORE_ID: o ID do armazenamento FHIR R4 da API Cloud Healthcare.
Resposta

Você receberá uma resposta JSON semelhante a seguinte. A resposta contém um identificador para uma operação de longa duração. Operações de longa duração são retornadas quando as chamadas de método podem levar um tempo considerável para serem concluídas. Anote o valor de IMPORT_OPERATION_ID. Você precisa desse valor para verificar o status da importação.
```
{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
  }
}
```

Python

Para mais informações, consulte a documentação de referência da API Python de aplicativos de IA.

Para autenticar no AI Applications, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.