Perguntas frequentes

Quem rotulará meus dados?
Temos dois fornecedores principais, subprocessadores oficialmente integrados de acordo com nossos Termos de segurança e processamento de dados (DPST, na sigla em inglês): GlobalLogic Technologies Ltd e Teleperformance Global Services. Eles estão sujeitos a todas as obrigações de segurança e conformidade padrão aplicáveis ao subprocessador estabelecidas nos DPST.

Vocês podem fornecer informações sobre a segurança e a proteção dos meus dados?
Todos os dados usados no Serviço de rotulagem de dados do AI Platform e armazenados no Google Cloud são criptografados por padrão. Os rotuladores humanos só podem visualizar seus dados durante a rotulagem. Não divulgaremos nem usaremos seus dados sem sua permissão para outros fins além da rotulagem de dados solicitada. Se você excluir os conjuntos de dados rotulados pelo serviço de rotulagem de dados, o início da exclusão de todas as cópias dos seus dados do nosso sistema começará dentro de 24 horas. Implementamos medidas de segurança destinadas a impedir a perda de dados, o acesso não autorizado ou spam nos seus dados.

Posso rotular os dados de saúde?
Sim, o Serviço de rotulagem de dados do AI Platform é compatível com HIPAA e pode ser usado para rotular dados de saúde.

Quais métodos de controle de qualidade posso usar para garantir a qualidade da rotulagem?

É possível solicitar que vários rotuladores humanos façam anotações em cada um dos seus dados. Quando houver discordância quanto à rotulagem, receberemos opiniões de outros rotuladores até que haja consenso ou o número máximo de rotuladores que você definiu seja atingido.

Por exemplo, se você solicita três rotuladores:

  1. em tarefas de classificação de imagens, todos os três rotuladores classificam cada imagem e usam o voto da maioria para decidir a resposta final;
  2. em tarefas de caixa delimitadora de imagem, o primeiro rotulador desenha as caixas e o segundo as verifica. Se o segundo rotulador discordar e fizer alguma edição, consultaremos o terceiro para definir uma opinião majoritária.
As instruções são muito importantes para o resultado da rotulagem, porque ensina nossos rotuladores a rotular o conjunto de dados deles. Por isso, recomendamos que você dê uma olhada nas dicas de como criar boas instruções. Podemos notificar você se as instruções não forem claras.
Além disso, recomendamos que você aumente gradualmente seus jobs de rotulagem de dados. Inicie seu primeiro job com uma pequena quantidade de dados e verifique se os resultados são os esperados. Revise suas instruções de acordo com o feedback e os resultados que você recebeu e crie jobs subsequentes para iteração até se sentir confortável para enviar grandes quantidades de dados. Isso ajudará você a conseguir resultados de alta qualidade e aproveitar ao máximo seu orçamento.

Qual é a diferença entre uma "tarefa" e uma "operação"?
Uma tarefa é uma ação que você executa usando o serviço de rotulagem de dados, como importação, exportação ou solicitação de rotulagem. Uma operação é o job de longa duração do Google que conclui a tarefa solicitada por meio de uma chamada de API.

Como saberei quando uma operação (de importação, exportação ou rotulagem) for concluída?
Quando você usa a API Data Labeling Service para solicitar importação, exportação ou rotulagem, a resposta inclui o nome da operação que concluirá a tarefa solicitada. Use o nome da operação para verificar o status da solicitação.
Enquanto a operação está em execução, você vê um campo progressPercent indicando o progresso (se não for mostrado, o progresso é 0%). Quando a operação estiver concluída, a resposta incluirá o valor "done": true.
Além disso, você recebe um e-mail sempre que uma operação é concluída.

Como recebo o ID do conjunto de dados anotado após solicitar a rotulagem?
ListAnnotatedDatasets retorna os nomes dos seus conjuntos de dados anotados. O formato do nome é projects/sample_project_id/datasets/test_dataset_id/annotatedDatasets/sample_id. O ID é o valor que aparece depois de annotatedDataSets/.

O que significa quando recebo um HttpError 404 com a mensagem "Os acessos de recurso solicitados não estão disponíveis. Esta solicitação foi rejeitada devido a conflito de recursos"?
Isso significa que outra operação em execução está usando o recurso. Por exemplo, o erro poderá aparecer se você solicitar a rotulagem antes que a operação de dados de importação seja concluída.

Por que não consigo excluir minha tarefa de rotulagem/instrução/conjunto de dados?
Provavelmente há um conflito de recursos porque uma operação em execução está usando o recurso.

Preciso digitar manualmente todos os meus rótulos um de cada vez para criar um conjunto de rótulos?
Sim, se você estiver usando a IU do Serviço de rotulagem de dados do AI Platform. Se você estiver usando a API, encaminhe de maneira programática quantos argumentos quiser.

Por que minha solicitação de rotulagem de dados da caixa delimitadora de imagens é retornada dentro de alguns minutos sem anotações?
Muito provavelmente, o formato da imagem não é aceito.

Por que a porcentagem de progresso ainda é zero um tempo depois de eu ter enviado minha tarefa de rotulagem?
Dois motivos possíveis (entre em contato com cloudml-data-customer@google.com para mais informações):
  • Sua tarefa ainda não foi selecionada por causa de um grande volume de solicitações. A tarefa está na fila e será iniciada assim que possível.
  • Você solicitou vários rotuladores por item, e nem todos rotularam os itens de dados. Por exemplo, se você solicitou três rotuladores, um item de dados será marcado como completo somente depois que todos os três rotuladores terminarem de rotulá-lo. Mesmo que todos os itens de dados tenham sido rotulados por um ou dois rotuladores, o percentual de progresso permanecerá zerado.