Domande frequenti

Chi etichetterà i miei dati?
Abbiamo due fornitori principali che hanno ufficialmente ricevuto l'onboarding di Sub-responsabili ai sensi dell'Addendum per il trattamento dei dati Cloud (ATDC): GlobalLogic Technologies Ltd e Teleperformance Global Services. Sono soggetti a tutte le obbligazioni vigenti in materia di sicurezza e conformità dei Sub-responsabili indicate nell'ATDC.

Potete fornire informazioni sulla sicurezza e sulla protezione dei miei dati?
Tutti i dati utilizzati in AI Platform Data Labeling Service e archiviati in Google Cloud sono criptati per impostazione predefinita. I labeler umani possono visualizzare i tuoi dati solo durante l'etichettatura. Senza il tuo consenso, non divulgheremo o utilizzeremo i tuoi dati per altri scopi oltre a quelli che hai richiesto. Se elimini i set di dati etichettati dal servizio di etichettatura dei dati, l'avvio dell'eliminazione di tutte le copie dei dati dal nostro sistema inizierà entro 24 ore. Implementiamo misure di sicurezza volte a prevenire la perdita di dati, l'accesso non autorizzato o lo spam nei tuoi dati.

Posso etichettare i dati sanitari?
Sì, AI Platform Data Labeling Service è conforme alla normativa HIPAA e può essere utilizzato per etichettare i dati sanitari.

Quali metodi di controllo della qualità posso utilizzare per garantire la qualità dell'etichettatura?

Puoi richiedere a più etichettatori umani di annotare ogni singolo dato. In caso di disaccordo sull'etichettatura, riceviamo ulteriori opinioni dagli altri etichettatori finché non abbiamo raggiunto un accordo o raggiunto il numero massimo di etichettatori che avete impostato.

Ad esempio, se richiedi 3 etichettatori:

  1. Per le attività di classificazione delle immagini, tutte e 3 le etichette avranno la classificazione di ciascuna immagine e useremo la maggioranza dei voti per decidere la risposta finale.
  2. Per le attività del riquadro di delimitazione delle immagini, chiederemo al primo etichettatore di tracciare i riquadri e al secondo etichettarlo di verificarli. Se il secondo etichettatore non è d'accordo e apporta modifiche, continueremo con la terza per ottenere un'opinione a maggioranza.
Le istruzioni sono molto importanti per il risultato dell'etichettatura, in quanto insegnano ai nostri etichettatori come etichettare il tuo set di dati. Di conseguenza, vi invitiamo a dare un'occhiata ai suggerimenti su come creare istruzioni efficaci. Potremmo informarti se le istruzioni non sono chiare.
Inoltre, ti invitiamo a eseguire l'incremento incrementale dei job di etichettatura dei dati. Inizia il tuo primo job di etichettatura con una piccola quantità di dati, quindi verifica se i risultati sono quelli che ti aspetti. Rivedi le istruzioni in base al feedback e ai risultati ricevuti, quindi crea job successivi per eseguire l'iterazione finché non hai dimestichezza con l'invio di quantità di dati maggiori. Questo ti aiuterà a ottenere risultati di alta qualità e a sfruttare al meglio il tuo budget.

Qual è la differenza tra un'"attività" e un'"operazione"?
Un'attività è un'azione che esegui utilizzando Data Labeling Service, ad esempio importare dati, esportare dati o richiedere l'etichettatura. Un'operazione è il job a lunga esecuzione di Google che completa l'attività richiesta utilizzando una chiamata API.

Come faccio a sapere quando viene eseguita un'operazione di (importazione, esportazione o etichettatura)?
Quando utilizzi l'API Data Labeling Service per richiedere l'importazione, l'esportazione o l'etichettatura, la risposta include il nome dell'operazione che completerà l'attività richiesta. Puoi utilizzare il nome dell'operazione per controllare lo stato della richiesta.
Mentre l'operazione è in esecuzione, viene visualizzato un campo progressPercent che indica l'avanzamento (se non viene visualizzato, l'avanzamento è 0%). Quando l'operazione è completata, la risposta include il valore "done": true.
Inoltre, riceverai un'email ogni volta che viene completata un'operazione.

Come faccio a ottenere l'ID del set di dati annotati dopo aver richiesto l'etichettatura?
ListAnnotatedDatasets restituisce i nomi dei set di dati annotati.Il formato del nome è projects/sample_project_id/datasets/test_dataset_id/annotatedDatasets/sample_id; l'ID è il valore visualizzato dopo annotatedDataSets/.

Cosa significa quando ricevo un HttpError 404 con il messaggio "Gli accessi alle risorse richiesti non sono disponibili. Questa richiesta è stata rifiutata a causa di un conflitto di risorse."?
Ciò significa che la risorsa è in uso in un'altra operazione in esecuzione. Ad esempio, potresti visualizzare questo errore se richiedi l'etichettatura prima del completamento dell'operazione di importazione dei dati.

Perché non posso eliminare il mio set di dati, istruzioni/attività di etichettatura?
Probabilmente c'è un conflitto tra le risorse perché un'operazione in esecuzione sta utilizzando la risorsa.

Devo digitare manualmente tutte le mie etichette una alla volta per creare un set di etichette?
Sì, se utilizzi l'interfaccia utente del servizio Data Labeling di AI Platform. Se utilizzi l'API, puoi inoltrare in modo programmatico tutti gli argomenti che vuoi.

Perché la mia richiesta di etichettatura dei dati del riquadro di delimitazione delle immagini restituisce pochi minuti senza annotazioni?
È molto probabile che il formato immagine non sia supportato.

Perché la percentuale di avanzamento è ancora pari a zero un po' dopo aver inviato la mia attività di etichettatura?
Due possibili motivi (per ulteriori informazioni puoi contattare cloudml-data-customer@google.com):
  • La tua attività non è stata ancora raccolta a causa dell'elevato volume di richieste. L'attività è in coda e verrà avviata il prima possibile.
  • Hai richiesto più etichettatori per elemento e non tutti gli etichettatori hanno etichettato alcun elemento di dati. Ad esempio, se hai richiesto tre etichettatori, un elemento di dati viene contrassegnato come completato solo dopo che tutti e tre gli etichettatori hanno terminato l'etichettatura. Anche se tutti gli elementi di dati siano stati etichettati da uno o due etichettatori, la percentuale di avanzamento rimarrebbe pari a zero.