Glossário de IA generativa

  • Application Default Credentials (ADC)
    • As credenciais padrão do aplicativo (ADC) oferecem uma maneira simples de receber credenciais de autorização para uso em chamadas de APIs do Google. Elas são mais adequadas para casos em que a chamada precisa ter o mesmo nível de identidade e autorização para o aplicativo, seja qual for o usuário. Essa é a abordagem recomendada para autorizar chamadas para as APIs do Google Cloud, principalmente quando você está criando um aplicativo implantado em máquinas virtuais do Google App Engine (GAE) ou do Compute Engine. Para mais informações, consulte Como o Application Default Credentials funciona.
  • Inteligência artificial (IA)
    • A inteligência artificial (IA) é o estudo e o design de máquinas que parecem inteligentes, ou seja, que imitam funções humanas ou intelectuais, como movimento mecânico, raciocínio ou solução de problemas. Um dos subcampos mais conhecidos da IA é o machine learning, que usa uma abordagem estatística e baseada em dados para criar IA. No entanto, algumas pessoas usam esses dois termos como sinônimos.
  • Realidade aumentada (RA)
    • Mesclar conteúdo digital renderizado com conteúdo do mundo real, seja por uma tela, como em um smartphone, ou como uma sobreposição do mundo visto por lentes, como óculos. O conteúdo digital precisa ser rastreado de acordo com o movimento da câmera ou dos óculos (dependendo de como a cena é renderizada) para que pareça parte do mundo real.
  • Reconhecimento automático de fala (ASR,na sigla em inglês)
    • Transcrição automática de linguagem falada (voz) em texto.
  • authentication
    • O processo de verificação da identidade de um cliente (que pode ser um usuário ou outro processo) para ter acesso a um sistema protegido. Um cliente que provou sua identidade é considerado autenticado. Para mais informações, consulte Métodos de autenticação no Google.
  • AutoML
    • Algoritmos de aprendizado de máquina que "aprendem a aprender" com a otimização de caixa preta. Para mais informações, consulte o glossário de ML.
  • valor de referência
    • Um modelo usado como ponto de referência para comparar o desempenho de outro modelo (geralmente, um mais complexo). Por exemplo, um modelo de regressão logística pode servir como uma boa referência para um modelo profundo. Para um problema específico, a linha de base ajuda os desenvolvedores a quantificar a performance mínima esperada que um novo modelo precisa alcançar para ser útil. Para mais informações, consulte Conjuntos de dados de destino e de referência.
  • lote
    • Conjunto de exemplos usados em uma iteração de treinamento. O tamanho do lote determina o número de exemplos em um lote.
  • tamanho do lote
    • O número de exemplos em um lote. Por exemplo, o tamanho do lote de SGD é 1, enquanto o tamanho do lote de um minilote geralmente fica entre 10 e 1.000. O tamanho do lote geralmente é fixado durante o treinamento e a inferência. No entanto, o TensorFlow permite tamanhos de lote dinâmicos.
  • viés
    • 1. Estereótipos, preconceito ou favoritismo em relação a algumas coisas, pessoas ou grupos. Esses vieses podem afetar a coleta e a interpretação de dados, o design de um sistema e a forma como os usuários interagem com ele. 2. Erro sistemático causado por um procedimento de amostragem ou relatório.
  • bidirecional
    • Termo usado para descrever um sistema que avalia o texto que precede e segue uma seção de texto de destino. Em contraste, um sistema unidirecional só avalia o texto que precede uma seção de texto de destino.
  • Representações de codificador bidirecional de transformadores (BERT)
    • O BERT é um método de representação de linguagem pré-treinada, ou seja, treinamos um modelo de compreensão de linguagem de uso geral em um grande corpus de texto (como a Wikipédia) e, em seguida, usamos esse modelo para tarefas de PLN posteriores que nos interessam (como responder a perguntas). O BERT supera os métodos anteriores porque é o primeiro sistema não supervisionado e profundamente bidirecional para pré-treinamento de PLN.
  • Assistente de avaliação bilíngue (BLEU)
    • Uma medida comum para avaliar a qualidade de um algoritmo de tradução automática comparando a saída dele com a de uma ou mais traduções humanas.
  • caixa delimitadora
    • Uma caixa delimitadora para um objeto no frame de vídeo pode ser especificada de duas maneiras: (i) usando dois vértices que consistem em um conjunto de coordenadas x,y se eles forem pontos diagonalmente opostos do retângulo. Por exemplo: x_relative_min, y_relative_min,,,x_relative_max,y_relative_max,, (ii) usar todos os quatro vértices. Para mais informações, consulte Preparar dados do vídeo.
  • chat
    • O conteúdo de uma conversa com um sistema de ML, geralmente um modelo de linguagem grande. A interação anterior em uma conversa (o que você digitou e como o modelo de linguagem grande respondeu) se torna o contexto para as partes subsequentes da conversa. Um chatbot é uma aplicação de um modelo de linguagem grande.
  • ponto de verificação
    • Dados que capturam o estado dos parâmetros de um modelo durante o treinamento ou após a conclusão dele. Por exemplo, durante o treinamento, você pode: 1. Interromper o treinamento, talvez intencionalmente ou como resultado de determinados erros. 2. Capture o checkpoint. 3. Mais tarde, recarregue o ponto de verificação, possivelmente em outro hardware. 4. Reinicie o treinamento. No Gemini, um ponto de verificação se refere a uma versão específica de um modelo treinado em um conjunto de dados específico.
  • modelo de classificação
    • Um modelo cuja previsão é uma classe. Por exemplo, os modelos de classificação a seguir: um modelo que prevê o idioma de uma frase de entrada (francês? Espanhol? Italiano?). Um modelo que prevê espécies de árvores (maple? Carvalho? Baobá?). Um modelo que prevê a classe positiva ou negativa de uma condição médica específica.
  • Cloud TPU
    • Um acelerador de hardware especializado projetado para acelerar cargas de trabalho de machine learning no Google Cloud.
  • janela de contexto
    • O número de tokens que um modelo pode processar em um determinado comando. Quanto maior a janela de contexto, mais informações o modelo pode usar para fornecer respostas coerentes e consistentes ao comando.
  • análise de dados
    • Entender os dados considerando amostras, medições e visualização. A análise de dados pode ser particularmente útil quando um conjunto de dados é recebido pela primeira vez, antes de criar o primeiro modelo. Também é crucial para entender experimentos e depurar problemas com o sistema.
  • aumento de dados
    • Aumentar artificialmente o intervalo e o número de exemplos de treinamento transformando exemplos atuais para criar outros. Por exemplo, suponha que as imagens sejam um dos seus atributos, mas o conjunto de dados não contém exemplos suficientes para o modelo aprender associações úteis. O ideal é adicionar imagens marcadas suficientes ao conjunto de dados para que o modelo seja treinado corretamente. Se isso não for possível, o aumento de dados poderá girar, esticar e refletir cada imagem para produzir muitas variantes da imagem original, possivelmente gerando dados rotulados suficientes para permitir um excelente treinamento.
  • DataFrame
    • Um tipo de dados pandas conhecido para representar conjuntos de dados na memória. Um DataFrame é análogo a uma tabela ou planilha. Cada coluna de um DataFrame tem um nome (um cabeçalho) e cada linha é identificada por um número exclusivo.Cada coluna em um DataFrame é estruturada como uma matriz 2D, exceto que cada coluna pode receber o próprio tipo de dados.
  • paralelismo de dados
    • Veja mais informações em :
  • conjunto de dados
    • Um conjunto de dados é amplamente definido como uma coleção de registros de dados estruturados ou não estruturados. Uma coleção de dados brutos, geralmente (mas não exclusivamente) organizados em um dos seguintes formatos: uma planilha ou um arquivo no formato CSV (valores separados por vírgula). Para mais informações, consulte Criar um conjunto de dados
  • informações empíricas
    • Termo que se refere à verificação da precisão do aprendizado de máquina em relação ao mundo real, como um conjunto de dados de informações empíricas.
  • loss (cost)
    • Durante o treinamento de um modelo supervisionado, uma medida de quão distante a previsão de um modelo está do rótulo. Uma função de perda calcula a perda.
  • model
    • Qualquer modelo pré-treinado ou não. Em geral, qualquer construção matemática que processa dados de entrada e retorna a saída. Em outras palavras, um modelo é o conjunto de parâmetros e estrutura necessários para que um sistema faça previsões.
  • pipeline job
    • Um job de pipeline ou uma execução de pipeline corresponde ao recurso PipelineJob na API Vertex AI. É uma instância de execução da definição do pipeline de ML, que é definida como um conjunto de tarefas de ML interconectadas por dependências de entrada/saída.