Vista geral do pré-processamento de caraterísticas

A pré-processamento de caraterísticas é um dos passos mais importantes no ciclo de vida da aprendizagem automática. Consiste na criação de funcionalidades e na limpeza dos dados de preparação. A criação de funcionalidades também é denominada engenharia de funcionalidades.

O BigQuery ML oferece as seguintes técnicas de pré-processamento de funcionalidades:

  • Pré-processamento automático. O BigQuery ML realiza o pré-processamento automático durante a preparação. Para mais informações, consulte a secção Pré-processamento automático de caraterísticas.

  • Pré-processamento manual. Pode usar a cláusula TRANSFORM na declaração CREATE MODEL para definir o pré-processamento personalizado através de funções de pré-processamento manual. Também pode usar estas funções fora da cláusula TRANSFORM para processar dados de preparação antes de criar o modelo.

Obtenha informações sobre funcionalidades

Pode usar a ML.FEATURE_INFOfunção para obter as estatísticas de todas as colunas de caraterísticas de entrada.

Ao usar as predefinições nas declarações CREATE MODEL e nas funções de inferência, pode criar e usar modelos do BigQuery ML, mesmo sem muitos conhecimentos de AA. No entanto, ter conhecimentos básicos sobre o ciclo de vida do desenvolvimento de ML, como a engenharia de funcionalidades e a preparação de modelos, ajuda a otimizar os dados e o modelo para oferecer melhores resultados. Recomendamos que use os seguintes recursos para desenvolver familiaridade com as técnicas e os processos de ML:

O que se segue?