Vista geral do pré-processamento de caraterísticas
A pré-processamento de caraterísticas é um dos passos mais importantes no ciclo de vida da aprendizagem automática. Consiste na criação de funcionalidades e na limpeza dos dados de preparação. A criação de funcionalidades também é denominada engenharia de funcionalidades.
O BigQuery ML oferece as seguintes técnicas de pré-processamento de funcionalidades:
Pré-processamento automático. O BigQuery ML realiza o pré-processamento automático durante a preparação. Para mais informações, consulte a secção Pré-processamento automático de caraterísticas.
Pré-processamento manual. Pode usar a cláusula
TRANSFORM
na declaraçãoCREATE MODEL
para definir o pré-processamento personalizado através de funções de pré-processamento manual. Também pode usar estas funções fora da cláusulaTRANSFORM
para processar dados de preparação antes de criar o modelo.
Obtenha informações sobre funcionalidades
Pode usar a ML.FEATURE_INFO
função para obter as estatísticas de todas as colunas de caraterísticas de entrada.
Conhecimentos recomendados
Ao usar as predefinições nas declarações CREATE MODEL
e nas funções de inferência, pode criar e usar modelos do BigQuery ML, mesmo sem muitos conhecimentos de AA. No entanto, ter conhecimentos básicos sobre o ciclo de vida do desenvolvimento de ML, como a engenharia de funcionalidades e a preparação de modelos, ajuda a otimizar os dados e o modelo para oferecer melhores resultados. Recomendamos que use os seguintes recursos para desenvolver
familiaridade com as técnicas e os processos de ML:
- Machine Learning Crash Course
- Introdução à aprendizagem automática
- Limpeza de dados
- Engenharia de funcionalidades
- Aprendizagem automática intermédia
O que se segue?
- Saiba mais sobre a publicação de funcionalidades no BigQuery ML.
Para mais informações sobre as funções e as declarações SQL suportadas para modelos que suportam o pré-processamento de caraterísticas, consulte os seguintes documentos: