O aprendizado supervisionado é uma categoria de machine learning que usa conjuntos de dados rotulados para treinar algoritmos, prever resultados e reconhecer padrões. Ao contrário do aprendizado não supervisionado, os algoritmos de aprendizado supervisionado recebem treinamento rotulado para aprender a relação entre a entrada e as saídas.
Com os algoritmos de machine learning supervisionados, as organizações podem criar modelos complexos com mais facilidade para fazer previsões precisas. Por isso, eles são amplamente utilizados em vários setores e áreas, incluindo saúde, marketing, serviços financeiros e muito mais.
Vamos abordar os fundamentos do aprendizado supervisionado em IA, como os algoritmos de aprendizado supervisionado funcionam e alguns dos casos de uso mais comuns.
Clientes novos ganham até US$ 300 em créditos para testar a Vertex AI e outros produtos do Google Cloud.
Os dados usados no aprendizado supervisionado são rotulados, ou seja, contêm exemplos das entradas (chamadas de atributos) e das saídas corretas (rótulos). Os algoritmos analisam um grande conjunto de dados com esses pares de treinamento para inferir qual seria o valor de saída desejado quando solicitado a fazer uma previsão com base em dados novos.
Por exemplo, vamos supor que você quer ensinar um modelo a identificar imagens de árvores. Você fornece um conjunto de dados rotulado que contém muitos exemplos diferentes de tipos de árvores e os nomes de cada espécie. Você permite que o algoritmo tente definir qual conjunto de características pertence a cada árvore com base nos resultados rotulados. Depois disso, é possível testar o modelo mostrando a foto de uma árvore e pedindo que ele adivinhe qual é a espécie. Se o modelo fornecer uma resposta incorreta, continue treinando e ajustando os parâmetros com mais exemplos para melhorar a acurácia e minimizar erros.
Depois de treinar e testar o modelo, ele pode ser usado para fazer previsões sobre dados desconhecidos com base no conhecimento prévio que ele aprendeu.
Os dados usados no aprendizado supervisionado são rotulados, ou seja, contêm exemplos das entradas (chamadas de atributos) e das saídas corretas (rótulos). Os algoritmos analisam um grande conjunto de dados com esses pares de treinamento para inferir qual seria o valor de saída desejado quando solicitado a fazer uma previsão com base em dados novos.
Por exemplo, vamos supor que você quer ensinar um modelo a identificar imagens de árvores. Você fornece um conjunto de dados rotulado que contém muitos exemplos diferentes de tipos de árvores e os nomes de cada espécie. Você permite que o algoritmo tente definir qual conjunto de características pertence a cada árvore com base nos resultados rotulados. Depois disso, é possível testar o modelo mostrando a foto de uma árvore e pedindo que ele adivinhe qual é a espécie. Se o modelo fornecer uma resposta incorreta, continue treinando e ajustando os parâmetros com mais exemplos para melhorar a acurácia e minimizar erros.
Depois de treinar e testar o modelo, ele pode ser usado para fazer previsões sobre dados desconhecidos com base no conhecimento prévio que ele aprendeu.
O aprendizado supervisionado em machine learning é geralmente dividido em duas categorias: classificação e regressão.
Os algoritmos de classificação são usados para agrupar dados ao prever um rótulo categórico ou uma variável de saída com base nos dados de entrada. A classificação é usada quando as variáveis de saída são categóricas, ou seja, há duas ou mais classes.
Um dos exemplos mais comuns de algoritmos de classificação em uso é o filtro de spam na caixa de entrada. Aqui, um modelo de aprendizado supervisionado é treinado para prever se um e-mail é ou não spam com um conjunto de dados que contém exemplos rotulados de spam e e-mails legítimos. O algoritmo extrai informações sobre cada e-mail, incluindo o remetente, a linha de assunto, o corpo do texto e mais. Em seguida, ele usa esses recursos e os rótulos de saída correspondentes para aprender padrões e atribuir uma pontuação que indica se um e-mail é real ou spam.
Algoritmos de regressão são usados para prever um valor real ou contínuo, em que o algoritmo detecta uma relação entre duas ou mais variáveis.
Um exemplo comum de tarefa de regressão é prever um salário com base na experiência profissional. Por exemplo, um algoritmo de aprendizado supervisionado receberia entradas relacionadas à experiência profissional (por exemplo, tempo, setor ou campo, local etc.) e o valor salarial correspondente. Depois de treinado, o modelo pode ser usado para prever o salário médio com base na experiência de trabalho.
Os modelos de aprendizado supervisionado podem ser usados em vários casos de uso de negócios diferentes que resolvem uma ampla gama de problemas. Exemplos comuns de aprendizado supervisionado incluem:
Sistema de recomendação: os algoritmos de aprendizado supervisionado são usados por plataformas on-line e serviços de streaming para melhorar as recomendações com base no comportamento anterior do cliente ou no histórico de compras. Os modelos extraem informações importantes sobre o comportamento de um usuário e sugerem produtos e conteúdos semelhantes.
Quando se trata de entender a diferença entre aprendizado supervisionado e não supervisionado, a principal diferença é o tipo de dados de entrada usado para treinar o modelo. O aprendizado supervisionado usa conjuntos de dados de treinamento rotulados para tentar ensinar um modelo uma meta específica e predefinida.
Em comparação, o aprendizado não supervisionado usa dados não rotulados e opera de forma autônoma para tentar aprender a estrutura dos dados sem receber instruções explícitas.
Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.