El aprendizaje supervisado es una categoría del aprendizaje automático que utiliza conjuntos de datos etiquetados para entrenar algoritmos con el objetivo de predecir resultados y reconocer patrones. A diferencia del aprendizaje no supervisado, los algoritmos de aprendizaje supervisado reciben entrenamiento etiquetado para aprender la relación entre los datos de entrada y los de salida.
Los algoritmos de aprendizaje automático supervisado facilitan la creación de modelos complejos que pueden hacer predicciones precisas. Por eso, se usan en multitud de sectores y campos, como la sanidad, el marketing y los servicios financieros, entre otros.
En este artículo, veremos los aspectos básicos del aprendizaje supervisado en IA, cómo funcionan los algoritmos de aprendizaje supervisado y algunos de los casos prácticos más habituales.
Los nuevos clientes reciben hasta 300 USD en crédito gratis para probar Vertex AI y otros productos de Google Cloud.
Los datos que se usan en el aprendizaje supervisado están etiquetados, lo que significa que contienen ejemplos de entradas (llamadas funciones) y resultados correctos (etiquetas). Los algoritmos analizan un gran conjunto de datos de estos pares de entrenamiento para inferir cuál sería el valor de salida deseado cuando se le pide que haga una predicción sobre nuevos datos.
Por ejemplo, supongamos que quieres enseñar a un modelo a identificar imágenes de árboles. Proporcionas un conjunto de datos etiquetado que contiene muchos ejemplos diferentes de tipos de árboles y los nombres de cada especie. Dejas que el algoritmo intente definir qué conjunto de características pertenece a cada árbol en función de los resultados etiquetados. A continuación, puedes probar el modelo enseñándole una imagen de árbol y pidiéndole que adivine de qué especie se trata. Si el modelo proporciona una respuesta incorrecta, puedes seguir entrenándolo y ajustando sus parámetros con más ejemplos para mejorar su precisión y minimizar los errores.
Una vez que el modelo se haya entrenado y probado, podrás usarlo para hacer predicciones a partir de datos desconocidos basándose en los conocimientos que haya aprendido previamente.
En el caso del aprendizaje automático, el aprendizaje supervisado se suele dividir en dos categorías: clasificación y regresión.
Los algoritmos de clasificación se usan para agrupar datos mediante la predicción de una etiqueta categórica o una variable de salida en función de los datos de entrada. La clasificación se utiliza cuando las variables de salida son categóricas, es decir, cuando hay dos o más clases.
Uno de los ejemplos más habituales de algoritmos de clasificación que se utilizan es el filtro de spam de la bandeja de entrada del correo. En ese caso, un modelo de aprendizaje supervisado se entrena para predecir si un correo es spam o no con un conjunto de datos que contiene ejemplos etiquetados de spam y correos legítimos. El algoritmo extrae información sobre cada correo, como el remitente, la línea del asunto y el texto del cuerpo. A continuación, usa estas funciones y las etiquetas de salida correspondientes para aprender patrones y asignar una puntuación que indica si un correo es real o si es spam.
Los algoritmos de regresión se usan para predecir un valor real o continuo, en el que el algoritmo detecta una relación entre dos o más variables.
Un ejemplo habitual de una tarea de regresión podría ser predecir un salario según la experiencia laboral. Por ejemplo, un algoritmo de aprendizaje supervisado recibiría datos relacionados con la experiencia laboral (como la duración, el sector o el campo, la ubicación, etc.) y el salario asignado. Una vez entrenado el modelo, podría usarse para predecir el salario medio en función de la experiencia laboral.
Los modelos de aprendizaje supervisado se pueden utilizar en diferentes casos prácticos empresariales que ayudan a abordar una amplia variedad de problemas. Estos son algunos ejemplos de aprendizaje supervisado habituales:
A la hora de entender la diferencia entre el aprendizaje supervisado y el no supervisado, la principal diferencia es el tipo de datos de entrada que se usan para entrenar el modelo. El aprendizaje supervisado utiliza conjuntos de datos de entrenamiento etiquetados para intentar enseñar a un modelo un objetivo específico predefinido.
En cambio, el aprendizaje no supervisado utiliza datos sin etiquetar y funciona de forma autónoma para intentar aprender la estructura de los datos sin recibir instrucciones explícitas.
Empieza a crear en Google Cloud con 300 USD en crédito gratis y más de 20 productos Always Free.