¿Qué es el aprendizaje supervisado?

El aprendizaje supervisado es una categoría del aprendizaje automático que utiliza conjuntos de datos etiquetados para entrenar algoritmos con el objetivo de predecir resultados y reconocer patrones. A diferencia del aprendizaje no supervisado, los algoritmos de aprendizaje supervisado reciben entrenamiento etiquetado para aprender la relación entre los datos de entrada y los de salida. 

Los algoritmos de aprendizaje automático supervisado facilitan la creación de modelos complejos que pueden hacer predicciones precisas. Por eso, se usan en multitud de sectores y campos, como la sanidad, el marketing y los servicios financieros, entre otros. 

En este artículo, veremos los aspectos básicos del aprendizaje supervisado en IA, cómo funcionan los algoritmos de aprendizaje supervisado y algunos de los casos prácticos más habituales.

Los nuevos clientes reciben hasta 300 USD en crédito gratis para probar Vertex AI y otros productos de Google Cloud. 

¿Cómo funciona el aprendizaje supervisado?

Los datos utilizados en el aprendizaje supervisado están etiquetados, lo que significa que contienen ejemplos tanto de entradas (llamadas funciones) como de resultados correctos (etiquetas). Los algoritmos analizan un gran conjunto de datos de estos pares de entrenamiento para deducir cuál sería el valor de salida deseado cuando se les pida que hagan una predicción a partir de nuevos datos.

Por ejemplo, supongamos que quieres enseñar a un modelo a identificar imágenes de árboles. Proporcionas un conjunto de datos etiquetado que contiene muchos ejemplos diferentes de tipos de árboles y los nombres de cada especie. Dejas que el algoritmo intente definir qué conjunto de características pertenece a cada árbol en función de los resultados etiquetados. A continuación, puedes probar el modelo mostrándole la imagen de un árbol y pidiéndole que adivine de qué especie es. Si el modelo proporciona una respuesta incorrecta, puedes seguir entrenándolo y ajustando sus parámetros con más ejemplos para mejorar su precisión y minimizar los errores. 

Una vez que el modelo se haya entrenado y probado, podrás usarlo para hacer predicciones a partir de datos desconocidos basándose en los conocimientos que haya aprendido previamente.

¿Cómo funciona el aprendizaje supervisado?

Los datos utilizados en el aprendizaje supervisado están etiquetados, lo que significa que contienen ejemplos tanto de entradas (llamadas funciones) como de resultados correctos (etiquetas). Los algoritmos analizan un gran conjunto de datos de estos pares de entrenamiento para deducir cuál sería el valor de salida deseado cuando se les pida que hagan una predicción a partir de nuevos datos.

Por ejemplo, supongamos que quieres enseñar a un modelo a identificar imágenes de árboles. Proporcionas un conjunto de datos etiquetado que contiene muchos ejemplos diferentes de tipos de árboles y los nombres de cada especie. Dejas que el algoritmo intente definir qué conjunto de características pertenece a cada árbol en función de los resultados etiquetados. A continuación, puedes probar el modelo mostrándole la imagen de un árbol y pidiéndole que adivine de qué especie es. Si el modelo proporciona una respuesta incorrecta, puedes seguir entrenándolo y ajustando sus parámetros con más ejemplos para mejorar su precisión y minimizar los errores. 

Una vez que el modelo se haya entrenado y probado, podrás usarlo para hacer predicciones a partir de datos desconocidos basándose en los conocimientos que haya aprendido previamente.

Tipos de aprendizaje supervisado

En el caso del aprendizaje automático, el aprendizaje supervisado se suele dividir en dos categorías: clasificación y regresión. 

Clasificación

Los algoritmos de clasificación se usan para agrupar datos mediante la predicción de una etiqueta categórica o una variable de salida en función de los datos de entrada. La clasificación se utiliza cuando las variables de salida son categóricas, es decir, cuando hay dos o más clases.

Uno de los ejemplos más habituales de algoritmos de clasificación que se utilizan es el filtro de spam de la bandeja de entrada del correo. En ese caso, un modelo de aprendizaje supervisado se entrena para predecir si un correo es spam o no con un conjunto de datos que contiene ejemplos etiquetados de spam y correos legítimos. El algoritmo extrae información sobre cada correo, como el remitente, la línea del asunto y el texto del cuerpo. A continuación, usa estas funciones y las etiquetas de salida correspondientes para aprender patrones y asignar una puntuación que indica si un correo es real o si es spam.

Regresión

Los algoritmos de regresión se usan para predecir un valor real o continuo, en el que el algoritmo detecta una relación entre dos o más variables. 

Un ejemplo habitual de una tarea de regresión podría ser predecir un salario según la experiencia laboral. Por ejemplo, un algoritmo de aprendizaje supervisado recibiría datos relacionados con la experiencia laboral (como la duración, el sector o el campo, la ubicación, etc.) y el salario asignado. Una vez entrenado el modelo, podría usarse para predecir el salario medio en función de la experiencia laboral.

Aprendizaje supervisado y aprendizaje no supervisado

Los modelos de aprendizaje supervisado se pueden usar para una serie de casos prácticos distintos que ayudan a abordar una gran variedad de problemas. Estos son algunos ejemplos habituales del aprendizaje supervisado: 

  • Evaluación de riesgos: los modelos de aprendizaje automático supervisado pueden ayudar a los bancos y otras empresas de servicios financieros a determinar si es probable que los clientes cancelen sus préstamos, lo que ayuda a minimizar el riesgo en sus carteras. 
  • Clasificación de imágenes: los algoritmos de aprendizaje automático supervisado se suelen entrenar para clasificar objetos en imágenes y vídeos. Por ejemplo, se puede usar un algoritmo para reconocer a una persona en una imagen y etiquetarla automáticamente en una red social. 
  • Detección de fraudes: el aprendizaje supervisado es la base de muchos sistemas de detección de fraudes, lo que permite a las empresas reconocer la actividad fraudulenta. Estos modelos se entrenan con conjuntos de datos que contienen tanto actividad fraudulenta como no fraudulenta, por lo que pueden usarse para detectar actividades sospechosas en tiempo real.

Sistemas de recomendación: las plataformas online y los servicios de streaming usan algoritmos de aprendizaje supervisado para ofrecer recomendaciones basadas en el comportamiento previo de los clientes o en el historial de compras. Los modelos extraen información importante sobre el comportamiento de los usuarios y sugieren productos y contenidos similares. 

Aprendizaje supervisado y aprendizaje no supervisado

A la hora de entender la diferencia entre el aprendizaje supervisado y el no supervisado, la principal diferencia es el tipo de datos de entrada que se usan para entrenar el modelo. El aprendizaje supervisado utiliza conjuntos de datos de entrenamiento etiquetados para intentar enseñar a un modelo un objetivo específico predefinido.  

En cambio, el aprendizaje no supervisado utiliza datos sin etiquetar y funciona de forma autónoma para intentar aprender la estructura de los datos sin recibir instrucciones explícitas.

Soluciona los retos más complejos que se te presenten con Google Cloud

Los nuevos clientes reciben 300 USD en crédito gratis para invertirlos en Google Cloud.
Habla con un especialista del equipo de ventas de Google Cloud y explícale tu reto único al detalle.

Ve un paso más allá

Empieza a crear en Google Cloud con 300 USD en crédito gratis y más de 20 productos Always Free.

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
Google Cloud