¿Cuál es la diferencia entre el aprendizaje profundo, el aprendizaje automático y la inteligencia artificial?

La Inteligencia Artificial es un campo amplio con muchos términos y conceptos interconectados, y a menudo se usa como una palabra genérica para referirse a cualquier tipo de máquina inteligente. En realidad, Inteligencia Artificial, aprendizaje automático y aprendizaje profundo son términos distintos con diferencias sutiles. 

Si quieres obtener más información sobre cómo la Inteligencia Artificial y el aprendizaje automático pueden ayudar a tu empresa, consulta este artículo.

Los clientes nuevos obtienen hasta $300 en créditos gratuitos para probar Vertex AI y otros productos de Google Cloud. 

Para obtener más información sobre la relación entre la IA, el aprendizaje profundo y el aprendizaje automático, sigue leyendo.

¿Qué es el aprendizaje profundo?

El aprendizaje profundo es un subconjunto del aprendizaje automático que usa redes neuronales artificiales para procesar y analizar información. Las redes neuronales se componen de nodos computacionales que se agrupan en capas dentro de los algoritmos de aprendizaje profundo. Cada una contiene una capa de entrada, una de salida y una oculta. La red neuronal recibe datos de entrenamiento que ayudan al algoritmo a aprender y mejorar la exactitud. Cuando una red neuronal contiene varias capas ocultas además de sus capas de entrada y salida, se considera una red neuronal profunda, que es la base del aprendizaje profundo.

Los algoritmos de aprendizaje profundo están inspirados en el funcionamiento del cerebro humano y son particularmente potentes para analizar grandes cantidades de datos no estructurados. El aprendizaje profundo se usa en muchas de las tareas que se consideran IA en la actualidad, como el reconocimiento de voz y de imagen, la detección de objetos y el procesamiento de lenguaje natural. El aprendizaje profundo puede crear correlaciones complejas y no lineales dentro de los conjuntos de datos, aunque requiere más datos de entrenamiento y recursos de procesamiento que el aprendizaje automático.

Estos son algunos tipos comunes de redes neuronales que se usan en el aprendizaje profundo:

  • Las redes neuronales prealimentadas (FF) son una de las formas más antiguas de redes neuronales, ya que los datos fluyen en una dirección a través de capas de neuronas artificiales hasta que se obtiene el resultado.
  • Las redes neuronales recurrentes (RNN) difieren de las redes neuronales prealimentadas en que suelen usar datos de series temporales o datos que involucran secuencias. Las redes neuronales recurrentes tienen una “memoria” de lo que sucedió en la capa anterior como contingente a la salida de la capa actual.
  • La memoria a largo/corto plazo (LSTM) es una forma avanzada de RNN que puede usar memoria para "recordar" lo que sucedió en capas anteriores.
  • Las redes neuronales convolucionales (CNN) incluyen algunas de las redes neuronales más comunes en la inteligencia artificial moderna y usan varias capas distintas (una convolucional y, luego, una de reducción) que filtran diferentes partes de una imagen antes de colocarla (en la capa completamente conectada).
  • Las redes generativas adversarias (GAN) involucran dos redes neuronales (un "generador" y un "discriminador") que compiten entre sí en un juego que, en última instancia, mejora la precisión del resultado.

¿Qué es el aprendizaje automático?

El aprendizaje automático es un subconjunto de la Inteligencia Artificial que permite que un sistema aprenda y mejore de forma autónoma sin necesidad de una programación explícita. Los algoritmos de aprendizaje automático reconocen patrones y datos, y realizan predicciones cuando se ingresan datos nuevos al sistema.

En el aprendizaje automático, se suelen usar varios modelos diferentes, incluidos los siguientes:

Aprendizaje supervisado

El aprendizaje supervisado es un modelo de aprendizaje automático que usa datos de entrenamiento etiquetados (datos estructurados) para asignar una entrada específica a unos datos de salida. En el aprendizaje supervisado, se conoce la salida (por ejemplo, el reconocimiento de la imagen de una manzana) y el modelo se entrena con los datos de la salida conocida. En términos sencillos, para entrenar al algoritmo para que reconozca fotos de manzanas, transmítele fotos etiquetadas como manzanas.

Los algoritmos de aprendizaje supervisado más comunes que se usan en la actualidad incluyen los siguientes:

  • Regresión lineal
  • K‑vecinos más cercanos
  • Naive Bayes
  • Regresión polinómica
  • Árboles de decisión

Aprendizaje no supervisado

El aprendizaje no supervisado es un modelo de aprendizaje automático que usa datos sin etiquetar (datos no estructurados) para aprender patrones. A diferencia del aprendizaje supervisado, el resultado no se conoce con anticipación. En cambio, el algoritmo aprende de los datos sin intervención humana (por lo tanto, no supervisados) y los categoriza en grupos según los atributos. 

Los algoritmos de aprendizaje no supervisado más comunes que se usan en la actualidad incluyen los siguientes:

  • Difuminado significa
  • Agrupación en clústeres con el modelo K-means
  • Hierarchical clustering
  • Analiza componentes principales.
  • Mínimos cuadrados parciales

Aprendizaje semisupervisado

Con frecuencia, también se emplea un enfoque mixto de aprendizaje automático llamado aprendizaje semisupervisado, en el que solo se etiquetan algunos de los datos. En el aprendizaje semisupervisado, el algoritmo debe determinar cómo organizar y estructurar los datos para lograr un resultado conocido. Por ejemplo, al modelo de aprendizaje automático se le dice que el resultado final es una manzana, pero solo algunos de los datos de entrenamiento están etiquetados como una manzana.

Aprendizaje por refuerzo

El aprendizaje por refuerzo es un modelo de aprendizaje automático que se puede describir como “aprende haciendo” a través de una serie de experimentos de prueba y error. Un “agente” aprende a realizar una tarea definida a través de un ciclo de retroalimentación hasta que su rendimiento está dentro de un rango deseable. El agente recibe un refuerzo positivo cuando realiza la tarea de forma correcta y un refuerzo negativo cuando tiene bajo rendimiento. 

¿Qué es la inteligencia artificial?

La Inteligencia Artificial es un campo de la ciencia relacionado con la creación de computadoras y máquinas que pueden razonar, aprender y actuar de una manera que normalmente requeriría inteligencia humana o que involucra datos cuya escala excede lo que los humanos pueden analizar. La IA es un campo grande que incluye muchas disciplinas como informática, datos y análisis, ingeniería de software y hasta filosofía. 

A nivel empresarial, la IA es un conjunto de tecnologías que tiene muchos casos de uso, incluidos análisis de datos, predicciones y previsión, procesamiento de lenguaje natural, recomendaciones, automatización de máquinas, recuperación de datos inteligente y mucho más.

Inteligencia Artificial frente a aprendizaje automático y aprendizaje profundo

Si bien estos términos están relacionados, representan una jerarquía clara: el aprendizaje profundo es un tipo especializado de aprendizaje automático, y el aprendizaje automático es una disciplina central dentro del campo más amplio de la Inteligencia Artificial. La distinción principal se reduce a la capacidad, la complejidad y la ingeniería de atributos. 

Función

Inteligencia artificial

Aprendizaje automático

Aprendizaje profundo

Alcance y definición

Es el concepto más amplio. Es el campo dedicado a crear sistemas o máquinas que pueden realizar tareas que normalmente requieren inteligencia humana (por ejemplo, razonamiento, resolución de problemas, aprendizaje, percepción).

Es un subconjunto de la IA. Se enfoca en desarrollar sistemas que pueden aprender de los datos y tomar decisiones basadas en ellos sin estar programados explícitamente para cada situación.

Es un subconjunto del AA. Usa redes neuronales artificiales (ANN) de varias capas para aprender patrones complejos y representaciones jerárquicas directamente de grandes cantidades de datos sin procesar.

Objetivo


Simular o replicar la inteligencia humana en las máquinas.

Permitir que las máquinas aprendan de los datos para realizar tareas específicas con precisión.

Para lograr una mayor precisión y manejar patrones más complejos (especialmente en datos no estructurados) aprendiendo automáticamente los atributos de los datos con redes neuronales profundas.

Enfoque

Puede usar varias técnicas: lógica, sistemas basados en reglas, algoritmos de búsqueda, optimización y, quizás lo más importante, aprendizaje automático y aprendizaje profundo.

Usa algoritmos (por ejemplo, regresión lineal, SVM, árboles de decisión, bosques aleatorios) para analizar datos, aprender de ellos y tomar decisiones o realizar predicciones fundamentadas.

Usa redes neuronales artificiales complejas de varias capas (inspiradas en la estructura del cerebro humano) con muchos parámetros.

Requisitos de los datos

Varía mucho. La IA basada en reglas podría necesitar pocos datos, mientras que la IA que depende del AA o el aprendizaje profundo necesita una cantidad significativa de datos.

Requiere cantidades significativas de datos estructurados o etiquetados para entrenar algoritmos de manera eficaz. Por lo general, el rendimiento mejora con más datos.

Requiere conjuntos de datos muy grandes (a menudo, millones de datos) para entrenar las redes profundas de manera eficaz. El rendimiento depende en gran medida de la escala de los datos.

Requisitos de hardware

Varía. La IA simple puede ejecutarse en hardware básico.

A menudo, se puede ejecutar en CPUs estándar, aunque los modelos complejos se benefician de una mayor potencia de procesamiento.

Por lo general, requiere computación de alto rendimiento, especialmente GPU o TPU, para un entrenamiento eficiente debido a los cálculos paralelos masivos.

Ingeniería de atributos


Depende del método utilizado.

A menudo requiere una ingeniería de atributos manual significativa. Los humanos deben seleccionar, transformar y crear atributos de entrada relevantes a partir de los datos sin procesar para ayudar al algoritmo a aprender.

Realiza la extracción de atributos automática. La red aprende los atributos relevantes de forma jerárquica a través de sus capas directamente de los datos sin procesar, lo que reduce la necesidad de ingeniería manual de atributos.

Tiempo de entrenamiento

No aplica para la IA que no aprende. Varía mucho para la IA basada en AA o aprendizaje profundo.

Puede variar de segundos a horas, generalmente más rápido que el aprendizaje profundo para tareas en las que el AA es adecuado.

A menudo requiere tiempos de entrenamiento muy largos (horas, días o incluso semanas) debido a los grandes conjuntos de datos y las arquitecturas de red complejas.

Interpretabilidad

Varía. Los sistemas basados en reglas pueden ser altamente interpretables. La IA que usa AA o aprendizaje profundo complejos puede ser difícil de interpretar.

Varía. Los modelos más simples (por ejemplo, árboles de decisión y regresión lineal) son relativamente más interpretables. Los modelos complejos (por ejemplo, los métodos de conjunto) pueden ser menos interpretables.

A menudo, carece de transparencia. Comprender por qué un modelo de aprendizaje profundo tomó una decisión específica puede ser un desafío debido a la complejidad y la cantidad de parámetros.

Casos de uso y ejemplos clave


Sistemas expertos, programas de ajedrez, solucionadores de problemas generales, conceptos generales para asistentes virtuales y vehículos autónomos.

Sistemas de recomendación en comercio electrónico o servicios de transmisión, filtrado de spam, mantenimiento predictivo, diagnóstico médico a partir de datos estructurados, predicción de deserción de clientes.

Reconocimiento de imágenes (etiquetado de fotos), procesamiento de lenguaje natural (traducción, análisis de opiniones), reconocimiento de voz (asistentes de voz), sistemas de percepción de vehículos autónomos y análisis avanzado de imágenes médicas.

Función

Inteligencia artificial

Aprendizaje automático

Aprendizaje profundo

Alcance y definición

Es el concepto más amplio. Es el campo dedicado a crear sistemas o máquinas que pueden realizar tareas que normalmente requieren inteligencia humana (por ejemplo, razonamiento, resolución de problemas, aprendizaje, percepción).

Es un subconjunto de la IA. Se enfoca en desarrollar sistemas que pueden aprender de los datos y tomar decisiones basadas en ellos sin estar programados explícitamente para cada situación.

Es un subconjunto del AA. Usa redes neuronales artificiales (ANN) de varias capas para aprender patrones complejos y representaciones jerárquicas directamente de grandes cantidades de datos sin procesar.

Objetivo


Simular o replicar la inteligencia humana en las máquinas.

Permitir que las máquinas aprendan de los datos para realizar tareas específicas con precisión.

Para lograr una mayor precisión y manejar patrones más complejos (especialmente en datos no estructurados) aprendiendo automáticamente los atributos de los datos con redes neuronales profundas.

Enfoque

Puede usar varias técnicas: lógica, sistemas basados en reglas, algoritmos de búsqueda, optimización y, quizás lo más importante, aprendizaje automático y aprendizaje profundo.

Usa algoritmos (por ejemplo, regresión lineal, SVM, árboles de decisión, bosques aleatorios) para analizar datos, aprender de ellos y tomar decisiones o realizar predicciones fundamentadas.

Usa redes neuronales artificiales complejas de varias capas (inspiradas en la estructura del cerebro humano) con muchos parámetros.

Requisitos de los datos

Varía mucho. La IA basada en reglas podría necesitar pocos datos, mientras que la IA que depende del AA o el aprendizaje profundo necesita una cantidad significativa de datos.

Requiere cantidades significativas de datos estructurados o etiquetados para entrenar algoritmos de manera eficaz. Por lo general, el rendimiento mejora con más datos.

Requiere conjuntos de datos muy grandes (a menudo, millones de datos) para entrenar las redes profundas de manera eficaz. El rendimiento depende en gran medida de la escala de los datos.

Requisitos de hardware

Varía. La IA simple puede ejecutarse en hardware básico.

A menudo, se puede ejecutar en CPUs estándar, aunque los modelos complejos se benefician de una mayor potencia de procesamiento.

Por lo general, requiere computación de alto rendimiento, especialmente GPU o TPU, para un entrenamiento eficiente debido a los cálculos paralelos masivos.

Ingeniería de atributos


Depende del método utilizado.

A menudo requiere una ingeniería de atributos manual significativa. Los humanos deben seleccionar, transformar y crear atributos de entrada relevantes a partir de los datos sin procesar para ayudar al algoritmo a aprender.

Realiza la extracción de atributos automática. La red aprende los atributos relevantes de forma jerárquica a través de sus capas directamente de los datos sin procesar, lo que reduce la necesidad de ingeniería manual de atributos.

Tiempo de entrenamiento

No aplica para la IA que no aprende. Varía mucho para la IA basada en AA o aprendizaje profundo.

Puede variar de segundos a horas, generalmente más rápido que el aprendizaje profundo para tareas en las que el AA es adecuado.

A menudo requiere tiempos de entrenamiento muy largos (horas, días o incluso semanas) debido a los grandes conjuntos de datos y las arquitecturas de red complejas.

Interpretabilidad

Varía. Los sistemas basados en reglas pueden ser altamente interpretables. La IA que usa AA o aprendizaje profundo complejos puede ser difícil de interpretar.

Varía. Los modelos más simples (por ejemplo, árboles de decisión y regresión lineal) son relativamente más interpretables. Los modelos complejos (por ejemplo, los métodos de conjunto) pueden ser menos interpretables.

A menudo, carece de transparencia. Comprender por qué un modelo de aprendizaje profundo tomó una decisión específica puede ser un desafío debido a la complejidad y la cantidad de parámetros.

Casos de uso y ejemplos clave


Sistemas expertos, programas de ajedrez, solucionadores de problemas generales, conceptos generales para asistentes virtuales y vehículos autónomos.

Sistemas de recomendación en comercio electrónico o servicios de transmisión, filtrado de spam, mantenimiento predictivo, diagnóstico médico a partir de datos estructurados, predicción de deserción de clientes.

Reconocimiento de imágenes (etiquetado de fotos), procesamiento de lenguaje natural (traducción, análisis de opiniones), reconocimiento de voz (asistentes de voz), sistemas de percepción de vehículos autónomos y análisis avanzado de imágenes médicas.

Da el siguiente paso

Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.

Google Cloud