¿Qué son los macrodatos?

El término macrodatos hace referencia a conjuntos de datos que normalmente sería demasiado costoso almacenar, administrar y analizar mediante sistemas de bases de datos tradicionales (sean relacionales o monolíticas). Por lo general, esos sistemas son poco rentables debido a su falta de flexibilidad para almacenar datos no estructurados (como imágenes, texto y video), recibir datos de “alta velocidad” (en tiempo real) o aumentar su escala para admitir volúmenes de datos muy grandes (a escala de petabytes).

Por este motivo, en los últimos años se ha visto una adopción generalizada de nuevos enfoques para la administración y el procesamiento de los macrodatos, como Apache Hadoop y los sistemas de base de datos NoSQL. Sin embargo, esas opciones suelen resultar demasiado complejas de implementar, administrar y utilizar a nivel local.

¿De dónde provienen los macrodatos?

En el pasado, la mayoría de los datos de los clientes podía categorizarse como transacciones bien estructuradas (por ejemplo, operaciones bancarias). Sin embargo, en la actualidad las organizaciones producen cantidades masivas de datos no estructurados sobre las interacciones en línea con sus clientes, cuya magnitud eclipsa los volúmenes de datos que se producían hace apenas algunos años. La reciente aparición de la “Internet de las cosas” (un término que describe la red global de miles de millones de dispositivos y sensores interconectados) generó una explosión en el volumen de datos de texto, video, imágenes y audio. Por último, el cumplimiento de la normativa que regula determinados sectores requiere acceso continuo a datos que normalmente estarían archivados.

¿Por qué son importantes los macrodatos?

Hoy en día, la capacidad de obtener valor empresarial de los datos de forma coherente es una de las características que definen a las organizaciones exitosas, sin importar el sector ni el tamaño. En algunos sectores (como la venta minorista y los servicios financieros, aunque esta lista crece día a día), esto se ha convertido en algo esencial para permanecer vigente.

El análisis de datos solo genera valor si se tiene acceso a más datos, por lo que las organizaciones de diversos sectores se han dado cuenta de que los macrodatos son un importante recurso para descubrir información valiosa de profunda importancia para la empresa. Además, dado que los modelos de aprendizaje automático se vuelven más eficientes cuanto más “entrenan”, el AA y los macrodatos se complementan considerablemente.

¿Los datos que tengo califican como “macrodatos”?

Si bien muchas empresas aún no alcanzan la escala de petabytes en cuanto al volumen de sus datos, es posible que estos tengan alguna de las otras dos características que definen a los macrodatos. Además, si de algo no caben dudas, es de que tus datos crecerán con el tiempo, probablemente de manera exponencial. En ese sentido, puede decirse que los “macrodatos” siempre comienzan como un conjunto de datos común.

¿Qué hace de la nube la plataforma ideal para trabajar con macrodatos?

La computación en la nube ofrece acceso a almacenamiento de datos, procesamiento y análisis de forma más escalable, flexible, económica y segura que cualquier implementación local. En un contexto en el que los volúmenes de datos crecen de manera exponencial, estas características resultan esenciales para los clientes a fin de disponer de los recursos de almacenamiento y procesamiento cuando los necesiten, y también para extraer valor de esos datos. Además, la nube ofrece una manera de experimentar con servicios administrados (como Google BigQuery y Google Cloud ML Engine) mediante un modelo de prepago para las organizaciones que apenas están iniciando el recorrido hacia el análisis de macrodatos y el uso de aprendizaje automático y que desean evitar las posibles complejidades de los sistemas de macrodatos locales.

Más información: