¿Qué es el Big Data?

Big Data hace referencia a datos que serían muy caros de almacenar, gestionar y analizar con sistemas de bases de datos tradicionales (relacionales o monolíticos). Por lo general, estos sistemas no soy muy rentables debido a su poca flexibilidad a la hora de almacenar datos sin estructurar (como imágenes, texto y vídeo), alojar datos de "alta velocidad" (en tiempo real) o escalar para gestionar volúmenes más grandes de datos (de varios petabytes).

Por esta razón, en los últimos años se ha observado una tendencia general a adoptar nuevas estrategias para gestionar y procesar el Big Data, incluidos los sistemas de bases de datos NoSQL y Apache Hadoop. Sin embargo, estas opciones suelen ser difíciles de desplegar, gestionar y usar en un entorno on‑premise.

¿De dónde procede el Big Data?

Si bien antes la mayoría de los datos de clientes se podían categorizar como transacciones bien estructuradas (como las bancarias), hoy en día la ingente cantidad que las organizaciones generan cada día en forma de datos de interacción de clientes online sin estructurar no tiene ni punto de comparación con lo que se generaba hace solo unos años. La reciente aparición del "Internet de las cosas", término que describe la red global de miles de millones de dispositivos y sensores conectados, ha dado lugar a un aumento sin precedentes del volumen de datos en forma de texto, vídeo, imágenes e incluso audio. Por último, en algunos sectores regulados, el acceso a los datos, que de otro modo se archivarían, es a menudo necesario por motivos de cumplimiento.

¿Por qué es importante el Big Data?

En la actualidad, analizar datos para obtener valor empresarial se ha convertido en una práctica generalizada entre las empresas, independientemente de su tamaño o del sector en el que trabajen. En algunos sectores, como el comercio minorista, la publicidad, los servicios financieros y otros que se van sumando a la lista, se trata de una cuestión de supervivencia.

Cuanto mayor es el volumen de datos al que se puede acceder, mayor valor aportan los análisis de datos. Por este motivo, muchas empresas de distintos sectores consideran que el Big Data constituye un recurso excelente para obtener información empresarial valiosa. Además, dado que los modelos de aprendizaje automático son más eficaces cuantos más datos se utilicen para prepararlos, el aprendizaje automático y el Big Data se complementan a la perfección.

¿Cómo puedo saber si dispongo de Big Data?

Aunque muchas empresas aún no han alcanzado un volumen de datos de varios petabytes, es posible que los datos tengan alguna de las otras dos características del Big Data. Y, si hay alguna garantía, es que los datos aumentarán con el tiempo de forma exponencial. En ese sentido, todo "Big Data" ha comenzado a partir de pequeños volúmenes de datos.

¿Por qué la nube es la mejor plataforma para el Big Data?

Cloud computing permite analizar, procesar y almacenar los datos de una forma más escalable, flexible, rentable y segura de lo que se puede conseguir con un despliegue on‑premise. Estas características son esenciales para aquellos clientes cuyos volúmenes de datos crecen de forma exponencial. De este modo, pueden almacenar y procesar recursos disponibles según sus necesidades, así como obtener valor de dichos datos. Además, para las organizaciones que están empezando con el aprendizaje electrónico y los análisis del Big Data y que quieren evitar las posibles complejidades de sistemas de Big Data on‑premise, la nube es una solución idónea para experimentar con servicios gestionados (como Google BigQuery y Google Cloud ML Engine) con una estrategia de pago por uso.

Más información: