Aclaremos conceptos: ¿Cuál es la diferencia entre Big Data y Machine Learning?

229

A pesar de su creciente popularidad en el mundo de los negocios, la diferencia entre Big Data y Machine Learning no siempre queda clara. Aunque sin dudas tienen varios puntos en común, muchos los confunden, mezclan o intercambian. Para terminar con las dudas hoy vamos a explicar en qué consiste cada uno, sus diferencias y cómo se complementan para potenciar los negocios.

¿Qué es Big Data?

Como explicamos en más detalle en nuestra sección de Big Data, el término refiere a conjuntos de datos masivos, complejos y cambiantes. Estas características suelen resumirse en las denominadas 3 V del big data:

  • Volumen: tienen un gran tamaño. Los datos provienen de diferentes fuentes, como transacciones comerciales, dispositivos IoT, redes sociales o buscadores online. En su mayoría, son datos no estructurados (desordenados) de baja densidad (cada uno refiere a un caso pequeño), pero de gran cantidad, llegando incluso a decenas de terabytes.
  • Velocidad: los datos crecen y se distribuyen de manera rápida, llegando casi a velocidades de tiempo real.
  • Variedad: hace referencia al gran abanico de formatos en los que se pueden encontrar los datos. Estos pueden provenir de diferentes fuentes, que combinen datos estructurados, no estructurados y semiestructurados.

Si querés saber qué otros tipos de datos existen (dark data, small data, open data, etc) te recomendamos nuestra nota sobre diferentes tipos de datos.

Big Data Analytics

Big Data suele hacer referencia también al conjunto de técnicas y analíticas que se utilizan para recabar y entender los datos. Las más comunes de estas analíticas son de índole descriptiva. Es decir que extraen insights (hallazgos) sobre el estado de la situación para ayudarnos a tomar decisiones.

Pero existen otras maneras de usar las grandes cantidades de datos: de forma predictiva y prescriptiva. En este caso el objeto de estudio no es el presente sino el futuro. Acá es donde empezamos a adentrarnos en el mundo del Machine Learning.

¿Qué es Machine Learning?

Machine Learning es una aplicación de la Inteligencia Artificial que le permite a los sistemas encontrar patrones y predecir conductas a partir de enormes cantidades de datos. Estos programas tienen la capacidad de “aprender” por sí mismos y optimizarse sin necesidad de intervención humana directa.

De la definición anterior podemos extraer una primera conclusión: sin Big Data no habría Machine Learning. Para “entrenar” una Inteligencia Artificial hace falta una base de datos lo suficientemente grande como para que el programa pueda encontrar los patrones de comportamiento subyacentes y hacer sus predicciones.

Machine Learning utiliza los datos del pasado, pero pone su foco en el futuro. Por eso sirve para analíticas predictivas y prescriptivas. Esto es lo mismo que decir que los programas de Inteligencia Artificial usan sus experiencias previas para mejorar sus procesos internos, entender mejor los nuevos datos (aunque su estructura sea diferente), encontrar más patrones de comportamiento y realizar mejores predicciones. Nada mal para un conjunto de códigos.

Existen diferentes tipos de Machine Learning, como el supervisado, no supervisado o el reforzamiento de aprendizaje. Cada uno cumple su rol para el Business Intelligence.

Diferencia entre Big Data y Machine Learning

Big Data es un conjunto masivo de datos que pueden ser minados de diferentes formas y procesados con diversas herramientas. Machine Learning, en cambio, es una de las maneras de usar esos datos, centrada en la predicción de tendencias. En cierto sentido se puede decir que Big Data es a Machine Learning lo que el combustible es a un vehículo.

Sin ese combustible, la Inteligencia Artificial no podría encontrar patrones relevantes y realizar predicciones de valor. Industrias como la publicitaria, petrolera, financiera o cualquier otra que requiera anticiparse a tendencias macro, se ven enormemente beneficiadas por su implementación.

infografía anaíticas de big data: descriptiva, predictiva y prescriptiva