De seguro has escuchado del Big Data, pero no has tenido el interés o el tiempo suficiente para indagar en el tema. Es cierto que ha estado en auge estos últimos años, pero es algo que ya se venía discutiendo desde antes. Fue usada en la campaña de Obama en el 2012, por comercios de Ropa como Macy’s para segmentar sus envíos e incluso por BBVA (Banco Bilbao Vizcaya Argentaria) en una investigación para medir el impacto económico del Mobile World Congress.
¿Qué es Big Data?
La compañía de Software y bases de datos, Oracle, describe el Big Data como
Una estrategia de administración de información integral que incluye e integra muchos tipos nuevos de datos y administración de datos, además de los datos tradicionales
Un concepto algo abstracto para digerir; por otro lado, la empresa IBM lo define como una tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir enormes cantidades de datos.
Las cuatro V del Big Data
El Big Data se constituye a partir de 4 variables: volumen, velocidad, variedad y valor.
Volumen: con este término nos referimos a la cantidad de datos; mientras más datos, mayor información. Oracle explica que los big data requieren procesar altos volúmenes de datos Hadoop no estructurados y de baja densidad. Un ejemplo, para entender mejor esta parte, pueden ser fuentes de datos de Twitter, flujos de clics en una página web y una aplicación móvil, tráfico de red, equipos con sensores que capturan datos a la velocidad de la luz, etc.
Velocidad: como la palabra lo explica, a qué velocidad se reciben los datos y en qué ritmo se ponen en práctica.
Variedad: Los datos no son de un solo tipo. Estos pueden ser estructurados o semiestructurados; estos últimos requieren un proceso adicional para extraer el significado, pueden ser texto, video o audio.
Valor: Los datos pueden tener un significado, dependiendo de las necesidades, preferencias o el motivo de la investigación. Oracle explica que gracias el avance tecnológico hace que sea posible tomar decisiones mucho más precisas y adecuadas.
¿Qué tipos de datos hay?
Podemos encontrar datos en las redes sociales (Facebook, Twitter, Linkedln, Instagram, en las tecnologías que permiten la conexión con otros dispositivos (Machine-to-Machine), que captura información como velocidad, temperatura, presión, variables meteorológicas, etc. También están los datos de facturación, datos de registro de llamada y de telecomunicaciones, estos se conocen como Big Transaction Data.
Por otro lado, está la información biométrica (huellas digitales, escaneo de la retina, reconocimiento facial, genética) y por últimos, los generados por las personas en el día a día, como la información que hay tras una llamada, mensaje de texto, correo electrónico, documentos, etc.