¿Qué es el Big Data y cómo cambiará al mundo de la tecnología?
Big Data se escribe con V. ¿No nos crees? A continuación te diremos por qué.
La aparición de plataformas como redes sociales, servicios de streaming y sitios web cada vez más complejos -sin olvidarnos de los cientos de videos de gatitos haciendo travesuras- está creando y almacenando una cantidad astronómica e inmensurable de datos alojados en la red.
Es tal la magnitud que, si se quisiera reunir toda la información generada en el último año en CDs, se formaría una gigantesca torre desde nuestro planeta hasta la Luna (y de regreso). Es por ello que surgió la necesidad de crear una tecnología capaz de manejar tales cantidades de datos: el Big Data.
Pero ¿qué es Big Data? ¿En qué nos beneficia? ¿Cómo cambiará nuestras vidas? En el siguiente artículo te ayudaremos a comprender este término, mismo que desde su aparición ha generado debates e interés. ¿Estás listo para sentirte tan pequeño como un grano de arena?
Definición de Big Data
En términos generales, se refiere al análisis y gestión de colosales volúmenes de datos que serían imposibles de manejar con herramientas de software convencionales, debido a los límites de sus capacidades. Sin embargo, el término no hace alusión a una cantidad de información en específico, ya que se utiliza cuando se habla de medidas exorbitantes de datos como petabytes y exabytes.
También hace referencia a infraestructuras, tecnologías y servicios creados para facilitar la gestión de enormes cantidades de conjuntos de datos estructurados, no estructurados o semi-estructurados (archivos de audio, imágenes digitales, correos electrónicos, datos de encuestas y formularios, mensajes de redes sociales, señales de telefonía celular, etc..) provenientes de cámaras, escáneres, imágenes, micrófonos, sensores y un largo etcétera.
¿De dónde surgen todos esos datos?
La contribución masiva de registros proviene de distintas fuentes: las compañías mantienen grandes cantidades de referencias transaccionales, información de clientes, operaciones, proveedores, etc. El sector público también contribuye, ya que de esa manera se administran las bases de datos que contienen censos de población, impuestos, registros médicos, etc.
Eso no es todo, ya que se deben añadir todas las transacciones financieras en línea, la actividad en redes sociales, la ubicación geográfica registrada en los sistemas de GPS e incluso la información de envío de un paquete. En fin, muchas de las actividades que realizamos día con día con nuestros dispositivos móviles. Además, no debemos olvidar que los seres humanos no somos los únicos que contribuimos, ya que también existe la comunicación entre máquinas (M2M machine-to-machine). Conclusión: la cantidad de datos generada en el mundo es asfixiante.
La enorme cantidad de datos no surgió de la noche a la mañana , vía GTI
Que su nombre tenga la palabra Big (grande) no es ninguna coincidencia o exageración: si pensabas que después de los terabytes ya no existía manera de medir datos, a continuación te diremos cuál es la cantidad de información que procesa el Big Data. Pista, es bastante:
- Gigabyte (GB) equivale a 1,000,000,000 (mil millones de) bytes
- Terabyte (TB) equivale a 1,000,000,000,000 (un billón de) bytes
- Petabyte (PB) equivale a 1,000,000,000,000,000 de bytes
- Exabyte equivale a 1,000,000,000,000,000,000 bytes
Para que tengas una idea de la magnitud del tamaño de estas cifras, te daremos algunas anotaciones interesantes:
- Google procesó cerca de 20 petabytes de datos al día en 2007
- YouTube tuvo un tráfico de 20 petabytes
- Filmar 100 días de la vida de una persona en alta definición (a 10 megapixeles y 50 cuadros por segundo) ocuparía 0.5 petabytes
- 1,024 petabytes equivalen a un exabyte
- El tráfico anual de Internet en 2015 se estimó en 2021 exabytes.
Te lo dijimos, tales cantidades te harían sentir pequeño. Ahora veamos cuáles son los beneficios de este tema en nuestros días.
Características del Big Data
Al igual que los sistemas analíticos convencionales (como el Business Analytics o Análisis de Negocios y la inteligencia competitiva), el objetivo del Big Data es convertir datos en información para ser más productivos e innovar. Por supuesto, no se trata sólo del tamaño de dicha información, sino de su papel como recurso primordial para el modelo de negocios de las empresas, ya que utilizan el Big Data para conocer las necesidades, opiniones y el perfil de sus clientes respecto a los productos y servicios que ofrecen. Más adelante explicaremos cómo te beneficia esto.
Pareciera que los sistemas analíticos convencionales y el Big Data fueran lo mismo, sin embargo, sus diferencias se pueden explicar con las cinco Vs (5Vs) que hacen al Big Data único: Volumen, Variedad, Velocidad, Veracidad y Valor del dato. Cabe mencionar que no existe un consenso sobre cuántas V utilizar, ya que se suelen utilizar de tres a siete para explicar las características fundamentales del Big Data, sin embargo, te presentamos las principales.
Sean tres o siete, éstas Vs no pueden faltar en el Big Data, vía LinkedIn
Volúmen
Es cuando se supera la capacidad del software comúnmente usado para la gestión de datos. Con el paso del tiempo, el desarrollo tecnológico ha permitido que sea posible manejar cantidades mayores, por ejemplo los Petabytes y Terabytes. Trata de imaginar la cantidad si se estima que para 2020, 40 zettabytes (43 trillones de gigabytes) serán creados en todo el mundo.
Variedad
Se refiere a la inclusión de diferentes fuentes de datos, distintas a las utilizadas tradicionalmente, por ejemplo: redes sociales, dispositivos electrónicos conectados, sensores, smartphones, etc. Toda fuente que permita conocer hábitos de vida. Por ejemplo, los 400 millones de tuits que son enviados diario. Los datos pueden categorizarse de la siguiente manera:
- Datos públicos: bases de datos gubernamentales (transporte, uso de energía, sanidad, etc...)
- Datos privados: transacciones comerciales, navegación web y tráfico orgánico (no pagado), uso de servicios de telefonía móvil.
- Data exhaust: son datos ambientales que se recogen de forma pasiva. No tienen valor por sí solos, pero combinados con otros, sí.
- Datos comunitarios: son producidos en redes sociales o contenidos generados por el usuario.
- Self-quantification data: estos son datos producidos por el individuo al momento de cuantificar sus acciones y comportamientos, por ejemplo: las pulsaciones generadas mediante el ejercicio físico registradas en los dispositivos vestibles o wearables.
Velocidad
Aquí se habla de la rapidez con la que se procesan, reciben y se toman decisiones con los datos. A diferencia de los sistemas analíticos convencionales, al Big Data no le es imposible analizar de forma inmediata y en tiempo real grandes volúmenes de datos intercambiados. Un ejemplo de ello es la Bolsa de Valores de Nueva York, la cual registra un terabyte de información en cada sesión de cambio.
Veracidad
Se refiere a la confianza de los datos; es decir, la extracción de información de calidad al eliminar su imprevisibilidad inherente, como por ejemplo el tiempo y la economía. De esta manera, la toma de decisiones será correcta.
Valor
Hace referencia al valor del dato para las empresas. Conocer qué datos se van a utilizar es fundamental, pero saber qué se puede lograr con esos datos es preferente. Trabajar con Big Data debe tener la finalidad de ser útil en distintos aspectos de la vida diaria, fomentar la competitividad, innovación y promover una mejor calidad de vida.
Ejemplos de Big Data
Como puedes imaginarlo, las funciones del Big Data no terminan en la gestión de grandes volúmenes de registros y su conversión a información. Algunas de sus aplicaciones en la vida diaria son:
Big Data en la salud
Los hospitales acumulan grandes cantidades de datos sobre sus pacientes en distintos formatos, digitales o físicos, que debido a su dispersión (algunos son estructurados mientras que otros no) resulta imposible utilizar. En este caso ayuda a organizar dichas cantidades de información de forma efectiva. En un futuro las computadoras podrían sustituir a un 80% de la planta administrativa de un centro de salud, por lo que su productividad incrementará.
El Big Data estará presente hasta en los hospitales, vía KDnuggets
Big Data en el marketing
Las compañías se ven beneficiadas gracias a que ayudará a adecuar la forma en la que interactúan con su cliente. ¿Cómo? Sencillo, personalizando los anuncios que el individuo ve en Internet. Los hábitos en Internet son el objetivo de las agencias de publicidad, quienes buscan transformar las variables en posibles llamadas a la acción. Si alguna vez te has preguntado por qué ves anuncios relacionados con tus búsquedas en Internet, ahora sabes la respuesta.
¿Te has preguntado sobre los anuncios que ves en Internet?, vía Business 2 Community
En conclusión...
El desarrollo tecnológico y la aparación de complejas y diversas plataformas en la red han provocado la existencia de una acumulación extraordinaria de datos, mismos que sería imposible gestionar y aprovechar con software tradicional. El Big Data no ayuda sólo a facilitar el almacenamiento de estos datos, sino en convertirlos en información útil en diversos campos del conocimiento.
Sin embargo, aunque los beneficios son inmensos, también existe el riesgo (como con todo avance tecnológico) de que sea usado con finalidades poco éticas. Si quieres saber cómo se puede evitar que el Big Data se convierta en el Big Brother (no el reality show, sino el sombrío líder en el distópico libro de George Orwell, 1984), no te pierdas el siguiente video.