Big data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan un negocio cada día. Pero no es la cantidad de datos lo que importa. Es lo que hacen las organizaciones con los datos que importan. Los datos grandes se pueden analizar para obtener información que conduzca a mejores decisiones y movimientos estratégicos de negocios.
Si bien el término "big data" es relativamente nuevo, el hecho de recopilar y almacenar grandes cantidades de información para un análisis eventual tiene una antigüedad de años. El concepto cobró impulso a principios de la década de 2000 cuando el analista de la industria Doug Laney articuló la definición ahora general de big data como las tres V:
- Volumen. Las organizaciones recopilan datos de una variedad de fuentes, incluidas transacciones comerciales, redes sociales e información de sensores o datos de máquina a máquina. En el pasado, almacenarlo habría sido un problema, pero las nuevas tecnologías han aliviado la carga.
- Velocidad. Los datos se transmiten a una velocidad sin precedentes y deben tratarse de manera oportuna. Las etiquetas RFID, los sensores y la medición inteligente están impulsando la necesidad de lidiar con torrentes de datos casi en tiempo real.
- Variedad. Los datos vienen en todo tipo de formatos, desde datos numéricos estructurados en bases de datos tradicionales hasta documentos de texto no estructurados, correo electrónico, video, audio, datos de cotización de acciones y transacciones financieras.
Adicional, debemos considerar dos dimensiones adicionales cuando se trata de big data:
- Variabilidad. Además de las crecientes velocidades y variedades de datos, los flujos de datos pueden ser altamente inconsistentes con picos periódicos. ¿Hay alguna tendencia en las redes sociales? La carga de datos pico diaria, estacional y desencadenada por eventos puede ser difícil de administrar. Más aún con datos no estructurados.
- Complejidad. Los datos de hoy provienen de múltiples fuentes, lo que hace que sea difícil vincular, combinar, limpiar y transformar datos entre sistemas. Sin embargo, es necesario conectar y correlacionar relaciones, jerarquías y múltiples enlaces de datos o sus datos pueden salirse rápidamente de control.
Importancia
La importancia de bit data no gira en torno a la cantidad de datos que tiene, sino a lo que hace con ellos. Puede tomar datos de cualquier fuente y analizarlos para encontrar respuestas que permitan:
- Reducciones de costos
- Reducciones de tiempo
- Desarrollo de nuevos productos y ofertas optimizadas
- Toma de decisiones inteligente. Cuando combina big data con análisis de gran potencia, puede realizar tareas relacionadas con la empresa, como:
- Determinación de las causas raíz de fallas, problemas y defectos en tiempo casi real.
- Generación de decisión en el punto de venta según los hábitos de compra del cliente.
- Recalculando carteras de riesgo completas en minutos.
- Detectar comportamientos fraudulentos antes de que afecte a su organización.