Este fenómeno de almacenamiento está enmarcado en las nuevas tecnologías de información y comunicación. Big Data es aquello que ocupa todas las actividades que están relacionadas con los sistemas que almacenan gran conjunto de datos. Una de las características principales es que manipula gran cantidad de información, recolectando, clasificándolos y luego almacenando los. El fin de esta recolección es crear informes estadísticos para uso de las organizaciones, ya sea como análisis de planes de negocios, publicitarios, espionajes, entre otros.
El margen de almacenamiento ha crecido con los años, desde el 2008 se medía el nivel de almacenamiento en petabytes a zettabytes de datos. Los expertos periódicamente están buscando nuevas medidas de almacenamiento debido a que existen ciertas áreas en donde hay que guardar gran cantidad de datos y los programas existentes no son muy óptimos.
Hay miles de herramientas para realizar y manejar una Big Data, sin embargo no todas son iguales, existen tres tipos de Datas, las cuales son:
- Datos Estructurados: son aquellos donde los datos tienen una estructura bien particular, como son las fechas, los números, entre otros. Un ejemplo de ellos son las hojas de cálculo.
- Datos no estructurados: usualmente son datos que tienen un formato específico y no se pueden almacenar en hoja de cálculos y mucho menos manipular la información, un ejemplo de lo los documentos en PDF.
- Datos semiestructurados: este tipo de datos no tienen un formato en particular, ya que cuentan con sus propios metadatos semiestruturados, ejemplo de estos son los codigos HTML.