martes, 6 de octubre de 2015

BIG DATA

El Big Data o Datos masivos es un concepto que hace referencia a la acumulación masiva de datos y a los procedimientos usados para identificar patrones recurrentes dentro de esos datos.
La disciplina dedicada a los datos masivos se enmarca en el sector de las tecnologías de la información y la comunicación. Esta disciplina se ocupa de todas las actividades relacionadas con los sistemas que manipulan grandes conjuntos de datos.

Los Datos masivos es un término que hace referencia a una cantidad de datos tal que supera la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable, el volumen de los datos masivos crece constantemente. La metodología MIKE2.0 que investiga la gestión de información, definen big data en términos de permutaciones útiles, complejidad y dificultad para borrar registros individuales.

Existen muchísima herramientas que se utiliza en big data: Hadoo, NoSQL, Cassandra, Business intelligence, Machine Learnin, estas herramientas ulitizan uno de los tres tipos de big data como son:

Datos estructurados: Datos que tienen bien definidos su longitud y su formato, como las fechas, los números o las cadenas de caracteres.

 Datos no estructurados: Datos en el formato tal y como fueron recolectados, carecen de un formato específico. No se pueden almacenar dentro de una tabla ya que no se puede desgranar su información a tipos básicos de datos.


Datos semiestructurados: Datos que no se limitan a campos determinados, pero que contiene marcadores para separar los diferentes elementos. Es una información poco regular como para ser gestionada de una forma estándar.

La cantidad de información que producimos procede de una gran cantidad de dispositivos que forman parte de nuestra vida, con ellos emitimos un perfil de datos que van conformando nuestros avatares, por ejemplo cuando pagamos con la tarjeta, dejamos rastro de qué hemos comprado y a qué precio, cuando realizamos las lecturas de los contadores de electricidad o del gas constatamos digitalmente el consumo que hacemos, cuando opinamos en la Red, colgamos imágenes, realizamos compras online o utilizamos una app, de eso trata el big data. 

Big data es el término que afronta la labor de almacenar, clasificar, analizar y compartir ese cúmulo masivo de información.

Para poder visualizar toda esta montaña de datos de forma correcta y ordenada utilizamos la plataforma Mondrian que nos permite visualizar la información a través de los análisis llevados a cabo de los datos que disponemos, con esta plataforma podemos llegar a un público más concreto.
Este conjunto de tecnologías se puede usar en una gran variedad de ámbitos, en lo empresarial, deportes, investigación.

Uno de los últimos proyectos sobre big data a sido el proyecto aloja, un proyecto iniciado en Barcelona, el objetivo de este proyecto es conseguir una optimización automática en despliegues de Hadoop en diferentes infraestructuras.




No hay comentarios:

Publicar un comentario