Técnicas de procesamiento.

 

       Procesamiento batch: para lotes de grandes volúmenes de datos:

Es un marco de computación distribuida el modelo de Google mapreduce para procesar grandes cantidades de datos en paralelo. hadoop distributed file system  es el sistema de archivos subyacente de un cluster hadoop y funciona de manera más eficiente con un número reducido de archivos big data de gran volumen, que con una cantidad superior de archivos de datos más pequeños.



       Procesamiento en stream:

Este tipo de técnicas de procesamiento y análisis de datos se basan en la implementación de un modelo de flujo de datos en el que los datos asociados a series de tiempo fluyen continuamente a través de una red de entidades de transformación que componen el sistema. se conoce como procesamiento streaming o de flujo.


       Técnicas de procesamiento y análisis de datos en tiempo real:

Cuando los datos se trabajan en tiempo real el nivel de procesamiento analítico en línea alcanzado es extremadamente alto y el margen es inferior a segundos. precisamente por ello, los sistemas real time no suelen usar mecanismos especiales para la atomicidad y durabilidad. simplemente se ocupan de procesar la entrada tan pronto como sea posible.





Comentarios

Entradas más populares de este blog

Portada

Programas tecnológicos