Técnicas de procesamiento.
• Procesamiento batch: para lotes de
grandes volúmenes de datos:
Es un marco
de computación distribuida el modelo de Google mapreduce para procesar grandes
cantidades de datos en paralelo. hadoop distributed file system es el sistema de archivos subyacente de un
cluster hadoop y funciona de manera más eficiente con un número reducido de
archivos big data de gran volumen, que con una cantidad superior de archivos de
datos más pequeños.
• Procesamiento
en stream:
Este tipo
de técnicas de procesamiento y análisis de datos se basan en la implementación
de un modelo de flujo de datos en el que los datos asociados a series de tiempo
fluyen continuamente a través de una red de entidades de transformación que
componen el sistema. se conoce como procesamiento streaming o de flujo.
• Técnicas de procesamiento y análisis
de datos en tiempo real:
Cuando los
datos se trabajan en tiempo real el nivel de procesamiento analítico en línea
alcanzado es extremadamente alto y el margen es inferior a segundos.
precisamente por ello, los sistemas real time no suelen usar mecanismos especiales
para la atomicidad y durabilidad. simplemente se ocupan de procesar la entrada
tan pronto como sea posible.



Comentarios
Publicar un comentario