YARN y MapReduce: Big Data para gente de Marketing (6)

Los Problemas de MapReduce Como hemos visto en el post anterior MapReduce se encarga de automatizar el procesado de los datos en paralelo a través de distintos nodos de un cluster gestionando las tareas necesarios para la realización del trabajo. También proporciona la capacidad de reconducir el proceso en el momento en que detecta que uno de los nodos falla . MapReduce fue concebido para una función muy concreta, indexar el contenido de cada página […]

Leer más