Buenas, en este articulo seré breve, lo que haremos sera conectar Apache Flume con el HDFS de Hadoop, esto para poder obtener el Stream de Twitter de una cuenta particular, para ello debemos realizar varias tareas, estamos listos? Lo primero que debes hacer es descargar los paquetes que necesitaremos, son dos el primero Apache flume bajatelo de aqui, luego necesitaremos el código fuente o el .JAR que ofrece el proyecto Cloudera para esta tarea, les comento que a la primera no me funciono en Ubuntu, se debe recompilar el .JAR para que esto camine, asumo en este articulo que la implementación de HADOOP en la plataforma es efectiva y correcta.