Preguntas con respuestas sobre "hadoop"

1,592 preguntas, página #1

7

votos

4

respuestas

vistas 6,224

Integración de Hive / HBase: la sesión de Zookeeper se cierra inmediatamente

Tenemos un clúster de 8 nodos usando CDH3u2 configurado usando Cloudera Manager. Tenemos un nodo maestro dedicado que ejecuta nuestra única instancia de zookeeper. Cuando configuro Hive para ejecutar hadoop local, ejecutado desde el nodo maestro, no tengo problemas para recuperar los datos de HBase. Cuando corro distribuido ...

preguntado 9 años, 9 meses

0

votos

1

respuestas

vistas 1,196

El escáner de cliente Hbase se bloquea

He estado usando Hbase durante meses y he cargado la tabla Hbase con más de 6GB de datos. Cuando intenté escanear las filas usando el cliente Java, se cuelga e informa el siguiente error, ...

preguntado 9 años, 9 meses

1

votos

3

respuestas

vistas 1,149

¿Amazon Elastic Map Reduce ejecuta uno o varios procesos de mapeador por instancia?

Mi pregunta es: ¿debería preocuparme por el multiprocesamiento en mi mapeador (leer las tareas de stdin y luego distribuirlas en los procesos de trabajo, combinar los resultados en un proceso maestro y enviarlos a stdout) o Hadoop se encargará de ello automáticamente? ...

preguntado 9 años, 9 meses

1

votos

3

respuestas

vistas 2,550

Análisis de Useragent con Hadoop

Estoy buscando una biblioteca que me ayude a extraer características de useragents para usar con Hadoop (Pig o Hive). Me interesan principalmente los usuarios de dispositivos móviles. ...

preguntado 9 años, 10 meses

0

votos

1

respuestas

vistas 317

Tareas de mapas de ejecución prolongada en un archivo HDFS pequeño

Imagine un escenario en el que tiene un archivo de texto con, digamos, 10000 filas, por lo que será muy pequeño cuando lo guarde en el HDFS. Ahora su objetivo es ejecutar un trabajo de mapa / reducción en este pequeño archivo esperando que cada línea del archivo de texto se pase al asignador. Sin embargo, el tiempo de procesamiento para cada mapa k, v es ...

preguntado 9 años, 10 meses

5

votos

1

respuestas

vistas 4,470

Actualización de un archivo HDFS de hadoop

Soy un novato en Hadoop. He estado leyendo que HDFS se trata principalmente de "escribir una vez, leer en cualquier momento". Tengo un caso de uso en el que es posible que tenga que realizar modificaciones en los archivos almacenados en HDFS. He estado investigando si hay alguna forma de hacer esto. ...

preguntado 9 años, 10 meses

4

votos

2

respuestas

vistas 2,604

Crear externo con partición

Tengo datos en hadoop y creé una tabla externa usando particiones (fecha y hora). La creación de la tabla está bien, pero cuando intento consultar los datos, no obtengo ningún resultado. ...

preguntado 9 años, 10 meses

16

votos

9

respuestas

vistas 46,524

anular log4j.properties en hadoop

¿Cómo anulo el log4j.properties predeterminado en hadoop? Si configuro hadoop.root.logger = WARN, consola, no imprime los registros en la consola, mientras que lo que quiero es que no imprima la INFORMACIÓN en el archivo de registros. Agregué un archivo log4j.properties en mi jar, pero no puedo anular el ...

preguntado 9 años, 10 meses