Preguntas con respuestas sobre "avro"

30 preguntas, página #1

3

votos

1

respuestas

vistas 4,333

Búferes de protocolo y Hadoop

Soy nuevo en el mundo Hadoop. Sé que Hadoop tiene su propio mecanismo de serialización llamado Writables. Y ese AVRO es otra biblioteca de este tipo. Quería saber si podemos escribir trabajos de reducción de mapas utilizando la serialización del búfer del protocolo de Google. En caso afirmativo, alguien puede señalar un buen ejemplo para obtener ...

preguntado 11 años, 0 meses

0

votos

2

respuestas

vistas 797

Avro un reemplazo para Writables

Soy muy nuevo en Hadoop y tengo que profundizar en su serialización. Sé que Hadoop viene con su propio serializador llamado Writables. Tenía curiosidad por saber si Avro (o protobuf, thrift) reemplaza la interfaz Writables o si Avro solo sirve para serializar los datos del cliente MR pero no los internos...

preguntado 11 años, 0 meses

1

votos

1

respuestas

vistas 2,695

Use MUnit y AVRO juntos

Creé un Mapper & Reducer que usa AVRO para entrada, salida de mapa y salida reducida. Al crear una prueba de MRUnit, obtengo el siguiente seguimiento de pila: ...

preguntado 11 años, 1 meses

1

votos

2

respuestas

vistas 1,058

¿Puedo seguir usando StringIO cuando el Writer () que lo contiene lo cierra?

Estoy usando la biblioteca avro de Python. Quiero enviar un archivo avro a través de http, pero en particular no quiero guardar ese archivo en el disco primero, así que pensé en usar StringIO para alojar el contenido del archivo hasta que esté listo para enviarlo. Pero avro.datafile.DataFileWriter cuidadosamente se encarga de cerrar el archivo...

preguntado 11 años, 1 meses

6

votos

2

respuestas

vistas 6,628

¿Puede agregar datos a un archivo de datos Avro existente?

Parece que no hay forma de agregar datos a un archivo serializado de Avro existente. Me gustaría tener varios procesos escribiendo en un solo archivo avro, pero parece que cada vez que lo abro, empiezo de cero. No quiero leer todos los datos y luego volver a escribirlos. ...

preguntado 11 años, 4 meses

1

votos

2

respuestas

vistas 270

Compatibilidad con versiones anteriores de Hadoop Streaming

AFAK, Hadoop Streaming solo admite la entrada de texto, lo que significa que los datos están organizados por líneas. pero el código del mapeador se volverá complicado si queremos compatibilidad con versiones anteriores, admitiendo diferentes versiones de líneas de registro en el mismo programa mapeador escrito en c ++. ...

preguntado 11 años, 6 meses

1

votos

0

respuestas

vistas 691

Uso de thrift / avro para un trabajo de hadoop para comunicarse entre Java y C ++

Ahora mismo tenemos un trabajo de Hadoop en Java que está trabajando con algunos binarios de C ++. Escribimos archivos en NFS y C ++ y Java los lee y esa es nuestra forma de comunicación, lo que nos impide escalar. Estoy investigando Proto Buff, Thrift y Avro para alejarme de la cuestión de NFS. Este enfoque sería ...

preguntado 12 años, 1 meses

3

votos

3

respuestas

vistas 19,687

Escribir en el archivo de datos de Avro

El siguiente código simplemente escribe datos en formato avro y lee y muestra lo mismo del archivo avro escrito también. Estaba probando el ejemplo de la guía definitiva de Hadoop. Pude ejecutar esta primera vez. Entonces recibí el siguiente error. Funcionó por primera vez. Así que estoy ...

preguntado 12 años, 1 meses

3

votos

1

respuestas

vistas 1,375

¿Cómo utilizo Avro para procesar una transmisión que no puedo buscar?

Estoy usando Avro 1.4.0 para leer algunos datos de S3 a través de los enlaces de Python avro y la biblioteca boto S3. Cuando abro un avro.datafile.DataFileReader en el archivo como los objetos devueltos por boto, falla inmediatamente cuando intenta buscar (). Por ahora, estoy trabajando en esto leyendo los objetos S3 en ...

preguntado 12 años, 8 meses