Personalización de InputFormat en Hadoop

Estoy tratando de leer una base de datos muy grande que consiste en datos de series temporales georreferenciadas. Entonces tengo el archivo en el siguiente formato:

latitud,longitud,valor@hora1,valor@hora2,....valor@horaN.

Así que estos son los datos para toda la tierra. Ahora, para mi trabajo, necesito obtener la latitud, la longitud como clave y los valores de la serie temporal como valor. Por lo que sé, Hadoop tiene KeyValueInputFormat pero considera la primera pestaña como delimitador. ¿Hay alguna forma de personalizarlo? Necesito una solución para esto.

preguntado el 27 de julio de 12 a las 15:07

1 Respuestas

Jugar con

key.value.separator.in.input.line

en la configuración del trabajo.

Respondido 27 Jul 12, 15:07

¿Puedes señalar un tutorial que pueda ayudarme a hacer esto? Soy bastante nuevo en esto. - ayush singhal

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.