Mahout: ¿Cómo se formatea, carga y trabaja con datos para la clasificación?

La página de inicio rápido de JavaDocs y mahout es horrible. Tengo una copia del libro Mahout en acción. He leído grandes porciones del libro Mahout in Action que se enfoca en formatear datos solo para sistemas de recomendación.

¿Cómo se formatea el archivo que contiene los datos de clasificación?

¿Cómo se carga en el DataModel de mahout o hay un modelo de datos diferente para la clasificación? (Vi algo sobre vectores)

¿Cómo toma ese modelo de datos y lo incorpora con su sistema de clasificación?

preguntado el 22 de mayo de 12 a las 18:05

1 Respuestas

(Vi tu otra pregunta hace un momento).

No creo que los documentos sean buenos en general. Solo mejora cuando personas como usted agregan documentos. Pero, Mahout no es un producto, ni siquiera una biblioteca. Es código para desarrolladores y prácticamente tiene que usarse como código.

La mayor parte de la clasificación (de la que sé poco) utiliza Vector y así utiliza VectorWritable como el formato de conexión de Hadoop para la entrada.

DataModel no está relacionado con clasificadores y no hay contraparte. Eso es parte del bit de recomendación.

contestado el 29 de mayo de 12 a las 23:05

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.