Big data CMS Búsqueda de texto completo
Frecuentes
Visto 467 veces
0
Actualmente tengo una aplicación donde los usuarios suben el documento (pdfs/excel/word, pocas imágenes). Buscando una solución de Big-Data (Hadoop-MangoDB) donde pueda
almacene miles de archivos pdf, word, excel (como somos, el tamaño también está creciendo)
Buscar metainformación de la imagen
Búsqueda de texto completo (principalmente en tiempo real)
Recuperación más rápida
Por favor aconséjame
1 Respuestas
0
eche un vistazo a apache Hbase también... puede que le resulte útil para su caso de uso... es una base de datos NOSQL que se ejecuta sobre Hdfs y proporciona acceso aleatorio de lectura/escritura en tiempo real... puede echar un vistazo a Apache Hive como bueno... aunque no es para el procesamiento en tiempo real a diferencia de Hbase, proporciona un almacén de datos en la parte superior de un clúster de Hadoop con una interfaz similar a SQL... puede ejecutar trabajos de Hive en segundo plano y mantener sus datos procesados y listos para servir si conoce el tipo de procesamiento por adelantado ... sería útil si proviene de un fondo de SQL.
Respondido el 12 de junio de 12 a las 21:06
No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas content-management-system full-text-search bigdata or haz tu propia pregunta.
He usado HBase, Hive para mi otro proyecto. HBase está orientado a la columna y se puede usar para indexar con solr y Hive es totalmente irrelevante aquí. Estoy buscando un sistema orientado a documentos como Mongo. Pero no me gusta la idea de derivación. - kumar MI
No he dicho que debas usar Hive en lugar de Mongo o algo así. Y hay varias opciones si desea optar por un sistema orientado a documentos como: Terrastore, Apache CouchDB, Amazon SimpleDB, etc. Puede elegir uno según su conveniencia: Tariq