Preguntas con respuestas sobre "text-processing"

251 preguntas, página #1

2

votos

2

respuestas

vistas 129

Algoritmo diferencial para legislación

Como parte de un proyecto ambicioso, intento comprender mejor el texto legislativo que está escrito en los proyectos de ley presentados en el Congreso de los Estados Unidos. Tengo versiones electrónicas de facturas recientes y estoy intentando implementar un algoritmo que compararía una factura con facturas anteriores, buscando ...

preguntado 9 años, 11 meses

1

votos

1

respuestas

vistas 864

ANTLR para escribir gramática japonesa

Estoy usando GATE para procesar textos escritos en lenguaje natural. Tengo que extraer la altura, el peso, pb, etc. del texto y almacenarlo en forma estructurada. Ahora, estas cosas (es decir, altura, peso, etc.) se pueden escribir en muchas formas que desconozco. Escribiendo gramática japonesa de todas las formas en que puedo ...

preguntado 10 años, 0 meses

4

votos

1

respuestas

vistas 2,356

Cómo lidiar con problemas de codificación de caracteres unicode al convertir documentos de PDF a texto

Estoy intentando extraer texto de un PDF. El PDF contiene texto en hindi (Unicode). La utilidad de extracción que estoy usando es Apache PDFBox (http://pdfbox.apache.org/). El extractor extrae el texto, pero el texto no es reconocible. Intenté cambiar entre muchas codificaciones y fuentes, pero el ...

preguntado 10 años, 1 meses

21

votos

3

respuestas

vistas 4,850

¿Cuál es la forma preferida de implementar 'rendimiento' en Scala?

Estoy escribiendo código para investigación de doctorado y comenzando a usar Scala. A menudo tengo que procesar texto. Estoy acostumbrado a Python, cuya declaración de 'rendimiento' es extremadamente útil para implementar iteradores complejos en archivos de texto grandes, a menudo estructurados de manera irregular. Existen constructos similares en otros ...

preguntado 10 años, 1 meses