Preguntas con respuestas sobre "sgml"

36 preguntas, página #1

1

votos

3

respuestas

vistas 981

¿Sintaxis correcta para analizar un archivo SGML a XML usando Perl?

Soy un novato de Perl que intenta leer un archivo SGML, analizarlo y luego convertirlo a XML para poder obtener los pares clave / valor de todos los elementos. Encontré los módulos SGML :: DTDParse y XML :: Simple ya que creo que esto es lo que quiero para la tarea. Mi problema es que no puedo encontrar ninguna documentación sobre DTDParse o cualquier ...

preguntado 10 años, 2 meses

0

votos

1

respuestas

vistas 303

¿Cómo extraer contenido textual de un DTD SGML usando Perl?

Estoy buscando extraer todo el contenido de un DTD usando Perl, pero no estoy seguro de cuál es la mejor manera de hacerlo. Sé que hay módulos para trabajar con XML, pero no estoy seguro si hay alguno para este tipo de trabajo con SGML o si debería intentar crear una expresión regular para este trabajo. ...

preguntado 10 años, 2 meses

1

votos

3

respuestas

vistas 2,699

Código Java para leer archivos SGML

Estoy haciendo mi proyecto sobre categorización de texto. Tengo una colección de pruebas de categorización de texto llamada Reuters-21578 para mi proyecto de recuperación de información. Se distribuye en 22 archivos. Cada uno de los primeros 21 archivos (reut2-000.sgm a reut2-020.sgm) contiene 1000 documentos, mientras que el último ...

preguntado 11 años, 2 meses

1

votos

1

respuestas

vistas 812

Usar lxml para extraer datos donde no se conocen todos los elementos de antemano

Tengo algunos archivos sgml que están aproximadamente estandarizados. Sin embargo, puede haber datos contenidos en una etiqueta que no sé que existen antes de abrir el archivo y leerlo personalmente. Por ejemplo, los archivos tienen direcciones y generalmente las direcciones tienen una calle, una ciudad, un estado, un código postal y un teléfono. ...

preguntado 11 años, 6 meses

14

votos

5

respuestas

vistas 487

¿Es> alguna vez necesario?

Ahora desarrollo sitios web e interfaces XML desde hace 7 años, y nunca, nunca llegué a una situación en la que fuera realmente necesario usar el> para un>. Toda desambiguación podría manejarse hasta ahora citando <, &, "y 'solos. ...

preguntado 11 años, 8 meses

3

votos

2

respuestas

vistas 2,986

Toma algunos datos ofx con Python

Estaba intentando usar http://www.jongsma.org/gc/scripts/ofx-ba.py para obtener la información de mi cuenta bancaria de wachovia. Al no tener suerte, decidí que simplemente intentaría construir manualmente algunos datos de solicitud usando este ejemplo ...

preguntado 12 años, 6 meses

0

votos

1

respuestas

vistas 1,401

Conversión de SGM heredado a XML

Tengo una tarea en el trabajo que implica convertir archivos SGM heredados en XML. Los archivos SGM se crearon utilizando 5 etiquetas de alto nivel independientes, la nueva DTD tiene entre 8 y 12 etiquetas de nivel superior a las que deberían asignarse las antiguas. Hay algunas etiquetas comunes entre las 2 DTD, pero hay suficientes ...

preguntado 12 años, 7 meses

8

votos

4

respuestas

vistas 3,495

Definición de reglas de espacios en blanco HTML?

Estoy buscando esta definición para que mi renderizador HTML se ajuste un poco mejor. Actualmente se trata de adivinar qué espacios en blanco conservar, cuáles colapsar y qué arrojar. El estándar SGML es difícil de encontrar y el estándar HTML no parece tratar el tema con la profundidad requerida para mis necesidades. ...

preguntado 12 años, 8 meses