¿Cómo se analiza el DOM? [duplicar]

Posible duplicado:
Si se supone que no debe usar expresiones regulares para analizar HTML, ¿cómo se escriben los analizadores de HTML?

Mi pregunta es simple: ¿Cómo funcionan los analizadores DOM actuales Realmente analizar el DOM a partir de una cadena (XML, HTML u otro)?

Sé que no deberías analizar html con RegEx, pero ¿no podría un analizador DOM usar RegEx para hacer coincidir patrones para etiquetas de apertura / cierre? ¿O existe un buen algoritmo de revisión para analizar la cadena proporcionada como una matriz de caracteres?

preguntado el 09 de enero de 11 a las 06:01

Depende de la implementación del analizador, ¿no es así? -

Pero para responder a esta pregunta exacta rápidamente: la mayoría probablemente use expresiones regulares, pero solo para tokenización (por ejemplo, reconocer etiquetas de apertura y cierre). -

De alguna manera me perdí esa pregunta y voté a favor de cerrar esta copia. -

2 Respuestas

Bueno, podría comenzar con un enfoque básico como:

http://www.blackbeltcoder.com/Articles/strings/parsing-html-tags-in-c

Y luego simplemente amplíelo para almacenar todo en la estructura completa del árbol DOM.

Respondido el 09 de enero de 11 a las 10:01

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.