Cómo extraer contenido dinámico ajax de una página web

Mi requisito es extraer el contenido requerido de una página web. La página tiene una sección que se completa con ajax. Cuando veo en la fuente de la página, no muestra el contenido cargado usando ajax. El contenido de la sección cambiará según la casilla de verificación seleccionada. Si seleccionamos la casilla de verificación 'India', la sección mostrará todos los detalles de India. La fuente de la página mostrará solo el contenido predeterminado, no el contenido que se muestra con ajax. Verifiqué la fuente de la página después de seleccionar la casilla de verificación, aún muestra solo el valor predeterminado. Cómo obtener el contenido de esa sección,

preguntado el 24 de agosto de 12 a las 09:08

2 Respuestas

En C#, puede usar HTMLAgilityPack para dibujar datos, pero si usa webBrowser.DocumentText, no puede cargar contenido ajax desde la página web para obtener xpath. Entonces, después de que el control webBrowser cargó la página web por completo. En el método Document_Complete, agrega algunos códigos a continuación:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
this.webBrowser1.Document;
IHTMLDocument2 currentDoc =(IHTMLDocument2)this.webBrowser1.Document.DomDocument;

doc.LoadHtml(currentDoc.activeElement.innerHTML);

Respondido el 04 de diciembre de 12 a las 17:12

Utilice Firebug en Firefox. En la pestaña NET, verá el contenido adicional cargado.

Respondido 24 ago 12, 09:08

Gracias Zuum. Me ayudaron a ver el contenido extra cargado. ¿Puede ayudarme a obtener acceso a ese contenido usando el código C#? Para que pueda extraer el contenido requerido de la página web. - Maddy

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.