Cómo extraer contenido dinámico ajax de una página web
Frecuentes
Visto 3,089 veces
3
Mi requisito es extraer el contenido requerido de una página web. La página tiene una sección que se completa con ajax. Cuando veo en la fuente de la página, no muestra el contenido cargado usando ajax. El contenido de la sección cambiará según la casilla de verificación seleccionada. Si seleccionamos la casilla de verificación 'India', la sección mostrará todos los detalles de India. La fuente de la página mostrará solo el contenido predeterminado, no el contenido que se muestra con ajax. Verifiqué la fuente de la página después de seleccionar la casilla de verificación, aún muestra solo el valor predeterminado. Cómo obtener el contenido de esa sección,
2 Respuestas
4
En C#, puede usar HTMLAgilityPack para dibujar datos, pero si usa webBrowser.DocumentText, no puede cargar contenido ajax desde la página web para obtener xpath. Entonces, después de que el control webBrowser cargó la página web por completo. En el método Document_Complete, agrega algunos códigos a continuación:
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
this.webBrowser1.Document;
IHTMLDocument2 currentDoc =(IHTMLDocument2)this.webBrowser1.Document.DomDocument;
doc.LoadHtml(currentDoc.activeElement.innerHTML);
Respondido el 04 de diciembre de 12 a las 17:12
0
Utilice Firebug en Firefox. En la pestaña NET, verá el contenido adicional cargado.
Respondido 24 ago 12, 09:08
No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas c# parsing c#-4.0 html-parsing web-scraping or haz tu propia pregunta.
Gracias Zuum. Me ayudaron a ver el contenido extra cargado. ¿Puede ayudarme a obtener acceso a ese contenido usando el código C#? Para que pueda extraer el contenido requerido de la página web. - Maddy