0
votos
1
respuestas
vistas 1,646
¿Cómo ignoro un error de atributo de BeautifulSoup/Continue on Exception?
He construido un web scraper con Python y Beautiful Soup...
preguntado 10 años, 9 meses
781 preguntas, página #1
0
votos
1
respuestas
vistas 1,646
He construido un web scraper con Python y Beautiful Soup...
preguntado 10 años, 9 meses
2
votos
2
respuestas
vistas 945
Tengo un proyecto que tiene un formato de archivo no estándar algo así como: ...
preguntado 10 años, 9 meses
0
votos
2
respuestas
vistas 58
Estoy buscando modificar el siguiente código para ejecutarlo en python2.x y beautifulsoup3.x ...
preguntado 10 años, 9 meses
0
votos
1
respuestas
vistas 688
He tenido muchos problemas con esto... Nuevo en Python, así que lo siento si no conozco los términos de búsqueda adecuados para encontrar la información yo mismo. Ni siquiera estoy seguro de que sea por el JS, pero esa es la mejor idea que tengo. ...
preguntado 10 años, 9 meses
1
votos
3
respuestas
vistas 9,038
Estoy intentando usar BeautifulSoup para obtener una lista de HTML etiquetas, luego verifique si tienen un atributo de nombre y luego devuelva ese valor de atributo. Por favor vea mi código: ...
preguntado 10 años, 9 meses
7
votos
1
respuestas
vistas 5,350
Así que estoy tratando de encontrar una manera de encontrar todos los elementos dentro de un objeto BeautifulSoup que tienen una etiqueta determinada que no están dentro de otra etiqueta determinada. Por ejemplo: ...
preguntado 10 años, 9 meses
0
votos
1
respuestas
vistas 456
Estoy trabajando en un proyecto de rastreador. Estoy atrapado en una situación en la que el texto href en una página sigue repitiéndose en otras páginas bajo ese dominio. ...
preguntado 10 años, 9 meses
0
votos
3
respuestas
vistas 436
Usé page.prettify() para ordenar el HTML, y este es el texto que quiero extraer ahora: ...
preguntado 10 años, 9 meses
1
votos
3
respuestas
vistas 64
Honestamente, encuentro que BeautifulSoup es demasiado difícil, la documentación no explica los conceptos básicos que estoy buscando. ...
preguntado 10 años, 9 meses
2
votos
1
respuestas
vistas 2,782
Estoy intentando usar Pygments y Beautiful Soup como una solución de resaltado de código para el software de blog que estoy creando para Google App Engine. ...
preguntado 10 años, 9 meses
0
votos
0
respuestas
vistas 351
Estoy tratando de raspar un sitio y tengo varios problemas; por un lado, dice que mi código está roto y parece que no puedo encontrar un problema. Tampoco estoy seguro de qué poner cuando busco una expresión regular cuando es . por ejemplo: ...
preguntado 10 años, 10 meses
0
votos
2
respuestas
vistas 100
Este código: ...
preguntado 10 años, 10 meses
2
votos
1
respuestas
vistas 377
para encontrar en soup.findAll(text=reg_compiled_keyword): ...
preguntado 10 años, 10 meses
1
votos
1
respuestas
vistas 2,536
Estoy tratando de analizar una tabla de filas usando una sopa hermosa y guardar los valores de cada fila en un dictado. ...
preguntado 10 años, 10 meses
4
votos
1
respuestas
vistas 745
Quiero raspar el HTML de algún sitio web y luego enviarlo a BeautifulSoup para analizarlo. El problema es que el HTML devuelto por urllib2.urlopen() contiene líneas nuevas (\n) y tabulaciones (\t), además de tener comillas simples y otros caracteres escapados. Cuando intento construir un objeto BeautifulSoup con...
preguntado 10 años, 10 meses
1
votos
0
respuestas
vistas 210
Estoy leyendo un archivo html del directorio de almacenamiento, haciendo algunas modificaciones con sopa hermosa y luego emitiendo el resultado usando HttpResponse. Mi problema es que algunos de los caracteres, como los símbolos <>, se devuelven como códigos ASCII en lugar de símbolos, por ejemplo, < en lugar de <...
preguntado 10 años, 10 meses
0
votos
2
respuestas
vistas 145
Estoy tratando de analizar la fuente HTML de muchas páginas diferentes, como esta: ...
preguntado 10 años, 10 meses
1
votos
1
respuestas
vistas 1,599
Obtengo "AttributeError: el objeto 'NoneType' no tiene atributo 'cadena'" cuando ejecuto lo siguiente. sin embargo, cuando se realizan las mismas tareas en una variable de cadena de bloques; funciona. ...
preguntado 10 años, 10 meses
1
votos
1
respuestas
vistas 463
Mi script funciona cuando descargo una biblia en inglés. pero me da error ascii cuando descargo una biblia extranjera. ...
preguntado 10 años, 10 meses
5
votos
6
respuestas
vistas 20,754
Estoy usando beautifulsoup para analizar todas las etiquetas img que están presentes en 'www.youtube.com'...
preguntado 10 años, 10 meses
0
votos
1
respuestas
vistas 3,038
Estoy tratando de escribir un programa que lea artículos (publicaciones) de cualquier sitio web que pueda variar desde Blogspot o blogs de Wordpress / cualquier otro sitio web. En cuanto a escribir código que sea compatible con casi todos los sitios web que podrían haber sido escritos en HTML5/XHTML, etc. Pensé en usar fuentes RSS/Atomo como...
preguntado 10 años, 10 meses
0
votos
2
respuestas
vistas 5,907
Tengo algunos xml: ...
preguntado 10 años, 10 meses
3
votos
2
respuestas
vistas 5,272
tengo el siguiente código. ...
preguntado 10 años, 10 meses
7
votos
1
respuestas
vistas 3,675
¿Cómo usaría BeautifulSoup para eliminar solo una etiqueta? El método que encontré elimina la etiqueta y todas las demás etiquetas y contenido dentro de ella. Quiero eliminar solo la etiqueta y dejar todo lo que hay dentro intacto, por ejemplo...
preguntado 10 años, 10 meses
1
votos
1
respuestas
vistas 95
¿Hay una forma más eficiente de escribir esto para que solo ocupe una línea? Esto funciona, pero siento que de alguna manera se puede comprimir en una sola línea de código...
preguntado 10 años, 10 meses
2
votos
1
respuestas
vistas 2,027
Estoy analizando datos de una página web y, a veces, las tablas tienen retornos de carro no deseados que me causan problemas. Quiero eliminar los retornos de carro, pero una tira simple () no funciona. ...
preguntado 10 años, 10 meses
0
votos
1
respuestas
vistas 424
Busco y analizo una cantidad mediana o grande de páginas web. Noté que mi secuencia de comandos finalizaba espontáneamente con un reinicio de sesión de Python. Hasta ahora, solo parece suceder cuando trato de hacer sopa con la página nasa.gov. es decir: ...
preguntado 10 años, 10 meses
3
votos
2
respuestas
vistas 2,502
Tengo este script: ...
preguntado 10 años, 10 meses
0
votos
1
respuestas
vistas 1,490
Me he estado tirando de los pelos todo el día con esto. Básicamente, no puedo extraer información de las etiquetas...
preguntado 10 años, 10 meses
7
votos
3
respuestas
vistas 14,927
Estoy tratando de usar BeautifulSoup para obtener texto de páginas web. ...
preguntado 10 años, 10 meses