Preguntas con respuestas sobre "beautifulsoup"

519 preguntas, página #1

3

votos

3

respuestas

vistas 2,270

Eliminación de etiquetas html al rastrear wikipedia con urllib2 y Beautifulsoup de python

Estoy tratando de rastrear wikipedia para obtener algunos datos para la minería de texto. Estoy usando urllib2 y Beautifulsoup de python. Mi pregunta es la siguiente: ¿existe una manera fácil de deshacerse de las etiquetas innecesarias (como enlaces 'a's o' span's) del texto que leo? ...

preguntado 9 años, 11 meses

0

votos

1

respuestas

vistas 2,798

Cómo imprimir solo cierto texto usando BeautifulSoup

Estoy tratando de obtener algunos datos financieros para los gobiernos de la ciudad usando BeautifulSoup (tuve que convertir los archivos de pdf). Solo quiero obtener los datos como un archivo csv y luego los analizaré en Excel o SAS. Mi problema es que no quiero imprimir el "& nbsp;" que está en el HTML original, solo el ...

preguntado 9 años, 11 meses

4

votos

1

respuestas

vistas 2,248

Sensibilidad a mayúsculas y minúsculas de Beautiful Stone Soup en nombres de etiquetas XML

Estoy intentando utilizar Beautiful Stone Soup (BSS) para modificar XML existente que tiene nombres de etiquetas que distinguen entre mayúsculas y minúsculas. Cuando BSS lee el XML, convierte todos los nombres de las etiquetas en minúsculas y no puedo encontrar una manera fácil de recuperar el patrón de mayúsculas original al escribirlo de nuevo en el archivo. Esto causa ...

preguntado 9 años, 11 meses

2

votos

4

respuestas

vistas 614

Python: consejos sobre la reescritura de la función BeautifulSoup para ser más elegante

El código funciona, pero estoy buscando consejos sobre cómo se podría escribir un poco más correctamente, especialmente el uso de if. Como puede ver, no soy un programador por naturaleza ... solo un administrador de sistemas que juega un poco en Python. Gracias por cualquier consejo que usted puede proporcionar. ...

preguntado 9 años, 11 meses