Tratando de aislar un enlace de los mensajes de IRC

Tengo un bot de IRC en el que estoy trabajando, y una de las características que me gustaría que tuviera es tomar cualquier enlace que publique una persona y usar BeautifulSoup para analizar esa página. Ahora, tengo el bot funcionando, recibiendo los mensajes que la gente publica, etc. Pero, ¿cómo sacaría un enlace del mensaje de IRC? Digamos que alguien dice esto:

Persona: Echa un vistazo http://www.site.com, ¡Es genial!

¿Cómo sacaría el enlace y lo asignaría a una variable para su uso posterior, sin extraer las otras partes del mensaje?

Creo que tiene algo que ver con las expresiones regulares, pero no estoy seguro.

preguntado el 27 de julio de 12 a las 19:07

2 Respuestas

De hecho, necesitará usar expresiones regulares.

Hay un artículo decente con una expresión regular para las URL coincidentes y algo así como una descripción de lo que está haciendo en atrevida bola de fuego.

Puedes ver cómo lo hace Django aquí.

Finalmente, la expresión regular de Python documentación También puede ser útil.

Respondido 27 Jul 12, 19:07

La expresión regular de URL de Gruber fue lo primero que pensé también. ¡Buena respuesta! - Brighid McDonnell

Estás en el camino exacto para terminar esto. Usted mismo se dio la respuesta con la última oración de su pregunta. Utilizará una expresión regular con un grupo de captura para obtener la URL y desde allí puede analizar/tomar la página que el usuario ha dicho en el irc.

Este sitio puede ser de alguna utilidad para usted: http://www.regular-expressions.info/

Respondido 27 Jul 12, 19:07

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.