Enviando bots de SPAM a un agujero negro

Tengo algunos formularios en mi sitio que últimamente han sido atacados por robots de SPAM. Finalmente lo tengo bajo control (sin el uso de un captcha).

Básicamente, estoy revisando el formulario en busca de varias banderas. Si se detecta, simplemente redirijo su solicitud a Google.

¿Hay alguna manera de redirigir el bot a su dirección IP o algún tipo de ciclo infinito que posiblemente lo ralentice o al menos cause un pequeño dolor de cabeza a la persona que está detrás?

ACLARACIÓN:

Ya estoy bloqueando el SPAM, estoy buscando una forma inteligente de irritar al spammer una vez que lo redirijo.

preguntado el 22 de mayo de 12 a las 19:05

¿Persona detrás? CORREO NO DESEADO los robots?? Sería de mala forma to'bucle infinito' su solicitud en su servidor. Reduciría la velocidad de USTED (servidor) y consumiría continuamente sus recursos. -

Lo siento, eso fue mal redactado. Estoy buscando sacarlos de mi servidor y llevarlos a una especie de bucle, agujero negro, etc. -

Y, sí, la persona detrás de él. Siempre hay alguien detrás del bot. Estoy tratando de hacerles la vida un poco más difícil. -

¡Sí, entiendo lo que quieres decir! Aunque por definición general, un bot no es una persona :) -

Si puede identificar los bots de spam de manera confiable, le sugiero que agregue un poco de código que omita hacer cualquier trabajo cuando uno intenta acceder a su sitio; si están tratando de ingresar un comentario en un formulario de comentarios, omita el código que lo escribe en la base de datos o lo envía por correo electrónico. Eso debería reducir la cantidad de trabajo que está haciendo su servidor, y su spam se elimina silenciosamente. Tenga en cuenta que es probable que los bots sean PC comprometidos y, por lo tanto, no estén conectados con quien esté detrás de ellos. -

5 Respuestas

Una vez, uno de mis profesores nos dijo que habían desarrollado una especie de honeypot anti-spambot. Era bastante simple, redirigía a los bots a una página generada dinámicamente que contenía un bucle infinito de direcciones falsas. Los objetivos eran dos: mantenerlos ocupados y llenar su base de datos con direcciones de correo electrónico inutilizables, dañando a los spammers. Esto fue solo una idea, no sé si se ajusta a sus necesidades, pero... vale la pena intentarlo^^ Por supuesto, es más fácil simplemente descartar una solicitud relacionada con el robot de spam si puede identificarlos...

contestado el 22 de mayo de 12 a las 19:05

Esto es wveneno; pero está dirigido principalmente a los robots de raspado de direcciones. monos.com/wpoison - triples

sí, ¿y realmente quieres consumir toda la CPU de tu servidor alimentando la URL con información falsa? Lo más probable es que solo te bloqueen arañas válidas, vaya, ya no estás en Google. - FlavorScape

Aquí hay otra trampa para los robots de raspado de direcciones: officeofstrategicinfluence.com/spam - Sófivoro

@FlavorScape Sé que han pasado siete años pero, para cualquier otra persona que deambule, es por eso que pones las formas a las que se dirigen los spammers y el ciclo infinito de direcciones falsas bajo un robots.txt regla de exclusión. Los bots legítimos obedecerán la exclusión y los spammers no podrán darse cuenta de que una exclusión es lo que quieren, mientras que la otra es una trampa. - sosokolow

Debería bloquear estas solicitudes si puede identificarlas. Bloquee sus direcciones IP en el lado del servidor.

Además, este hilo está relacionado con los ataques de DOS, pero podría serle útil.

Ideas de trampas para arañas / BOT

contestado el 23 de mayo de 17 a las 12:05

La desventaja de un bloqueo absoluto es que se darán cuenta y se ajustarán en consecuencia. La forma más efectiva de bloquear un bot es mantenerlo ocupado y hacerle creer que está haciendo su trabajo. - mike shurtz

para eso es la trampa de arañas - FlavorScape

Técnicamente sigue siendo un captcha, pero ¿qué hay de usar una pregunta "general" estática con su formulario?

What is the value of two plus two?

Verifique ese campo en su secuencia de comandos PHP para asegurarse de que la respuesta sea correcta. Si no es así, ¡deje de procesar!

De lo contrario, y si tiene control sobre su firewall (y el registro adecuado), comience a eliminar la solicitud de la dirección IP más abusiva. Sin embargo, tenga cuidado, este enfoque podría ¡haga que los usuarios legítimos no puedan acceder a su sitio!

contestado el 22 de mayo de 12 a las 19:05

Cierto, entiendo cómo detenerlos, estoy buscando la manera de darles a probar su propia medicina. Una vez detectados, quiero enviarlos a un agujero profundo del que será difícil salir... Postre Paul

Esto me funcionó de un día para otro:

Configuré este campo de formulario invisible que los bots completan con galimatías y, si se llenó, no procesé el formulario y solo devolví una página de éxito.

Pero la publicación en este formulario en particular creció a diario. Comenzó con 2 solicitudes POST al día y al final hubo más de 20 solicitudes.

Así que TL; DR, envío un 404 Cabecera http no encontrada en esta página en particular ahora. Los humanos y el navegador no ven la diferencia, pero por lo que observé, el bot verificó primero la disponibilidad de la página (solicitud HEAD), por lo que el formulario todavía estaba allí, pero ¿cómo puede saber el bot cuándo recibe un 404 de vuelta?

Esto redujo completamente la acción POST de los bots hasta ahora. Sé que esta solución no funciona para páginas que deben ser visibles para buenos bots (google, etc.), pero para un formulario de contacto o formulario de inicio de sesión funciona bien.

¿Quizás uno puede incluir en la lista blanca los bots "buenos" y enviar 404 para todos?

contestado el 21 de mayo de 13 a las 17:05

No.

Los robots de spam buscan formularios de comentarios y correos electrónicos obvios. No harán nada con una redirección. Podría configurar algún servidor que sea una trampa llena de formularios de correo electrónico que no funcionan.

Por lo tanto, le gustaría que los mecanismos de generación automática de URL definan un árbol de sitio, con cada nueva URL que tenga otro formulario de correo electrónico. Probablemente querrá hacer esto en un servidor dedicado.

Pero al final NO. Piénsalo: ¿cómo va a desgastar tu pequeño servidor PHP a los zombis o a un servidor de spam de 64 núcleos en Rusia?

No creo que entiendas lo que hace una redirección. Establece un código de respuesta y dice que el contenido se movió "aquí". A un bot de spam no le importará y probablemente no hará nada si no hay un formulario de correo electrónico allí.

Si realmente quieres evitar el spam, lee esto. Puedes atraparlos, pero si estás lidiando con zombis, en última instancia, no importará. http://www.neilgunton.com/doc/?doc_id=8580

contestado el 24 de mayo de 12 a las 04:05

No es la respuesta que estás buscando? Examinar otras preguntas etiquetadas or haz tu propia pregunta.