
Qué es un bot en Internet y para qué sirve
Hoy en día más del 50% del tráfico en Internet está ocasionado por bots. Casi todos hemos escuchado hablar en algún momento de ellos pero ¿sabes exactamente qué es un bot y cuál es su función?
Un bot es un software que pone en marcha un algoritmo automáticamente imitando el comportamiento humano.
Son empleados para realizar tareas que serían muy difíciles de ejecutar para nosotros o demasiados tediosas. Según el uso que se les da y las tareas que ejecutan en la red, los bots son clasificados como bots buenos y bots de actividad maliciosa.
¿Qué es un bot bueno?
Los bots buenos cumplen con el protocolo robots.txt y se pueden agrupar en cuatro categorías:
Bots de motores de búsqueda
Utilizados para rastrear sitios web, consultar enlaces y actualizar los índices del motor de búsqueda. Los más conocidos son:
- Googlebot: el bot de Google.
- Yandex bot: el bot del motor de búsqueda más popular en Rusia, Yandex.
- MSN/Bingbot: el bot del motor de búsqueda Bing de Microsoft que reemplazó al de MSN en 2010.
- Yahoo! Slurp Bot: uitlizado por el motor de búsqueda de Yahoo junto con Bing.
- MJ12Bot: bot de búsqueda utilizado para indexar sitios web para Majestic-12, un motor de búsqueda con sede en el Reino Unido.
- Mail.Ru bot: bot del motor de búsqueda utilizado por el grupo Mail.Ru, el principal servicio de correo electrónico de Rusia.
- Baiduspider: bot de búsqueda utilizado por Baidu, el principal motor de búsqueda chino.
- Haosou 360 spider: bot de búsqueda utilizado por Qihoo 360, el segundo motor de búsqueda más usado de China.
- Sogou spider: bot de búsqueda utilizado por Sogou, otro de los principales motores de búsqueda de China.
- Google AdsBot: bot de búsqueda que inspecciona la calidad de las páginas de destino, que luego se clasifican según las búsquedas de Google.
Arañas o Rastreadores comerciales
Bots utilizados para rastrear sitios web y recuperar información de la competencia. Los principales son:
- SEMrushBot: un bot de rastreo de la empresa SEMrush, plataforma que proporciona datos de SEO, incluida la búsqueda de palabras clave y backlinks.
- Proximic bot: bot de rastreo utilizado por Proximic, una plataforma que haces coincidir las campañas publicitarias con el contenido del sitio web.
- AhrefsBot: un bot de rastreo operado por Ahrefs, una herramienta de marketing y SEO utilizada principalmente para la auditoría de backlinks.
- Pinterest bot: utilizado por Pinterest, una aplicación de redes sociales que permite a los usuarios compartir y administrar colecciones de fotos.
- Dotmic DotBot: un robot de rastreo que identifica sitios web de comercio electrónico, nombres de productos, datos de precios y descripciones.
- YisouSpider: un robot de rastreo operado por el motor de búsqueda chino Yisou.
- XoviBot: gestionado por Xovi GmbH, una solución de marketing que ofrece servicios de SEO, análisis de búsqueda y gestión de enlaces.
- ADmantX bot: operado por ADmantX, un proveedor de análisis de datos que ayuda a los profesionales del marketing a desarrollar campañas online efectivas.
- Grapeshot bot: utilizado por Grapeshot, una empresa de tecnología de palabras clave que analiza el contenido de las páginas web.
- Alexa bot: bot empleado por Alexa, una filial de Amazon que proporciona datos y análisis sobre el tráfico de un sitio web.
Feed Fetchers (Recolectores de Feeds)
Son programados para recuperar datos que se puedan mostrar en otros sitios web.
- Facebook Mobile App: recupera la información del sitio web de Facebook para ser vista en el navegador de la aplicación de Facebook.
- Android Framework bot: utilizado por el entorno Android Runtime para recuperar contenido para aplicaciones móviles.
- CFNetwork bot: usado por CFNetwork en aplicaciones de iPhone.
- .NET WebClient: asociado con .NET Framework, un software que se ejecuta principalmente en Microsoft Windows.
- Facebook External Hit: utilizado por Facebook para recuperar detalles, como imágenes en miniatura o etiquetas de vídeo, asociados a enlaces compartidos.
- Windows Phone WebClient: utilizado por Windows Phone WebClient para buscar información del sitio web para ver en aplicaciones móviles.
- Adobe AIR: utilizado por Adobe AIR para recuperar contenido para aplicaciones nativas que se ejecutan en plataformas móviles y de escritorio.
- Feedfetcher de Google: usado por Google para recuperar feeds RSS.
- Twitter bot: recupera detalles asociados con enlaces externos que se muestran en Twitter.
Bots de monitorización
Son usados para monitorizar métricas de rendimiento en los sitios web. Los más conocidos son:
- WordPress (pingback): permite a los usuarios de WordPress notificar a los bloggers que se han vinculado a su sitio.
- Paessler Monitor: utilizado por Paessler, una plataforma que supervisa las redes en busca de interrupciones del sistema.
- UptimeBot: utilizado por Uptime, un servicio de supervisión del rendimiento de un sitio web.
- Site24X7 Tools: un robot de supervisión utilizado por Site24x7 para la supervisión del rendimiento de un sitio web.
- Keynote: operado por Keynote, un proveedor de soluciones de monitorización de aplicaciones móviles basadas en la nube.
¿Qué es un bot malo o de actividad maliciosa?
Al contrario de los bots buenos los bots de actividad maliciosa no respetan los protocolos y son utilizados para atacar los sitios web o lucrarse a través de ellos.
Entre las actividades más habituales que se llevan a cabo con bots malos cabe destacar el Blackhat SEO, spam, ataques DDoS, etc.
La forma más común de bloquearlos se basa en los famosos CAPTCHA dónde el bot para poder acceder al sitio debe identificar elementos gráficos, lo cuál es muy difícil para el desarrollo actual de los mismos.
Los principales tipos de bots de actividad maliciosa son los siguientes:
Clic bots
Hacen clic fraudulentamente en anuncios, lo que causa que los datos informados a los anunciantes sean sesgados. Pero el inconveniente no es sólo para los especialistas en marketing, sino que si se usan campañas de pago por clic (PPC), esos clics suman un gasto de dinero en visitas falsas que ni siquiera provienen de humanos o de la audiencia que se desea impactar.
Bots Impostores
Su propósito es eludir las medidas de seguridad en línea. A menudo son los culpables de los ataques DDoS. Un caso para recordar con este tipo de bot se dió en octubre de 2016 cuando parecía que la mitad de Internet, incluido Twitter, había dejado de funcionar. La causa fue un ataque DDoS orquestado por un bot impostor apodado Mirai.
Scraper bots
Logran el efecto opuesto a los bots de copyright. En lugar de proteger el contenido patentado, los scraper bots están diseñados para robarlo y reutilizarlo en otro lugar, a menudo sin que su dueño lo sepa.
Spam bots
Los bots que básicamente distribuyen contenido «spam» como correos electrónicos injustificados o comentarios sin sentido en artículos y publicaciones de blogs. También se pueden encontrar este tipo de bots en redes sociales como Instagram dónde constituyen hasta el 8% del tráfico.
Spy bots
Es un tipo de bot que mina datos sobre personas (o empresas) en los sitios web para que después el responsable del uso del software malicioso pueda venderlos.
Zombie bots
Burlan la seguridad de un ordenador para que una vez que obtienen acceso, operar en segundo plano, y usar la computadora para transmitir otro virus o malware. Lo usual es que este tipo de actividad bot lleve aparejado a un «ejército» de robots zombie, también conocido como «botnet«, que es una red de sitios zombificados que reciben comandos de la cabeza zombie, que probablemente sea un spammer, un hacker o un mercenario.
Conclusión
Espero haberte aclarado a lo largo del artículo no sólo el concepto de qué es un bot si no cuáles son legítimos que rastreen tu web y cuáles no.
Los bots de actividad maliciosa son perjudiciales si al ser un gran número ocasionan que la web cargue lenta o la dejan sin servicio, pero esto es un caso extremo que no se suele dar.
Lo que podemos hacer para no registrar visitas de bots en nuestras estadísticas es aplicar filtros en Google Analytics. También se pueden bloquear desde el servidor o web utilizando un firewall. Si se utiliza WordPress como CMS, se han desarrollado plugins que pueden ayudar a detectar y bloquear estos bots como Wordfence Security.
Muchas gracias por pasarte :-). Si te ha gustado el artículo te agradezco mucho que lo compartas en tus redes 😉 .
Te interesa:
- Siteimprove, el 360 de las herramientas SEO.
- 7 Trucos para mejorar la velocidad de carga de tu WordPress (WPO).
Paco Bellido
Posted at 12:01h, 25 septiembreMe parece un post muy interesante y currado, gracias por compartir
Carlota Galván
Posted at 13:03h, 25 septiembreMuchas gracias a tí por leerlo Paco ?, un abrazo.
Lidia Sánchez
Posted at 14:26h, 25 septiembreUn artículo genial, Carlota!!
Espero que los Zombie Bot nunca lleguen a mi ?
¡Fantástico!!!
Un besote!
Carlota Galván
Posted at 14:52h, 25 septiembreMuchas gracias Lidia ?, jajjaja nadie quiere un zombie en su vida y menos un bot que te pueda meter un virusazo.
Neto
Posted at 14:34h, 25 septiembreNo sabía todo lo que movía el marivolloso mundo Bot! Me ha encantado y me has sacado de muchas dudas. Gracias!!
Carlota Galván
Posted at 14:53h, 25 septiembreGracias a ti como siempre por pasarte ?. Un superabrazo para los dos.