Hoy, la nueva realidad es que los bots de IA ya se mueven por la red a la par de los humanos, y transformaron el acceso, la extracción y, potencialmente, la monetización del contenido online. Pero la situación es alarmante. Una reciente investigación de Fastly reveló que el 87% de estos bots que circulan por la red, son maliciosos.
Diversas investigaciones realizadas durante el último año revelaron que la mitad de la actividad en la web corresponde a este tipo de programas-robot, un verdadero ejército virtual compuesto por rastreadores que entrenan modelos de lenguaje a gran escala (LLM) y recuperadores que enriquecen las respuestas a consultas de usuarios.
El informe de Fastly clasifica a los bots en dos categorías, de acuerdo a su actividad, comportamiento y propósito: AI Crawlers (rastreadores de IA) y AI Fetchers (recuperadores de IA)
Bots AI Crawlers
Son rastreadores utilizados para entrenar modelos de IA y LLM. Su función es escanear sitios web de manera sistemática para recopilar contenido, utilizándolo para construir índices o directamente entrenar modelos de lenguaje a gran escala (LLM). Este proceso es una condición previa a la fase de “entrenamiento” del modelo. Estos crawlers representan el 80% del volumen total de bots de IA y Meta lidera este segmento con el 52%, seguida por Google (23%) y OpenAI (20%).
Bots AI Fetchers
Los AI Fetchers, que constituyen el 20% restante del tráfico de bots de IA, tienen como función acceder al contenido de los sitios web en tiempo real en respuesta a consultas de usuarios y así enriquecer las respuestas de los LLM o proporcionar enlaces de referencia que verifiquen la información generada.
OpenAI domina este segmento, con casi el 98% del volumen a través de sus bots (ChatGPT-User y OAI-SearchBot), impulsado principalmente por su producto ChatGPT. Perplexity le sigue con un 1.53%.
La investigación de Fastly asegura que la composición del tráfico de bots de IA varía significativamente según la región y el sector: en América del Norte se experimenta un fuerte sesgo hacia los rastreadores de IA (casi el 90% del tráfico de bots de IA), mientras que la región EMEA (Europa, Oriente Próximo y África) recibe menos de la mitad (41%) de su tráfico de bots de IA de rastreadores, con el 59% proveniente de fetchers. En cuanto a América Latina (72%) y Asia Pacífico (58%) todavía tienen una mayoría de su tráfico de bots de IA proveniente de crawlers.