Cloudflare bloqueará bots de IA en sitios con publicidad a partir del 15 de septiembre
Cloudflare impondrá bloqueos automáticos a los rastreadores de inteligencia artificial que combinen varias funciones en un solo bot, a partir del 15 de septiembre de 2026. La medida afecta a los llamados crawlers mixtos —los que al mismo tiempo recopilan datos de entrenamiento, indexan páginas para buscadores y alimentan agentes de IA— en sitios que incluyen publicidad. Dado que Cloudflare gestiona aproximadamente el 20% del tráfico web global, el alcance práctico de esta decisión es enorme.
El problema con los bots mixtos
Hasta ahora, los propietarios de sitios web podían configurar manualmente qué sistemas tenían acceso a su contenido. Con el nuevo modelo, parte de esas restricciones se aplicará de forma automática y por defecto.
El ejemplo más claro es Googlebot: un único rastreador que sirve tanto para la búsqueda tradicional de Google como para funciones vinculadas a Gemini, AI Overviews y AI Mode. Cloudflare señala esta dualidad como el núcleo del problema. Los datos de la propia compañía muestran la asimetría del sector: Google genera un rastreo por cada 14 referencias de tráfico a los editores, mientras que OpenAI necesita 1.700 rastreos para generar una sola referencia, y Anthropic llega a los 73.000, según Let's Data Science.
Qué cambia para editores y usuarios
A partir del 15 de septiembre, los nuevos clientes, los nuevos sitios y todas las cuentas gratuitas de Cloudflare tendrán por defecto permitida la indexación para buscadores, pero bloqueado el uso del contenido para entrenamiento de modelos o para agentes de IA en páginas con publicidad. Quienes no quieran esas restricciones deberán desactivarlas antes de esa fecha.
Al mismo tiempo, Cloudflare actualiza su programa de monetización. La antigua función Pay Per Crawl —introducida en 2025— pasa a llamarse Pay Per Use: los editores ahora cobran no solo cuando un bot escanea su página, sino cuando ese contenido aparece efectivamente en la respuesta de un chatbot. Los primeros socios del programa son Ceramic.AI y You.com, aunque la plataforma está abierta a otras empresas que quieran unirse, informa TechCrunch.
El contexto regulatorio en España y la UE
El cambio de Cloudflare llega en un momento clave. La Ley de IA de la UE obliga desde agosto de 2026 a los proveedores de modelos de uso general (GPAI) a publicar las fuentes de entrenamiento del top 10% de sus dominios y a respetar los opt-out de derechos de autor expresados en `robots.txt` y `ai.txt`, según Cloro. El incumplimiento puede acarrear multas de hasta el 3% de la facturación global, aplicadas por la Agencia Española de Protección de Datos (AEPD) en el ámbito nacional.
Para editores como El País o RTVE, y para startups de IA con sede en Barcelona o Madrid, las nuevas reglas de Cloudflare y la normativa europea abren una vía para exigir compensación y documentar el uso de sus contenidos. Las empresas que ya operen con fuentes de datos consensuadas partirán con ventaja frente a quienes aún dependan del scraping masivo sin control.