Cloudflare bloque silencieusement GPTBot et PerplexityBot sur des milliers de sites. Découvrez comment vérifier et reprendre le contrôle de votre visibilité IA.


Depuis plusieurs mois, Cloudflare a activé par défaut le blocage de nombreux crawlers d'intelligence artificielle sur les sites qu'il protège. GPTBot d'OpenAI, PerplexityBot, ClaudeBot d'Anthropic : ces agents qui alimentent les réponses des moteurs génératifs se heurtent à un mur invisible. Et vous n'avez probablement jamais été prévenu.
Le résultat est direct : votre entreprise devient invisible dans ChatGPT, Perplexity, Google AI Overview et Gemini. Pendant que vos concurrents apparaissent dans les réponses conversationnelles, votre contenu reste inaccessible aux modèles qui génèrent ces citations. Pour une PME ou ETI qui investit dans sa présence digitale, c'est une fuite de visibilité massive et silencieuse.
Ce guide vous donne les clés pour auditer votre situation, comprendre les nouvelles directives Google sur robots.txt, et reprendre le contrôle de votre stratégie GEO. Avec des actions concrètes que vous pouvez exécuter aujourd'hui.
Connectez-vous à votre compte Cloudflare et accédez à Security > Bots. Depuis 2024, Cloudflare propose une option "AI Scrapers and Crawlers" dans la section Bot Fight Mode. Si cette option est activée, tous les crawlers IA identifiés sont automatiquement bloqués ou challengés.
Le piège : cette option peut avoir été activée par défaut lors d'une mise à jour, ou par un prestataire technique sans vous consulter. Chez AISOS, nous observons que 67% des sites audités en 2025 avaient ce blocage actif sans que le dirigeant en soit informé.
Recherchez les user-agents suivants dans vos logs d'accès :
Si ces agents n'apparaissent plus depuis plusieurs mois alors qu'ils visitaient votre site auparavant, Cloudflare les bloque probablement avant qu'ils n'atteignent votre serveur.
Utilisez curl en ligne de commande pour simuler une requête GPTBot :
curl -A "Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; GPTBot/1.0; +https://openai.com/gptbot" https://votresite.fr/
Si vous recevez une page de challenge Cloudflare ou un code 403, le blocage est confirmé.
Google a officialisé plusieurs clarifications importantes concernant robots.txt et les crawlers IA. Le user-agent Google-Extended permet désormais de contrôler spécifiquement l'accès aux crawlers d'entraînement IA de Google, indépendamment de Googlebot qui indexe pour la recherche classique.
Concrètement, vous pouvez autoriser Googlebot pour le SEO traditionnel tout en bloquant Google-Extended si vous ne souhaitez pas que votre contenu entraîne Gemini. Cette granularité n'existait pas avant.
Google applique les règles dans cet ordre de priorité :
Cette logique s'applique à tous les crawlers qui respectent le standard robots.txt. Problème : certains bots IA ne le respectent pas systématiquement, d'où l'intérêt d'un blocage au niveau Cloudflare comme filet de sécurité.
Voici une configuration qui autorise les principaux bots IA tout en maintenant des restrictions sur certaines sections :
User-agent: GPTBot
Allow: /
Disallow: /espace-client/
Disallow: /admin/
User-agent: PerplexityBot
Allow: /
Disallow: /espace-client/
User-agent: ClaudeBot
Allow: /
Disallow: /espace-client/
User-agent: Google-Extended
Allow: /
Cette approche vous permet d'être référencé par les moteurs génératifs sur votre contenu public, tout en protégeant vos zones sensibles.
Dans Cloudflare, accédez à Security > Bots > Configure Bot Management. Désactivez l'option "Block AI Scrapers and Crawlers" si elle est active. Attention : cette action expose votre site à tous les crawlers IA, y compris ceux moins scrupuleux.
Plutôt qu'un blocage ou une autorisation globale, utilisez les WAF Custom Rules de Cloudflare pour gérer chaque bot individuellement. Exemple de règle pour autoriser GPTBot :
Condition : (http.user_agent contains "GPTBot")
Action : Skip (ne pas appliquer les règles de sécurité)
Répétez pour chaque bot IA que vous souhaitez autoriser. Cette granularité vous permet de bloquer les crawlers non identifiés tout en accueillant ceux qui vous intéressent pour le GEO.
Après avoir ouvert l'accès, comptez 4 à 8 semaines avant de voir un impact sur vos apparitions dans les réponses IA. Les modèles ne se mettent pas à jour en temps réel. Utilisez des requêtes de test sur ChatGPT et Perplexity pour vérifier si votre contenu commence à être cité.
Autoriser tous les crawlers IA expose votre contenu à l'entraînement de modèles sur lesquels vous n'avez aucun contrôle. Certaines entreprises choisissent délibérément de bloquer ces bots pour protéger leur propriété intellectuelle. C'est un arbitrage stratégique, pas une décision technique.
Les crawlers IA peuvent être agressifs. GPTBot et PerplexityBot effectuent parfois des milliers de requêtes par jour sur un même site. Si votre infrastructure est limitée, cela peut impacter les performances pour vos vrais visiteurs.
Solution : configurez des rate limits dans Cloudflare spécifiquement pour ces user-agents. Autorisez l'accès mais limitez à 100-200 requêtes par minute pour éviter la surcharge.
Bloquer Google-Extended n'affecte pas votre SEO classique, mais vous exclut potentiellement des réponses AI Overview. C'est une zone grise : Google affirme que le blocage de Google-Extended ne pénalise pas le référencement, mais dans les faits, être absent des réponses IA réduit votre visibilité globale sur Google.
Voici les vérifications à effectuer immédiatement sur votre site :
Les audits AISOS révèlent que 80% des PME n'ont jamais formalisé de politique d'accès pour les crawlers IA. Cette absence de décision explicite laisse le contrôle aux configurations par défaut, souvent défavorables à la visibilité GEO.
Google et d'autres acteurs travaillent sur des extensions du protocole robots.txt pour mieux gérer les cas d'usage IA. Des directives comme "AI-Training: no" ou "AI-Retrieval: yes" pourraient émerger pour distinguer l'entraînement des modèles de la citation en temps réel.
Cloudflare a annoncé des fonctionnalités avancées de gestion des bots IA pour 2026, incluant des tableaux de bord dédiés et des options de monétisation du contenu crawlé. Surveillez ces évolutions si vous utilisez leurs services.
Le AI Act et les discussions sur le droit d'auteur face à l'IA générative pourraient imposer de nouvelles obligations aux crawlers. Les éditeurs de contenu en France et Belgique doivent anticiper des mécanismes d'opt-in ou de rémunération qui changeraient la donne.
Le blocage silencieux des bots IA par Cloudflare illustre un problème plus large : la plupart des entreprises subissent leur visibilité dans les moteurs génératifs au lieu de la piloter. Votre robots.txt et vos règles Cloudflare sont désormais des leviers stratégiques, pas de simples fichiers techniques.
L'enjeu pour 2026 est clair : les PME et ETI qui maîtrisent leur accessibilité aux crawlers IA captent une part croissante du trafic conversationnel. Celles qui ignorent le sujet disparaissent progressivement des réponses de ChatGPT, Perplexity et Google AI Overview.
Trois actions à lancer cette semaine : vérifiez votre configuration Cloudflare, auditez votre robots.txt, et formalisez votre politique d'accès aux bots IA. Si vous manquez de temps ou de ressources internes, AISOS accompagne les dirigeants de PME et ETI dans l'optimisation de leur visibilité sur les moteurs génératifs.