ChatGPT et Google : un découplage plus fort qu'on ne le croit
Sur une analyse portant sur environ 350 000 requêtes et 500 000 sites remontant dans ChatGPT, la corrélation avec les résultats Google est réelle mais partielle. Elle dépend du type de requête. Quand ChatGPT a besoin d'une information fraîche en temps réel, il passe par le web et la corrélation avec Google (ou Bing) est forte. Quand il répond depuis sa base de connaissances interne, il n'utilise pas Google du tout.
Les études récentes montrent que plus on va dans la profondeur des réponses (les "deep dives"), plus le découplage est marqué : plus de 80 % des sources citées dans les réponses détaillées ne figurent pas dans les 100 premiers résultats Google, parfois même pas dans les 10 premiers.
Autre différence importante selon les LLMs : ChatGPT privilégie les comparateurs et les avis. Gemini et Perplexity favorisent les contenus de conseil et de guide. Ce ne sont pas les mêmes types de pages, ni les mêmes types de sites qui performent sur chacun.
Des sites pénalisés par Google très visibles dans ChatGPT
Sur les 300 sites analysés avec plus de 1 000 requêtes sur lesquelles ils remontent dans ChatGPT, environ 50 sont pénalisés ou quasi invisibles sur Google. C'est un site sur six. Certains ont un trafic organique nul. Certaines pages ne sont même pas indexées dans Google. Pourtant, elles sont citées par ChatGPT, Copilot et Perplexity.
Exemple documenté : un site qui a copié-collé intégralement du contenu Wikipédia. Google l'a blacklisté pour contenu dupliqué. ChatGPT, lui, le remonte normalement parce qu'il n'a pas les mêmes filtres antispam. La logique est simple : la base d'entraînement de ChatGPT a été construite à partir de Common Crawl avant novembre 2022. Des sites qui avaient généré massivement du contenu dans les mois précédents ont été absorbés dans cette base avant que Google ne les pénalise.
Ce n'est pas une stratégie à reproduire. Ces sites bénéficient d'un artefact historique lié à la construction du dataset initial. La tendance est à l'amélioration progressive du filtrage dans les LLMs. Mais le constat révèle que la visibilité dans les LLMs suit une logique propre, distincte du SEO classique.
Les types de contenu que ChatGPT privilégie
Sur les 5 millions de sites actifs estimés en France, environ 500 000 remontent dans ChatGPT, soit 10 %. Parmi ces sites, la moyenne est de 7 pages citées par site. Très peu de sites ont plus de 1 000 pages sur lesquelles ils remontent.
ChatGPT se fait une idée d'un site à partir de quelques pages, pas de l'intégralité. Avoir un gros site avec beaucoup de contenu n'est pas en soi un avantage. Ce qui compte, c'est la qualité et la structure des quelques pages qui vont être sélectionnées.
Les formats qui performent dans ChatGPT : les comparatifs, les wikis, les contenus avec des chiffres et des données précises, les listes, les contenus facilement découpables en extraits autonomes. Un contenu bien structuré avec des niveaux de titres clairs facilite l'extraction par le LLM. Pour approfondir ces techniques, consultez le guide GEO et optimisation IA.
Mention vs citation : deux objectifs, deux stratégies
Il faut distinguer deux types de présence dans les réponses des LLMs.
Une mention, c'est quand le nom de votre marque apparaît dans le texte de la réponse. "Matmut propose ce type de contrat" est une mention. La source citée par le LLM n'est pas forcément votre site : c'est souvent un comparateur, un forum ou un article tiers qui parle de vous.
Une citation, c'est quand votre URL apparaît comme source dans les références du LLM. C'est votre page qui est utilisée directement pour construire la réponse. Les deux sont utiles mais ne se travaillent pas de la même façon.
Stratégie 1 : faire mentionner sa marque
Pour être mentionné dans les réponses de ChatGPT, votre marque doit apparaître dans des contenus que ChatGPT cite déjà. Ce ne sont pas nécessairement des sites à très forte autorité. ChatGPT est particulièrement sensible aux contenus spécialisés et thématiques, aux comparatifs, aux sites qui correspondent exactement à la requête posée.
La stratégie concrète : publier des articles sur des sites tiers spécialisés qui mentionnent votre marque favorablement, dans des comparatifs ou des guides qui sont déjà indexés dans ChatGPT. Une recherche en moyenne dans ChatGPT dure environ 7 minutes. L'objectif est d'être mentionné plusieurs fois au cours de cette conversation pour ancrer la marque.
Stratégie 2 : être cité comme source
Pour que ce soit votre propre page qui soit citée comme source, deux leviers sont efficaces. Le premier : adapter le contenu de votre site pour qu'il soit facilement exploitable par les LLMs (structure claire, données chiffrées, contenu régulièrement mis à jour). Le second : obtenir des liens depuis des articles qui sont déjà eux-mêmes présents dans ChatGPT.
Ce deuxième point est important. Il ne suffit pas qu'un site soit globalement bien référencé dans ChatGPT. Sur un site qui a 15 000 pages positionnées dans Google, seule une centaine se retrouve citée dans ChatGPT, soit environ 1 %. Obtenir un lien depuis ce site ne garantit pas que l'article qui vous cite sera dans ce 1 %. Il faut cibler les pages spécifiques qui sont déjà citées, pas juste les domaines.
Un exemple concret : un petit site avec 1 000 pages atteint 14 % de taux de présence dans ChatGPT (146 pages citées), contre une moyenne de 7 % dans son secteur. Ce résultat s'explique par une mise à jour régulière de ses contenus et une structure adaptée aux LLMs, pas par la taille de son site ou son autorité de domaine.
Ce qui influence la visibilité dans les LLMs
L'étude de corrélation d'Ahrefs sur les AI Overviews place les mentions de marque comme premier facteur de corrélation, devant les backlinks. Le domain rank et le trafic de marque ont moins d'influence que la fréquence à laquelle la marque est mentionnée ailleurs sur le web.
Les backlinks restent pertinents mais pour une raison différente du SEO classique : ce n'est pas le calcul de PageRank qui compte (les LLMs n'en font pas), c'est le fait qu'un lien entrant depuis une page déjà citée dans ChatGPT augmente la probabilité que votre page soit elle-même découverte et intégrée. Le link building pour LLMs détaille comment identifier et contacter ces sources.
Le contenu bien structuré, avec des chiffres, des listes, des niveaux de titres et des extraits autonomes facilite l'extraction par les LLMs. Un texte dense et continu, sans structure, est beaucoup plus difficile à découper en passages utilisables.
La fraîcheur du contenu comme signal clé
Une hypothèse bien étayée par les observations terrain : les LLMs utilisent la vectorisation pour détecter si un contenu a changé. Quand une page est re-vectorisée et que le vecteur diffère significativement du précédent, c'est interprété comme une mise à jour, ce qui redonne de l'intérêt à cette page. Un contenu qui n'a pas changé depuis des mois finit par disparaître progressivement des citations.
Des tests sur 250 sites avec publication régulière de contenu IA ont produit une augmentation de 700 à 800 % du trafic organique sur 6 mois. Sur ces mêmes sites, la visibilité dans ChatGPT est corrélée positivement. Publier régulièrement ou mettre à jour des contenus existants améliore la présence dans les LLMs, indépendamment du fait que les métadonnées de date soient présentes ou non dans le HTML.
Ce qu'il ne faut surtout pas faire
La stratégie de comparatifs et d'articles tiers qui mentionnent votre marque est efficace, mais elle a des limites légales strictes. Publier des comparatifs qui dénigrent des concurrents, qui contiennent des informations fausses sur leurs produits, ou qui font passer un contenu commandité pour un avis indépendant relève de la concurrence déloyale.
Internet Archive conserve tout. Un concurrent qui trouve un comparatif qui le dénigre peut remonter jusqu'à son éditeur, établir le lien avec votre marque si vous avez commandé ce contenu, et engager une procédure. Plus votre marque est visible, plus ce risque est réel.
La stratégie correcte : des contenus comparatifs factuels, qui ne racontent pas de contre-vérités sur les concurrents, publiés sur des sites spécialisés sérieux. La visibilité dans les LLMs se construit sur la durée avec des contenus fiables, pas sur des raccourcis qui exposent à des risques juridiques.


