GEO : quels KPIs suivre en Search AI ?

Améliorer sa visibilité dans les réponses des moteurs d'IA générative (ChatGPT, Gemini, Perplexity) est un enjeu majeur pour de nombreuses marques en 2026. Mais une question revient systématiquement : comment mesurer réellement cette visibilité ?
Si le SEO est aujourd'hui une discipline mature, avec des KPIs bien balisés, la situation est très différente côté GEO (Generative Engine Optimization). Les indicateurs restent encore flous, voire peu fiables, et surtout largement incomplets. Impossible par exemple de s'appuyer sur un équivalent de Google Search Console pour savoir quelles requêtes déclenchent une mention de votre marque, quels contenus sont cités, ou à quelle fréquence vous apparaissez dans les réponses générées par ChatGPT et les autres LLM.
Dans cet article, nous allons voir qu'il existe une méthode fiable pour mesurer l'activité des crawlers des moteurs d'IA générative sur votre site, l'analyse de logs, et qu'il est possible de s'appuyer dessus pour le suivi de ses KPIs GEO.
Le prompt tracking, une indication plus qu'un indicateur fiable
Le premier réflexe, pour mesurer votre visibilité en GEO, c'est bien sûr de regarder si votre marque est citée dans les réponses des LLM. Ainsi, à partir d'une liste de requêtes stratégiques que vous avez identifiées, vous allez supposer les prompts que pourraient taper vos utilisateurs dans ChatGPT, Gemini ou Perplexity (en vous basant par exemple sur vos différents personas marketing), puis regarder dans la réponse :
- Si votre marque est mentionnée (mention dans la réponse, sans URL)
- Si votre marque est citée (citation avec une URL de votre site)
- A quelle position votre marque est mentionnée ou citée
- Si le sentiment associé à chaque mention ou citation est positif, neutre ou négatif
Votre objectif ? Apparaître dans la réponse à ces différents prompts, idéalement en étant recommandé comme la référence (plutôt qu'en étant simplement mentionné en bas de liste). Par exemple, si je demande à ChatGPT "Quel outil utiliser pour mettre en place facilement un plan de redirection en SEO ?", la réponse apportée par ChatGPT est intéressante car elle :
- mentionne en premier redirection.io, avec un lien vers la page qui détaille la fonctionnalité permettant de générer en quelques minutes son plan de redirection (redirect mapping)
- propose en deuxième position Screaming Frog, avec un lien vers l'outil
- suggère ensuite plusieurs outils (Ahrefs, SEMrush, Google Search Console, httpstatus.io), avec uniquement un lien vers un article du blog d'Ahrefs sur les redirections

Le même exercice serait ensuite à effectuer pour chacun des différents prompts que vous avez listés. Évidemment, plusieurs outils permettent d'effectuer cela à grande échelle, c'est-à-dire :
- d'aller interroger le moteur d'IA générative sur tous les prompts que vous avez définis
- de faire la même chose pour chacun des principaux moteurs d'IA générative (ChatGPT, Gemini, Perplexity, etc.) sur tous ces prompts
- potentiellement, d'interroger plusieurs fois à la suite chaque moteur d'IA générative sur le même prompt (car leur réponse peut varier, comme nous le verrons par la suite)
- d'effectuer cette opération chaque jour, de façon à suivre au quotidien l'évolution de votre visibilité
Définir ses prompts
Pour vous, la première étape consiste ainsi, à partir d'une liste de vos mots clés stratégiques, à définir les prompts que pourraient taper vos utilisateurs lorsqu'ils interrogent leur moteur de réponse favori. Vous pouvez ensuite segmenter ces prompts par intention :
- Informationnelle ("Comment choisir")
- Commerciale ("Quel est le meilleur")
- Comparative (marque A ou marque B ?)
- Etc.
De cette façon, vous adressez les différentes étapes du parcours de votre prospect (TOFU / MOFU / BOFU), qu'il ne connaisse pas encore votre marque ou qu'il soit dans une phase de décision ou d'achat. Une fois votre liste de prompts établie, reste à aller interroger les différents LLM, soit manuellement, soit en utilisant un outil.
Définir ses indicateurs de visibilité GEO
Vous pouvez ensuite utiliser différents indicateurs pour évaluer votre visibilité - les outils faisant généralement ce calcul pour vous.
- Nombre de mentions : combien de fois votre marque est-elle mentionnée dans les réponses (sans lien vers votre site) ?
- Nombre de citations : combien de fois votre marque est-elle citée dans les réponses (avec un lien vers votre site) ?
- À quelle position êtes-vous cité ?
Ces données vous permettent ensuite de calculer plusieurs autres indicateurs :
- Votre taux de présence : quel est le pourcentage des réponses qui mentionnent votre marque ?
- Quel est votre score de visibilité / votre part de voix ? Vous pouvez calculer cela en pondérant votre taux de présence par la position occupée dans chaque réponse, et en faisant de même pour tous vos concurrents
Vous pouvez en plus associer à ces indicateurs des données qualitatives, à savoir le sentiment de marque associé à chaque réponse (positif, négatif, neutre).
Aller plus loin : distinguer visibilité paramétrique et visibilité dynamique
Dans une récente étude, Resoneo a bien mis en évidence sur ChatGPT la différence entre deux types de visibilité :
- La visibilité paramétrique, qui correspond à ce que le modèle sait déjà de votre marque grâce à ses données d'entraînement
- La visibilité dynamique, qui correspond à ce que le modèle va trouver en temps réel sur votre marque, en lançant une recherche sur le web pour répondre à l'utilisateur
Là où la visibilité paramétrique est stable, puisqu'elle n'évolue qu'avec la mise à jour des données d'entraînement (à chaque "knowledge cutoff" donc), la visibilité dynamique est en revanche beaucoup plus instable, puisqu'elle dépend d'une part des sources que va chercher en temps réel ChatGPT lorsqu'il lance une recherche web pour répondre à un utilisateur, et d'autre part des mises à jour du modèle.
Il peut être pertinent d'évaluer la visibilité de votre marque en paramétrique et en dynamique, car la première forme de visibilité a une influence directe sur la seconde. Être connu du modèle d'entraînement (c'est-à-dire avoir de la visibilité paramétrique) présente en effet un double avantage :
- Cela influence les requêtes lors du processus de query fan-out (les marques connues ont plus de chance d'être ciblées)
- Cela donne plus de poids ensuite dans la réponse
Resoneo donne ainsi des exemples de prompts pour auditer la visibilité paramétrique de votre marque.
Les limites du prompt tracking
Utiliser le prompt tracking pour évaluer sa visibilité sur les moteurs de réponse générative donne une illusion de mesure, mais est en réalité très imparfait pour évaluer sa visibilité réelle.
-
Cette mesure est effectuée à partir de prompts que vous avez supposés ou imaginés. En réalité, vous ne savez pas ce que recherchent exactement vos prospects sur ChatGPT, Gemini ou Perplexity, ni comment ils le recherchent (or, la formulation peut avoir une grande importance sur le contenu de la réponse).
-
Les réponses renvoyées varient selon l'historique de l'utilisateur, sa localisation, le contexte de la session, le modèle utilisé (et sa version), etc.
-
Les résultats du moteur d'IA générative diffèrent entre API et interface - qui ajoute une surcouche supplémentaire et, dans certains cas, un accès à des données externes. Il faut donc bien s'assurer que l'outil que vous utilisez scrape directement les résultats de l'interface (car c'est ce qu'utilise le grand public), et ne fasse pas des requêtes API - du moins selon ce que vous cherchez à mesurer.
-
Au-delà de la personnalisation, même à paramètres identiques, le même prompt peut donner des réponses différentes à quelques minutes d'intervalle seulement.
Ainsi, SparkToro a mené une étude fin 2025 qui montre que, même en demandant 100 fois la même chose à ChatGPT ou à Google AI Overviews, il y a moins d'une chance sur 100 d'obtenir la même liste de marques dans deux réponses différentes…. et même une chance sur 1000 seulement d'obtenir la même liste dans le même ordre.
Comment, dès lors, se baser sur des données fiables - et incontestables - pour définir ses indicateurs GEO ?
L'analyse de logs, une source de données fiable pour mesurer ses KPIs GEO
Il existe pourtant une source de données directe et observable côté site sur laquelle vous pouvez baser - au moins en partie - vos KPIs GEO : vos logs serveurs. A chaque requête sur votre site - qu'elle soit effectuée par un utilisateur ou un robot -, une ligne est enregistrée dans vos logs, avec des informations comme l'URL demandée, le code réponse obtenu, la date et l'heure, l'user-agent, etc.
Ces logs vous donnent ainsi des informations sur le passage des crawlers IA sur votre site, et les pages qu'ils ont visitées. Plus intéressant encore : chaque moteur d'IA générative possède généralement plusieurs types de robots d'exploration, matérialisés par un user-agent différent, ce qui peut nous permettre d'analyser plus précisément les pages de votre site qui ont été citées comme source dans les réponses des LLM.
Les différents types de robots d'exploration des LLM
Les robots d'exploration des LLM peuvent être classés en trois catégories :
- Les "training bots" : ils explorent les contenus pour collecter des données utilisées ensuite pour l'entraînement de leurs modèles d'IA générative
- Les "search bots" : ils servent à alimenter les fonctionnalités de recherche des moteurs d'IA générative
- Les "user-fetch bots" ou ("user-triggered bots") : comme leur nom l'indique, ils se déclenchent en réponse à une action utilisateur pour aller parcourir une (ou plusieurs) page(s) de votre site web dont le contenu est ensuite utilisé dans la réponse du LLM. Ce sont ces crawlers qui nous intéressent plus particulièrement lorsque nous voulons identifier les pages de notre site très probablement utilisées comme source dans les réponses des moteurs d'IA générative.
Voici quelques exemples d'user-agents utilisés par les principaux LLM :
| Catégorie de bot | Exemples de bots |
|---|---|
| Training bots | GPTBot (OpenAI), ClaudeBot (Anthropic), CCBot (Common Crawl), Bytespider (TikTok), Meta-ExternalAgent (Meta) |
| Search bots | OAI-SearchBot (OpenAI), PerplexityBot (Anthropic), Claude-SearchBot (Claude), DuckAssistBot (DuckDuckGo) |
| User-fetch bots | ChatGPT-User (OpenAI), Perplexity-User (Perplexity), Claude-User (Claude), MistralAI-User (Mistral AI) |
À noter, on pourrait même y ajouter une quatrième catégorie de bot, les "ads bots", puisque OpenAI a récemment mis à jour sa documentation sur ses crawlers pour y ajouter "OAI-AdsBot", un robot d'exploration utilisé pour "vérifier la sécurité des pages web soumises en tant que publicités sur ChatGPT". Toutefois, celui-ci ne concerne que les pages soumises comme publicités, et donc seulement les annonceurs sur ChatGPT.
En utilisant l'analyse de logs, vous pouvez ainsi suivre l'activité des crawlers AI sur votre site, en les distinguant selon le type de bot (search, training, user-fetch).
Quels KPIs GEO grâce à l'analyse de logs ?
L'analyse de vos logs serveur vous permet ainsi d'obtenir plusieurs indicateurs.
Nombre de hits par type de crawler AI
Quel type de crawler AI parcourt votre site ? Vous pouvez comptabiliser :
- Le nombre de hits par un robot "training"
- Le nombre de hits par un robot "search"
- Le nombre de hits par un robot "user-fetch"
Vous pouvez ensuite suivre l'évolution de ces hits par catégorie, et également afficher leur répartition.
Nombre de hits par LLM
Quels sont les moteurs d'IA générative dont les robots parcourent votre site ? Vous pouvez comptabiliser les hits associés à chaque moteur d'IA générative :
- ChatGPT
- Claude
- Perplexity
- Mistral AI
- Etc.
De même, pour chaque moteur d'IA générative, vous pouvez suivre l'évolution de ces hits et regarder comment ils se répartissent par catégorie de bot (training, search, user-fetch).
Top URL
Quels sont vos URL les plus explorées par les crawlers AI ? Ce qui nous intéressera plus particulièrement ici, ce sont notamment les URL les plus explorées par les crawlers de type "user-fetch" (c'est-à-dire les crawlers de réponse instantanée des LLM), puisqu'il s'agit de vos pages qui servent le plus de source dans les réponses des LLM.
Comme vu précédemment, vous pourrez comptabiliser le nombre de hits par catégorie de robot, mais aussi distinguer en plus le nombre d'URL uniques crawlées - et suivre son évolution.
Dans le cas des crawlers de type "user-fetch", cela vous permettra de suivre l'évolution du nombre de pages uniques ayant vraisemblablement servi à une citation dans la réponse d'un LLM.
Codes réponses
De la même façon que vous surveillez en SEO les codes réponses rencontrés par Googlebot lorsqu'il explore votre site, vous pouvez suivre ces données pour les crawlers des moteurs d'IA générative, avec la possibilité de les distinguer par type de robot et par LLM.
Surveillez en particulier les pages qui renvoient une erreur (4XX ou 5XX).
Visites
Vos logs vous permettent aussi de comptabiliser le trafic en provenance de chaque LLM, et d'afficher la répartition par moteur d'IA générative, le top des URL qui génèrent le plus de visites, etc.
Vous pouvez également croiser ces données de trafic avec d'autres de façon à mesurer :
- Le nombre de pages uniques qui ont généré une visite (avec la possibilité de filtrer par LLM)
- Le taux de clic (CTR) depuis l'interface du LLM, en faisant pour chaque LLM le rapport entre le nombre de visites et le nombre de hits d'un robot de type "user-fetch" (c'est-à-dire le rapport entre le nombre de fois où un utilisateur a visité votre site en provenant du LLM et le nombre de fois où vous avez été cité par ce LLM)
Utiliser les log views de redirection.io pour monitorer ses KPIs GEO
Grâce à sa fonctionnalité d'analyse des logs de trafic en temps réel, et sa possibilité de créer des "log views" (vues filtrées selon certains critères : user-agent, code réponse, URL, etc.), redirection.io vous permet d'exploiter facilement vos données de logs pour le suivi de vos KPIs GEO.
Sur le manager, allez sur l'écran de liste des logs, utilisez les filtres de votre choix, puis sauvegardez votre "log view" pour pouvoir la réutiliser par la suite.
Voici quelques exemples des vues que vous pouvez obtenir.
Top pages les plus citées dans les réponses des LLM
En filtrant sur le user-agent (pour prendre uniquement les robots de type "user-fetch"), puis en groupant par URL, on obtient la liste des pages de son site les plus citées dans les réponses des LLM.

Top robots de type "user-fetch" qui explorent le plus le site
En groupant par user-agent plutôt que par URL, on voit quels sont les robots de type "user-fetch" qui viennent parcourir notre site en réponse à une action utilisateur pour probablement utiliser son contenu dans leur réponse.

Détail du crawl d'un LLM
En filtrant par user-agent pour vous focaliser sur un LLM en particulier (Claude, dans notre exemple), puis en groupant par user-agent, vous pouvez voir le nombre de hits associés à chaque catégorie de bot (training, search, user-fetch).

En groupant en plus par URL, vous pouvez voir les URL les plus crawlées par chaque type de bot du moteur d'IA générative qui vous intéresse.

Vous pouvez en plus filtrer par code réponse pour étudier de plus près les URL en erreur rencontrées par le crawler IA qui vous intéresse.

redirection.io vous permet de créer et de sauvegarder de multiples "log views" selon vos besoins. Vous pouvez également en ajouter en favoris, de façon à ce qu'elles soient accessibles et visibles en haut de l'outil de l'analyse de logs, avec l'indication du nombre de hits sur la période sélectionnée.

Exporter ses données pour construire son dashboard avec ses KPIs GEO
redirection.io vous permet également d'exporter vos données de logs au format CSV. Grâce à quelques exports filtrés, vous pouvez facilement réutiliser ces données sur un outil comme Google Data Studio de façon à construire votre propre dashboard avec vos KPIs GEO.
Voici un exemple de dashboard construit de la sorte, avec la possibilité de filtrer les données :
- Par type de crawler (training, search, user-fetch)
- Par LLM (ChatGPT, Claude, Perplexity, Mistral AI, etc.)

Ces filtres ont été créés sur Google Data Studio grâce à un champ calculé basé sur l'user-agent, de façon à associer chaque user-agent à un type de crawler et un LLM.
Utiliser les données de votre outil d'analytics
Votre outil d'analytics peut vous apporter deux types de données qui serviront à alimenter vos KPIs GEO :
- Le trafic généré par les LLM
- Les conversions générées
Ce dernier indicateur en particulier ne peut généralement être mesuré que sur votre outil d'analytics.
Vous pourrez ensuite :
- Calculer un taux de conversion
- Identifier plus précisément vos top pages de destination pour cette typologie de trafic
- Associer des indicateurs qualitatifs à ce trafic (temps passé, nombre de pages vues, etc.)
Comme nous l'avions vu dans cet article, sur Google Analytics 4, il vous faut pour cela isoler le trafic provenant des moteurs d'IA générative en procédant de la façon suivante :
- Aller sur "Acquisition de trafic"
- Cliquer sur "Ajoutez un filtre"
- Sélectionner "Source de la session" en variable, et "Correspond à l'expression régulière" en type de correspondance
- Saisir l'expression régulière ci-dessous en valeur et cliquer sur "Appliquer"
Voici l'expression régulière à renseigner dans le champ "Valeur" pour filtrer le trafic issu des principaux LLM :
.*chatgpt.com.*|.*openai.com.*|.*perplexity.*|.*mistral.ai.*|.*copilot.microsoft.com.*|.*copilot.com.*|.*copilot.cloud.microsoft.*|.*gemini.google.com.*|.*claude.ai.*|.*meta.ai.*|.*grok.com.*
Cette règle peut bien sûr être amenée à évoluer, et peut également être complétée si vous souhaitez prendre en compte d'autres moteurs d'IA générative existants.

Rappelez-vous toutefois que, si votre outil d'analytics vous fournira des données précieuses sur les conversions que vous générez grâce à ChatGPT, Perplexity ou Claude, il ne vous dira rien des pages explorées par leurs crawlers - et donc des pages susceptibles de servir de source dans leur réponse. Or, avant d'être un canal de trafic, le GEO est un canal d'influence, et votre objectif est que votre marque soit citée dans ces réponses, d'où l'intérêt de monitorer plus précisément vos contenus utilisés comme source.
Conclusion
Votre outil d'analytics - si vous en avez un d'installé sur votre site - peut d'ores et déjà vous fournir des indicateurs utiles en GEO :
- Trafic généré par les moteurs d'IA générative
- Conversions générées
Toutefois, se limiter à ces données, c'est passer à côté du fait qu'une grande partie de votre visibilité dans les LLM ne se traduit pas forcément par un clic vers votre site, mais par une mention ou une citation dans la réponse de ChatGPT, Gemini ou Perplexity. Et c'est cette mention qui peut ensuite faire découvrir votre marque à un utilisateur, l'amener à la considérer, ou être gage de réassurance, selon l'étape à laquelle il se situe dans son processus d'achat ou de décision.
Si le prompt tracking peut permettre d'évaluer votre visibilité GEO, il ne reste qu'une indication, et se heurte à plusieurs limites. Dès lors, l'analyse de logs apparaît comme la seule méthode fiable pour suivre l'activité des crawlers IA sur votre site, et en particulier celle des "user-fetch bots", les robots qui se déclenchent en réponse à une action utilisateur pour récupérer le contenu d'une page de votre site web - signe qu'elle a très probablement été utilisée comme source dans la réponse du LLM.
Synthèse : KPIs GEO à suivre et méthode associée
| KPIs GEO à suivre | Méthode |
|---|---|
|
Outil analytics |
|
Analyse de logs |
|
Outil de prompt tracking |