Contexte
Une boutique e-commerce B2C avec un volume de commandes en croissance faisait face à une saturation de son équipe support. La majorité des tickets entrants concernaient des sujets prévisibles : statut de commande, délais de livraison, politique de retour, disponibilité produit.
Ces tickets, bien que simples à traiter, mobilisaient l'équipe sur des tâches à faible valeur ajoutée — au détriment des demandes complexes nécessitant un vrai jugement humain.
Taille de l'équipe support : 3 personnes Volume hebdomadaire : environ 400-500 tickets entrants Proportion de tickets répétitifs : estimée à 60-65% du volume total
Agent déployé
Architecture
L'agent a été construit sur les briques suivantes :
- LLM : Claude Haiku pour les réponses standards, escalade vers Sonnet pour les cas complexes
- RAG : base de connaissance couvrant la politique de retour, les FAQs, et les process de remboursement
- Intégrations : API de la boutique (statut commande, tracking) et outil de ticketing existant
- Guardrails : escalade automatique vers un humain pour tout ticket impliquant un litige, une réclamation émotionnelle, ou une situation hors périmètre
Périmètre de l'agent
L'agent traite de manière autonome :
- Les demandes de statut de commande (connexion API temps réel)
- Les questions sur la politique de retour
- Les délais de livraison et informations de tracking
- Les FAQs produit sur la base de connaissance
L'agent escalade systématiquement vers un humain :
- Les réclamations impliquant un remboursement
- Les situations avec un ton émotionnel négatif marqué
- Les demandes hors périmètre documenté
- Les cas où la confiance de l'agent est inférieure au seuil défini
Déploiement
Le déploiement s'est déroulé en 3 semaines :
Semaine 1 : Audit des tickets existants, classification des types, construction de la base de connaissance RAG, intégration API boutique.
Semaine 2 : POC sur 100 tickets historiques, validation manuelle des réponses, ajustement des seuils d'escalade.
Semaine 3 : Déploiement progressif (10% du trafic, puis 50%, puis 100%), monitoring intensif, ajustements.
Résultat
Note : les résultats ci-dessous sont qualitatifs. Nous ne publions pas de chiffres non vérifiés.
Le volume de tickets traités manuellement sur les sujets couverts par l'agent a significativement diminué. L'équipe a pu se concentrer sur les demandes complexes nécessitant un jugement humain.
La satisfaction client sur les tickets traités par l'agent a été mesurée via un score post-interaction simple (pouce haut/bas). Les premiers mois ont montré une satisfaction comparable aux réponses humaines sur les sujets standards.
Des ajustements ont été nécessaires les premières semaines : certaines formulations de la base de connaissance généraient des réponses imprécises qui ont été corrigées.
Ce qu'on referait pareil : le déploiement progressif (10% → 50% → 100%) et les seuils d'escalade conservateurs.
Ce qu'on ferait différemment : commencer la construction de la base de connaissance plus tôt — c'est souvent le goulot d'étranglement.