Comparatif des moteurs de recherche Apache Solr / Antidot AFS@Store / Celebros Salesperson
Par Grégoire Genestier le 6 décembre 2010Le moteur de recherche est un élément clé du e-commerce.
73% des visiteurs de site e-commerce quittent le site au bout de 2 minutes s’ils ne trouvent pas ce qu’ils cherchent.
96% disent que la fonction de recherche est très importante dans leur processus d’achat.
40% des visiteurs d’un site marchand vont utiliser le moteur de recherche interne, un « chercheur » transforme 2 fois plus qu’un « navigateur ».
Nous vous proposons ici un comparatif de 3 moteurs de recherche intégrables sous Magento : Apache Solr, Antidot AFS@Store et Celebros Salesperson.
Apache Solr
Solr (« solar ») est un serveur de recherche Open Source basé sur la librairie Lucene, écrite en Java.
- Recherche full-text avancée
- Optimisé pour les forts trafics web
- Basé sur des interfaces standards : XML, JSON, http
- Evolutivité : Réplication avec d’autres serveurs Solr
Architecture:
Solr repose sur :
- un web service d’indexation des données
- un web service de recherche
- une interface web d’administration
Solr s’appuie sur le fichier schema.xml qui contient toutes les informations relatives aux champs des documents, et la façon dont ils doivent être traités lorsque les documents sont indexés ou lorsque ces champs sont interrogés.
Un exemple de schéma Solr commenté est disponible ici : http://svn.apache.org/viewvc/lucene/dev/trunk/solr/example/solr/conf/schema.xml?view=markup
Le schéma est structuré de la façon suivante :
Les types des données:
- La section <types> permet de définir une liste de déclaration de <fieldtype>
- Possibilité de définir des types de champs « poly », permettant de créer des champs multiples.
Les champs:
- La section <fields> contient la liste de déclaration des <field>, composés entre autre des attributs name, type, indexed=true|false ( true si le champ doit être classable et « facetable »), stored=true|false ( true si la valeur du champ doit être récupérable dans la recherche).
- Une des fonctionnalités les plus intéressantes, les champs dynamiques, basés sur des préfixes ou des suffixes : <dynamicField name=”*_i” type=”integer” indexed=”true” stored=”true”/>
- Indexation des mêmes données dans des champs différents, pour les indexer de manière différentes par exemple pour la recherche, le tri et le « facettage ».
Les configurations diverses:
- Le champ <uniqueKey> permet d’indiquer à SolR qu’un champ doit être unique pour tous les documents. Si un nouveau document indexé contient la même valeur pour le champ qu’un document existant, l’ancien document est supprimé de l’index.
- Il est possible de déclarer des <copyField> afin de dupliquer les données d’un champ source dans un champ destination
Intégration
La recherche s’effectue par requête http au format de réponse configurable (XML, JSON, Python, Ruby, PHP).
L’intégration de Solr consiste en 3 étapes :
- Installation et configuration de Solr sur un serveur d’application (Tomcat, JBoss, …)
- Extraction et indexation des données
- Intégration des résultats de recherche sur la plateforme Web
La version Entreprise de Magento simplifie l’intégration puisqu’elle inclut en natif l’extraction des données et l’intégration des résultats de recherche dans les storefronts.
Modes de Recherche
Recherche par mots clés:
- support des opérateurs booléens (ET, OU)
- Recherche full-text
Aides à la recherche:
- Suggestions d’orthographe
- Suggestions « More Like This » pour un document donné
- Fonction d’auto-complétion
Outils de guidage:
- Possible de trier la recherche sur autant de champs que souhaité
- La recherche à facette permet d’affiner les résultats en ajoutant des critères supplémentaires parmi les résultats retournés, en indiquant le nombre de résultats correspondant à chaque critère.
- Possibilité de configurer de meilleurs résultats pour une requête, se substituant au résultat normal selon le score et le tri
Exemple de la fonction de suggestion d’orthographe sur le site www.furet.com :
Exemple de la fonction d’auto-complétion sur le site www.furet.com:
Recherche sur le site de la maison blanche, les tris possibles apparaissent en haut et les facettes à droite :
ANTIDOT AFS@Store
AFS@Store est une solution clé en main spécialisée et optimisée pour le E-commerce. Elle intègre de nombreuses fonctions d’optimisation des ventes :
- Indexation complète du catalogue et des fiches descriptives
- Très forte tolérance orthographique pour trouver le produit recherché quelque soit l’orthographe utilisée
- Mise en avant de produits particuliers
- Gestion de campagnes promotionnelles dans le flux de réponse du moteur
- Cross-Selling : Suggestion automatique d’articles connexes sous contrainte (marge, prix plus élevé,…)
- Affichage de « Best-sellers » par catégorie
- Navigation assistée dans les pages réponses afin de trouver le bon produit en quelques clics en suivant une méthode de vente éprouvée (”Effet entonnoir”)
Architecture:
La version 7 est disponible en SaaS et sera proposée en janvier 2011 sous forme de licences logicielles intégrables au sein du système d’information des entreprises.
Une architecture en 3 modules :
- Pipes and Filters (AFS-PAF) est le module amont, en charge de la captation des données, de leur traitement et de l’indexation.
- Query Engine (AFS-QE) est le module aval qui répond aux requêtes des utilisateurs ou d’applications tierces qui exploitent les flux de réponse. AFS-QE utilise pour cela les index de recherche et les éléments linguistiques générés par AFS-PAF lors de la phase d’analyse et d’indexation.
- Le Back-Office (AFS-BO) permet à la fois de configurer la solution de recherche, mais aussi de l’exploiter au quotidien : gestion des indexations et des agents de recherche, suivi en temps réel des requêtes utilisateurs…
Intégration:
AFS se présente sous forme d’un Web Service interrogeable avec les protocoles les plus classiques : HTTP (en GET ou en POST) ou XML-RPC.
Les requêtes des utilisateurs peuvent soit être transmises directement à AFS, soit transiter par une application intermédiaire (portail web, application métier) qui récupérera les réponses et pourra à son tour appliquer les traitements nécessaires.
La présentation des résultats entièrement personnalisable :
- flux de réponse disponible nativement en XML
- support de feuilles de styles XSL et CSS multiples pour une intégration graphique personnalisée en HTML ou xHTML
- intégration simple dans du Flash ou des interfaces Ajax
- mise en place facile et rapide en utilisant un kit de widgets prêt à l’emploi
Modes de Recherche:
AFS propose de nombreux modes de recherche ainsi que des fonctions avancées pour assister l’utilisateur et le guider :
- Recherche par mots clés
- support des opérateurs booléens (ET, OU, SAUF, recherche de phrase exacte …)
- recherche full-text
- recherche floue
- recherche phonétique
- recherche par troncature droite ou gauche, support des expressions régulières
Aides à la recherche:
- suggestion orthographique
- auto-complétion
- suggestion d’expressions contextuelles à la recherche
Outils de guidage:
AFS propose des fonctions qui permettent aux utilisateurs de comprendre l’information, de la filtrer et de naviguer.
- Catégorisation : les réponses sont regroupées en catégories distinctes pour une meilleure lecture
- Navigation par facette : possibilité de filtrer les listes de résultats afin d’affiner la recherche
- Navigation transversale : module qui associe automatiquement les contenus ayant une proximité sémantique afin de proposer à l’utilisateur l’ensemble des documents liés à une information.
- Génération automatique de nuages de tags
Merchandising:
- Reprise automatique du merchandising selon des critères marchands : AFS peut afficher la liste de réponse la plus pertinente en masquant les produits indisponibles, en montrant en premier les produits les plus vendus, en identifiant les produits en promotion, …
- Up-selling et cross-selling automatique : AFS propose ces deux fonctions entièrement automatiques avec des liens entre les produits générés lors de l’indexation et dans le respect des règles métier.
Recherche sur le site www.service-public.fr, les résultats sont classés en catégories (Particuliers, Professionnels et associations, …), des suggestions d’expressions contextuelles et un nuage de mots-clés sont affichés à gauche :
Recherche sur le site www.3suisses.fr, le moteur propose une alternative lorsqu’il ne trouve pas de résultats, et propose un filtre à facettes à gauche :
CELEBROS Salesperson
Salesperson, la solution de recherche de Celebros, imite le comportement d’un vrai vendeur en magasin en utilisant :
- L’analyse du langage naturel (NLP) et autres outils sémantiques
- Une vaste réserve de connaissances accumulées sur les magasins électroniques
- Des données en temps réel concernant les changements d’habitudes et d’intérêts des clients
Ainsi, Salesperson possède deux avantages majeurs:
- La compréhension de toutes les requêtes des clients, quelle que soit la formulation
- La capacité du moteur de recherche à améliorer automatiquement les résultats en se basant sur l’expérience acquise de par les choix et les requêtes des clients
Architecture:
Salesperson est disponible sous trois formules :
- Le logiciel proposé comme un service (Software as Service, SaaS)
- Une solution de recherché hébergé en XML
- Une solution de recherche implémentée sur les serveurs du clients
Elle est composée des outils suivants :
- Le Salesperson Desktop permet d’implémenter des règles commerciales, ajuster les résultats de recherche aux objectifs de merchandising, déterminer le positionnement des produits par rapport aux requêtes, initier des nouvelles campagnes (promotions spéciales, produits reliés, meilleures ventes, …)
- L’outil Analytics présente des statistiques précieuses portant sur le comportement de recherche des clients : recherches des clients, articles les plus populaires, les taux de clic, …
- Le Package Machine Learning (merchandising automatique en temps réel) permet au gestionnaire de site de suivre 24h/24 les changements du site et des tendances. Le module complet d’apprentissage de recherche autonome (self-learning search) utilise la technologie du machine learning (ML) pour analyser les préférences des clients. Il utilise ces connaissances pour ajuster automatiquement l’affichage des résultats de recherche et ainsi augmenter le taux de conversion, les acquisitions et les profits.
- Le programme Managed Services (MS) qui optimise de façon proactive les résultats de recherche et applique des règles de merchandising.
Intégration:
Les intégrateurs de Celebros dirigent les aspects majeurs du processus d’intégration, ce qui allège les tâches du client.
Une extension Magento devrait bientôt être disponible (compatible en versions community et entreprise), permettant en outre :
- De réduire les efforts d’intégration du moteur de recherche
- D’offrir un contrôle sur l’apparence des résultats de recherche
Modes de Recherche:
Recherche conceptuelle:
- Comprend les intentions réelles de recherche du client, syntaxe et sémantique
- Requêtes complexes (« télé lcd sony 52’’ »)
- Compréhension des fautes d’orthographe (dictionnaire, dictionnaire phonétique, thésaurus), des synonymes, de l’argot
- Requêtes basées sur le prix (« pantalon à moins de 50 euros »)
Outils de guidage:
- Le filtre social : classe les résultats par indicateurs sociaux (meilleures ventes, notations clients, avis clients, popularité, …)
- génération dynamique de catégories appropriées organisant les résultats par groupes. Chaque sélection est statistiquement analysée et mène à une nouvelle sélection d’articles en fonction des choix du client. Les internautes arrivent rapidement vers l’article désiré.
- Génération automatique de nuages de tags
- Echelle de prix : propose une sélection facile de prix dans les résultats de recherche
- Mise en relief du champ de recherche : augmente la visibilité, l’efficacité et l’attrait pour le champ de recherche en proposant des exemples de requêtes
- Vue rapide d’un produit : consulter les caractéristiques d’un produit instantanément en naviguant parmi les résultats de recherche.
Merchandising:
- Application des règles définies avec le Salesperson Desktop
- Avis clients intégrés : les avis des autres internautes intégrés dans les pages de recherche.
- Comparaison de produit : comparer facilement plusieurs produits affichés dans la page de résultats.
Exemple de la fonction d’auto-complétion sur le site www.mistergooddeal.com:
Recherche sur le site www.ice.com, affichage du filtre social en haut, des facettes à gauche, et des avis clients dans le résultat :
| Apache Solr | Antidot AFS@Store | Celebros Salesperson | |
| Recherche Full-text | |||
| Recherche Phonétique | |||
| Recherche conceptuelle | |||
| Suggestion d’orthographe | |||
| Auto-complétion | |||
| Tri du résultat | |||
| Filtre à facettes | |||
| Catégorisation des résultats | |||
| Nuages de tags | |||
| Filtre social | |||
| Merchandising client | |||
| Up-selling et Cross-selling | |||
| Tarif Installation | Gratuit | A partir de 200 € | A partir de 1000 € |
| Tarif Utilisation | Gratuit | A partir de 400 € / mois | A partir de 650 € / mois |











