Article original : What is the Cold Start Problem in Recommender Systems?

Les systèmes de recommandation sont utilisés pour offrir des expériences personnalisées aux clients dans de nombreuses industries aujourd'hui, y compris le commerce électronique, les réseaux sociaux, le divertissement et l'éducation. Ces systèmes de recommandation font des suggestions basées sur les préférences des utilisateurs et collectent les retours des utilisateurs pour optimiser leurs performances.

Netflix utilise votre historique de visionnage et les préférences des téléspectateurs similaires pour déterminer ce que vous pourriez aimer regarder ensuite. C'est pourquoi Netflix vous incite à regarder Prison Break après avoir terminé Money Heist.

Selon Statista, à la fin de l'année 2024, Netflix comptait plus de 300 millions d'abonnés payants, donc son système de recommandation dispose de données utilisateur significatives pour travailler. D'où les recommandations intelligentes de films.

Mais une plateforme avec un système de recommandation nouvellement mis en œuvre qui dispose d'informations insuffisantes pour interagir rencontrera ce que l'on appelle le problème de démarrage à froid. Cela signifie que la plateforme ne pourra pas recommander efficacement et avec précision des produits ou services qui répondent aux besoins de ses utilisateurs.

Dans cet article, vous apprendrez ce qu'est le problème de démarrage à froid dans les systèmes de recommandation, ses types, pourquoi il se produit et comment il peut être atténué.

Qu'est-ce que le problème de démarrage à froid ?

Le problème de démarrage à froid dans les systèmes de recommandation se produit lorsqu'il y a peu ou pas de données historiques pour tirer des inferences. Cela signifie que le système de recommandation ne peut pas fournir de suggestions pertinentes aux utilisateurs lorsqu'il est initialement mis en œuvre sur une nouvelle plateforme, car il faut du temps pour collecter des données et en tirer des insights.

Typiquement, les systèmes de recommandation collectent des données telles que les interactions avec les produits, les achats, les avis, etc., en fonction des points de données clés de l'entreprise. Ces données sont appelées les caractéristiques de référence du système. Le système s'entraîne sur ces données pour fournir des suggestions intelligentes qui inciteront les utilisateurs à continuer à utiliser la plateforme.

Par exemple, le système de recommandation de Spotify peut analyser votre historique d'écoute et la fréquence de lecture pour comprendre vos préférences musicales passées et prédire ce que vous pourriez aimer écouter ensuite.

Le problème de démarrage à froid est un problème courant auquel sont confrontés les scientifiques des données et les ingénieurs en machine learning (ML) lors de la construction de systèmes de recommandation pour une entreprise. La performance du système de recommandation diminue lorsqu'il n'y a pas suffisamment de données à collecter auprès des nouveaux utilisateurs ou des nouveaux articles sur la plateforme. Malheureusement, cette faible performance peut éloigner les utilisateurs et entraîner une perte de revenus.

Types de problèmes de démarrage à froid dans les systèmes de recommandation

Il existe deux principaux types de problèmes de démarrage à froid dans les systèmes de recommandation : le démarrage à froid de l'utilisateur et le démarrage à froid de l'article. Pour illustrer ces problèmes, j'ai créé un tableau représentant un système de recommandation basé sur les évaluations des utilisateurs. Dans ce tableau :

  • Les lignes représentent les utilisateurs

  • Les colonnes représentent les articles

  • La matrice représente les évaluations des utilisateurs sur une échelle de 1 à 5.

  • "--" représente les articles non évalués.

Système de recommandation basé sur les évaluations des utilisateurs

Démarrage à froid de l'utilisateur

Le problème de démarrage à froid de l'utilisateur se produit lorsque les nouveaux utilisateurs n'ont pas fourni suffisamment d'informations de base ou d'interactions passées pour que le système de recommandation puisse faire des suggestions intelligentes. Ainsi, le système ne peut pas prédire avec précision les intérêts possibles de l'utilisateur.

Comme le montre le tableau ci-dessus, le NOUVEL UTILISATEUR n'a utilisé ou évalué aucun article. Cela signifie que le système ne peut pas prédire avec précision quel article le nouvel utilisateur serait le plus susceptible d'apprécier.

C'est un problème sérieux car si les nouveaux utilisateurs continuent à recevoir des recommandations non pertinentes initialement, ils pourraient arrêter d'utiliser la plateforme avant que le système de recommandation n'ait suffisamment de données pour mieux performer.

Démarrage à froid de l'article

Le problème de démarrage à froid de l'article se produit lorsqu'un nouvel article ou produit, ou plus de contenu, est ajouté à une plateforme, mais qu'il n'y a pas suffisamment d'évaluations, d'achats ou d'avis pour que l'article soit recommandé.

Comme le montre le tableau ci-dessus, l'article E est nouveau et n'a aucune évaluation d'utilisateur. Ainsi, le système de recommandation ne recommandera pas cet article aux utilisateurs.

Notez que le problème de démarrage à froid de l'article n'affecte pas seulement les nouveaux articles. Il peut également impacter les articles existants mais impopulaires. Si un article existant n'a eu que quelques interactions, le système de recommandation ne dispose pas de suffisamment de retours historiques des utilisateurs pour comprendre les métadonnées de l'article et les préférences des utilisateurs. Cela signifie que le système fera de mauvaises recommandations, donnant à l'article moins de visibilité.

Défis du problème de démarrage à froid dans les systèmes de recommandation

Recommandations stéréotypées

S'appuyer sur des données limitées peut conduire à des recommandations stéréotypées dans les systèmes de recommandation. Par exemple, lorsque le système n'utilise que des actions de base de l'utilisateur, il peut finir par offrir le même type de contenu ou d'articles de manière répétée, sur la base d'hypothèses généralisées. Ce stéréotype peut éloigner les utilisateurs, surtout s'ils commencent à avoir l'impression que leurs intérêts ne sont pas pleinement compris.

Taux de désabonnement élevé

Lorsque un utilisateur doit faire défiler sans fin pour trouver des articles qu'il veut parce que le système de recommandation ne propose pas d'articles pertinents, la plateforme est plus susceptible de connaître un taux de désabonnement élevé. Cela signifie que la plateforme peut perdre beaucoup de ses utilisateurs s'ils ne peuvent pas trouver rapidement des produits ou services pertinents.

Perte de la fidélité des clients

Statista a rapporté qu'en 2023, 56 % des consommateurs préféraient revenir chez un détaillant qui offrait une expérience d'achat personnalisée. Cela signifie qu'un manque d'expérience personnalisée à travers des recommandations intelligentes fera que les utilisateurs se méfieront de la capacité du système à comprendre leurs besoins. Cette méfiance peut conduire à la frustration des utilisateurs, à la perte de la fidélité des clients et, en fin de compte, à une perception négative de la marque.

Comment résoudre le problème de démarrage à froid dans les systèmes de recommandation

Voici quelques stratégies que les chercheurs en IA ont proposées pour aider à atténuer les problèmes de démarrage à froid des utilisateurs et des articles, respectivement :

Comment résoudre le problème de démarrage à froid dans les systèmes de recommandation

Comment résoudre le démarrage à froid de l'utilisateur

Collecte des préférences des utilisateurs lors de l'inscription

Une façon de remédier au manque de données historiques des utilisateurs est de fournir un questionnaire dès le début lorsque de nouveaux utilisateurs s'inscrivent sur une plateforme. Ce questionnaire peut aider les entreprises à obtenir certaines préférences de base afin qu'elles puissent construire un profil utilisateur utile et faire des recommandations initiales.

Spotify utilise cette méthode pour éviter les problèmes de démarrage à froid des utilisateurs. Lorsque vous vous inscrivez, Spotify vous demandera de sélectionner vos artistes et genres musicaux préférés parmi une liste d'options. Le système de recommandation de Spotify utilise ensuite ces informations pour comprendre le type de chansons que vous pourriez aimer et construire une playlist initiale pour vous.

Néanmoins, les entreprises doivent mettre en œuvre cette stratégie d'intégration avec soin, car si elles posent trop de questions aux nouveaux utilisateurs lors de l'inscription, ils pourraient sauter les questions ou abandonner la plateforme.

Utilisation des données contextuelles

Les données contextuelles se concentrent sur des informations comme la localisation de l'utilisateur, les données démographiques, le type de périphérique ou le comportement en temps réel. Les entreprises peuvent obtenir ces données grâce aux informations d'inscription de l'utilisateur, à l'adresse IP, aux cookies et aux paramètres du navigateur. Ces informations supplémentaires peuvent aider les entreprises à améliorer l'expérience des nouveaux utilisateurs en personnalisant leur contenu et leurs recommandations.

Capture d'écran du site Booking.com

Les plateformes de voyage comme Booking.com utilisent cette stratégie pour fournir des recommandations personnalisées et afficher du contenu localisé aux nouveaux utilisateurs. Lorsque les visiteurs accèdent pour la première fois au site, Booking.com obtient des données contextuelles grâce à leur adresse IP, aux paramètres du navigateur et aux cookies. En utilisant ces informations, Booking.com peut recommander des hébergements, des attractions et des offres de voyage à proximité dans la région de l'utilisateur. Dans la capture d'écran ci-dessus, je ne me suis pas connecté ou inscrit sur Booking.com, mais le site recommande déjà du contenu pour ma localisation.

Utilisation des données basées sur les réseaux sociaux

Les entreprises peuvent résoudre le problème de démarrage à froid des utilisateurs en permettant aux nouveaux utilisateurs de s'inscrire avec leurs connexions sociales. Avec cet accès, le système de recommandation peut récupérer les intérêts de l'utilisateur, les interactions passées et le comportement à partir de leurs profils sociaux. Ces informations aident le système à comprendre les préférences de l'utilisateur et à faire des suggestions en conséquence.

Comment résoudre le démarrage à froid de l'article

Exploitation du filtrage basé sur le contenu

Le filtrage basé sur le contenu est une technique de recommandation qui utilise les caractéristiques ou les métadonnées d'un article, telles que les fonctionnalités, les genres, les catégories ou les descriptions, pour faire des recommandations.

En analysant les informations de l'article, le système de recommandation peut encore suggérer de nouveaux articles ou des articles impopulaires aux utilisateurs même si les articles ont peu d'avis ou d'interactions.

Notez que le filtrage basé sur le contenu peut souffrir d'une mauvaise qualité de recommandation lorsqu'il y a des caractéristiques d'article insuffisantes. Ainsi, une entreprise ne devrait utiliser cette méthode que si elle dispose d'informations détaillées sur les articles.

Utilisation du filtrage hybride

Le filtrage hybride implique de combiner les avantages du filtrage basé sur le contenu et du filtrage collaboratif. Le filtrage collaboratif est une technique de recommandation qui prédit les préférences d'un utilisateur en fonction du comportement d'utilisateurs similaires. Il analyse des données telles que l'historique de navigation, l'historique d'achat et les évaluations d'articles pour identifier les utilisateurs ayant des intérêts similaires. Ensuite, le système suggère aux nouveaux utilisateurs des articles que ces utilisateurs ont aimés.

Vous avez probablement vu cette technique en action à travers des fonctionnalités comme "Les gens ont aussi aimé" ou "Les gens ont aussi recherché". Au-delà des recommandations basées sur les utilisateurs, le filtrage collaboratif suggère également des articles similaires à ceux avec lesquels un utilisateur a précédemment interagi.

L'approche de filtrage hybride alterne entre le filtrage basé sur le contenu que nous avons discuté ci-dessus et le filtrage collaboratif lorsque l'un manque plus de données que l'autre. Par exemple, Amazon pourrait recommander des articles en fonction des descriptions et catégories de produits (filtrage basé sur le contenu). Ensuite, après un certain historique d'achat, le système de recommandation pourrait suggérer des produits en fonction de ce que les utilisateurs avec des habitudes d'achat similaires ont acheté (filtrage collaboratif).

Affichage des nouvelles sorties sur la page d'accueil

Promouvoir de nouveaux articles ou contenu sur la page d'accueil peut fournir de la visibilité et encourager les utilisateurs à interagir avec l'article. Pour un impact maximal, il est préférable de mettre en avant le nouvel article dans une section visible sur la page d'accueil et d'étiqueter clairement l'article comme nouveau. De cette façon, les clients ne manqueront pas la mise à jour et seront plus enclins à l'essayer.

Conclusion

Dans cet article, vous avez appris que le problème de démarrage à froid est l'un des principaux défis auxquels sont confrontés les systèmes de recommandation. Aborder ce problème nécessite une approche combinée d'analyse de données et d'amélioration continue. En appliquant les stratégies discutées ci-dessus, les entreprises peuvent améliorer leurs systèmes de recommandation et offrir des expériences plus pertinentes et personnalisées.

Si vous avez trouvé cet article utile, partagez-le avec d'autres personnes qui pourraient le trouver intéressant.

Restez informé de mes projets en me suivant sur LinkedIn et YouTube.