Atelier One to One Monaco 2025 : création de contenus à grande échelle par IA générative

Back to blog

De ChatGPT aux usages business : potentialités et limites de l’IA générative

Seo

Découvrez Incremys

Le plateforme SEO Next Gen 360°

Demande de demo

10 Mars 2025

Chapitre 01

Example H2
Example H3
Example H4
Example H5
Example H6

L’IA générative est au cœur des innovations technologiques actuelles. Propulsée par des géants comme OpenAI, elle promet des résultats incroyables tout en soulevant des questions fondamentales : comment ces moteurs fonctionnent-ils réellement ? Sont-ils aussi intelligents que nous le pensons ? Et surtout, jusqu’où pouvons-nous aller dans leur utilisation ?

Lors de la conférence sur l’IA générative, le mardi 17 septembre 2024 dans la salle plénière du salon Paris Retail Week, @Iban Touchet, directeur d'@Incremys, a apporté des réponses éclairantes à ces questions, en abordant en profondeur le fonctionnement des moteurs d'IA, l'importance de la qualité des données tout en dévoilant des cas concrets d’applications qui fonctionnent aujourd’hui. Dans cet article nous explorons un compte-rendu détaillé de ces points cruciaux.

Comprendre le fonctionnement des moteurs d'IA

Le moteur d'une IA générative repose sur des milliards de paramètres ajustés lors de son entraînement à partir d'immenses bases de données. Contrairement à ce que l'on pourrait imaginer, il ne s'agit pas de machines capables de comprendre ou de raisonner. L'approche utilisée, bien que puissante, est fondamentalement probabiliste.

Les premiers moteurs d’IA étaient principalement utilisés pour des tâches simples de reconnaissance d'images. Par exemple, un moteur pouvait apprendre à distinguer un chien d'un chat après avoir été exposé à des millions d'images de ces animaux. Il "devinait" alors l'animal présenté en ajustant ses paramètres internes selon ce qu'il avait appris.

Pour le texte, la tâche est bien plus complexe. Les modèles d’IA génèrent les mots les plus probables en fonction du texte d’entrée. Si deux personnes différentes devaient deviner la suite d’une même phrase, elles pourraient avoir des suggestions totalement différentes. Cela reflète la nature non déterministe du langage, ce qui rend la tâche de prédiction textuelle plus incertaine.

Implications technologiques

Dépendant à 100% de sa data d’entraînement

Les moteurs d'IA sont dépendants à 100% des données qui leur sont fournies. Par exemple, si une IA est entraînée sur des textes pro-démocratiques, elle produira des résultats alignés sur cette idéologie. De même, si elle est nourrie de textes dictatoriaux, elle générera des réponses favorables à ce régime.

Aucune compréhension des textes qu’il génère

L'IA génère des bouts de mots les uns à la suite des autres sans aucune compréhension du sens global de la phrase une fois terminée.

Incapacité de représentation du monde

L'IA ne peut pas comprendre le monde physique ou émotionnel comme les humains. Les concepts concrets tels que les 5 sens (voir, toucher, sentir, entendre, goûter) ou les sentiments (joie, tristesse, jalousie) sont totalement absents de son fonctionnement. Peut-on comprendre le monde en lisant uniquement des livres et sans aucun contact avec le réel ?

Pas de raisonnement, pas de sens critique, beaucoup de hasard !

L'IA est une technologie qui génère du texte ou des images sans véritable compréhension ou raisonnement, se contentant d'enchaîner les prédictions sur la base des données qu'elle a apprise.

Le fonctionnement des tokens dans l’IA : démonstration en vidéo

Contrairement à ce que l'on pourrait penser, l'IA ne raisonne pas de manière linéaire ou logique. Elle analyse les probabilités de chaque token (ou morceau de mot) pour prédire la suite la plus plausible dans une phrase donnée.

Dans cette vidéo datant de 2022 juste avant le lancement de Sparkneo, nous mettons en évidence ce qui se passe derrière la machine. On pouvait à l’époque activer une option dans l'interface d'OpenAI pour visualiser le fonctionnement des probabilités associées à chaque token généré par l'IA. Cette démonstration illustre le processus de création par petites itérations successives

Exemple de “raisonnement” de GPT-4o

Illustrons cette limitation en prenant l’exemple d'une question posée à GPT-4 :

Charlotte a 3 sœurs et 1 frère. Combien de sœurs a le frère de Charlotte ?

Le modèle gpt-4o, bien que impressionnant en surface, génère une réponse erronée (oui, car nous espérons que vous avez bien saisi que la réponse ici est 4, Charlotte étant également l'une des sœurs). Cet exemple montre que l'IA n'a aucune compréhension des relations familiales ni de la logique humaine, il se base sur des statistiques de probabilité de mots plutôt que sur un véritable raisonnement. On note aussi que les phrases générées par l’assistant sont peu naturelles voire incompréhensibles et surtout ne rèflète aucun raisonnement sérieux qu’aurait effectué un humain.

L’IA, c’est sa data

L’élément central qui conditionne le succès ou l’échec d’une IA réside dans ses données. Peu importe la sophistication d’un moteur d’IA, celui-ci ne peut produire des résultats pertinents qu’à la hauteur de la qualité des informations qu’il ingère. Une IA peut générer des erreurs surprenantes, parfois même absurdes, si ses données d'entrée sont incomplètes, obsolètes ou mal structurées.

La question n’est donc pas simplement de savoir comment faire fonctionner une IA, mais de comprendre comment la qualité des données en entrée influence chaque sortie générée par le moteur. De la même manière qu'une machine construite pour produire des pièces de haute précision échouera si elle est alimentée avec des matériaux défectueux, une IA nourrie de données imparfaites produit des résultats déformés, peu fiables, voire incohérents.

Pour illustrer ce point, voici une analogie avec le célèbre conte du Petit Prince :

Imaginez que l'on nourrisse un modèle d'IA avec l'ensemble des dessins préhistoriques des grottes du monde entier. Si le Petit Prince arrivait alors pour demander à cette machine étrange : "Dessine-moi un mouton", que produirait-elle ?

Incapable de concevoir un mouton tel que nous le visualisons aujourd'hui, l’IA générerait une image basée uniquement sur les références préhistoriques à sa disposition. Peut-être un animal ressemblant vaguement à un mouton, mais très éloigné de ce que le Petit Prince attendrait. Pourquoi ? Parce que l'IA est enfermée dans les limites des données qu’elle a été formées à traiter.

Mauvaise data + IA = tracas

Ce point est illustré avec un exemple tiré d’une expérience réelle: lors de l’achat d’un répéteur Wi-Fi sur Amazon, nous sommes tombés sur une description indiquant que le produit pouvait également servir de… cocotte-minute !

Si on utilise de la mauvaise donnée pour générer un texte, l’IA produira un résultat incorrect qui pourrait avoir des conséquences désastreuses. Car elle n’a aucune compréhension du monde réel. C'est pourquoi il est crucial de bien comprendre et de gérer les données d'entraînement avant de se lancer dans l’utilisation d’IA.

Imaginons que la donnée erronée de ce produit soit fournie à un modèle d'IA tel que GPT-4o pour générer une description de produit. L'IA intégrerait alors cette information incorrecte dans la description sans être consciente de son absurdité. Ainsi, le modèle pourrait créer un texte affirmant que le répéteur Wi-Fi est idéal pour améliorer la couverture réseau, et qu'il serait également... parfait pour cuisiner du riz pour plusieurs personnes.

Le problème : toute donnée a t-elle une ... valeur ?

La question fondamentale soulevée lors de cette conférence concerne la valeur des données.

Contrairement à l’intuition première, toute donnée n’a pas de valeur ! Il est tentant de croire qu'il suffit d'accumuler une grande quantité de données pour obtenir des résultats probants mais cette approche peut être trompeuse et même dangereuse.

Notre expérience de génération de contenu à grande échelle depuis plusieurs années nous a permis de distinguer 3 grandes familles de données qui nécessitent des traitements différents :

La data absolue

Ce sont des données inchangeables qui ont une valeur intrinsèque et fixe. Il s'agit, par exemple, des attributs produits (comme la couleur d’un objet) ou des informations personnelles (comme une date de naissance). Une donnée absolue ne change pas avec le temps et est considérée comme fiable. Un produit blanc restera blanc, et une personne née en 2000 n'aura jamais une date de naissance différente. Dans ce cas, l’IA peut facilement travailler avec ces données, car elles ne changent pas.

Si les données absolues sont mal renseignées, cela conduit à des erreurs claires et nettes. Cela reprend typiquement l’exemple vu plus haut sur le répéteur Wi-Fi d’Amazon, dont la description mentionne, à tort, des capacités de cocotte-minute. Cette mauvaise donnée absolue a entraîné un contenu absurde et potentiellement trompeur pour les utilisateurs.

Pour éviter ce type d’erreur, il est nécessaire de mettre en place une stratégie de données, par exemple multiplier les sources de données et comparer les informations pour identifier d'éventuelles incohérences.

La data temporelle

Ces données sont des informations dont la valeur est vraie à un moment précis. Ce type de données inclut, par exemple, les lois, l’actualité, la connaissance de la science mais aussi toute offre business car votre organisation évolue tous les jours.

Si l'IA utilise des données temporelles obsolètes, elle produira des résultats inadaptés à la réalité actuelle. Dans un contexte commercial, si une IA est utilisée pour créer des fiches produits en s'appuyant sur des offres expirées, elle pourrait générer des informations trompeuses. Un autre risque, dans un cadre légal, serait que l’IA fasse référence à des textes de loi obsolètes, ce qui pourrait entraîner des erreurs graves voire coûteuses pour une entreprise.

Pour y pallier, il est nécessaire de mettre en place à la fois des stratégies de données absolues et d’y ajouter des processus d'actualisation régulière. Cela implique de s'assurer que l'IA accède toujours à la version la plus récente des données.

Dans une organisation, la donnée temporelle réfère à la pertinence des fichiers disponibles: certains sont à jour de l’information alors que d’autres sont caduques et ne doivent pas être pris en compte. Donc la donnée temporelle concerne beaucoup plus de données qu’il n’y paraît de premier abord.

La data subjective

Il s'agit de données basées sur des perceptions humaines, qui varient d’une personne à l’autre. Par exemple, si l'on demande à plusieurs personnes de décrire les "meilleures activités à faire à Paris", chacune aura une réponse différente en fonction de ses goûts et de ses expériences. L’IA, ne pouvant pas juger ou comprendre ces nuances, générera des résultats qui pourraient être rejetés en fonction des attentes subjectives du client.

Le risque lié à ce type de données est que l’IA génère un contenu qui est "correct" du point de vue de la véracité des faits énoncés, mais qui ne correspond pas aux attentes du client. Ces divergences peuvent entraîner un rejet du contenu généré, même si les informations de base sont factuellement correctes.

Pour gérer les données subjectives, la précision des briefs devient cruciale. Il est essentiel de bien définir les attentes avant même de lancer un projet avec l’IA. Plus le brief est précis, plus l’IA peut générer un contenu qui répond aux attentes spécifiques du client.

Dans une organisation, les données subjectives correspondent à tout document produit par un collaborateur. Ainsi, lorsqu'un même sujet est traité par les équipes business, marketing et opérationnelles dans des fichiers distincts, ces contenus qui abordent pourtant le même thème manqueront de cohérence et d'alignement entre eux.

Pour résumer, non la data n’a pas de valeur ! Que ce soit pour des données absolues, temporelles ou subjectives, il est impératif de mettre en place une stratégie de données rigoureuse afin de maximiser l'efficacité de l'IA. Cela inclut la vérification régulière des sources, la mise à jour constante des informations et la définition claire des attentes. En l’absence de ces mesures, l’IA, aussi puissante soit-elle, ne peut qu’amplifier les erreurs présentes dans les données qui lui sont fournies.

La fausse promesse marketing de l'IA générative

L’une des promesses récurrente dans le monde du marketing est que la mise en place d’un moteur LLM entrainé sur l’intégralité des données d’une entreprise permettra d’automatiser les tâches complexes et produire des résultats en cliquant simplement sur un bouton.

Cette promesse nous semble largement exagérée et difficile voire impossible à matérialiser technologiquement.

Pourquoi ? Tout simplement à cause des problèmes de la donnée. L’IA n’est pas conçue pour comprendre le monde de manière critique. Elle ne fait que répéter les schémas qu'elle a appris à partir des données qu'on lui a fournies. Comme à l’échelle d’une organisation les données seront contradictoires ou incomplètes, l'IA génèrera des résultats tout aussi incohérents. De plus, elle est incapable de faire la distinction entre des données pertinentes et des données obsolètes ou erronées. En réalité, la gestion des données, surtout lorsqu'elles sont nombreuses et variées, demande une stratégie complexe.

Cas concrets d’application de l'IA générative

Loin des promesses marketing, l'IA générative a su prouver son utilité dans des domaines bien définis où elle a un impact tangible. Elle offre une capacité d'automatisation qui, bien exploitée, permet d’accélérer des processus autrefois laborieux. Toutefois, ce n’est pas la magie d’un clic qui révolutionne ces domaines, mais bien une intégration stratégique, reposant sur des cas d’usage précis.

À travers des exemples concrets, nous allons voir comment, dans les bonnes conditions, l’IA générative peut véritablement transformer la production de contenus à grande échelle tout en soulignant les limites qu’il est crucial de comprendre avant de se lancer.

L'ambition portée par Incremys et Sparkneo

Rappelons que l'ambition des solutions Incremys et Sparkneo est de permettre aux entreprises de générer des contenus à grande échelle de manière totalement automatisée. L'objectif est de produire des textes, images et vidéos publiables sans qu'aucune retouche humaine ne soit nécessaire. Cela pourrait, par exemple, permettre à une chaîne de salons de coiffure de créer des campagnes locales (texte, image, vidéo) pour chaque ville, tout en respectant la cohérence de la marque…

Textes, images et vidéos : quelles sont les technologies disponibles dans un cadre B2B ?

Aujourd'hui, les IA peuvent déjà générer des textes basés sur des briefs prédéfinis, un ADN de marque et des exemples de contenus. Cependant, nous rappelons que la qualité du texte dépendra directement de la qualité des données fournies.

En revanche, quand il s'agit de la création d'images ou de vidéos, la technologie n'est pas encore au niveau pour remplacer entièrement le travail manuel, surtout dans des contextes exigeants. Si les IA peuvent générer des images, elles sont loin de pouvoir créer des visuels parfaitement conformes à une charte graphique existante à grande échelle. Les résultats sont souvent aléatoires et nécessitent une intervention humaine importante pour garantir la cohérence et la qualité. Quant aux vidéos, l'idée de générer un film ou une séquence cohérente à partir d'un scénario est encore hors de portée des technologies actuelles. Bien que l'IA puisse aider à automatiser certaines tâches dans la production vidéo, comme l'édition ou le sous-titrage, elle ne peut pas, à ce jour, remplacer un processus de création vidéo complet.

L'IA requiert une approche par usage avec une volumétrie suffisante pour justifier les coûts fixes

L'un des aspects sous-estimé dans l’adoption de l’IA générative est son coût d’implémentation. Contrairement à l’idée que l’IA pourrait être une solution simple et peu coûteuse, la réalité est que ces technologies engendrent des coûts fixes relativement élevés, liés à la personnalisation des modèles, la formalisation d’un brief, la définition de la stratégie de données, et le fine-tuning pour répondre à des besoins spécifiques.

C'est pourquoi, pour justifier ces coûts fixes, l'IA doit être déployée dans des contextes où elle peut traiter des volumes importants de données ou produire des contenus à grande échelle. En d’autres termes, l’investissement dans l'IA n'est réellement rentable que lorsqu'une volumétrie suffisante se présente.

Il est essentiel de bien définir les cas d'usage et de s’assurer que la volumétrie des contenus à générer est suffisante pour garantir un retour sur investissement positif. L'IA générative est donc particulièrement adaptée à des secteurs qui traitent des quantités massives de données ou qui nécessitent une production répétée et régulière, comme les e-commerces, les services en ligne ou les entreprises disposant d’un vaste catalogue de produits.

Les cas d'applications qui fonctionnent : 3 familles d’usages engendrent de la volumétrie

Il existe trois types de cas d’usage où l'IA générative peut être particulièrement efficace :

1 use case pour beaucoup de data

Par exemple, la génération de pages produits pour un site e-commerce ou de pages locales. Il est intéressant d’investir dans la formalisation d’un brief car l’IA pourra créer des milliers pages en quelques clics ce qui assure le retour sur investissement.

1 data pour plusieurs assets

Par exemple, une même offre commerciale peut être déclinée en différents supports (publicité, e-mail, SMS, etc). L’IA peut aider à automatiser cette déclinaison, facilitant ainsi la création de campagnes marketing. Là encore, une volumétrie se déclenche pour absorber les coûts fixes.

Use case récurrent dans le temps

Des textes récurrents, comme des e-mails de bienvenue ou de relance, ou encore des promotions saisonnières, peuvent être également automatisés grâce à l’IA. Le client ne va pas créer des milliers de textes d’un coup, mais la récurrence temporelle assure la volumétrie sur le moyen / long terme.

Ces trois familles d’usages montrent que l’IA générative n'est pas une solution universelle, mais qu'elle peut devenir un atout redoutable lorsqu'elle est appliquée dans des cas précis. En optimisant ces processus récurrents ou à grande échelle, les entreprises peuvent non seulement gagner en productivité, mais aussi en réactivité, tout en réduisant considérablement leurs coûts de production. La clé réside dans l'identification de ces cas d'usage spécifiques et dans la mise en place d'une stratégie de gestion des données qui permette à l'IA de briller dans ces scénarios.

Lorsque l’IA générative est approchée de la bonne manière, les résultats sont impressionnants !

Bien que l'IA générative présente des défis et nécessite une approche méthodique, elle peut produire des résultats remarquables lorsqu'elle est utilisée de manière stratégique, avec des objectifs clairs et une volumétrie suffisante. Lors de cette conférence, nous avons partagé un exemple frappant d'un client @Incremys qui a généré près de 500 000 mots en quelques clics.

Grâce à l'utilisation d'un modèle d'IA spécialement configuré pour son projet, ce client a pu produire 742 pages produits, avec une moyenne de 740 mots par page. Cela montre à quel point l'IA peut transformer la manière dont les entreprises abordent la création de contenu à grande échelle. Au lieu de passer des semaines à rédiger manuellement des centaines de pages, l'IA a permis de réaliser cette tâche en un temps record, tout en respectant les critères spécifiques établis lors du brief initial.

3 éléments clés à retenir

Pour résumer, il est essentiel de garder à l'esprit trois points fondamentaux pour toute entreprise ou organisation souhaitant intégrer l'IA générative :

La réalité technologique ≠ la promesse marketing

Bien que l'IA générative offre des potentialités indéniables, il est crucial de ne pas se laisser emporter par les promesses souvent exagérées des discours marketing. L’IA, bien que puissante, a des limitations importantes, notamment en termes de compréhension et de création autonome. Il est donc nécessaire d’avoir une vision réaliste de ce que cette technologie peut accomplir.

La data : un sujet complexe et central

La qualité des résultats d'une IA dépend directement des données qui lui sont fournies. Les données incorrectes, obsolètes ou mal structurées peuvent entraîner des résultats incohérents, voire dangereux. Une stratégie de gestion des données au cas par cas est donc indispensable pour tirer parti de l'IA de manière efficace et éviter les erreurs coûteuses.

Une approche cas par cas, avec une volumétrie suffisante

L'IA générative ne s'applique pas de manière universelle à tous les cas d’usage. Pour qu'elle soit rentable et efficace, il est nécessaire de la déployer dans des contextes spécifiques avec une volumétrie suffisante pour justifier les coûts fixes. Cela implique une réflexion approfondie sur les besoins de l’entreprise et sur la manière dont l'IA peut les satisfaire, tout en générant des gains significatifs en termes de temps et de ressources.

Conclusion : Il n'y a pas d'IA facile

En conclusion, bien que l’IA générative soit une technologie puissante, elle reste limitée par la qualité et la gestion des données qui l'alimentent. Pour tirer parti de ses capacités, il est essentiel d’identifier les bons cas d'usage puis d’établir une stratégie de données rigoureuse. Les promesses marketing peuvent être séduisantes, mais il ne faut pas sous-estimer la complexité et les coûts inhérents à la mise en place de solutions basées sur l'IA.

Aujourd’hui nous observons une accélération importante des usages de l’IA de la part de tous nos clients afin de gagner du temps dans la création de contenus. Beaucoup de marques font confiance à Incremys et Sparkneo pour les accompagner sur leur enjeux d’automatisation par IA générative.

N'hésitez pas à prendre contact avec notre équipe pour discuter de la manière dont notre IA personnalisée peut répondre spécifiquement à vos besoins.

Exemple concret

Le SEO nouvelle génération commence ici

Complétez le formulaire pour que l’on puisse vous contacter.

Complétez le formulaire pour que l’on puisse vous contacter.

Complétez le formulaire pour que l’on puisse vous contacter.

Complétez le formulaire pour que l’on puisse vous contacter.

Complétez le formulaire pour que l’on puisse vous contacter.

Le SEO nouvelle génération
est en marche !

Merci pour votre demande, nous revenons vers vous rapidement.

Oops! Something went wrong while submitting the form.