Le contenu publié sur Reddit sera utilisé par OpenAI pour former son bot ChatGPT. Cela sera possible grâce à l'accord conclu la semaine dernière par les deux sociétés. Il permet à OpenAI d'accéder à l'API de Reddit, ce qui lui donnera un accès en temps réel aux publications de Reddit.
Dans le cadre du partenariat, Reddit aura accès à de grands modèles de langage OpenAI (LLM), qu'il utilisera dans ses opérations. Il convient de rappeler que Reddit a conclu un accord similaire avec Google plus tôt cette année. L'accord stipule également qu'OpenAI commencera à diffuser ses publicités sur Reddit. Les deux sociétés n'ont pas encore dévoilé les conditions financières de l'accord. Cependant, étant donné que le partenariat de Reddit avec Google était estimé à 60 millions de dollars, il pourrait s'agir d'un montant similaire.
Rappelons qu’il y a presque exactement un an, Reddit commençait à facturer l’accès à son API de données. Cette décision a conduit de nombreuses entreprises à suspendre leurs services utilisant du contenu publié sur Reddit, ce qui a suscité de vives critiques de la part des utilisateurs utilisant ces services. Reddit s'est défendu en affirmant que la conclusion d'accords de licence de données constituait une partie essentielle de son activité. L’utilisation de contenu généré par les utilisateurs pour alimenter des modèles d’intelligence artificielle, sans que les utilisateurs ne reçoivent de compensation, est depuis longtemps controversée.
L'accord avec Reddit place OpenAI devant un nouveau défi. Le fait est que le contenu publié sur Reddit contiendra probablement de fausses informations, ce qui entraînera un mauvais fonctionnement de l'intelligence artificielle qui l'utilise. Malgré cela, de nombreuses entreprises travaillant dans le domaine de l'intelligence artificielle générative utilisent volontiers l'accès aux contenus publiés sur des sites tels que Reddit, ce qui soulève des questions sur cette méthode de formation de divers types de robots IA.
