Ecran d’accueil d’un smartphone affichant plusieurs icones d’application IA
Ecran d’accueil d’un smartphone affichant plusieurs icones d’application IA

De nombreux organes de presse et sites internet ont choisi de fermer leur porte à GPTBot, le robot aspirateur de données lancé par OpenAI. — Photography OLIVIER MORIN / AFP© 

GPTBot, le robot aspirateur de données d’OpenAI pour nourrir son IA générative, est rejeté par de nombreux médias et sites internet. Lancé début août 2023, il est accusé de « piller » les contenus sans autorisation ni rémunération. 

GPTBot : quand le robot qui crée ChatGPT se fait rejeter par les géants de l’information 

Les géants de l’information tels que The New York Times, CNN, le diffuseur australien ABC, et les agences de presse Reuters et Bloomberg ont unanimement fait front contre l’incursion digitale du GPTBot, un robot silencieusement déployé par OpenAI le 8 août, donnant naissance à ChatGPT. 

L’objectif affiché de ce nouvel acteur ? Scruter inlassablement les données de sites internet volontaires, afin d’alimenter les modèles d’intelligence artificielle générative. 

Pourtant, cette startup californienne, ayant explicitement divulgué les méthodes pour bloquer l’accès de GPTBot aux données d’un site, se heurte à une résistance croissante au sein de la sphère numérique. 

Face à cet aspirateur de données : les sites internet bloquent l’accès à la collecte automatisée  

D’après Originality.ai, un outil de détection des plagiats, environ 10 % des 1 000 sites les plus influents au niveau mondial avaient opposé une fin de non-recevoir à GPTBot deux semaines après son lancement en tant qu’aspirateur de données. Parmi ces sites figurent des poids lourds tels qu’Amazon.com, Wikihow.com, Quora.com, ainsi que la plateforme de stockage d’images Shutterstock. Cette liste devrait s’allonger de manière significative, avec Originality.ai estimant que la proportion de sites interdisant l’accès à GPTBot pourrait augmenter de 5 % chaque semaine. 

En France, GPTBot se voit désormais qualifié de « robot non grata ». C’est du moins ce que l’on peut observer sur les plateformes de France Médias Monde (France 24 et RFI), Radio France, Mediapart et TF1. L’opposition grandissante à GPTBot souligne les préoccupations croissantes liées à la collecte automatisée des données sur la toile. 

OpenAI : Radio France dénonce le pillage de ses contenus sans autorisation 

« Dans les premières 24 heures suivant l’annonce de GPTBot, nous avons immédiatement évalué les actions à entreprendre », se remémore Laurent Frisch, le directeur du numérique et de la stratégie d’innovation au sein du groupe Radio France, lors d’un échange avec l’AFP. La réaction rapide découle du souci majeur suscité par « le pillage non autorisé de nos contenus » par le service d’OpenAI, comme l’a justifié Sibyle Veil, présidente de Radio France, lors d’une conférence de presse tenue lundi.

Elle a expliqué que le fait que GPTBot explore leurs contenus sans leur consentement était inacceptable. Elle insiste sur le manque de transparence sur les intentions et les utilisations prévues pour ces contenus. Laurent Frisch a renchéri en exprimant la nécessité de connaître les détails et les implications de l’utilisation des contenus collectés. 

Intelligence artificielle et médias : quels enjeux pour la fiabilité de l’information ? 

L’IA générative, opérant sur un modèle probabiliste, soulève des préoccupations quant à l’association de leurs données avec d’autres, pouvant être plus ou moins exacte, voire erronée. C’est ce qu’a souligné Vincent Fleury, directeur des environnements numériques de France Médias Monde. C’est dans cette optique que Bertrand Gié, directeur du pôle News du Figaro et président du Geste (Groupement des éditeurs de services en ligne), plaide pour que « les plateformes sourcent l’ensemble des médias ».

Cette mesure vise à garantir la neutralité et à éviter toute tentative de manipulation dans la diffusion de l’information. Cela évoque ainsi l’importance cruciale de la transparence et de la véracité des sources dans le paysage médiatique actuel. 

IA générative : un défi pour la valorisation du travail journalistique 

Les médias français ne veulent pas se laisser déposséder de leurs contenus par les géants de l’IA générative, comme OpenAI et son robot GPTBot. Ces outils d’intelligence artificielle sont capables de produire des textes originaux à partir de sources diverses, sans rémunérer les auteurs. « L’idée c’est de ne pas se faire duper. Subir le pillage de nos contenus par ces entreprises qui en tirent ensuite des bénéfices, cela ne peut perdurer indéfiniment », résume Vincent Fleury, directeur général adjoint du Parisien.  

Face à cette menace, les médias français réclament des accords de licence et de rémunération pour leurs contenus. Bertrand Gié, directeur du pôle news du Figaro, ajoute que les organes de presse doivent être récompensés de manière équitable. Ils aspirent ainsi à obtenir des accords de licence et de compensation appropriée. Des discussions sont en cours avec OpenAI et d’autres acteurs de l’IA générative ayant pour finalité de valoriser le travail journalistique dans cette ère numérique en constante évolution. 

Une alliance voit le jour aux États-Unis pour renforcer le journalisme local 

Aux États-Unis, l’agence de presse Associated Press (AP) a ouvert la voie en juillet en concluant un accord novateur avec OpenAI. Cet accord permet à AP d’accéder et d’utiliser ses archives datant de 1985 en échange d’un partage de technologie et d’expertise en Intelligence artificielle avec l’entreprise de Sam Altman.

En plus de cette collaboration, l’entreprise mère de GPTBot et ChatGPT s’est engagée à verser cinq millions de dollars à l’American Journalism Project, une organisation qui soutient la presse locale. De plus, jusqu’à cinq millions de dollars de crédits sont alloués pour l’utilisation de son interface de programmation (API), facilitant l’intégration d’outils d’IA par les journalistes dans leur processus de production. Cette initiative marque un pas important vers l’association entre médias traditionnels et technologie d’IA. 

Comment préserver l’éthique et la qualité des informations face au raisonnement artificiel ? 

Au-delà de la médiatisation d’OpenAI avec ChatGPT, il est essentiel de noter que le secteur des médias voit fleurir de nombreuses start-up œuvrant dans divers domaines liés à l’IA, comme le rappelle Mediapart. Cette multiplication des acteurs suscite un appel à un « débat ouvert sur la régulation » et sur les répercussions de « toutes les formes d’IA » (GPTBot et consorts) dans le panorama médiatique actuel. 

Cette préoccupation grandissante a conduit dix groupes de médias internationaux, parmi lesquels l’AFP, The Associated Press et le groupe Gannett/USA Today, à interpeller les leaders politiques et les acteurs du secteur en août dernier. Ils plaident en faveur d’un encadrement rigoureux de l’utilisation de l’IA dans la production et la diffusion de l’information, soulignant ainsi l’importance cruciale d’une régulation adaptée pour préserver l’intégrité de l’information. 

Avec ETX / DailyUp 

Article similaire