Google veut que les contenus en ligne servent à entraîner les IA

L’intelligence artificielle (IA) nous étonne par ses performances dans de nombreux domaines. Mais comment les IA apprennent-elles à faire ce qu’elles font ?

La réponse est simple : en se nourrissant de données massives qui proviennent du web. C’est grâce à ces données que des IA comme ChatGPT et Bard ont pu acquérir des connaissances et des compétences qui leur permettent de comprendre le monde réel de façon précise.

Mais cette méthode d’apprentissage pose des questions juridiques et éthiques, notamment sur le respect des droits d’auteur. Google, qui utilise largement les données en ligne pour entraîner ses IA, a proposé de modifier la législation actuelle sur ce sujet.

Dans cet article, nous découvrirons cette proposition et ses implications.

La proposition de Google sur l’accessibilité des contenus en ligne aux IA

Google a proposé que tout le contenu en ligne soit accessible aux IA pour l’entraînement, sauf si les éditeurs ne sont pas d’accord. Dans une proposition adressée au gouvernement australien, le moteur de recherche a plaidé pour une modification des lois sur le droit d’auteur existantes.

Google souhaite que l’IA puisse accéder à tous les contenus numériques, sauf si les éditeurs choisissent de ne pas participer. Le géant du web a présenté cette proposition au gouvernement australien pour inciter ce dernier à modifier les lois sur le droit d’auteur actuelles.

Si ces lois venaient à changer, la responsabilité reviendra aux marques et aux éditeurs de prévenir l’exploitation de leurs contenus par l’IA.

En cas d’échec, ils pourraient se voir concurrencés par du contenu très similaire et ne pas être en mesure de faire valoir leurs droits, ce qui pourrait nuire considérablement à une campagne en termes d’image et d’identité.

Dans sa lettre adressée au gouvernement australien, Google affirme : 

« Les systèmes de droit d’auteur qui permettent une utilisation appropriée et équitable du contenu protégé par le droit d’auteur pour l’entraînement des modèles d’IA en Australie sur une gamme large et variée de données, tout en soutenant des retraits optionnels viables pour les entités qui préfèrent que leurs données ne soient pas utilisées dans les systèmes d’IA.« 

Le moteur de recherche a déjà présenté des cas similaires au gouvernement australien, en soutenant que l’IA devrait pouvoir utiliser de manière équitable le contenu en ligne à des fins d’entraînement.

Mais c’est la première fois que Google suggère une clause d’exclusion pour répondre aux préoccupations précédentes.

Quel est le plan de Google avec les contenus et l’IA ?

Google ne dispose pas encore d’un plan spécifique, mais a exprimé son souhait d’établir des discussions pour mettre en place une norme web développée par la communauté.

Il peut s’agit de quelque chose semblable au système robots.txt, qui permet aux éditeurs d’empêcher les moteurs de recherche de parcourir leurs contenus.

Quant à cela, Danielle Romain, vice-présidente de la confiance chez Google Search, a annoncé lors d’un communiqué de presse le mois dernier que :

« Un écosystème de contenu dynamique profite à tous. La clé est que les éditeurs de web aient le choix et le contrôle sur leurs contenus et des possibilités de tirer profit de leur participation à l’écosystème du web.

Cependant, nous reconnaissons que les contrôles existants des éditeurs de web ont été développés avant l’émergence des nouvelles utilisations de l’IA et des recherches.

Nous pensons qu’il est temps que la communauté web et l’IA étudient des moyens supplémentaires, lisibles par machine, pour le choix et le contrôle des éditeurs de web pour les utilisations émergentes de l’IA et les cas de recherche.« 

En d’autres termes, il est important d’avoir un écosystème de contenu dynamique qui profite à toutes les parties impliquées.

L’idée centrale est que les éditeurs de sites web devraient avoir la liberté de décider et de contrôler leurs contenus, tout en étant en mesure de bénéficier de leur participation à l’écosystème en ligne.

En résumé

Pour conclure, Google souhaite que les législations soient favorables à l’utilisation des contenus en ligne pour entraîner les intelligences artificielles. Le but est de permettre aux créateurs de contenus de décider par eux-mêmes si leurs contenus peuvent être accessibles aux IA.

Catégories SEO

Fondateur de l'agence SEO Twaino, Alexandre Marotel est passionné par le SEO et la génération de trafic sur internet. Il est l'auteur de nombreuses publications, et détient une chaine Youtube qui a pour but d'aider les entrepreneurs à créer leurs sites web et à être mieux référencés dans Google.

Laisser un commentaire