Le monde de l’intelligence artificielle est en émoi après les révélations concernant Guillaume Lample, cofondateur de Mistral AI. Ce dernier est accusé d’avoir sciemment ignoré les droits d’auteur en exploitant des bases de données non autorisées durant son passage chez Meta. Alors que le débat sur l’éthique des données prend de l’ampleur, cette affaire soulève de nombreuses questions sur les pratiques des géants de la tech.
Résumé en 3 points
Guillaume Lample, aujourd’hui figure de proue de Mistral AI, a vu sa réputation entachée par des pratiques discutables durant son passage chez Meta. Selon les informations révélées par Mediapart, il aurait encouragé ses équipes à télécharger massivement des données protégées, utilisant des ressources telles que Library Genesis, une bibliothèque pirate bien connue.
Les échanges internes de Meta, désormais accessibles au public, éclairent sur cette affaire. Une chercheuse de l’entreprise s’était opposée à l’utilisation de ces données, qualifiant cela de « ligne rouge ». Cependant, Lample aurait justifié ces actions en affirmant que d’autres grandes entreprises, comme OpenAI et Google, faisaient de même.
La question est désormais de savoir si de telles pratiques ont influencé le développement des modèles de Mistral AI, notamment le modèle Mistral 7B, lancé en septembre 2023. Les soupçons sont renforcés par un mail interne de Meta qui évoque l’utilisation de Library Genesis par Mistral pour ses modèles.
Jusqu’à présent, ni Guillaume Lample ni Mistral AI n’ont commenté les allégations. Cette situation jette une ombre sur leur modèle d’affaires et pourrait avoir des conséquences sur leur réputation dans le secteur de l’intelligence artificielle.
Ce scandale met en lumière les défis éthiques auxquels sont confrontées les entreprises technologiques concernant l’utilisation des données. L’utilisation non autorisée de bases de données protégées soulève des questions sur la légalité et l’éthique des méthodes utilisées pour former des modèles d’IA.
Des affaires similaires ont déjà vu le jour, notamment le procès entre le New York Times et OpenAI. Ces événements rappellent l’importance de respecter les droits d’auteur et de trouver des méthodes éthiques pour l’entraînement des intelligences artificielles.
Mistral AI, fondée en 2023 par Guillaume Lample, Timothée Lacroix, et Arthur Mensch, s’est rapidement positionnée comme un acteur majeur de l’intelligence artificielle en France. Leur premier modèle, Mistral 7B, a marqué leur entrée sur le marché en septembre 2023. Cependant, cette rapide ascension est aujourd’hui remise en question par les controverses entourant leurs pratiques de collecte de données.
Guillaume Lample, avant de cofonder Mistral AI, avait travaillé chez Meta, entreprise mondiale de la technologie. C’est durant cette période que les pratiques discutables en matière d’utilisation de données ont été mises en lumière. Alors que Mistral AI continue de se développer, ces révélations risquent de peser sur son avenir et celui de ses dirigeants.