Maison > Nouvelles > Les modèles d'IA de DeepSeek sous le feu des critiques pour utilisation présumée de données d'OpenAI

Les modèles d'IA de DeepSeek sous le feu des critiques pour utilisation présumée de données d'OpenAI

By BenjaminDec 24,2025

OpenAI soupçonne que les modèles d'IA DeepSeek de la Chine, connus pour leur faible coût, aient été développés en utilisant des données d'OpenAI.

Le président Donald Trump a qualifié DeepSeek de "réveil" pour les entreprises technologiques américaines cette semaine, tandis que Nvidia perdait près de 600 milliards de dollars de valeur boursière.

L'ascension de DeepSeek a déclenché un déclin brutal des actions des entreprises axées sur l'IA. Nvidia, un important fournisseur de GPU pour l'IA, a vu son action chuter de 16,86 %, marquant la plus grande perte en une seule journée à Wall Street.

Microsoft, Meta Platforms et Alphabet, la société mère de Google, ont chuté entre 2,1 % et 4,2 %, tandis que Dell Technologies, un fabricant de serveurs IA, a baissé de 8,7 %.

DeepSeek présente son modèle R1 comme une alternative économique à l'IA occidentale comme ChatGPT. Basé sur l'open source DeepSeek-V3, il nécessiterait moins de puissance de calcul et aurait été entraîné pour environ 6 millions de dollars.

Bien que certains mettent en doute cette affirmation, DeepSeek a suscité des inquiétudes quant aux investissements massifs en IA des géants technologiques américains, perturbant les investisseurs. La popularité du modèle a explosé, atteignant le sommet du classement des téléchargements d'applications gratuites aux États-Unis, alimentée par le buzz autour de ses performances.

Bloomberg a rapporté qu'OpenAI et Microsoft enquêtent pour savoir si DeepSeek a utilisé l'API d'OpenAI pour incorporer ses modèles d'IA dans les siens. "Nous savons que des entreprises basées en RPC et d'autres tentent de manière persistante d'extraire les principaux modèles d'IA américains", a déclaré OpenAI à Bloomberg.

La distillation, une méthode par laquelle les développeurs entraînent une IA en extrayant des données de modèles plus grands, viole les conditions d'utilisation d'OpenAI.

"En tant que développeur d'IA de premier plan, nous prenons des mesures pour sauvegarder notre propriété intellectuelle, en choisissant soigneusement quelles fonctionnalités avancées inclure dans les modèles publiés. À l'avenir, nous croyons qu'une collaboration étroite avec le gouvernement américain est vitale pour protéger nos modèles les plus avancés contre les adversaires et les concurrents", a déclaré OpenAI.

David Sacks, conseiller en IA du président Trump, a déclaré à Fox News : "Il existe des preuves solides que DeepSeek a distillé des connaissances à partir des modèles d'OpenAI, et OpenAI n'est pas content. Attendez-vous à ce que les principales entreprises d'IA prennent des mesures contre la distillation dans les prochains mois."

DeepSeek est accusé d'avoir entraîné son IA avec le modèle d'OpenAI par distillation. Crédit image : Andrey Rudakov/Bloomberg via Getty Images.

Des critiques ont relevé l'ironie, OpenAI ayant elle-même été accusée d'utiliser des données d'internet pour construire ChatGPT. L'écrivain tech Ed Zitron a tweeté : "Je ne peux pas m'arrêter de rire. OpenAI, construite en aspirant tout internet, est contrariée parce que DeepSeek a peut-être utilisé des sorties de ChatGPT pour l'entraînement. Ils jouent les victimes - quelle hypocrisie."

En janvier 2024, OpenAI a déclaré qu'il était "impossible" de développer des outils comme ChatGPT sans matériel protégé par le droit d'auteur.

Dans une soumission au comité des communications et du numérique de la Chambre des Lords britannique, OpenAI a soutenu que l'entraînement de grands modèles de langage comme ChatGPT nécessite du contenu protégé par le droit d'auteur.

"Puisque le droit d'auteur couvre presque toutes les formes d'expression humaine — posts de blog, photos, discussions de forums, extraits de code et documents gouvernementaux — il est impossible d'entraîner les meilleurs modèles d'IA actuels sans matériel protégé", a expliqué OpenAI dans sa soumission, comme rapporté par le Telegraph.

"Limiter les données d'entraînement à des livres et dessins du domaine public vieux de plus d'un siècle pourrait être un test intéressant, mais cela ne produirait pas de systèmes d'IA répondant aux besoins d'aujourd'hui", a ajouté OpenAI.

L'entraînement de l'IA sur du matériel protégé par le droit d'auteur est devenu un débat majeur dans la tech avec l'essor de l'IA générative. En décembre 2023, le New York Times a poursuivi OpenAI et Microsoft pour "utilisation illégale" de son contenu pour développer leurs produits. En réponse, OpenAI a qualifié l'entraînement d'"usage loyal" et a déclaré : "Nous soutenons le journalisme, collaborons avec des organes de presse, et croyons que le procès du New York Times est infondé."

Le procès du New York Times a suivi une plainte en septembre 2023 de 17 auteurs, dont George R. R. Martin de Game of Thrones, qui accusaient OpenAI de "vol systématique à grande échelle".

En août 2023, la juge de district Beryl Howell a confirmé une décision du Bureau américain du droit d'auteur stipulant que l'art généré par IA ne peut être protégé par le droit d'auteur. La décision de 2018 soulignait que "le lien entre l'esprit humain et l'expression créative" est essentiel pour la protection par le droit d'auteur.

Article précédent:Cookie Run : Kingdom dévoile un aperçu du nouveau mode de création de personnages personnalisé MyCookie Article suivant:Pokémon TCG Pocket lance l'événement Métal Ravageur