Des solutions d'affaires
Informatique, téléphonie
Trucs et astuces
Mode de vie
10.02.2025 14:00

Partager avec d'autres :

Partager

DeepSeek : Pourquoi le monde entier devient-il fou ? Que se passe-t-il en arrière-plan ?

Nous savions que cela arriverait, mais c’est arrivé beaucoup plus tôt que prévu. Même aux États-Unis, ils pensaient avoir au moins un an ou deux d’avance avant que la Chine ne les rattrape dans le domaine de l’intelligence artificielle.
DeepSeek : Pourquoi le monde entier devient-il fou ? Que se passe-t-il en arrière-plan ?

DeepSeek est un nom qui a semé la peur au sein des plus grandes entreprises américaines. Ce n’est pas seulement OpenAI qui a lancé l’engouement pour l’intelligence artificielle (IA) générative, mais aussi Google, Microsoft, Anthropic, Meta, Amazon et tous les autres qui pensaient à tort qu’ils domineraient au moins un peu plus longtemps et attireraient des milliards d’investissements ont eu peur.

Lorsque l’entreprise chinoise DeepSeek a dévoilé son modèle d’intelligence artificielle le mois dernier, elle a ébranlé les fondements américains en affirmant que son modèle était équivalent, voire, à certains égards, meilleur que celui des États-Unis, et ce à une fraction du prix. Le modèle DeepSeek-V3 ne nécessiterait que 6 millions de dollars de puissance de calcul pour être formé, ce qui n'inclut pas « les recherches préalables et les expériences d'ablation sur les architectures, les algorithmes ou les données ».

Immédiatement après sa sortie, DeepSeek a dépassé ChatGPT en termes d'évaluation dans l'App Store d'Apple, et le nombre de téléchargements augmente également régulièrement.

Les conséquences ont été énormes. Aux États-Unis, on se demande si les énormes investissements dans l’IA étaient vraiment nécessaires si leurs collègues chinois étaient capables d’obtenir le même résultat avec de maigres investissements. Les actions des entreprises, dont Nvidia, ont chuté et la question s'est à nouveau posée de savoir si c'était le moment où la bulle de l'IA allait éclater.

D’un autre côté, beaucoup se demandent si DeepSeek est vraiment aussi révolutionnaire que le prétend l’entreprise. Est-ce qu’ils cachent quelque chose ? Qu’ont-ils utilisé pour entraîner leur modèle ?

Qu'est-ce que DeepSeek ?

DeepSeek est le nom d'une startup, d'un modèle linguistique à grande échelle et d'un chatbot qui fonctionne de manière similaire à ChatGPT, Gemini et Copilot. L'apparence, le mode d'utilisation et le mode de communication sont presque identiques aux solutions américaines, la transition a donc été très facile pour les utilisateurs et l'utilisation était déjà familière.

Quelle est sa puissance et est-il vraiment meilleur que ChatGPT et les autres ? L'entreprise affirme qu'il est aussi puissant que le modèle o1 d'OpenAI, sorti à la fin de l'année dernière, pour des tâches comme les mathématiques et le codage. OpenAI a récemment introduit un nouveau modèle, le o3, qui serait plus puissant que tous les modèles testés, mais qui n'est pas encore disponible au public pour les tests.

Le dernier modèle R1 (DeepSeek) est un modèle de langage de raisonnement. Même que le modèle o1 d'OpenAI. Ces modèles génèrent des réponses progressivement et simulent la façon dont les gens réfléchissent aux problèmes ou aux idées.

Intelligence artificielle DeepSeek ChatGPT-1

Le plus grand choc a été le fait que seulement 6 millions de dollars ont été dépensés pour la formation du modèle V3 qui alimente le chatbot. À titre de comparaison, OpenAI a dépensé plus de 100 millions de dollars pour le développement du modèle GPT-4, et Meta a dépensé environ 60 millions de dollars pour Llama. Ils ont réussi à le faire malgré les restrictions commerciales qui ont empêché la Chine d’avoir officiellement accès aux dernières puces depuis un certain temps.

Le fondateur de DeepSeek aurait stocké des puces Nvidia A100, dont l'exportation vers la Chine est interdite depuis septembre 2022. Certains experts pensent qu’il a combiné ces puces avec d’autres moins chères et moins sophistiquées, ce qui a donné lieu à un processus beaucoup plus efficace. DeepSeek utilise également moins de mémoire que ses concurrents, ce qui réduit en fin de compte le coût d’exécution des tâches pour les utilisateurs.

Il y a également des rumeurs selon lesquelles la société utiliserait en fait les dernières puces Nvidia H100, mais il n'y a aucune preuve concrète et la société n'a pas encore commenté les « allégations ».

Une nouvelle étude indépendante de SemiAnalysis indique qu'ils ont dépensé environ 500 millions de dollars en matériel. Leur rythme fulgurant de développement de modèles d'IA équivalents est également scruté par OpenAI, qui soupçonne l'entreprise chinoise d'avoir « distillé ses modèles ».

Peu de temps après son lancement et sa popularité croissante dans l'Apple Store, DeepSeek a commencé à connaître des pannes. Le chatbot était indisponible pendant longtemps et les entreprises et les développeurs n’avaient pas accès à son API. La société a annoncé avoir été la cible d'attaques malveillantes, ce qui a ralenti ses opérations et restreint temporairement les enregistrements.

Qui mène la révolution de l’IA en Chine ?

DeepSeek n’est pas apparu du jour au lendemain, mais jusqu’au mois dernier, il n’a pas attiré beaucoup d’attention médiatique, même s’il était connu pour développer des modèles d’IA. La startup est détenue majoritairement par Liang Wenfeng, qui est également le cofondateur du fonds d'investissement High-Flyer. Ce dernier a annoncé en mars 2023 qu'il lançait un nouveau projet et créait un « nouveau groupe de recherche indépendant pour explorer l'essence de l'intelligence artificielle générale ». Quelques mois plus tard, nous avons acquis la société DeepSeek. Ils ont attiré des talents jeunes et expérimentés principalement en leur promettant des salaires élevés et la possibilité de travailler sur des projets de recherche uniques.

On ne sait pas exactement combien High-Flyer a investi dans DeepSeek. High-Flyer possède un bureau dans le même bâtiment que DeepSeek et, selon les données des registres des sociétés chinoises, il détient également des brevets liés aux puces utilisées pour former des modèles d'intelligence artificielle.

Comment procéder ?

DeepSeek a décrit dans la recherche comment il entraîne ses modèles. Comme l'entreprise officielle n'a pas accès aux mêmes puces que ses concurrents américains, elle a dû trouver un autre moyen.

Les principaux systèmes d’intelligence artificielle acquièrent leurs compétences en trouvant des modèles dans de grandes quantités de données, notamment du texte, des images et des sons. DeepSeek a décrit un moyen de distribuer cette analyse de données sur plusieurs modèles d’IA spécialisés tout en minimisant le temps perdu à transférer des données d’un endroit à un autre.

Des méthodes similaires ont déjà été utilisées par d’autres, mais le déplacement des données entre les modèles a généralement réduit l’efficacité. DeepSeek a fait cela d’une manière qui lui a permis d’utiliser moins de puissance de calcul.

Le coût et la méthode de formation ne sont pas les seules différences par rapport aux autres modèles d’IA. DeepSeek est également open source, ce qui signifie qu'il peut être téléchargé, utilisé et mis à niveau par pratiquement n'importe qui.

En revanche, les modèles de Meta et de Google, bien que accessibles à tous, ne sont pas considérés comme véritablement open source, car la manière dont les utilisateurs utilisent les modèles est limitée par des licences, et les ensembles de données de formation ne sont pas accessibles au public, et ont également fait l'objet de nombreux procès. Par exemple, Facebook, ou Meta, est engagé dans une bataille juridique avec des auteurs qui accusent l’entreprise d’utiliser des copies piratées de leurs livres à des fins pédagogiques. Le New York Times poursuit Microsoft et OpenAI pour avoir prétendument utilisé leur contenu à des fins d'apprentissage sans autorisation.

L’une des raisons pour lesquelles les modèles d’interface utilisateur américains ne sont pas open source est la plus grande possibilité de diffuser de fausses informations, des discours de haine, etc., mais la principale raison est certainement le profit et davantage d’opportunités de monétiser les modèles d’interface utilisateur.

Les modèles open source chinois, selon les experts, peuvent démocratiser l’intelligence artificielle, ce qui pourrait grandement miner la stratégie des entreprises américaines. La crainte est que les entreprises et les scientifiques américains commencent également à utiliser DeepSeek pour développer et construire leurs propres solutions.

En Chine, le dernier modèle a déjà été utilisé par des sociétés de télécommunications, et Geely est le premier constructeur automobile à intégrer le modèle DeepSeek dans les systèmes intelligents de ses voitures.

Pendant ce temps, ailleurs dans le monde, on envisage déjà un éventuel blocus. L'Italie, l'Irlande, la Belgique, les Pays-Bas et la France sont des pays qui ont déjà lancé une enquête sur la manière dont DeepSeek utilise et stocke les données et sur la possibilité qu'il viole les réglementations européennes sur les données. DeepSeek est bloqué préventivement en Italie, et son utilisation est également interdite en Corée du Sud et en Australie.

DeepSeek affirme avoir pris toutes les mesures de sécurité pour protéger les données qu'il stocke en Chine. Mais il n’a pas fallu longtemps avant que les experts découvrent que l’entreprise avait accidentellement laissé des millions de lignes de données non sécurisées, y compris des clés logicielles, des journaux, des chats, etc.

Cisco a analysé le dernier acteur de l'IA et a découvert que « DeepSeek R1 manque de protections robustes, ce qui le rend très vulnérable aux percées algorithmiques et aux abus potentiels ».

Un nouveau front s'est ouvert

En janvier 2025, les États-Unis étaient le seul cheval en course et les cavaliers américains n'avaient pas besoin de se tourner vers qui que ce soit dans l'arrière-pays. La Chine leur souffle désormais dans le cou. Un front commercial et technologique est ouvert depuis un certain temps entre les États-Unis et la Chine, et DeepSeek a ouvert un nouveau front où se décidera le sort de l’intelligence artificielle.


Vous souhaitez en savoir plus sur ce sujet ?
ChatGPT Copilote Recherche profonde intelligence artificielle


Que lisent les autres ?