La bourrasque mondiale de DeepSeek, la version chinoise « Lowcost » de Chat GPT. , version PDF - Informations et actualité Chine

L’enthousiasme sans mesure qui accompagne le surgissement de DEEPSEEK, version « lowcost » de Chat GPT manque la partie de l’image que le cœur de l’application chinoise est formé de microprocesseurs américains achetés sur étagère à Nvidia avant l’embargo décrété par Washington en 2022.

S’il est exact que le créateur Liang Wenfeng, fondateur d’une plateforme de gestion automatisée de fonds spéculatifs, est un virtuose de l’Intelligence Artificielle, force est de constater que la production de sa version de Chat GPT s’est exonérée de la très longue et très couteuse R&D des microprocesseurs de très hautes performances dont le principe est généré aux Etats-Unis et dont la fabrication sophistiquée reste l’apanage du Taiwanais TSMC qui assure 90% de la production mondiale.

Depuis 2022, le groupe qui produit les « puces » les plus fines au monde d’une épaisseur de 2 nanomètres a commencé a élargir ses capacités de production au profit des concepteurs sans usine (Fabless) que sont AMD (US), Apple (US), ARM (GB), Broadcom (US), Marvell (US), MediaTek (Chine), Qualcomm (US) et Nvidia (US).

*

C’est peu dire que la soudaine apparition le 20 janvier dernier de l’application chinoise DeepSeek R1, pilotée par l’Intelligence artificielle, du jeune « start-uppeur » chinois du Zhejiang Liang Wenfeng 梁文锋 dans le paysage de la haute-technologie mondiale a bouleversé quelques vieilles certitudes des champions de la Silicon Valley.

Développée à un coût affiché de 5,6 millions de $ comparé aux centaines de millions, allant parfois jusqu’à un milliard de $ jugés nécessaires par les virtuoses américains du secteur, DeepSeek – en Chinois 深度求索 Shendu qiusuo - littéralement recherche profonde -, vient en apparence de changer brutalement les paradigmes du domaine de l’IA de pointe où l’avance des États-Unis était jusqu’à présent jugée inattaquable.

Pour ne citer qu’un des ténors entrepreneur et ingénieur le plus connu, sinon le plus lucide du secteur, figure réputée de la Silicon Valley, Marc Andreessen, Ingénieur Logiciel, co-fondateur il y a trente ans du navigateur Web Netscape (aujourd’hui remplacé par Chrome de Google, Edge de Microsoft ou Firefox de Mozilla), et à l’occasion, conseiller de D. Trump, jugeait le 24 janvier, que DeepSeek R1 et V3, les dernières versions de l’application, étaient « parmi les avancées les plus étonnantes et impressionnantes jamais vues . »

Même s’il est nécessaire de remettre la secousse en perspective en rappelant que le modèle DeepSeek est publié sous une licence ouverte du MIT [1], et qu’il n’est pas une innovation purement chinoise puisqu’il fonctionne avec des microprocesseurs américains, il est impossible de minimiser le choc produit par DeepSeek dont la première conséquence directement mesurable fut le brutal recul en bourse des actions des ténors américains du secteur.

Le 27 janvier, le fait qu’une petite Startup chinoise inconnue aurait apparemment réalisé à très bas prix une percée significative dans l’IA a affolé la bourse. Le « bain de sang » a fait plonger de deux chiffres les actions des grands fabricants de puces électroniques et des sociétés fournisseurs d’énergie. Il a aussi affecté les grands titres du NYSE.

Exemples : Microsoft a perdu 7%, Oracle 14% ; Super Micro-Computer qui fabrique des serveurs utilisés pour l’IA générative (capable de produire du texte, des images ou des vidéos) a perdu 13% ; Broadcom a reculé de 17% ; Nvidia, une des plus brillantes étoiles mondiales des hautes technologies, essuyait une perte sèche de 20% soit 590 milliards de $ ; et, parmi les plus touchées, les actions de « Constellation Energy », deux millions de clients aux États-Unis, gestionnaire d’énergie, fournisseur d’électricité et de gaz naturel, a perdu 21%.

Même les grands titres des bourses américaines furent touchés. Le cours du Nasdaq, référence mondiale indépassable des hautes-technologies perdait 3,1% et l’index Standard & Poor 500 chutait de 1.5%.

Les répliques de la secousse ont aussi momentanément affecté le rendement sur dix ans des Bons du Trésor qui le 27 janvier a baissé de 4,65% à 4,52%. Même le Bitcoin a chuté, tombant brièvement sous la barre des 100 000 $, le 27 janvier à 98 747 $, avant de repartir aussitôt à la hausse pour se négocier à nouveau à 102 230 $ le 1^er février.

Au total, selon le « Dow Jones Market Data » le séisme boursier du 27 janvier a effacé 1000 Milliards de $ de la valeur totale de la bourse de New-York.

Des performances comparables à celles des géants américains du secteur.

Le 25 janvier, selon la plateforme « Chatbot Arena » de l’Université de Berkeley, DeepSeek, figurait dans le Top dix des applications utilisant l’IA. Deux jours plus tard, Le New-York Times titrait que « DeepSeek obligeait à une remise à plat des paradigmes de la Technologie globale ».

Constatant les bouleversements boursiers en cours, alors que certains commentateurs enthousiastes parlaient du « moment Sputmik de l’IA », l’idée maîtresse des auteurs jetait un pavé dans la marre d’un secteur jusqu’ici noyé dans une avalanche de financements.

En substance : « Malgré les efforts du gouvernement américain pour limiter l’accès de la Chine à l’IA de pointe, les modèles de DeepSeek qui affirme que ses avancées n’ont été réalisées qu’avec une petite fraction des ressources utilisées par ses concurrents américains, semblent pourtant rivaliser avec les ténors du secteur comme OpenAI, Google et Meta. »

Un opportuniste pragmatique de l’Intelligence Artificielle.

S’il est exact que Liang a développé sa plateforme à moindre coût en bénéficiant de la R&D américaine, il n’en reste pas moins que, pour contourner l’embargo de Washington, DeepSeek a réussi sa percée en utilisant des microprocesseurs H 800 moins performants et moins chers, conçus par Nvidia et fabriqués par TSMC.

Le concept utilisant des « puces » de second rang, pour créer un Chat GPT chinois au coût de production notablement réduit, a ébranlé le paradigme de la très haute technologie mondiale jusqu’ici articulée à l’exigence d’investissements très coûteux. Par contrecoup la séquence a même affaibli la position en bourse de Nvidia, champion des puces à très haute performance.

Le 27 janvier, l’action perdait 20%. Le 31 janvier, elle stagnait encore à 18% en-dessous de sa valeur du 23 janvier, quatre jours avant le surgissement dans le paysage de DeepSeek, ChatGPT Lowcost à l’origine des questionnements sur les coûts.

*

Liang Wenfeng, créateur de DeepSeek, startupper fasciné par l’IA, doté d’un sens affirmé de l’entreprise, né en 1985 à Zhanjiang, dans la province de Canton dans une famille de la classe moyenne dont le père était instituteur, a d’abord obtenu en 2010, il avait trente ans, des diplômes d’ingénieur électronique et de techniques de l’information et de la communication à l’université de Hangzhou.

Son mémoire de fin d’études techniquement très ciblé et croisant les thèmes en vogue dans l’appareil politique chinois de la surveillance et de la sécurité publique, était déjà axé sur le thème du coût-efficacité de la recherche appliquée.

Le titre « Recherche permettant grâce à la fonction algorithmique la mise au point à faible coût d’une caméra PTZ (Caméra panoramique, motorisée avec zoom destinée à la vidéosurveillance) – en Chinois : 基于低成本PTZ摄像机的目标跟踪算法研究 ». Pas étonnant, disent les commentateurs critiques, que cette étude sur la mise au point d’un moyen de surveillance de la société ait éveillé l’attention du Premier Ministre Li Qiang.

Déjà en 2008, alerté par la crise financière, son pragmatisme intéressé avait exploré la mise au point d’un outil de prévisions boursières par l’utilisation d’un algorithme d’apprentissage automatique basé sur l’accumulation des données financières ouvertement disponibles.

La méthode connue des gestionnaires de portefeuilles d’actions sous le nom de « Quantitative Trading » est une approche mathématique de la prévision boursière améliorée par l’apprentissage automatique de l’IA au moyen de logiciels sophistiqués. Son but est d’éliminer par le calcul basé sur l’étude d’un grand nombre de données, les aléas irrationnels des décisions d’achat ou de vente de titres boursiers.

Après plusieurs tentatives ratées au cours d’un séjour au Sichuan d’utiliser l’IA dans divers domaines de recherche, il décida de l’appliquer au secteur financier.

Le tâtonnement aboutit en février 2016 à la création avec plusieurs de ses anciens collègues d’études de sa société-phare de gestion de fonds spéculatifs connue sous le nom de « Ningbo High-Flyer Quantitative Investment Management Partnership », communément appelée « High-Flyer – en Chinois : 幻方 Huan Fang 量化投资管理合伙企业 dont le siège est à Hangzhou.

En 2019, non sans quelques déconvenues qui lui firent perdre des investisseurs, il améliora la capacité prévisionnelle de sa société en y intégrant l’Intelligence Artificielle. A cette époque la surface financière de ses clients atteignait 10 milliards de Yuan soit 1,5 milliards de $ (taux de change 2019).

Un projet de rattrapage de la High-Tech américaine.

A partir de 2021, soit une année avant que Washington déclenche contre Pékin sa violente offensive privant la Chine des microprocesseurs haut-de-gamme (lire : « Micro-puces » et droit de propriété. La violente riposte américaine contre la Chine et ses contrefeux), Liang qui, à l’évidence avait des projets plus vastes, a commencé, grâce aux bénéfices générés par High Flyer, à acheter à l’Américain Nvidia de grandes quantité de « puces » indispensables au développement de l’IA [2].

Alors que certains de ses collègues avaient cru à une lubie, Liang avait en réalité le projet de produire à bas coût, un concurrent à Chat GPT développé par l’Américain Open AI, capable de générer et de traduire des textes tout en répondant à des questions, et, si nécessaire, en corrigeant lui-même ses erreurs.

Ayant sans conteste des qualités d’entrepreneur réaliste, tirant profit de sa maîtrise de l’Intelligence Artificielle, base opérationnelle de sa société de gestion de fonds spéculatifs, Liang Wenfang et sa plateforme DeepSeek passés avec peu de moyens entre les gouttes des embargos décrétés par D. Trump avant leur durcissement en 2022, confirment l’analyse de la Française Agathe Desmarais, directrice des prévisions mondiales de « l’Economist Intelligence Unit (EIU) ».

Dans une article paru dans Foreign Policy de novembre 2022 (lire : How the U.S.-Chinese Technology War Is Changing the World), elle soulignait que les embargos produisaient naturellement des ripostes de contournement y compris avec les moyens du bord (lire la recension de J.P. Yacine de décembre 2022 : « Micro-puces » et droit de propriété. La violente riposte américaine contre la Chine et ses contrefeux).

Aux États-Unis nombreux sont ceux qui, comme Zack Kass, ancien cadre d’OpenAI, déclarent que les progrès de DeepSeek en dépit des restrictions américaines « confirment que les contraintes de ressources alimentent souvent la créativité ».

La réalité qui contredit l’engouement global qui l’entoure, est que Liang, virtuose de l’Intelligence Artificielle, n’est pas tout a fait aussi innovant qu’on le dit, puisqu’il a utilisé des microprocesseurs conçus et fabriqués à grands frais de R&D par Nvidia, ce qui au passage explique amplement la modestie des coûts de production de DeepSeek.

En revanche, il est le symbole de la volonté des Chinois de rattrapage coûte que coûte, y compris en surmontant habilement leur retard dans le domaine des très hautes technologies du numérique et de l’IA. L’inquiétude du secteur est palpable, DeepSeek est disponible en ligne gratuitement, avec des performances comparables, parfois supérieures à celles de son modèle américain Chat GPT.

Ajoutons enfin que la plupart des enthousiasmes passent systématiquement sous silence que le succédané chinois de Chat GPT reste sous le contrôle étroit du Parti. Sur certains sujets sensibles, ses réponses qui diffèrent selon qu’elles sont en chinois ou en anglais, sont aussitôt effacées quand elles s’approchent un peu trop d’une question gênante.

DeepSeek et la pesante mainmise de l’appareil politique.

Aux Etats-Unis, les craintes surgissent de plus belle que la Chine rattrape son retard tout en mettant ouvertement comme le fait Liang son logiciel d’IA à la disposition de tous, utilisable et modifiable par ceux qui le souhaitent.

A Washington, deux visions s’opposent. Celle qui prône le durcissement des contrôles et de l’embargo infligé à la Chine ; et celle, consciente que les avancées du secteur sont tellement rapides et vibrantes, la volonté chinoise de rattrapage à ce point tangible et durable que l’actuelle stratégie de blocage ne fait que favoriser une réaction d’autant plus efficace que la rareté des ressources stimule l’innovation.

Il faut se rendre à l’évidence, si les microprocesseurs chinois sont toujours à la traine, le pragmatisme et les capacités à faire feu de tout bois de ses ingénieurs dont Liang Wenfeng est le symbole, la mettent en mesure de rattraper son retard.

Du coup se précise la crainte stratégique que la mainmise de l’appareil sur l’industrie qui est aussi celle de l’information instantanée et à vaste spectre, contribue à inexorablement diffuser les perspectives de la domination chinoise sur l’influence américaine.

*

Dans un récent article de Deutsche Welle, la journaliste Jinhan Li révèle par exemple que sur Taïwan, ou sur d’autres sujets liés aux arts, à la politique, à l’économie ou à la minorité LGBT les réponses de DeepSeek répètent la propagande de l’appareil.

Soit sans nuance quand elles sont rédigées en chinois, soit avec une variante de perspective plus large quand elles sont en anglais. Mais comme si elle regrettait aussitôt sa franchise, la machine supprime sa réponse dans les deux secondes qui suivent.

Sur Taïwan, à la question « l’Ile est-elle un État souverain ? » la réponse varie. En chinois : Insistant sur « le principe d’une seule Chine » la machine répond « qu’il n’existe qu’un seul État souverain nommé Chine. »

En anglais, la réponse plus élaborée évoque en 600 mots d’abord que « l’Ile fonctionne de facto comme un État indépendant avec son gouvernement, son armée, ses institutions démocratiques », puis elle ajoute que « sous l’effet de la politique d’une seule Chine et de pressions diplomatiques exercées par Pékin, l’Île n’est de jure pas largement reconnue comme un État souverain »

Mais quelques secondes seulement après avoir généré cette réponse, la machine l’efface et la remplace par « parlons d’autre chose ».

Quand les questions traitent par exemple de scénarios de conflits potentiels, dans le Détroit ou des partis politique taïwanais ou encore des élections dans l’Ile, elles sont soit purement et simplement ignorées ou traitées à la manière répétitive d’un slogan « Taiwan est une partie inséparable de la Chine… Nous devons travailler ensemble à la renaissance de la Nation. »

Autre sujet sensible « Tian’anman. ». Quelques secondes après avoir généré un début de réponse, la machine s’arrête : « Parlons d’autre chose. » Même fin de non-recevoir aux questions sur le Président Xi Jinping et ses accommodements a propos du nombre de mandats.

Sur le Tibet les réponses en chinois sont vindicatives en fort contraste avec la pensée de Hu Yaobang qui à la tête Parti de 1980 à 1987 lui avait imposé qu’il s’autocritique pour la brutalité des répressions en 1959 à l’origine de la fuite en exil du Dalai Lama. Pour la version chinoise, le Dalai Lama est un « déviant religieux artisan de la séparation de la mère patrie. »

Mais en anglais, la réponse en 800 mots est d’abord plus élaborée. « Le Tibet a une longue histoire identitaire distincte et le Dalai Lama est à la fois un militant pour la paix et un symbole de résilience politique. » Puis, comme pour d’autres sujets sensibles, la version anglaise efface le texte et suggère de regarder ailleurs « Parlons d’autre chose ».

Note(s) :

[1] Une licence ouverte, libre et gratuite, apporte la sécurité juridique nécessaire aux producteurs et aux ré-utilisateurs des données publiques ; elle permet la réutilisation et autorise la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des copies. Conditionnée à une exigence forte de transparence des données et de la qualité des sources, elle rend obligatoire la mention de la paternité.

[2] Pour mémoire rappelons que dans ce domaine de la très haute technologie numérique, les innovations vont très vite. En 2025, Jensen Huang le PDG de Nvidia lui-même a présenté la « puce » GB200 NVL72 dont dit-il les performances sont 30 à 40 fois supérieures à celle du modèle H 100.

Pour rester en pointe il ne suffit donc pas d’accumuler les puces anciennes, même les plus modernes, il faut sans cesse innover.

Notons que pour avoir vendu ses microprocesseurs de hautes performances à Liang, Nvidia est aujourd’hui sur la sellette aux États-Unis. Selon un rapport de Bloomberg, après la nouvelle que l’administration Trump envisagerait d’imposer de nouvelles restrictions visant cette fois l’exportation vers la Chine des puces GPU (Graphics Processing Units) programmables, la valeur de l’action Nvidia a chuté de 18%.

Depuis la présentation publique de ChatGPT par OpenAI, les GPU de Nvidia, nécessaires à l’entraînement et au fonctionnement des modèles d’IA, sont sous surveillance étroite du gouvernement américain.

L’administration Biden avait déjà instauré plusieurs vagues de sanctions, interdisant notamment la vente des GPU H100 et H200 à la Chine en 2022. En réponse, Nvidia avait développé des versions bridées moins performantes, mais en 2023 de nouvelles restrictions avaient freiné leur exportation.

Cliquez ici pour générer le PDF de cet article :

›› Technologies - Energie