DeepSeek, l’IA made in China

Vous n’en aviez jamais entendu parler, mais ce nom est sur toutes les lèvres aujourd’hui : DeepSeek. La nouvelle application chinoise d’IA a mis au tapis la bourse américaine hier. Les entreprises de high-tech américaines ont été prises dans un tourbillon de panique leur faisant perdre des centaines de milliards de dollars de capitalisation en quelques heures. Une startup chinoise inconnue s’est fait une place dans la cour des grands à la vitesse d’un tremblement de Terre.

Comme son modèle et compétiteur américain ChatGPT, DeepSeek est une intelligence artificielle qui répond à toutes les questions, parle plusieurs langues et résout les problèmes les plus complexes. L’exploit, c’est le coût de fabrication de DeepSeek : seulement 5.6 millions de dollars contre 3 milliards pour son concurrent américain. Le tout en à peine deux mois. Un coup de tonnerre et une humiliation pour la tech américaine : a -t-elle trop investi et dépensé sans compter, créant une bulle de capitalisation qui risque maintenant de se dégonfler comme un vulgaire ballon de baudruche percé ?

Pluie de milliards ou low-cost ?

Les géants américains ont investi des milliards de dollars dans l’IA : 100 milliards l’année dernière, uniquement pour Microsoft, Google, Amazon et Facebook. Ils se croyaient intouchables, imbattables comme le lièvre dans sa course avec la tortue. Coup dur aussi pour le nouveau président américain ; avec son programme Stargate lancé la semaine dernière, Donald Trump a voulu taper fort : un plan gigantesque à 500 milliards de dollars censé assurer une avance confortable aux États-Unis en matière d’intelligence artificielle.

Mais DeepSeek rebat les cartes dans cette compétition qui s’apparente à une révolution, une course qui se conduit pour la Chine comme une guerre froide. C’est le premier qui ira sur la Lune qui sera le leader disait-on jadis. Pour Pékin, l’IA est aujourd’hui le prochain défi de l’humanité.

Et il y a de quoi s’inquiéter. Les experts qui ont analysé DeepSeek dès sa sortie, il y a une petite semaine, sont formels : cette application rivalise sans conteste avec les meilleures comme ChatGPT. Elle le fait pour une fraction non seulement du coût de développement mais aussi du coût d’exploitation. En effet, DeepSeek affirme pouvoir exploiter ses centres d’IA avec seulement 10% du coût dépensé par les Américains. Pour ces derniers, les performances de l’IA reposent sur toujours plus de puces dernier cri et des quantités astronomiques de calcul et d’énergie. Résultat : une requête DeepSeek coûte vingt-sept fois moins cher qu’une requête ChatGPT.

Selon Alexandre Piquard dans Le Monde, DeepSeek dit utiliser plusieurs techniques innovantes pour limiter les calculs, en s’appuyant davantage sur l’apprentissage par renforcement – par lequel un modèle tente par lui-même des solutions et est récompensé quand il trouve une bonne réponse – et moins sur l’apprentissage supervisé, dans lequel le modèle s’entraîne d’abord sur un jeu de questions-réponses. DeepSeek aurait aussi utilisé des nombres codés en 8 bits, formule plus légère en calcul. Enfin, l’entreprise utiliserait plusieurs modèles spécialisés, mobilisés en fonction des requêtes, plutôt qu’un seul, généraliste mais plus gros. Cette technique a notamment été utilisée par la prometteuse start-up française Mistral, qui assure aussi avoir des coûts d’entraînement plus bas que certains concurrents.

Pourquoi ne pas profiter d’une lecture illimitée de UP’ ? Abonnez-vous à partir de 1.90 € par semaine.

je choisis mon abonnement

Enfin, cerise sur le gâteau, DeepSeek est proposé en Open Source ce qui signifie que ses codes sont ouverts, permettant à d’autres développeurs de les utiliser gratuitement et de les enrichir pour leurs propres applications. De quoi donner des sueurs froides à la Tech américaine qui n’avait pas vu venir le danger et se croyait maître du monde de l’IA pour des années encore.

Un Lilliputien chez les géants

DeepSeek est, à l’échelle des géants de la Tech, un Lilliputien. Fondée en mai 2023, la startup est le projet de Liang Wenfeng, un quadragénaire discret propriétaire de fonds spéculatifs de la province de Guangdong, dans le sud de la Chine. Selon le Washington Post, une partie de son succès semble provenir du fait que l’entreprise est conçue comme une organisation purement axée sur la recherche, et non comme une société commerciale à but lucratif. Dans une interview accordée aux médias chinois l’année dernière, Liang déclarait : « Notre principe est de ne pas de perdre de l’argent, ni de faire d’énormes profits… notre point de départ n’est pas de profiter de l’occasion pour faire fortune, mais d’être à la pointe de la technologie et de promouvoir le développement de l’ensemble de l’écosystème ».

L’axe de recherche de DeepSeek est financé par le fonds spéculatif de Liang, High-Flyer Capital, qu’il a été lancé en 2015. Dans cette société, Liang a utilisé l’IA pour repérer des modèles dans les prix des actions, générant ainsi des tonnes de liquidités. En 2021, ses actifs sous gestion auraient dépassé les 100 milliards de yuans (13 milliards de dollars).

La même année, des rumeurs ont commencé à se répandre selon lesquelles Liang avait amassé une vaste collection de processeurs graphiques Nvidia. En 2021, il aurait acheté 10 000 de ces puces. Seule une poignée de grandes entreprises technologiques chinoises disposent de réserves similaires de semi-conducteurs Nvidia. Une décision arrivée à point nommé : en 2022, Joe Biden annonçait des contrôles radicaux sur les exportations de semi-conducteurs à destination de la Chine, afin d’empêcher le pays d’accéder à l’équipement nécessaire au développement rapide de l’IA. La puissante puce H100 de Nvidia a été interdite. L’entreprise a développé des puces H800 moins puissantes pour le marché chinois – sur lesquelles DeepSeek a entraîné son modèle – mais celles-ci ont également été interdites en 2023. « Notre plus grand défi n’a jamais été l’argent, mais l’embargo sur les puces haut de gamme », a ainsi déclaré M. Liang.

Liang, diplômé en ingénierie de l’information électronique à l’université de Zhejiang, s’est personnellement impliqué dans les recherches de DeepSeek et a expliqué qu’il préférait embaucher des talents locaux pour le campus de l’entreprise à Hangzhou, la ville de l’Est de la Chine, plutôt que des travailleurs qui ont étudié aux États-Unis ou à l’étranger. Le succès de DeepSeek n’en est que plus frappant. Les États-Unis ont toujours été en tête de la course à l’IA, dominant les équipements de fabrication de puces les plus avancés et produisant des talents de premier plan dans leurs universités. Pourtant, le lancement du puissant modèle de DeepSeek suggère que les scientifiques chinois ont, comme on devait s’y attendre, trouvé un moyen de contourner les restrictions américaines destinées à les empêcher de rattraper leur retard.

Lundi 27 janvier, Donald Trump a déclaré que la publication de DeepSeek devrait galvaniser les entreprises technologiques américaines. « La publication de l’IA DeepSeek par une entreprise chinoise devrait être un signal d’alarme pour nos industries : nous devons nous concentrer sur la concurrence pour gagner », a-t-il déclaré en Floride. Il a suggéré que le développement d’une IA moins coûteuse « pourrait être un développement très positif », y compris pour les entreprises technologiques américaines, ajoutant : « Au lieu de dépenser des milliards et des milliards de dollars, vous dépenserez moins, et vous arriverez, espérons-le, à la même solution ».

Séisme dans la Tech US

L’arrivée de DeepSeek est un séisme dans le monde de la Tech américaine. Les révélations de la startup chinoise amènent certains investisseurs à se demander si les fabricants de puces, tels que Nvidia, seront toujours en mesure de vendre des quantités gargantuesques de puces si les programmes d’IA deviennent plus efficaces. Conséquence : l’indice Nasdaq, dominé par les entreprises technologiques, a chuté de 3 % lundi 27 janvier. Nvidia a chuté de près de 17 %, perdant 589 milliards de dollars de capitalisation boursière — ce qui ne l’empêche pas d’être toujours l’une des entreprises les plus riches au monde, avec une capitalisation boursière de 2 900 milliards de dollars.

Le fabricant de puces Taiwan Semiconductor Manufacturing Co. ou TSMC, qui fabrique des puces pour Nvidia et d’autres, a chuté de 13 %. D’autres fabricants américains de puces, dont ARM et Intel, ont également perdu de la valeur.

Les analystes estiment que la réaction du marché souligne les inquiétudes existantes sur le fait de savoir si le battage médiatique autour de l’IA se traduira par des produits réellement rentables et dans quel délai cela se produira. Les grandes entreprises technologiques ont dépensé des milliards de dollars pour construire de nouveaux centres de données dans l’espoir qu’ils alimenteront à l’avenir des services d’IA rentables. Ainsi, certains voient dans cet événement une aubaine : « Au fur et à mesure que l’IA devient plus efficace et accessible, nous verrons son utilisation monter en flèche, la transformant en un produit de base dont nous ne pourrons plus nous passer », analyse le PDG de Microsoft, Satya Nadella, dans un message publié sur X.

Course à la domination du monde

À l’instar de son homologue américain, le gouvernement chinois a fait de l’IA une priorité nationale et a déclaré vouloir devenir le leader mondial de la technologie de l’IA d’ici à 2030. Le pays a également investi des sommes considérables dans la recherche et la technologie de l’IA, de la même manière que les entreprises américaines ont injecté des milliards dans les centres de données et le développement de l’IA au cours des deux dernières années.

Pour lutter contre la désinformation et privilégier les analyses qui décryptent l’actualité, rejoignez le cercle des lecteurs abonnés de UP’

je choisis mon abonnement

Dans cette course pour la domination du monde de demain, une absente de taille : l’Europe qui aggrave son retard dans des domaines cruciaux comme les puces, le cloud et l’IA.

Pourtant, avec l’apparition tonitruante de DeepSeek sur le marché, le paysage de l’IA a changé. Jusqu’à présent, la règle était que ceux qui avaient les investissements les plus massifs avaient le monopole de l’IA, dictaient les prix et étaient les rois du monde. Ce que montre DeepSeek c’est que le modèle a changé. On peut prendre une place forte dans l’IA, faire une révolution, mais low-cost. Cela rebat les cartes de la compétition : il pourrait être inutile d’injecter des centaines de milliards puisque le système est amené à se démocratiser au bout d’un certain moment. Le gagnant ne serait plus celui qui dépose le plus de brevets, possède les meilleurs centres de calculs, mais celui qui saura utiliser intelligemment l’IA et offrir des usages pertinents et utiles.

Pari très risqué

Reste toutefois la question de fond : jusqu’où ira cette course effrénée à l’IA ?

Steven Adler, ancien chercheur en sécurité d’OpenAI se dit dans The Guardian « assez terrifié » par le rythme de développement de l’intelligence artificielle, avertissant que l’industrie prend un « pari très risqué » sur la technologie, allant jusqu’à émettre des doutes sur l’avenir de l’humanité. »

Certains experts, comme le lauréat du prix Nobel Geoffrey Hinton, craignent que des systèmes d’IA puissants échappent au contrôle humain, ce qui pourrait entraîner des conséquences catastrophiques. D’autres, comme le Français Yann LeCun, responsable scientifique de Meta pour l’IA, minimisent la menace existentielle, affirmant que l’IA « pourrait en fait sauver l’humanité de l’extinction ».

Steven Adler estime qu’aucun laboratoire de recherche au monde ne dispose d’une solution à l’alignement de l’IA — le processus consistant à s’assurer que les systèmes adhèrent à un ensemble de valeurs humaines — et que l’industrie avançait peut-être trop vite pour en trouver une. « Plus nous courons vite, moins il y a de chances que quelqu’un trouve une solution à temps ».

Partagez cet article !