Traduit d’une interview de juillet 2024 avec le fondateur de DeepSeek, Liang Wenfeng—réalisée peu après que le modèle open-source V2 de l’entreprise l’ait propulsée sur le devant de la scène—ce dialogue rare révèle comment une startup chinoise a osé surpasser les géants et redéfinir les règles de l’innovation.
Publié le 27 janvier 2025 dans The China Academy

This post-85s entrepreneur appeared on Xinwen Lianbo (CCTV News) as the founder of the AI startup DeepSeek, participating in a high-level national symposium and delivering a speech.
Qui est DeepSeek ?
DeepSeek : L’excellence technologique au service de l’innovation
Dirigée par Liang Wenfeng, diplômé de l’Université du Zhejiang à Hangzhou, l’équipe de recherche DeepSeek (深度求索 en chinois) incarne l’excellence et la diversité. Composée de talents triés sur le volet pour leur expertise dans des domaines spécialisés, cette équipe représente le fleuron de la jeune génération de chercheurs et d’ingénieurs en Chine.


Photo de la Team DeepSeek : La nouvelle génération chinoise d’intelligence artificielle : l’équipe DeepSeek
DeepSeek #IA #Innovation #Chine
Liste des membres de l’équipe, le plus grand outsider de l’IA en Chine :
- Liang Wenfeng : Université du Zhejiang, intelligence artificielle (fondateur).
- Dai Yunli : Docteur en informatique de l’Université de Pékin.
- Zhu Qihao : Docteur en informatique de l’Université de Pékin.
- Bu Zhihong : Docteur en intelligence artificielle de l’Université Tsinghua.
- Zhao Chenggang : Membre de l’équipe de supercalcul de l’Université Tsinghua.
- Gao Huazuo : Département de physique de l’Université de Pékin.
- Zeng Wangding : Université des postes et télécommunications de Beijing.
- Xin Huajian : Spécialisé en logique à l’Université Sun Yat-sen.
Analyse et contexte :
Cette équipe, DeepSeek, représente une nouvelle génération de talents chinois dans le domaine de l’intelligence artificielle. Les membres proviennent de certaines des universités les plus prestigieuses de Chine, comme l’Université de Pékin, l’Université Tsinghua et l’Université du Zhejiang. Leur expertise couvre des domaines variés, allant de l’informatique à la physique en passant par la logique, ce qui témoigne d’une approche multidisciplinaire pour innover dans le domaine de l’IA.
Le fondateur, Liang Wenfeng, diplômé de l’Université du Zhejiang, a réuni une équipe composée de jeunes chercheurs et ingénieurs talentueux, reflétant la montée en puissance de la Chine dans le secteur technologique. Cette équipe incarne également la stratégie chinoise de développement de l’IA en s’appuyant sur des compétences locales et en favorisant la collaboration entre les meilleures institutions du pays.
Une sélection rigoureuse et une diversité de profils
Contrairement à ce que l’on pourrait imaginer, aucun membre de l’équipe ne provient de l’alma mater de Liang Wenfeng, l’Université du Zhejiang. DeepSeek a en effet adopté une stratégie de recrutement ambitieuse, en s’appuyant sur les meilleurs talents issus d’universités prestigieuses à travers la Chine. Cette approche a permis de constituer une équipe pluridisciplinaire, riche d’une variété de compétences et de perspectives.

Looked up 14 of Deepseek’s team members, mostly fresh PhD grads from top schools, 5 have won competitions. Strong team.
Jeunesse et dynamisme au cœur de la stratégie
Avec une moyenne d’âge inférieure à 35 ans, l’équipe DeepSeek mise résolument sur la jeunesse et l’énergie. Ces jeunes professionnels, tous formés au sein d’institutions chinoises, apportent une vision novatrice et une agilité essentielle pour relever les défis technologiques et scientifiques de demain.
Un ancrage fort dans le talent local
Fait notable : aucun membre de l’équipe n’a suivi de cursus académique à l’étranger ou dans des universités américaines. Ce choix reflète la volonté de DeepSeek de valoriser et de développer les compétences locales, tout en démontrant la maturité et la qualité du système éducatif et de recherche chinois.
La puissance technologique de DeepSeek
La supériorité de DeepSeek réside dans ses capacités informatiques (computing capabilities) exceptionnelles. Son modèle de langage (LLM) repose sur l’utilisation de 2 000 puces Nvidia H800 de gamme moyenne, une approche bien plus économe en énergie que celle d’OpenAI, qui utilise plus de 10 000 puces Nvidia de dernière génération. Cette optimisation technologique permet à DeepSeek de réduire considérablement sa consommation énergétique tout en maintenant des performances de pointe.
La particularité de la langue chinoise : un atout pour l’IA ?
Certains experts chinois avancent une théorie fascinante : la réussite hors norme du LLM de DeepSeek pourrait être liée à la singularité de la langue chinoise. Contrairement aux langues phonétiques, le chinois repose sur un système d’idéogrammes et de phonogrammes, reflétant une manière de penser unique. Cette particularité linguistique pourrait influencer la méthode des calculs informatiques en IA, offrant ainsi un avantage compétitif à DeepSeek. Cette thèse mérite d’être approfondie, car elle ouvre des perspectives passionnantes sur la relation entre langage, cognition et intelligence artificielle.
Le cerveau derrière DeepSeek V3 et R1 : Luo FuLi
Au cœur de cette innovation se trouve Luo FuLi (罗福莉), une ingénieure prodige de 29 ans. Diplômée de l’Université de Beijing (北大), elle est la cheffe de projet et dirige une équipe de 139 ingénieurs. Comme ses coéquipiers, Luo FuLi a été entièrement formée en Chine, ce qui souligne une fois de plus la capacité du pays à cultiver et à retenir les talents locaux.

Luo Fuli (罗福莉), est une figure clé de l’équipe #DeepSeek.
Elle a publié 8 articles dans des revues scientifiques de renommée mondiale sur l’IA pendant son programme de master à l’Université de Pékin (PKU). Elle a même décliné des offres d’emploi très bien rémunérées pour terminer son master.
Une vision tournée vers l’avenir
En s’appuyant sur les meilleurs jeunes esprits du pays, DeepSeek affirme son engagement à repousser les frontières de l’innovation. Cette équipe, à la fois jeune, talentueuse et résolument tournée vers l’avenir, incarne parfaitement la mission de DeepSeek : faire émerger des solutions disruptives et positionner la Chine comme un leader mondial dans les domaines de la recherche et de la technologie.
Note de la rédaction :
La Silicon Valley est sous le choc. Un bouleversement majeur dans la domination de l’IA est en cours, et tous les regards se tournent vers la Chine. En janvier 2025, DeepSeek-R1—un modèle d’inférence open-source de la société chinoise DeepSeek—a envoyé des ondes de choc à travers le monde technologique en égalant les performances de pointe d’OpenAI à 1/30e du coût de l’API, tout en adoptant une ouverture totale.
Avec seulement 6 millions de dollars, la Chine a construit l’un des meilleurs modèles d’IA au monde, éclipsant les milliards dépensés par Meta, Google et Microsoft. Déjà, les utilisateurs mondiaux—en particulier les particuliers et les PME—se ruent vers DeepSeek-R1, le réentraînant comme leur modèle de base.
Cette révolution menée par l’Est force une remise en question mondiale : Et si l’avenir de l’IA ne se forgeait pas dans la Silicon Valley ?
Interview du fondateur de DeepSeek Liang Wenfeng
Comment le premier coup de feu dans la guerre des prix a-t-il été tiré ?
An Yong (Intervieweur) : Après la sortie du modèle DeepSeek V2, une guerre des prix féroce a rapidement éclaté dans l’industrie des grands modèles. Certains disent que vous êtes un perturbateur du marché.
Liang Wenfeng (Fondateur de DeepSeek) : Nous n’avions jamais l’intention d’être des perturbateurs ; cela s’est fait par accident.
An Yong : Étiez-vous surpris par ce résultat ?
Liang Wenfeng : Très surpris. Nous ne nous attendions pas à ce que les prix soient un sujet aussi sensible. Nous suivions simplement notre propre rythme, calculant les coûts et fixant les prix en conséquence. Notre principe est de ne pas vendre à perte ni de rechercher des profits excessifs. Le prix actuel permet une marge bénéficiaire modeste au-dessus de nos coûts.
An Yong : Cinq jours plus tard, Zhipu AI a emboîté le pas, suivi de près par ByteDance, Alibaba, Baidu et Tencent.
Liang Wenfeng : Zhipu AI a baissé les prix pour un produit d’entrée de gamme, tandis que ses modèles phares restent chers. ByteDance a été le premier à vraiment égaler notre prix pour un modèle phare, ce qui a ensuite poussé les autres à suivre. Comme les grandes entreprises ont des coûts de modèle bien plus élevés que les nôtres, nous n’avions jamais imaginé que quelqu’un opérerait à perte. Cela a fini par refléter la logique des subventions de l’ère internet.
An Yong : D’un point de vue extérieur, les baisses de prix semblent être une tactique pour attirer les utilisateurs—typique de la concurrence de l’ère internet.
Liang Wenfeng : Attirer des utilisateurs n’était pas notre objectif principal. Nous avons baissé les prix parce que, premièrement, en explorant les structures de modèles de nouvelle génération, nos coûts ont diminué ; deuxièmement, nous croyons que l’IA et les services API devraient être abordables et accessibles à tous.
An Yong : Avant cela, la plupart des entreprises chinoises se contentaient de copier la structure du modèle Llama pour développer des applications. Pourquoi avez-vous choisi de vous concentrer sur la structure du modèle ?
Liang Wenfeng : Si l’objectif est de développer des applications, adopter la structure de Llama pour lancer rapidement un produit est un choix raisonnable. Cependant, notre objectif est l’AGI (Intelligence Générale Artificielle), ce qui nous oblige à explorer de nouvelles structures de modèles pour atteindre des capacités supérieures avec des ressources limitées. C’est une recherche fondamentale pour monter en échelle. Au-delà de l’architecture, nous avons étudié la curation des données et le raisonnement humain—tout cela se reflète dans nos modèles. De plus, l’efficacité de l’entraînement et les coûts d’inférence de Llama sont en retard d’environ deux générations par rapport aux standards mondiaux de pointe.
An Yong : D’où vient cet écart générationnel ?
Liang Wenfeng : Premièrement, il y a un écart dans l’efficacité de l’entraînement. Nous estimons que les meilleurs modèles chinois nécessitent probablement deux fois plus de puissance de calcul pour égaler les meilleurs modèles mondiaux en raison des écarts structurels et dynamiques. L’efficacité des données est également deux fois moins bonne, ce qui signifie que nous avons besoin de deux fois plus de données et de calcul pour des résultats équivalents. Combiné, cela représente quatre fois plus de ressources. Notre objectif est de réduire continuellement ces écarts.
An Yong : La plupart des entreprises chinoises poursuivent à la fois les modèles et les applications. Pourquoi DeepSeek se concentre-t-il uniquement sur la recherche ?
Liang Wenfeng : Parce que nous croyons que la chose la plus importante en ce moment est de participer à l’innovation mondiale. Pendant des années, les entreprises chinoises se sont habituées à exploiter les innovations technologiques développées ailleurs et à les monétiser via des applications. Mais cela n’est pas durable. Cette fois, notre objectif n’est pas de réaliser des profits rapides, mais de repousser les frontières technologiques pour stimuler la croissance de l’écosystème.
An Yong : La croyance dominante, issue des ères internet et mobile, est que les États-Unis mènent en innovation, tandis que la Chine excelle dans les applications.
Liang Wenfeng : Nous croyons qu’avec le développement économique, la Chine doit progressivement passer du statut de bénéficiaire à celui de contributeur, plutôt que de continuer à profiter des avancées des autres. Au cours des 30 dernières années de la révolution informatique, nous avons à peine participé à l’innovation technologique de base.
Nous nous sommes habitués à la “loi de Moore tombée du ciel”—attendre 18 mois pour un meilleur matériel et logiciel. La “loi de l’échelle” est traitée de la même manière. Cependant, ces avancées sont le résultat des efforts acharnés de générations de communautés technologiques dirigées par l’Occident. Parce que nous n’avons pas été activement impliqués dans ce processus, nous en avons sous-estimé l’importance.
Le véritable écart réside dans l’originalité, pas seulement dans le temps
An Yong : Pourquoi DeepSeek V2 a-t-il surpris tant de gens dans la Silicon Valley ?
Liang Wenfeng : Parmi les innovations quotidiennes aux États-Unis, cela est assez ordinaire. Leur surprise vient du fait de voir une entreprise chinoise rejoindre leur jeu en tant qu’innovateur, et non pas simplement en tant que suiveuse—ce à quoi la plupart des entreprises chinoises sont habituées.
An Yong : Mais dans le contexte chinois, donner la priorité à l’innovation pure semble presque un luxe. Développer de grands modèles est très coûteux. Toutes les entreprises ne peuvent pas se permettre de se concentrer uniquement sur la recherche sans se commercialiser d’abord.
Liang Wenfeng : L’innovation est indéniablement coûteuse, et notre tendance passée à adopter des technologies existantes était liée au stade de développement antérieur de la Chine. Mais aujourd’hui, l’échelle économique de la Chine et les profits des géants comme ByteDance et Tencent sont significatifs à l’échelle mondiale. Ce qui nous manque, ce n’est pas le capital, mais la confiance et la capacité à organiser des talents de haut niveau pour une innovation efficace.
An Yong : Pourquoi les entreprises chinoises, même les géants bien financés, donnent-elles souvent la priorité à une commercialisation rapide ?
Liang Wenfeng : Pendant trois décennies, nous avons mis l’accent sur le profit plutôt que sur l’innovation. L’innovation n’est pas uniquement motivée par les affaires ; elle nécessite de la curiosité et une ambition créative. Nous sommes enchaînés par de vieilles habitudes, mais ce n’est qu’une phase.
An Yong : Mais DeepSeek est une entreprise, pas un laboratoire de recherche à but non lucratif. Si vous innovez et ouvrez vos percées—comme l’innovation architecturale MLA publiée en mai—les concurrents ne les copieront-ils pas rapidement ? Où est votre avantage concurrentiel ?
Liang Wenfeng : Dans les technologies disruptives, les avantages concurrentiels fermés sont éphémères. Même le modèle fermé d’OpenAI ne peut empêcher les autres de rattraper leur retard.
Par conséquent, notre véritable avantage réside dans la croissance de notre équipe—accumuler du savoir-faire, cultiver une culture d’innovation. Ouvrir nos sources et publier des articles ne résulte pas en pertes significatives. Pour les technologues, être suivi est gratifiant. L’open-source est culturel, pas seulement commercial. Redonner est un honneur, et cela attire les talents.
An Yong : Comment réagissez-vous aux opinions axées sur le marché, comme celles de Zhu Xiaohu (qui préconise de donner la priorité à la commercialisation immédiate plutôt qu’à la recherche fondamentale en IA, et rejette l’AGI comme irréaliste) ?
Liang Wenfeng : La logique de Zhu convient aux entreprises à profit à court terme, mais les entreprises américaines les plus rentables sur le long terme sont des géants technologiques construits sur une R&D à long terme.
An Yong : Mais dans l’IA, la seule avance technique ne suffit pas. Sur quel objectif plus large DeepSeek parie-t-il ?
Liang Wenfeng : Nous croyons que l’IA chinoise ne peut pas rester éternellement une suiveuse. Souvent, nous disons qu’il y a un écart d’un ou deux ans entre l’IA chinoise et américaine, mais le véritable écart est entre l’originalité et l’imitation. Si cela ne change pas, la Chine sera toujours une suiveuse. Certaines explorations sont inévitables.
La domination de NVIDIA ne résulte pas seulement de ses efforts—c’est le résultat de la collaboration des écosystèmes technologiques occidentaux sur des feuilles de route pour les technologies de nouvelle génération. La Chine a besoin d’écosystèmes similaires. De nombreuses puces domestiques échouent parce qu’elles manquent de communautés technologiques de soutien et dépendent d’informations de seconde main. Quelqu’un doit se positionner à la pointe.
Plus d’investissement ne signifie pas toujours plus d’innovation
An Yong : DeepSeek dégage actuellement une vibe idéaliste rappelant les débuts d’OpenAI, et vous êtes open-source. Prévoyez-vous de passer à un modèle fermé à l’avenir, comme l’ont fait OpenAI et Mistral ?
Liang Wenfeng : Nous ne passerons pas à un modèle fermé. Nous croyons que l’établissement d’un écosystème technologique robuste est plus important.
An Yong : Y a-t-il des plans de levée de fonds ? Les médias rapportent que Huanfang【1】 vise à séparer DeepSeek pour une introduction en bourse. Les startups d’IA de la Silicon Valley s’alignent inévitablement avec les grands acteurs—allez-vous suivre ?
Liang Wenfeng : Pas de plans à court terme. Notre défi n’a jamais été l’argent ; c’est l’embargo sur les puces haut de gamme.
An Yong : Beaucoup soutiennent que l’AGI nécessite des alliances audacieuses et une visibilité, contrairement à l’investissement quantitatif, qui prospère dans le secret. Êtes-vous d’accord ?
Liang Wenfeng : Plus d’investissement ne se traduit pas nécessairement par plus d’innovation. Si c’était le cas, les grandes entreprises technologiques auraient monopolisé toute l’innovation.
An Yong : Évitez-vous les applications parce que DeepSeek manque d’expertise opérationnelle ?
Liang Wenfeng : Nous croyons que l’étape actuelle est une période d’innovation technologique, pas d’explosion d’applications. À long terme, nous visons à établir un écosystème où l’industrie utilise directement nos technologies et nos résultats. D’autres développent des services B2B/B2C sur nos modèles, tandis que nous nous concentrons sur la recherche fondamentale. Si une chaîne industrielle complète se forme, nous n’aurons pas besoin de développer des applications nous-mêmes. Cela dit, si nécessaire, nous en sommes pleinement capables. Cependant, la recherche et l’innovation resteront toujours notre priorité absolute.
An Yong : Pourquoi les clients choisiraient-ils l’API de DeepSeek plutôt que celles des grands acteurs ?
Liang Wenfeng : Le monde futur sera probablement un monde de division du travail spécialisée. Les modèles d’IA de base nécessitent une innovation continue, et les grandes entreprises ont leurs limites—elles ne sont pas toujours les mieux adaptées à ce rôle.
An Yong : Mais la technologie seule peut-elle créer un écart concurrentiel significatif ? Vous avez dit qu’il n’y a pas de “secrets” absolus.
Liang Wenfeng : Les secrets n’existent pas, mais la réplication prend du temps et coûte cher. Les GPU de NVIDIA n’ont pas de magie cachée—pourtant, rattraper leur retard nécessite de reconstruire des équipes et de poursuivre leur technologie de nouvelle génération. C’est là le véritable avantage concurrentiel.
An Yong : Après vos baisses de prix, ByteDance a été le premier à suivre, suggérant qu’ils se sentaient menacés. Comment voyez-vous le nouveau paysage concurrentiel entre startups et géants ?
Liang Wenfeng : Pour être honnête, nous ne nous en soucions pas vraiment. Baisser les prix était juste quelque chose que nous avons fait en chemin. Fournir des services cloud n’est pas notre objectif principal—atteindre l’AGI l’est. Jusqu’à présent, nous n’avons vu aucune solution révolutionnaire. Les géants ont des utilisateurs, mais leurs vaches à lait les enchaînent également, les rendant vulnérables à la disruption.
An Yong : Que pensez-vous de l’issue pour les six autres grandes startups d’IA en Chine ?
Liang Wenfeng : Peut-être 2 ou 3 survivront. Tous brûlent de l’argent en ce moment. Ceux qui ont une vision claire et une discipline opérationnelle persisteront. Les autres pivoteront. La valeur ne disparaît jamais ; elle prendra de nouvelles formes.
An Yong : Quelle est votre philosophie centrale en matière de concurrence ?
Liang Wenfeng : Je me concentre sur la question de savoir si quelque chose améliore l’efficacité sociétale et si nous pouvons trouver notre force dans la chaîne de valeur industrielle. Tant que l’objectif ultime est d’augmenter l’efficacité, c’est valable. Beaucoup d’aspects ne sont que des phases temporaires—trop s’y concentrer ne mènera qu’à la confusion.
Modèle V2 : Construit entièrement par des talents locaux
An Yong : Jack Clark, ancien responsable des politiques chez OpenAI et cofondateur d’Anthropic, a remarqué que DeepSeek a embauché “certains de ces sorciers impénétrables” qui ont construit DeepSeek V2. Comment définissez-vous ces personnes ?
Liang Wenfeng : Il n’y a pas de “sorciers impénétrables” ici—juste des diplômés fraîchement sortis des meilleures universités, des doctorants (même des stagiaires de quatrième ou cinquième année), et de jeunes talents avec quelques années d’expérience.
An Yong : De nombreuses grandes entreprises d’IA sont désireuses de recruter des talents à l’étranger. Certains pensent que les 50 meilleurs talents en IA au monde ne travaillent probablement pas pour des entreprises chinoises. D’où vient votre équipe ?
Liang Wenfeng : V2 a été entièrement construit par des talents locaux. Les 50 meilleurs talents mondiaux en IA ne sont peut-être pas en Chine aujourd’hui, mais nous visons à cultiver les nôtres.
An Yong : Comment l’innovation MLA est-elle née ? Nous avons entendu que l’idée initiale provenait de l’intérêt personnel d’un jeune chercheur.
Liang Wenfeng : Après avoir résumé les schémas évolutifs clés de l’architecture Attention dominante, il a eu une inspiration soudaine pour concevoir une alternative. Cependant, transformer une idée en réalité est un long voyage. Nous avons formé une équipe et passé des mois à la valider.
An Yong : Ce genre de créativité organique semble lié à votre structure organisationnelle plate. Chez Huanfang, vous avez évité les directives descendantes. Mais pour l’AGI—une frontière à haute incertitude—imposez-vous plus de gestion ?
Liang Wenfeng : DeepSeek reste entièrement ascendant. Nous n’attribuons pas non plus de rôles à l’avance ; une division naturelle du travail émerge. Chacun apporte des expériences et des idées uniques, et ils n’ont pas besoin d’être poussés. Lorsqu’ils rencontrent des défis, ils sollicitent naturellement les autres pour des discussions. Cependant, une fois qu’une idée montre du potentiel, nous allouons des ressources de haut en bas.
An Yong : Nous avons entendu que DeepSeek fonctionne avec une flexibilité remarquable dans l’allocation des ressources de calcul et du personnel.
Liang Wenfeng : Il n’y a aucune limite pour accéder aux ressources de calcul ou aux membres de l’équipe. Si quelqu’un a une idée, il peut accéder à nos clusters d’entraînement à tout moment sans approbation. De plus, comme nous n’avons pas de structures hiérarchiques rigides ou de barrières départementales, les gens peuvent collaborer librement tant qu’il y a un intérêt mutuel.
An Yong : Une telle gestion souple repose sur l’embauche d’individus extrêmement motivés. On dit que DeepSeek excelle à identifier des talents exceptionnels sur la base de critères non traditionnels.
Liang Wenfeng : Nos critères d’embauche ont toujours été basés sur la passion et la curiosité. Beaucoup de nos membres ont des parcours uniques et intéressants. Leur soif de recherche dépasse largement les préoccupations monétaires.
An Yong : Transformer est né dans le laboratoire d’IA de Google, et ChatGPT a émergé d’OpenAI. À votre avis, comment les laboratoires d’IA d’entreprise diffèrent-ils des startups dans la stimulation de l’innovation ?
Liang Wenfeng : Que ce soit les laboratoires de Google, OpenAI ou même les laboratoires d’IA des géants technologiques chinois, ils apportent tous une valeur significative. Le fait qu’OpenAI ait finalement réalisé des percées était en partie une question de chance historique.
An Yong : L’innovation est donc largement une question de chance ? La disposition de vos bureaux comprend des salles de réunion avec des portes qui peuvent être facilement ouvertes des deux côtés. Vos collègues ont mentionné que cette conception permet des “rencontres fortuites”, rappelant l’histoire de Transformer—où un passant a entendu une discussion et a contribué à en faire un cadre universel.
Liang Wenfeng : Je crois que l’innovation est, avant tout, une question de conviction. Pourquoi la Silicon Valley est-elle si innovante ? Parce qu’elle ose essayer. Lorsque ChatGPT a fait ses débuts, la Chine manquait de confiance dans la recherche de pointe. Des investisseurs aux grandes entreprises technologiques, beaucoup pensaient que l’écart était trop important et se concentraient plutôt sur les applications. Mais l’innovation nécessite de la confiance, et les jeunes en ont généralement plus.
An Yong : Contrairement à d’autres entreprises d’IA qui recherchent activement des financements et une attention médiatique, DeepSeek reste relativement discret. Comment vous assurez-vous que DeepSeek devient le premier choix pour les personnes souhaitant travailler dans l’IA ?
Liang Wenfeng : Parce que nous nous attaquons aux problèmes les plus difficiles. La chose la plus attrayante pour les talents de premier plan est l’opportunité de résoudre les défis les plus complexes du monde. En fait, les meilleurs talents en Chine sont souvent sous-estimés parce que l’innovation de pointe est rare, ce qui signifie qu’ils sont rarement reconnus. Nous offrons ce qu’ils recherchent.
An Yong : Le récent événement d’OpenAI n’a pas présenté GPT-5, ce qui a conduit beaucoup à croire que la courbe technologique de l’industrie ralentit, et certains ont commencé à remettre en question la loi de l’échelle. Quelle est votre perspective ?
Liang Wenfeng : Nous restons optimistes. Les progrès de l’industrie sont toujours conformes aux attentes. OpenAI n’est pas divin ; ils ne peuvent pas mener éternellement.
An Yong : Combien de temps pensez-vous qu’il faudra pour atteindre l’AGI ? Avant V2, vous avez publié des modèles de code/mathématiques et êtes passé de dense à MoE【2】. Quelle est votre feuille de route ?
Liang Wenfeng : Cela pourrait prendre deux ans, cinq ans ou dix ans—mais cela arrivera de notre vivant. Quant à notre feuille de route, il n’y a même pas de consensus au sein de notre entreprise. Cependant, nous misons sur trois directions :
- Les mathématiques et le code, qui servent de terrain d’essai naturel pour l’AGI—comme le jeu de Go, ce sont des systèmes clos et vérifiables où l’apprentissage autonome pourrait conduire à une intelligence élevée.
- La multimodalité, où l’IA interagit avec le monde réel pour apprendre.
- Le langage naturel lui-même, qui est fondamental pour une intelligence semblable à celle de l’homme.
Nous sommes ouverts à toutes les possibilités.
An Yong : Comment envisagez-vous l’aboutissement des grands modèles d’IA ?
Liang Wenfeng : Il y aura des entreprises spécialisées fournissant des modèles de base et des services, formant une longue chaîne de valeur de divisions spécialisées. Plus de joueurs émergeront pour répondre aux divers besoins de la société sur ces bases.
Toutes les stratégies sont des produits du passé
An Yong : Au cours de la dernière année, le paysage des startups de grands modèles en Chine a connu de nombreux changements. Par exemple, Wang Huiwen【3】, très actif au début, a quitté la course à mi-parcours, tandis que de nouveaux entrants commencent à se différencier.
Liang Wenfeng : Wang Huiwen a assumé toutes les pertes lui-même, permettant aux autres de partir indemnes. Il a pris une décision très défavorable pour lui-même mais bénéfique pour tous les autres. J’admire vraiment son intégrité.
An Yong : Où concentrez-vous actuellement la majeure partie de votre énergie ?
Liang Wenfeng : Je me concentre principalement sur la recherche de la prochaine génération de grands modèles. Il reste encore de nombreux défis non résolus.
An Yong : De nombreuses autres startups en IA insistent pour équilibrer le développement de modèles et les applications, car les avances techniques ne sont pas permanentes. Pourquoi DeepSeek est-il confiant dans sa concentration exclusive sur la recherche ? Est-ce parce que vos modèles sont encore en retard ?
Liang Wenfeng : Toutes les stratégies sont des produits de la génération précédente et peuvent ne pas tenir dans le futur. Discuter de la rentabilité future de l’IA en utilisant la logique commerciale de l’ère internet, c’est comme comparer les débuts de Tencent à General Electric ou Coca-Cola—c’est essentiellement sculpter un bateau pour marquer la position d’une épée, une approche dépassée.
An Yong : Huanfang avait de solides gènes technologiques et innovants, et sa croissance semblait relativement fluide. Est-ce pour cela que vous restez optimiste ?
Liang Wenfeng : Huanfang, dans une certaine mesure, a renforcé notre confiance dans l’innovation technologique, mais ce n’était pas toujours facile. Nous avons traversé un long processus d’accumulation. Les gens n’ont vu que ce qui s’est passé après 2015, mais en réalité, nous y travaillions depuis 16 ans.
An Yong : Revenons à l’innovation originale : avec le ralentissement économique et le refroidissement des capitaux, cela étouffera-t-il la R&D révolutionnaire ?
Liang Wenfeng : Pas nécessairement. La restructuration du paysage industriel chinois reposera de plus en plus sur l’innovation technologique profonde. À mesure que les opportunités de profit rapide disparaissent, davantage de personnes embrasseront la véritable innovation.
An Yong : Vous êtes donc optimiste à ce sujet ?
Liang Wenfeng : J’ai grandi dans les années 1980 dans une ville de cinquième catégorie du Guangdong. Mon père était instituteur. Dans les années 1990, il y avait beaucoup d’opportunités pour gagner de l’argent dans le Guangdong. De nombreux parents venaient chez nous et argumentaient que les études étaient inutiles. Mais aujourd’hui, les perspectives ont changé. Gagner de l’argent n’est plus aussi facile qu’avant—même conduire un taxi n’est plus une option viable. En une seule génération, les choses ont changé.
L’innovation de pointe ne fera qu’augmenter à l’avenir. Ce n’est pas largement compris maintenant parce que la société dans son ensemble doit apprendre de la réalité. Lorsque cette société commencera à célébrer le succès des innovateurs en technologie profonde, les perceptions collectives changeront. Nous avons juste besoin de plus d’exemples concrets et de temps pour permettre à ce processus de se dérouler.
Références
【1】Huanfang : Une firme d’investissement quantitatif et un soutien précoce de DeepSeek.
【2】MoE : Mixture of Experts, une architecture qui améliore l’efficacité des modèles en activant des sous-réseaux spécialisés.
【3】Wang Huiwen : Cofondateur de Meituan, qui a brièvement participé à la course à l’IA en 2023 avant de se retirer.