Les résultats étonnants de la Chine dans l’IA ont un endroit éblouissant avec éblouissement: accès au calcul – la force de traitement brute qui brûle l’IA et dépend de grandes quantités de semi-conducteurs avancés. Les États-Unis en ont actuellement un Dix fois avantage Sur la Chine dans la capacité globale de calcul, un trou est élargi qui ne peut être élargi qu’au fil du temps. US Tech-Companies coule Des milliards de dollars dans de nouveaux centres de données Et peut profiter des avantages des dernières progrès des puces de NVIDIA et AMD ou de leurs propres puces d’IA auto-développées.
Pendant ce temps, les performances et la quantité de puces d’IA étrangères que les entreprises chinoises peuvent atteindre ont baissé avec le temps en raison du contrôle des exportations américaines encore plus stricte. Des chefs de technologie chinois tels que TencentÀ Baiduet En profondeur a appelé les restrictions calculées comme un goulot d’étranglement clé pour le développement plus rapide de l’IA.
Les puces AI produites par Huawei, produites par Huawei, connues sous le nom de série Ascend, peuvent sembler être la solution évidente aux défis de calcul de la Chine. Mais il y a un hic: les entreprises technologiques chinoises ne veulent pas utiliser les jetons de Huawei suspendues derrière leurs collègues étrangers pour éduquer leurs modèles d’IA. En 2024, les entreprises chinoises ont acheté environ 1 million de puces Nvidia H20 par rapport à une Expédition estimée de 450 000 puces Huawei Ascend 910b.
Seule une poignée d’entreprises parrainées par l’État en Chine ont utilisé des puces Huawei pour former leurs modèles, notamment IflignekÀ Dernière foiset China Mobile. Les entreprises chinoises tirent leurs pieds en passant aux puces d’IA domestiques malgré pression des agences du gouvernement central chinois pour le faire.
Les développeurs d’IA chinois préfèrent écraser les nvidia-chips-auto-performances et beaucoup de performances et beaucoup pour y accéder. Beaucoup des meilleurs modèles d’IA chinois aujourd’hui sont toujours formés sur le matériel de Nvidia, notamment Modèle Deepseeks V3 et Modèle Kimi K2 de Moonshot. Dans l’interdiction américaine des puces H20 de Nvidia, Bytedance, Alibaba et Tencent se sont précipités pour utiliser 16 milliards de dollars aux actions d’environ. 1,3 à 1,6 million d’unités H20.
À la fin de 2024, Bytedance avait prévu d’utiliser 7 milliards de dollars Pour accéder aux puces Nvidia sur des serveurs en dehors de la Chine. Les entreprises technologiques chinoises ont perdu Marchés noirs à travers l’Asie ainsi que Sites de commerce électronique Acquérir des puches de nvidia interdites pour autant que doubler leur prix normalDoubler le prix. Les acheteurs chinois ont même recours à l’achat Chips de jeu RTX de Nvidia en tant que substituts même s’ils ne sont pas conçus pour les charges de travail de l’IA, et Conversement de disques durs pleins de données du pays Pour former des modèles sur des serveurs en dehors de la Chine.
Pourquoi les développeurs d’IA de la Chine sont-ils si réticents à passer de Nvidia à Huawei, même lorsque leur accès aux puces Nvidia devient de plus en plus limité?
Premièrement, les puces en panne de Nvidia à vendre en Chine sont toujours des jetons de Huawei dans certaines dimensions importantes. Huawei Ascender 910b Chips Utilisez la technologie de mémoire HBM2E plus ancienne qui n’offre que les deux tiers de la capacité de mémoire et 40% de la bande passante des puces H20 de NVIDIA.
Le plus récent de Huawei Ascender 910C ChipsCela augmente la production cette année, offre 80% de la bande passante de H20 mais toujours en utilisant Norme demory HBM2E plus ancienne Ce sont deux générations derrière les puces d’IA les plus avancées. Cet écart dans le bénéfice de la mémoire est particulièrement important compte tenu de l’augmentation des modèles de raisonnement et de l’inférence, où la bande passante de la mémoire joue un rôle important.
Une autre raison clé pour laquelle les entreprises technologiques chinoises ne peuvent pas facilement mettre fin à Nvidia est la même raison pour laquelle les entreprises technologiques américaines ne peuvent pas: Cuda. La plate-forme informatique parallèle de NVIDIA lancée en 2006 s’est accumulée et est étroitement intégrée à Pytorch, le cadre AI dominant qui crée un écosystème logiciel mature qui verrouille les développeurs dans les systèmes NVIDIA AI.
Pour les sociétés technologiques chinoises, cela signifie passer du code de réécriture de NVIDIA, abandonner cette infrastructure de pointe et perdre l’accès aux applications dans les bibliothèques CUDA construites au fil des années de développeurs mondiaux. Les alternatives de Huawei – son cadre de poule et de suivi de l’esprit, lancé dans 2018 et 2019– est plus récent, moins mature et en proie à des problèmes techniques Insectesplante et Surchauffe.
Avec une base d’utilisateurs IA-durware beaucoup plus petite que les systèmes de NVIDIA, Huawei n’a pas les commentaires de liaison élevés du monde réel de plus grands clients qui sont rapidement nécessaires pour affiner rapidement ses puces et ses logiciels. En conséquence, les solutions d’IA de Huawei ne sont pas en mesure de profiter du type d’optimisation itérative qui a fait de la Chine un leader mondial d’autres industries.
Bien que l’accès aux puces Nvidia devienne de plus en plus difficile, l’alimentation des puces de Huawei reste à la fois limitée et incertaine. Les contrôles d’exportation dirigés par les États-Unis sur l’équipement de production pour le semi-conducteur vers la Chine ont limité les fonctions de fabrication de chipons du pays.
En particulier, Huawei et Smic ont eu du mal à augmenter la production de puces avancées au niveau du processus de 7 nanomètres ou moins. Le manque d’accès à des machines à lithographie ultraviolette extrême (EUV) des outils ASML et américains pour les tâches clés telles que la gravure et le marketing a rendu difficile pour SMIC de produire des puces avancées précis et fiablePour garder ses résultats de production bien en dessous du directeur de l’industrie TSMC.
Alors que Smic fait des progrès constants et Huawei est en passe de vendre un million Ascension meurt cette année, Huawei acquis Plus de 2 millions de matrices logiques de TSMC, un composant de puce de base, pour ses puces Ascend 910B et 910C en 2024. Ironiquement, parce que Huawei est déjà fortement sanctionné, il fait face à une punition pour avoir un contrôle d’exportation de jupe de cette manière.
Les entreprises chinoises sont également en service contre les risques commerciaux et géopolitiques supplémentaires associés à Huawei, qui est une cible fréquente pour le gouvernement américain depuis des années. Par exemple, le ministère américain du Commerce en mai a averti que l’utilisation de Huawei-Chips »Dans le monde entier«Pourraient violer les règles de contrôle des exportations américaines avant d’ajuster plus tard leur avis.
Huawei n’est pas seulement un fournisseur de puces pour les entreprises technologiques chinoises, mais aussi un solide concurrent. Huawei est la Chine Le deuxième plus grand fournisseur de services cloud et a développé sa propre famille Pangu open source de modèles d’IA. D’autres entreprises de technologie chinoises regorgent de Huawei pour fournir des services cloud non seulement en Chine Mais aussi mondialement–Mopling Huaweis frappe une opportunité impopulaire pour les entreprises qui participent à la même pièce.
Cependant, cela peut changer si les États-Unis prennent les mauvaises décisions.
Alors que les puces de Huawei ont des performances de mémoire de bande passante plus faibles que les puces H20 de NVIDIA, les puces Huaweis 910B et 910C offrent déjà des performances de traitement totales plus élevées (TPP) et une meilleure efficacité énergétique (TPP / WATT) que H20. Loin d’être un “Puce puissante«Comme certains l’ont prétendu, le H20 a en fait de moins moins les performances de calcul et l’efficacité énergétique que les plus âgés de Nvidia A100 Chips a été lancé en 2020. De plus, Huawei a pu Améliorer le calcul du calcul de ses puces de montéeMême après avoir modifié la production du producteur de chipp taiwanais TSMC à la propre SMIC de la Chine après le contrôle des exportations américaines.
Peut-être plus important encore, Huawei a fait des progrès importants à égalité avec les systèmes informatiques de l’IA. Huawei a récemment révélé son Système CloudMatrix 384Composé de 384 par les dernières puces 910C de Huawei et une nouvelle méthode de réseau entièrement optique. Selon SemianalyseLe nouveau système CloudMatrix de Huawei dépasse le système avancé GB200 NVL72 avancé de NVIDIA sur des dimensions clés telles que l’effet de calcul (la rapidité avec laquelle la puce peut traiter de grandes quantités de données), la bande passante de mémoire et le réseau intégré.
Bien que le nouveau système de Huawei soit beaucoup plus cher et à forte intensité d’énergie que l’homologue de Nvidia, ce qui peut limiter l’absorption des clients, il marque une progression frappante dans les performances au niveau du système, ce qui peut être encore plus important que les performances individuelles des puces pour augmenter les grands grappes AI-ordinateur.
En un Document technique ultérieurHuawei a déjà prouvé que son nouveau système CloudMatrix peut être utilisé avec succès pour former des modèles d’IA avancés. Les problèmes de prix et d’énergie sont susceptibles d’être gérables pour Huawei car il continue d’investir massivement dans la R&D et de recevoir des aides d’État importantes.
Alors que les systèmes Huaweis IA continuent de nous améliorer, les politiques de contrôle des exportations américaines doivent être soigneusement calibrées pour éviter de pousser trop loin l’industrie de l’IA chinoise. Si les puces d’IA intérieures de la Chine continuent de s’améliorer, tandis que les puces américaines disponibles en Chine sont encore rétrogradées par le contrôle des exportations, il y aura un point de transition où les performances des puces chinoises dépassent clairement les puces américaines disponibles en Chine.
Le point de basculement crucial peut être que si les plus grandes sociétés technologiques de la Chine, telles que Alibaba, Tencent et Bytedance, ont jeté leurs formidables ressources contre le travail avec des fabricants de puces d’IA chinois. Cela commencerait une boucle de rétroaction positive pour les fabricants de chiples d’IA en Chine, en particulier Huawei, construisent les bibliothèques de logiciels et les outils pour créer un écosystème de logiciel chinois complet en matière d’IA-durware. Lorsque ce processus est en cours, il marquerait également un point sans retour pour les fabricants de puces AI comme Nvidia sur le marché chinois.
Il y a déjà quelques signes de ce changement potentiel. En profondeur et Bytedance Expérimenter l’utilisation des puces Huaweis AI pour exécuter leurs modèles AI. Groupe de fourmisUn spin-off d’Alibaba teste même l’utilisation des puces de Huawei pour la formation modèle. Huaweis Ascend Developer Community a cultivé presque dix fois Au cours des quatre dernières années, bien qu’elle reste bien moins que celle de Nvidia.
D’autres fabricants de puces en IA chinois en plus de Huawei font également des progrès, notamment Cambricon, Biren, Moore Threads, Enflame et Hycle. Cambricon a vu ses revenus au premier trimestre plus que42 foisQuartyfolds l’année dernière et a reçu une grande commande pour ses puces AI de la danse d’octetsLes revenus de Cambricon sont Attendu Pour croître 3,7 fois à 5,5 milliards de yuans cette année selon Goldman Sachs. Le PDG de Nvidia, Jensen Huang, a déclaré que la part de marché de Nvidia en Chine avait abandonné De 95% à 50% – une réclamation Soutenu par autre analyse crédible.
Les États-Unis ont besoin d’une approche plus sophistiquée pour le contrôle des exportations. Le tourner De l’interdiction de la puce H20 de l’administration Trump était un pas dans la bonne direction. En même temps, la Maison Blanche est nouvelle Plan d’action de l’IA Reconnaît correctement que gagner la course de l’IA avec la Chine dépend de la pile technologique américaine, y compris ses puces d’IA, la plate-forme dominante pour le développement mondial de l’IA.
Les commandes d’exportation de semi-conducteurs ne sont pas aussi simples que de resserrer la valve sur une pression. La Chine-Chip -Dilemma est non seulement un problème matériel mais un écosystème. Huawei a désormais accès à bon nombre des ressources les plus importantes dont elle a besoin pour développer des puces d’IA avancées, y compris le financement et les talents. Mais il manque une clientèle importante et dédiée qui est nécessaire pour co-baisser les logiciels et le matériel offerts par Huawei.
Une approche intelligente du contrôle d’exportation se concentrera sur la définition d’une limite de performances pour les puces d’IA qui peuvent être vendues à la Chine en fonction d’une fenêtre entre les fonctionnalités matérielles américaines et chinoises. Le seuil de performance doit être suffisamment élevé pour dépasser les paramètres matériels intérieurs de la Chine pour garantir que les développeurs chinois restent sur les plates-formes américaines. Dans le même temps, il doit être suffisamment bas pour maintenir un écart de prestations significatif avec les systèmes matériels disponibles pour les développeurs américains.
Idéalement, cette limite de prestations comprendra un tampon, comme un avantage de 50% par rapport aux systèmes matériels chinois sur les mesures clés, en prévision des améliorations des offres matérielles chinoises. Une mise à jour annuelle régulière avec des modifications ad hoc pour un développement inattendu serait probablement suffisante pour s’adapter aux progrès réalisés dans les puces d’IA chinois tout en offrant une stabilité politique suffisante pour les industriels.
L’objectif politique global est clair: assurez-vous que les États-Unis continuent de diriger le monde en IA. En limitant l’accès de la Chine aux puces révolutionnaires sans pousser les développeurs d’IA chinois à faire le saut dans les propres puces intérieures de la Chine, les États-Unis peuvent utiliser les contrôles d’exportation pour en faire une réalité.
Les points de vue exprimés par les auteurs ne représentent pas ceux de leurs institutions affiliées.