Alibaba dévoile une puce IA Zhenwu plus puissante et un nouveau LLM


Un logo Alibaba est visible sur un stand de l’entreprise, lors de la China International Fair for Trade in Services (CIFTIS) à Pékin.

Alibaba a annoncé une nouvelle avancée dans ses puces d’intelligence artificielle avec le Zhenwu M890. Présenté comme trois fois plus performant que la génération précédente, ce processeur s’inscrit dans la course à l’autonomie technologique de la Chine, alors que l’accès aux puces de pointe reste plus difficile, notamment en raison des restrictions à l’export.

Un Zhenwu M890 annoncé comme trois fois plus puissant

Selon Alibaba, le Zhenwu M890 offre des performances « trois fois supérieures » à celles du Zhenwu 810E, actuel dans la gamme. Le constructeur met également en avant deux caractéristiques matérielles : une mémoire GPU de 144 Go et une capacité d’échange entre puces annoncée à 800 Go par seconde.

Alibaba affirme par ailleurs avoir déjà livré 560 000 unités Zhenwu à plus de 400 clients, répartis dans 20 secteurs. Cette donnée vise à montrer que les puces ne sont pas seulement en phase de démonstration, mais déjà déployées à grande échelle dans des environnements professionnels.

Un levier pour T-Head et le marché chinois des accélérateurs IA

Le lancement du M890 pourrait renforcer la position d’Alibaba dans le marché domestique des accélérateurs IA, où se côtoient plusieurs acteurs. L’entreprise peut aussi compter sur son écosystème interne, notamment via T-Head, sa filiale dédiée aux puces.

Un analyste cité dans les informations disponibles estime que les puces conçues par Alibaba progressent auprès de clients externes et figurent désormais parmi les plateformes appréciées des fabricants chinois d’équipements IA.

En revanche, l’écosystème reste à surveiller : l’analyste souligne que les chiffres marketing concernant la mémoire et la bande passante ne suffisent pas, à eux seuls, à se comparer directement aux références des grands acteurs occidentaux. Alibaba n’a pas communiqué, dans l’immédiat, d’autres indicateurs clés tels que la performance de calcul brute.

Contexte : contraintes d’accès aux puces avancées et montée des exigences locales

Le développement d’accélérateurs domestiques en Chine s’explique en partie par les limitations imposées aux achats de composants de pointe auprès de fournisseurs occidentaux, dans un cadre lié aux règles américaines d’exportation. Dans ce contexte, la compétition entre solutions locales et alternatives plus accessibles est particulièrement structurante pour les développeurs.

Dans le même temps, les autorités chinoises ont renforcé la surveillance de l’utilisation de certaines puces étrangères dans des projets IA, même si des décisions récentes côté États-Unis ont concerné des autorisations de vente en Chine. Cette dynamique contribue à accélérer l’adoption de solutions fabriquées sur place.

Des progrès compatibles avec les besoins des modèles IA d’Alibaba

Alibaba indique que sa trajectoire sur les puces IA s’aligne avec la demande de calcul liée à ses modèles de langage. La mise à jour du matériel pourrait ainsi soutenir l’exécution et l’optimisation de ses systèmes, à mesure que la firme déploie ses modèles à plus grande échelle.

Parallèlement, l’entreprise a aussi évoqué l’arrivée prochaine de son prochain modèle de langage, Qwen3.7-Max, qui illustre la continuité entre l’amélioration du matériel et l’évolution des capacités logicielles.

Repères pour le marché : ce qui devrait être déterminant ensuite

  • La publication de métriques supplémentaires (performances de calcul, efficacité énergétique, latence) pour comparer plus finement le Zhenwu M890 aux solutions concurrentes.
  • La capacité à maintenir un haut niveau de disponibilité et de livraison, compte tenu des besoins croissants des centres de données.
  • Le rôle des puces dans l’optimisation des modèles IA d’Alibaba, notamment pour l’entraînement et l’inférence à grande échelle.

Suggestions de matériel pour un usage IA (référence)

Pour ceux qui souhaitent évaluer un environnement compatible avec des charges d’IA, un point de départ courant est l’achat d’un serveur ou châssis pour GPU selon le budget et les contraintes d’intégration. Côté mémoire et bande passante, la sélection de composants de stockage et de RAM est aussi déterminante ; un NVMe PCIe 4.0 peut servir de base pour limiter certains goulets d’étranglement lors du traitement de jeux de données volumineux.

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *