L'Administration nationale des données de la Chine a publié son premier cadre systématique national pour le développement de l'IA alimentée par les données, fixant 2028 comme échéance pour le déploiement de jeux de données de haute qualité à l'échelle industrielle.
Le régulateur chinois des données a publié le 3 juin son premier cadre systématique national pour l'utilisation des données au service de l'intelligence artificielle, imposant la construction de jeux de données de haute qualité dans plus de 20 secteurs d'ici 2028, alors que le gouvernement cherche à accélérer l'adoption de l'IA au-delà de l'internet grand public.
« Le plan aborde la chaîne complète de la construction de jeux de données, de la collecte et de l'annotation à l'application et à la réalisation de valeur », a déclaré Hu Jianbo, président de l'Institut national de recherche sur le développement des données, dans un entretien aux médias d'État. « Il cible les domaines clés et émergents, notamment la recherche scientifique, la fabrication industrielle, l'économie de basse altitude et l'intelligence incarnée. »
Le plan d'action, publié sous le numéro de document Guo Shu Ke Ji [2026] n° 25, définit six campagnes spéciales couvrant l'expansion des fondations, l'annotation des données, l'amélioration de la qualité, l'activation des applications, les services de gestion et la libération de valeur. Il prévoit des jeux de données multimodaux couvrant le texte, le code, les images, l'audio, la vidéo, les nuages de points et les données de séries temporelles, avec des mandats spécifiques pour l'intelligence incarnée, la conduite autonome et le développement de modèles du monde. Le plan désigne également l'annotation des données comme une capacité stratégique, s'appuyant sur sept villes pilotes déjà désignées pour l'innovation en matière d'annotation et prévoyant des zones de test supplémentaires.
Cette politique marque un tournant pour l'économie des données d'IA en Chine. En établissant un système de valeur basé sur les tokens — l'Administration nationale des données a officiellement classé en mars 2026 les tokens comme « ciyuan » (éléments de mot), les élevant d'un concept technique à un actif stratégique national — le cadre crée l'infrastructure pour la tarification, la négociation et le règlement des données. Le gouvernement oriente les institutions financières, les capitaux patients et les fonds sectoriels pour accroître les investissements dans la construction de jeux de données, tout en encourageant les agences gouvernementales et les entreprises publiques à inclure les achats de données dans la planification budgétaire.
L'annotation des données et l'économie des tokens au premier plan
Un pilier central du plan est la transformation de l'annotation des données, d'un processus à forte intensité de main-d'œuvre en un processus augmenté par l'IA. Le cadre impose une évolution vers la collaboration homme-machine avec la participation d'experts, favorisant le pré-étiquetage assisté par modèle et la vérification automatisée de la qualité. Il prévoit un mécanisme de certification des experts pour garantir que les connaissances spécifiques au domaine sont intégrées dans les données d'entraînement pour le réglage fin par instructions et l'apprentissage par renforcement.
Côté capture de valeur, le plan approuve explicitement les transactions basées sur les tokens comme nouveau modèle de négociation, visant à construire un système de valeur des données quantifiable et tarifiable avec les tokens comme unité de base. Cela s'aligne sur les développements parallèles de l'industrie : le 8 juin, PATEO (02889.HK), cotée à Shanghai, a annoncé un partenariat tripartite avec Xunce Technology et Saimo Technology pour construire TokenOS, une infrastructure de tokens en périphérie pour les scénarios d'IA embarquée dans les véhicules, et un modèle du monde d'IA physique — la première alliance en boucle fermée de valeur complète au sein de l'écosystème Nvidia.
Le cadre des droits sur les données ouvre la voie à l'actifisation
Le plan fait progresser le système chinois de séparation des trois droits sur les données — droits de détention, droits d'utilisation et droits d'exploitation — et appelle à des règles plus claires sur l'utilisation de contenus protégés par le droit d'auteur pour l'entraînement des modèles. Il encourage les programmes pilotes d'enregistrement des actifs de données, d'évaluation et de modèles de financement innovants, notamment les prêts garantis par des données, les apports en capital, les titrisations adossées à des actifs, les fiducies de données et l'assurance des données.
Le cadre impose également un système national de services de gestion des jeux de données avec une architecture physiquement distribuée mais logiquement centralisée, utilisant le calcul préservant la confidentialité et la blockchain pour garantir la traçabilité. Une norme d'évaluation de la qualité unifiée est prévue, avec un mécanisme de certification « une évaluation, reconnue au niveau national » pour réduire les tests redondants.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.