Le PDG de Perplexity affirme que l'efficacité des tokens décidera des gagnants de la course à l'IA

Un seul indicateur d'efficacité pourrait déterminer quelle entreprise d'IA obtiendra la plus haute valorisation — et il n'a rien à voir avec les revenus.

Le PDG de Perplexity, Aravind Srinivas, a déclaré mercredi que les entreprises capables de maximiser la « valeur par watt par token utilisateur » émergeront comme les gagnantes à long terme dans l'intelligence artificielle, proposant un cadre qui déplace l'attention des investisseurs de la croissance du chiffre d'affaires vers l'efficacité opérationnelle. Cet indicateur combine précision, latence, coût, confidentialité et intelligence en un ratio unique de production économique par unité d'énergie consommée, a-t-il expliqué dans une interview sur CNBC.

« Celui qui pourra maximiser cela — en équilibrant précision, latence, coût, confidentialité et intelligence — sera le gagnant à long terme », a déclaré Srinivas. Il a opposé son cadre à ce qu'il a décrit comme une croissance des revenus à court terme alimentée par des prix élevés, affirmant que certains fournisseurs de modèles « donnent l'impression de gagner beaucoup d'argent parce que leurs modèles sont très chers », mais que ces revenus pourraient ne pas se traduire par un avantage concurrentiel durable.

Ces commentaires interviennent alors que les coûts des tokens d'IA se sont effondrés, passant d'environ 20 dollars par million de tokens fin 2022 à environ 0,40 dollar par million de tokens à la mi-2025, selon les données d'Epoch AI. Pourtant, les dépenses totales des entreprises en IA ont évolué dans la direction opposée : les dépenses mensuelles moyennes des entreprises en IA sont passées à 85 500 dollars en 2025 contre 63 000 dollars en 2024, et près de la moitié des entreprises dépensent désormais plus de 100 000 dollars par mois en infrastructures ou services d'IA. Cette divergence — des tokens moins chers entraînant une consommation exponentiellement plus élevée — reflète l'effet paradoxe de Jevons que le PDG de Mercor, Brendan Foody, a récemment décrit en affirmant que sa startup dépense désormais plus en tokens d'IA qu'en salaires.

L'indicateur d'efficacité qui pourrait redéfinir les valorisations dans l'IA

Le cadre de Srinivas arrive à un moment où l'industrie de l'IA est confrontée à un décalage croissant entre les dépenses et les retours. Les recherches montrent que 85 % des entreprises peinent à démontrer un retour sur investissement clair de leurs déploiements d'IA, même si les capacités des modèles s'améliorent à un rythme rapide. Le directeur des opérations d'Uber, Andrew Macdonald, a récemment déclaré n'avoir pas encore observé de lien proportionnel entre l'augmentation des dépenses en tokens d'IA et les gains de productivité, soulignant le défi que représente la traduction du progrès technique en résultats commerciaux mesurables.

Perplexity elle-même illustre l'écart de valorisation que l'indicateur de Srinivas vise à combler. La startup de recherche en IA est valorisée à environ 20 milliards de dollars, selon des rapports — une fraction de la valorisation estimée d'Anthropic à environ 1 000 milliards de dollars et du prix de plus de 850 milliards de dollars d'OpenAI. En proposant un cadre qui privilégie l'efficacité à l'échelle, Srinivas plaide en substance que l'approche plus légère de Perplexity en matière de gestion des coûts d'inférence pourrait offrir des rendements supérieurs par dollar, même sans égaler les budgets de calcul bruts de ses plus grands rivaux.

L'entreprise élargit simultanément son empreinte produit. Perplexity Computer, un agent IA capable d'exécuter des tâches complexes en plusieurs étapes sur de longues périodes, est désormais disponible sur Microsoft Windows après son lancement sur la plateforme Mac d'Apple en février. La version Windows peut accéder à Word, Outlook et aux fichiers locaux des appareils, étendant ainsi la portée de Perplexity de la recherche cloud à la productivité sur l'appareil — une démarche qui la place en concurrence directe avec Copilot de Microsoft et l'agent Codex d'OpenAI, que Microsoft a récemment intégré à ses nouveaux conteneurs d'exécution (MXC), un environnement sécurisé pour le déploiement d'agents.

L'expansion vers Windows donne à Perplexity accès au système d'exploitation qui équipe la majorité des postes de travail en entreprise, mais elle place également la startup en concurrence avec les propres ambitions de Microsoft en matière d'IA. Le projet Solara de Microsoft, dévoilé lors de la conférence Build cette semaine, envisage un avenir où les appareils exécutent des agents IA plutôt que des applications traditionnelles, tandis que sa plateforme MXC offre un confinement de sécurité au niveau du noyau pour les agents autonomes — une infrastructure dans laquelle l'agent de Perplexity devra opérer sur les machines Windows.

Pour les investisseurs, l'indicateur d'efficacité de Srinivas offre une nouvelle perspective pour évaluer les entreprises d'IA à un moment où l'industrie dépense des centaines de milliards en infrastructures avec un retour sur investissement incertain. Les entreprises capables de démontrer des coûts d'inférence plus faibles par résultat réussi — que ce soit grâce à l'architecture des modèles, à l'optimisation matérielle ou à une conception de workflows plus intelligente — pourraient obtenir des valorisations premium même si leurs revenus absolus sont inférieurs à ceux de leurs pairs plus importants. La question est de savoir si le marché adoptera un indicateur qui pénalise l'échelle même qui a généré les gains les plus spectaculaires du secteur de l'IA.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.