Một AI của Google vừa giải được các bài toán đã làm khó con người trong nhiều thập kỷ, nhưng đột phá thực sự là cách nó có thể chấm dứt vấn đề ảo giác trị giá hàng tỷ đô la của AI.
Một AI của Google vừa giải được các bài toán đã làm khó con người trong nhiều thập kỷ, nhưng đột phá thực sự là cách nó có thể chấm dứt vấn đề ảo giác trị giá hàng tỷ đô la của AI.

AlphaProof Nexus của Google DeepMind, một hệ thống AI kết hợp các mô hình ngôn ngữ lớn với việc kiểm tra chứng minh hình thức, đã giải được 9 trong số 353 bài toán Erdős mở và 44 trong số 492 giả thuyết mở từ Từ điển bách khoa toàn thư trực tuyến về các dãy số nguyên. Đột phá này, chỉ tốn vài trăm đô la cho mỗi bài toán, thể hiện một ranh giới mới trong xác minh hình thức dựa trên AI, có thể thay đổi cách xây dựng các phần mềm quan trọng.
Eve Bodina, người sáng lập và CEO của Logical Intelligence, một phòng thí nghiệm AI đối thủ, cho biết trong một tuyên bố gần đây: "Các tổ chức nên thận trọng với việc lập trình theo cảm tính (vibe coding) mà không có xác minh, vì các hệ thống AI đang nhanh chóng tiến vào những môi trường mà tính chính xác không còn là tùy chọn nữa. Các tiêu chuẩn suy luận hình thức ngày càng quan trọng vì chúng buộc các hệ thống AI phải hoạt động trong những môi trường nơi tính chính xác được thực thi về mặt toán học."
Các kết quả đã được ghi lại trong một bản thảo arXiv (2605.22763v1) công bố vào ngày 21 tháng 5 năm 2026. AlphaProof Nexus hoạt động bằng cách tạo ra một chứng minh toán học với một mô hình ngôn ngữ lớn và sau đó sử dụng trợ lý chứng minh Lean để kiểm tra từng bước logic xem có chính xác không. "Vòng lặp tác nhân" (agentic loop) này lặp lại các chứng minh được đề xuất cho đến khi chúng được xác minh hình thức, một phản ứng trực tiếp đối với vấn đề ảo giác AI dai dẳng vốn đã gây trở ngại cho việc áp dụng trong doanh nghiệp.
Sự phát triển này đưa AI từ việc tạo ra văn bản nghe có vẻ hợp lý sang việc tạo ra logic có thể chứng minh là chính xác. Các tác động vượt xa phạm vi học thuật, đe dọa thay đổi tính kinh tế của việc kiểm tra hợp đồng thông minh, thiết kế giao thức mật mã và tạo chứng minh không tri thức—những lĩnh vực mà một lỗi logic duy nhất có thể dẫn đến tổn thất tài chính thảm khốc.
Google không đơn độc trong việc sử dụng AI để giải quyết các vấn đề toán học tiên phong. OpenAI gần đây đã thông báo một trong những mô hình đa dụng của mình đã bác bỏ một giả thuyết trung tâm liên quan đến bài toán khoảng cách đơn vị phẳng Erdős bằng cách tìm ra một phản ví dụ mới. Trong khi AlphaProof Nexus của DeepMind chứng minh các giả thuyết hàng thập kỷ là đúng, thì mô hình của OpenAI đã tìm thấy một lỗ hổng trong một niềm tin toán học lâu đời. Tuy nhiên, cả hai thành tựu này đều dựa vào các nhà toán học ưu tú của con người để kiểm tra, tinh chỉnh và diễn giải đầu ra của AI, hướng tới một sự phân công lao động mới giữa người và máy.
Các cách tiếp cận khác nhau làm nổi bật một xu hướng chính: ngành công nghiệp AI đang vượt ra ngoài điểm số tiêu chuẩn và hướng tới việc giải quyết các bài toán mở chưa có lời giải. Sự chuyển trục từ các bài kiểm tra được chuẩn bị sẵn sang nghiên cứu tiên phong là một bước quan trọng trong việc chứng minh giá trị của AI như một cộng sự trong khoa học và kỹ thuật, chứ không chỉ là một công cụ tóm tắt. Thách thức cốt lõi vẫn là niềm tin, khi các ảo giác do AI tạo ra tiếp tục xuất hiện trong các phòng xử án và các bài báo học thuật.
Cuộc đua thương mại hóa công nghệ này đã bắt đầu. Logical Intelligence, một phòng thí nghiệm AI tập trung vào các mô hình suy luận dựa trên năng lượng, gần đây đã thông báo rằng tác nhân của mình, Aleph, đã giải được 99,4% PutnamBench, một tiêu chuẩn cho việc chứng minh định lý toán học nâng cao. Hiệu suất này vượt xa các hệ thống từ ByteDance và các đối thủ cạnh tranh khác.
Logical Intelligence đã triển khai Aleph trong các quy trình xác minh sản xuất, bao gồm làm việc với các thư viện mật mã của Ethereum Foundation. Sự chuyển đổi này từ chứng minh khái niệm học thuật sang xác minh cấp độ sản xuất cho cơ sở hạ tầng quan trọng cho thấy một thị trường mới đang hình thành. Các công ty đang xây dựng AI không chỉ để tạo mã, mà còn để chứng minh mã đó là chính xác trước khi nó được đưa vào môi trường sản xuất nơi các lỗi có thể gây ra hậu quả trong thế giới thực.
Đối với các nhà đầu tư, hiểu biết then chốt là khả năng tạo ra đầu ra có thể chứng minh là chính xác là một yêu cầu nền tảng để mở rộng quy mô AI trong các hệ thống quan trọng. Sự thay đổi này giải quyết trực tiếp điểm yếu chính của các mô hình tạo sinh hiện nay: xu hướng bịa đặt dưới áp lực. Trong khi thành tựu của Alphabet (GOOGL) với AlphaProof Nexus củng cố vị thế dẫn đầu của mình trong nghiên cứu AI, sự xuất hiện của các công ty chuyên biệt như Logical Intelligence cho thấy một lớp cơ sở hạ tầng mới cho "AI được xác minh" đang được xây dựng. Công nghệ này sẽ thiết yếu cho bất kỳ ngành nào, từ tài chính đến năng lượng, vốn không thể chấp nhận rủi ro sai sót.
Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.