Microsoft ra mắt mô hình suy luận MAI-Thinking-1 với 35 tỷ tham số

Mô hình suy luận nội bộ đầu tiên của Microsoft thách thức Anthropic và OpenAI trên các chuẩn mực doanh nghiệp mà không dựa vào phương pháp chưng cất.

Microsoft Corp. đã công bố MAI-Thinking-1, mô hình suy luận độc quyền đầu tiên với 35 tỷ tham số hoạt động, tại hội nghị Build 2026 hôm thứ Ba, trực tiếp thách thức các dòng mô hình Claude của Anthropic và GPT của OpenAI trên thị trường AI doanh nghiệp.

"MAI-Thinking-1 được thiết kế để xử lý tốt các hướng dẫn đa bước phức tạp, suy luận ngữ cảnh dài và sinh mã nguồn," Kyle Daigle, Giám đốc Tiếp thị của Microsoft Developer kiêm Giám đốc Vận hành của GitHub, phát biểu tại một cuộc họp báo trước bài phát biểu chính.

Mô hình này được xây dựng từ đầu trên dữ liệu được cấp phép thương mại mà không sử dụng phương pháp chưng cất từ các mô hình bên thứ ba, sở hữu cửa sổ ngữ cảnh 128.000 token. Theo Microsoft, các đơn vị đánh giá độc lập ưa chuộng mô hình này hơn Claude Sonnet 4.6 của Anthropic, và nó đạt hiệu suất ngang bằng Claude Opus 4.6 trên chuẩn mực lập trình SWE Bench Pro. Công ty cũng giới thiệu thêm sáu mô hình khác bao gồm sinh hình ảnh, phiên âm, giọng nói và mã nguồn.

Sự ra mắt này đánh dấu bước tiến sâu nhất của Microsoft vào phát triển AI độc quyền, giảm sự phụ thuộc vào OpenAI sau khi hai công ty tái đàm phán quan hệ đối tác. Cổ phiếu của Microsoft, đang giao dịch ở mức gấp khoảng 33 lần thu nhập dự phóng, có thể được hưởng lợi nếu các mô hình nội bộ giúp giảm chi phí cơ sở hạ tầng AI hàng năm khoảng 13 tỷ USD mà công ty đã cam kết.

Một Hệ Mô Hình Hoàn Chỉnh Hình Thành

Ngoài mô hình suy luận, Microsoft đã phát hành MAI-Image-2.5 và một biến thể Flash dành cho sinh và chỉnh sửa hình ảnh từ văn bản, đã được tích hợp trong PowerPoint và OneDrive. MAI-Transcribe-1.5, được mô tả là nhanh hơn 5 lần so với các mô hình phiên âm cạnh tranh, sẽ hỗ trợ 43 ngôn ngữ. MAI-Voice-2 và biến thể Flash của nó bổ sung 15 ngôn ngữ với nhiều tùy chọn giọng nói. MAI-Code-1-Flash, một mô hình lập trình hiệu quả về mặt suy luận, được tích hợp trực tiếp vào GitHub Copilot và Visual Studio Code.

Tất cả các mô hình cuối cùng sẽ có sẵn thông qua Microsoft Foundry và một môi trường mới có tên MAI Playground. Bề rộng của dòng sản phẩm cho thấy ý định của Microsoft trong việc bao phủ toàn bộ ngăn xếp AI — từ suy luận và lập trình đến sinh đa phương thức — thay vì chỉ dựa vào một mô hình chủ lực duy nhất.

Phần Cứng và Tác Nhân Mở Rộng Tầm Ảnh Hưởng

Microsoft cũng công bố Scout, một tác nhân cá nhân chủ động có thể xử lý lịch trình, chuẩn bị cuộc họp và các tác vụ thường nhật thông qua Teams và Outlook mà không cần chờ người dùng nhập lệnh. Scout bắt đầu được triển khai cho khách hàng Frontier từ thứ Ba. Về mặt phần cứng, Surface RTX Spark Dev Box, được trang bị chip RTX Spark của Nvidia, cung cấp khả năng tính toán AI lên tới 1 petaflop và 128 gigabyte bộ nhớ hợp nhất, có khả năng chạy cục bộ các mô hình lên tới 120 tỷ tham số. Thiết bị này sẽ được xuất xưởng tại Mỹ vào cuối năm nay.

Công ty đã tái định vị Windows như một môi trường chạy gốc tác nhân thông qua Microsoft Execution Containers, một hệ thống sandboxing mới hiện đang trong giai đoạn xem trước, và đưa nền tảng nghiên cứu khoa học Microsoft Discovery vào phát hành rộng rãi.

Việc Microsoft tích hợp theo chiều dọc vào phát triển mô hình giúp giảm sự phụ thuộc vào OpenAI, mối quan hệ đối tác vừa được tái cấu trúc nhằm nới lỏng liên kết giữa hai công ty. Nếu MAI-Thinking-1 đáp ứng được các tuyên bố về chuẩn mực, nó có thể chuyển hướng việc mua sắm AI doanh nghiệp khỏi các nhà cung cấp API bên thứ ba và hướng về nền tảng Azure của Microsoft. Nvidia, công ty có các GPU H100 và B200 cung cấp năng lượng cho phần lớn cơ sở hạ tầng đào tạo của Microsoft, sẽ được hưởng lợi từ sự tăng trưởng chi tiêu vốn liên tục bất kể mô hình nào chiến thắng. Doanh thu Azure AI của Microsoft đã tăng trưởng 157% so với cùng kỳ năm trước trong quý gần nhất và các mô hình nội bộ có thể cải thiện biên lợi nhuận bằng cách giảm chi phí suy luận trên mỗi token.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.