阿里巴巴全新Qwen3.7-Plus將視覺與語言融合為單一智能體模型,在多模態AI主導權之爭中挑戰OpenAI與Google。
阿里巴巴全新Qwen3.7-Plus將視覺與語言融合為單一智能體模型,在多模態AI主導權之爭中挑戰OpenAI與Google。

阿里巴巴集團發布Qwen3.7-Plus多模態智能體模型,該模型統一了視覺與語言能力,正值中國科技巨頭在全球AI市場展開競爭,而OpenAI的估值已達8520億美元。
阿里巴巴透過其Qwen微信公眾號表示:「Qwen3.7-Plus升級了視覺語言能力,同時保留在程式編寫、工具使用和生產力工作流程中的完整智能體能力。」
該模型建立在Qwen3.7的文字基礎之上,新增視覺理解能力,打造出阿里巴巴所謂的「多模態互動混合智能體」。它保留了前代產品在程式編寫、工具使用和生產力任務方面的能力,同時擴展至視覺語言推理領域——這項功能直接與OpenAI的GPT-4o以及Google的Gemini競爭,後者據Google稱已擁有超過7.5億活躍用戶。
此次發布加劇了中國AI領域的競爭,阿里巴巴、百度和字節跳動正力圖追上全球領導者。阿里巴巴雲為企業客戶提供Qwen系列模型,隨著企業尋求多模態AI應用於從文件分析到自動化工作流程管理等任務,其採用率有望進一步提升。根據OpenAI的數據,ChatGPT的全球AI市場活躍用戶已達9億。
多模態AI市場升溫,競爭對手紛紛擴張
阿里巴巴此舉正值AI產業進入生成式AI全面爆發以來的第四年。Vibe coding——開發者使用自然語言提示生成程式碼——已逐漸普及,各行各業的公司紛紛採用能夠自動化處理多步驟任務的智能體工作流程。Qwen3.7-Plus的智能體能力正契合這一趨勢,讓模型能夠自主使用工具、編寫程式碼並執行生產力任務。
多模態方法解決了純文字模型的一個關鍵限制:無法處理圖像、圖表和視覺數據。透過整合視覺與語言,Qwen3.7-Plus可以分析圖表、閱讀含有嵌入式圖像的文件,並生成參照視覺背景的回應——這些功能在金融、醫療保健和製造等領域的企業客戶中需求日益增長。
包括華為技術和小米在內的中國科技公司也在擴大AI投資,各行業競爭日趨激烈。向AI驅動產品的更廣泛推進不僅限於軟體領域:根據Omdia的數據,去年AI智慧眼鏡出貨量激增超過300%,達到870萬副,預計今年將突破1500萬副。
阿里巴巴與AI領域的投資影響
阿里巴巴股票在紐約證券交易所上市,代碼為BABA。該公司已在AI基礎設施上投入巨資,將Qwen定位為服務亞洲企業和開發者社群的基礎模型。隨著企業從單一模態聊天機器人轉向能夠閱讀、觀察並跨多種數據類型行動的智能體,阿里巴巴希望藉助Qwen3.7-Plus在企業AI支出中佔有一席之地。
競爭風險極高。OpenAI最新融資輪對該公司的估值為8520億美元,而Google的Gemini已積累超過7.5億活躍用戶。阿里巴巴的Qwen系列,連同百度的文心一言和字節跳動的豆包,是中國在基礎AI模型領域挑戰美國主導地位的最強力量。對投資者而言,關鍵問題在於阿里巴巴能否將模型能力轉化為雲端營收增長——這一指標將在即將發布的財報中更加清晰。
阿里巴巴的股價約為預期本益比的10倍,低於美國科技同業,反映出地緣政治風險和國內增長放緩。花旗和摩根士丹利的分析師認為,成功的AI變現故事可能縮小這一差距,他們將阿里巴巴的AI投資視為股票重新評級的潛在驅動力。該公司的下一季財報將首次提供具體數據,顯示Qwen3.7-Plus是否正在推動企業採用和雲端營收加速。
本文僅供參考,不構成投資建議。