執行摘要
據報導,知名 ChatGPT 的開發者 OpenAI 正在開發一款代號為 Garlic 的新型大型語言模型 (LLM)。這一進展被視為一項戰略性轉變,即從通用人工智慧轉向為高價值領域設計的專業模型。此舉表明 OpenAI 旨在為生物醫學和醫療保健等需要高度精確性和領域特定知識的特定領域量身定制基礎模型。本報告分析了這一開發、其市場影響以及不斷發展的人工智慧格局的更廣泛背景,包括專家對這些模型所面臨挑戰的評論。
事件詳情
根據《The Information》首次發布的報導,OpenAI 正在積極開發一款名為 Garlic 的新型大型語言模型。儘管該公司提供的詳細資訊仍然稀少,但該項目代表著在競爭激烈的人工智慧行業中的一項重大舉措。與為廣泛的通用應用而構建的前身不同,Garlic 被認為旨在完成更小眾、更專業的任務。這一舉動遵循了技術成熟的自然軌跡,即通用平台演變為專業工具以滿足特定的市場需求。這一開發表明 OpenAI 意圖在通用人工智慧解決方案不足的行業中獲取價值,這些行業需要通過針對特定領域的數據進行訓練的模型來確保準確性和可靠性。
市場影響
Garlic 的開發正值人工智慧行業日益關注垂直應用之際。生物醫學領域 LLM 的市場正在迅速擴張,模型正在為從基因組學和蛋白質組學到藥物發現等任務而開發。諸如 BioBERT、Geneformer 和 ESM-2 等模型已經展示了人工智慧分析複雜生物數據的潛力,從 DNA 序列到蛋白質結構。
OpenAI 進入這一領域將加劇與現有參與者和 Google 等其他科技巨頭的競爭,Google 已經開發了諸如 Gemini 等自己的模型,並在醫療保健研究領域擁有強大的立足點。這種向專業領域的推動凸顯了所需的巨大計算資源,這強化了支持此類大規模人工智慧開發的主要雲和硬體提供商的市場地位。這些模型的成功取決於它們融入臨床診斷等複雜、受監管環境的能力,這是一個需要不僅僅是技術實力才能克服的障礙。
專家評論
儘管專業 LLM 具有明顯的潛力,但專家們警告不要將其視為資訊處理的萬能藥。由賓夕法尼亞大學教授 Shiri Melumad 合著的一項近期研究提供了一個批判性視角。該研究表明,與通過標準 Google 搜尋等傳統方法學習相比,依賴像 ChatGPT 這樣的人工智慧模型進行資訊綜合可能導致「更淺薄的知識」。
根據這項研究,在導航不同的網頁連結、解釋來源和獨立綜合資訊時所涉及的「摩擦」有助於形成對主題更深入、更原始的心理表徵。通過自動化這一過程,LLM 可能會將學習轉變為一種更被動的活動。這對像 Garlic 這樣的模型提出了一個根本性挑戰,特別是如果它們旨在供醫學和科學研究等領域的專業人士使用,在這些領域,深入的、可推廣的知識至關重要。
更廣闊的背景
OpenAI 開發 Garlic 是人工智慧行業從創建單一、龐大模型向構建可適應多種特定任務的多功能基礎模型轉變的更廣泛趨勢的一部分。LLM 在生物醫學中的應用是這一趨勢的一個典型例子。科學和醫學領域富含非結構化數據,這使得它們成為人工智慧驅動分析的理想候選者。從使用 DNABERT 等模型預測遺傳變異的影響到使用 Chemformer 等平台加速藥物發現,專業 LLM 已經證明了它們的價值。
然而,它們融入醫療保健等領域充滿了挑戰。數據隱私、模型偏差以及人工智慧決策的「黑箱」性質等問題仍然是重要的障礙。對於像 Garlic 這樣的模型要在受監管領域取得成功,它不僅必須展示高準確性,而且必須透明、公平和安全。此外,它必須克服「幻覺」——生成自信但錯誤的資訊——的內在風險,這在醫療環境中是一個特別危險的缺陷。專業 LLM 的最終成功將取決於克服這些技術和道德障礙,同時證明其相對於既定的人類中心流程的價值。