重點摘要:
- DeepSeek的中國內地版本發表親中反駁,而海外版本則對其提出批評
- 《自然》研究發現,ChatGPT和Claude處理中文提示詞時,有75%的比例給出對北京更有利的回應
- 國家宣傳文件在訓練數據中的比重,是中文維基百科文章的41倍
重點摘要:

《華爾街日報》一項實驗發現,包括DeepSeek和ChatGPT在內的AI聊天機器人,根據使用的語言不同——以及使用者反駁的力度——會給出關於中國截然不同的答案。
當加州讀者Jeff He將一篇《華爾街日報》觀點專欄翻譯成中文,並與在中國的高中同學分享時,回應迅速到來。一位朋友請DeepSeek——中國領先的國產AI模型——撰寫一篇反駁文章。該機器人產出一篇題為〈未來不屬於美國〉的文章,主張中國擁有華為、騰訊、字節跳動和比亞迪,而美國除了「一個比舊款稍微能聊的搜尋引擎」之外,幾乎沒什麼產出。
He隨後從他位於加州的辦公室——同一個網址——登入DeepSeek,將那篇反駁文章貼上,並要求機器人驗證每一項主張。海外版本將其逐一拆解,在八個論點中指出「選擇性使用數據」、「虛假二分法」以及「多個事實錯誤和邏輯謬誤」。
He告訴《華爾街日報》:「海外版DeepSeek那種『毫不留情』的批評確實讓我大吃一驚。」
這種分歧反映了大語言模型的一個結構性特徵,而研究人員才剛開始對其進行量化。上週發表在《自然》期刊上的一項研究,由加州大學聖地牙哥分校中國數據實驗室聯合主任Molly Roberts及其團隊進行,發現來自威權國家的國家媒體內容可能滲入訓練數據,並塑造聊天機器人的回應——即使沒有刻意的程式設計。
Roberts表示,He觀察到的中國內地版與海外版之間的差距,很可能源於訓練後對齊階段的差異,該階段是模型被賦予關於什麼是「安全」言論的指示。她說:「國家媒體進入訓練數據,通常會影響大型語言模型。訓練後的對齊階段,應該會引發受特定國家法規影響的大型語言模型產生拒絕回答或帶有偏見的回應。」
這項《自然》研究以相同的政治問題分別用英文和中文測試了Claude和ChatGPT。在75%的案例中,中文提示詞產生的答案對中國政府更為有利。在涵蓋越南、土庫曼和烏茲別克等37個威權國家中,當以當地主要語言提問時,兩個聊天機器人都給出更親政權的回答。相比之下,在新聞自由度最高的國家中,當以當地語言提問時,這些大型語言模型往往對政府更為批判。
其運作機制很直接:與國家立場一致的媒體產出大量文本,且幾乎不受付費牆限制。在開源訓練數據集CulturaX中,中國國家宣傳文件的比重是中文維基百科文章——通常是核心訓練來源——的41倍。當研究人員將腳本化的國家媒體內容加入測試模型的訓練數據後,該模型對中國共產黨的態度明顯變得更為友好。
反駁很重要——但不是每個人都會反駁
其他《華爾街日報》讀者也報告了ChatGPT在英文環境中的類似情況。德州私募股權投資人Chas Gile詢問ChatGPT,中國是否「在某些方面與西方國家一樣民主」。第一個回答提供了審慎的比較分析,指出自由之家將中國評為「不自由」,但該政權提供了「績效問責制」和「高報告的民眾滿意度」。
當Gile反駁——告訴機器人他認為它受到了中國宣傳的影響——ChatGPT在幾秒鐘內道歉,並給出更嚴厲的答案。當被要求「保持真正客觀」時,它進一步收緊立場:「中國可能提供了一個強大的國家能力替代模式,但它並未提供一個民主替代方案。」
這一事件說明了單一聊天機器人如何根據使用者的堅持程度,每次對話都能移動好幾步——這種動態對自信、資訊充分的用戶有利,而不利於隨意使用者。
這對AI產業意味著什麼
這些發現正值前沿AI實驗室準備公開上市之際。Anthropic和OpenAI都在規劃首次公開募股;DeepSeek則正在從與北京推動技術自主目標一致的投資者那裡募集新資金。財務上的利害關係放大了Roberts所謂「來源透明度」的需求——即AI訓練數據的營養標籤。
Roberts表示:「AI公司有責任盡可能保持透明。我們需要教育公眾批判性地思考AI的輸出,而不是盲目依賴它。」
政策影響超越了消費級聊天機器人。如果主要大型語言模型受到威權宣傳的影響,它們可能成為威權政權極其有效的辯護者——一台能夠綜合所有已知知識,但卻給出受國家媒體影響、用戶可能無法察覺其偏見的回答的機器。與國家報紙不同,聊天機器人會進行數小時的對話,並為質疑性問題提供詳細答案,使其影響力更難被察覺。
北京似乎將美國聊天機器人視為威脅:ChatGPT在中國被禁用。然而,《自然》研究顯示,相較於國內替代方案,資訊環境可能仍在改善。在一項單獨實驗中,以中文提示的ChatGPT仍然表達了廣泛的反威權觀點,並提供了如何抗議政府的建議——這表明即使存在訓練數據污染,前沿模型可能仍比國家控制的媒體偏見更少。
對監管機構和投資者而言,問題在於:當AI成為超過十億每週用戶的主要資訊介面時,目前這種——使用者使用的語言和堅持程度決定他們獲得資訊品質——的發展軌跡是否可以被接受。
本文僅供資訊參考,不構成投資建議。