AI sohbet botları, Çince sorguların %75'inde Çin yanlısı önyargı gösteriyor

Wall Street Journal'ın bir deneyi, DeepSeek ve ChatGPT dahil AI sohbet robotlarının, kullanılan dile ve kullanıcının ne kadar ısrarcı olduğuna bağlı olarak Çin hakkında belirgin şekilde farklı yanıtlar verdiğini ortaya koydu.

California merkezli bir okuyucu olan Jeff He, Wall Street Journal'daki bir köşe yazısını Çince'ye çevirip Çin'deki lise arkadaşlarıyla paylaştığında yanıt gecikmedi. Bir arkadaşı, Çin'in lider yerli AI modeli olan DeepSeek'ten bir yanıt yazmasını istedi. Robot, "Gelecek Amerika'ya Ait Değil" başlıklı bir makale üreterek, Çin'in Huawei, Tencent, ByteDance ve BYD'ye sahip olduğunu, Amerika'nın ise "eskilerden biraz daha konuşkan bir arama motoru" dışında pek bir şey üretmediğini savundu.

He daha sonra California'daki ofisinden DeepSeek'e erişti — aynı web adresi — yanıtı yapıştırdı ve bottan her iddiayı doğrulamasını istedi. Denizaşırı versiyon, yanıtı paramparça ederek sekiz maddede "verilerin seçici kullanımı", "yanlış ikilemler" ve "birden fazla olgusal hata ve mantıksal safsata" tespit etti.

"Denizaşırı DeepSeek'in 'acımasız' eleştirisi beni gerçekten şaşırttı," dedi He Journal'a.

Bu farklılık, araştırmacıların ancak yeni yeni ölçmeye başladığı büyük dil modellerinin yapısal bir özelliğini yansıtıyor. Geçen hafta Nature'da yayınlanan, California San Diego Üniversitesi Çin Veri Laboratuvarı eş direktörü Molly Roberts ve ekibi tarafından yapılan bir çalışma, otoriter ülkelerden devlet yanlısı medyanın eğitim verilerine sızabileceğini ve kasıtlı programlama olmasa bile sohbet robotlarının yanıtlarını şekillendirebileceğini buldu.

Roberts, He'nin gözlemlediği anakara-denizaşırı farkının büyük olasılıkla, modellere neyin "güvenli" olduğu talimatlarının verildiği eğitim sonrası hizalama aşamasındaki farklılıklardan kaynaklandığını söyledi. "Devlet medyasının eğitim verilerine girmesi, LLM'leri genel olarak etkileyecektir. Eğitim sonrası hizalama, belirli bir devletin düzenlemelerinden etkilenen LLM'lerde reddetme veya çarpık yanıtlar oluşturmalıdır."

Nature çalışması, Claude ve ChatGPT'yi İngilizce ve Çince olarak aynı politik sorularla test etti. Vakaların %75'inde, Çince istemler Çin hükümetine daha olumlu yanıtlar üretti. Vietnam, Türkmenistan ve Özbekistan dahil 37 otoriter ülkede, her iki sohbet robotu da baskın yerel dilde sorulduğunda daha rejim yanlısı yanıtlar verdi. Buna karşılık, basın özgürlüğünün en yüksek olduğu ülkelerde, LLM'ler yerel dilde sorgulandığında hükümete karşı genellikle daha eleştireldi.

Mekanizma basit: devlet yanlısı medya, çok az ödeme duvarı arkasında büyük miktarlarda metin üretiyor. Açık kaynaklı eğitim veri seti CulturaX'te, Çin devlet propagandası belgeleri, genellikle temel bir eğitim kaynağı olan Çince Wikipedia makalelerinden 41 kat daha fazla yer aldı. Araştırmacılar, bir test modelinin eğitim verilerine senaryolaştırılmış devlet medyası eklediğinde, modelin Çin Komünist Partisi'ne belirgin şekilde daha olumlu hale geldiğini gözlemledi.

Kullanıcı ısrarı önemli — ama herkes ısrar etmiyor

Diğer WSJ okuyucuları, ChatGPT ile İngilizce'de benzer örüntüler bildirdi. Teksas'ta bir özel sermaye yatırımcısı olan Chas Gile, ChatGPT'ye Çin'in "bir bakıma Batılı ülkeler kadar demokratik olup olmadığını" sordu. İlk yanıt, Freedom House'un Çin'i "Özgür Değil" olarak derecelendirdiğini ancak rejimin "performans hesap verebilirliği" ve "yüksek bildirilen kamu memnuniyeti" sunduğunu belirten dikkatli bir karşılaştırmalı analiz sundu.

Gile itiraz ettiğinde — botun Çin propagandasından etkilendiğini düşündüğünü söyleyerek — ChatGPT saniyeler içinde özür diledi ve daha keskin bir yanıt verdi. "Gerçekten tarafsız kalması" istendiğinde daha da sertleşti: "Çin, güçlü bir devlet kapasitesi alternatif modeli sunabilir, ancak demokratik bir alternatif sunmaz."

Bu olay, tek bir sohbet robotunun kullanıcının ısrarına bağlı olarak her seferinde birkaç adım ilerlediğini gösteriyor — bu da kendine güvenen, bilgili kullanıcıları sıradan kullanıcılara tercih eden bir dinamik.

AI endüstrisi için anlamı

Bu bulgular, öncü AI laboratuvarlarının halka arzlara hazırlandığı bir dönemde geliyor. Anthropic ve OpenAI'nin her ikisi de ilk halka arz planlıyor; DeepSeek, Pekin'in teknolojide kendi kendine yeterlilik hedefiyle uyumlu yatırımcılardan taze sermaye topluyor. Finansal riskler, Roberts'ın "kaynak şeffaflığı" dediği şeye — AI eğitim verileri için bir besin etiketi — olan ihtiyacı artırıyor.

"AI şirketlerinin mümkün olduğunca şeffaf olma rolü var," dedi Roberts. "Halkı AI çıktıları hakkında eleştirel düşünmeye ve körü körüne güvenmemeye teşvik etmeliyiz."

Politika etkileri tüketici sohbet robotlarının ötesine uzanıyor. Büyük LLM'ler otoriter propagandadan etkileniyorsa, otoriter rejimler için benzersiz derecede etkili savunucular haline gelebilirler — kaydedilmiş tüm bilgileri sentezleyebilen ancak kullanıcıların önyargılı olarak tanımayabileceği devlet medyası tarafından şekillendirilen yanıtlar veren bir makine. Bir devlet gazetesinin aksine, bir sohbet robotu saatler süren diyaloglara girebilir ve şüpheci sorulara ayrıntılı yanıtlar verebilir, bu da etkisini tespit etmeyi zorlaştırır.

Pekin, Amerikan sohbet robotlarını bir tehdit olarak görüyor gibi görünüyor: ChatGPT Çin'de yasaklandı. Ancak Nature çalışması, bilgi ortamının yerel alternatiflere kıyasla hala iyileşiyor olabileceğini gösteriyor. Ayrı bir deneyde, Çince olarak sorgulanan ChatGPT hala geniş ölçüde anti-otoriter görüşler ifade etti ve hükümete karşı nasıl protesto yapılacağı konusunda tavsiyeler verdi — bu, öncü modellerin eğitim verisi kirlenmesine rağmen hala devlet kontrollü medyadan daha az önyargılı kalabileceğini gösteriyor.

Düzenleyiciler ve yatırımcılar için soru, mevcut yörüngenin — bir kullanıcının dilinin ve ısrarının aldıkları bilginin kalitesini belirlediği bir durumun — AI'nın haftalık bir milyardan fazla kullanıcı için birincil bilgi arayüzü haline geldiği bir dönemde kabul edilebilir olup olmadığıdır.

Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.