DeepSeek 74 milyar dolar topladı, Claude tetiklemesinin ardından iş gücünü ikiye katlamayı planlıyor

DeepSeek'in 7,4 milyar dolarlık fonlaması — bir Çinli yapay zeka girişimi tarafından yapılan en büyük tek tur — Liang Wenfeng'in, Nisan ayında Anthropic'in Claude Mythos önizlemesini gördükten sonra şirketin devasa sermaye rezervleri olmadan rekabet edemeyeceğini fark etmesiyle tetiklendi.

DeepSeek'in 7,4 milyar dolarlık fonlaması — bir Çinli yapay zeka girişimi tarafından yapılan en büyük tek tur — kurucu ortak Liang Wenfeng'in, Nisan ayında Anthropic'in Claude Mythos önizlemesini inceledikten sonra şirketin araştırma hedeflerini devasa sermaye rezervleri olmadan sürdüremeyeceği sonucuna varmasıyla tetiklendi, konuya yakın kaynaklara göre. Hangzhou merkezli şirket, bu turda 50 milyar doların üzerinde değerlenirken, yaklaşık 300 kişilik iş gücünü tüm departmanlarda ikiye katlamayı planlıyor.

"İnsanlık şu anda AGI'nin şafağında," dedi DeepSeek, WeChat üzerinden yaptığı bir açıklamada. "Teknoloji ilerledikçe, tüm departmanların ölçeğini en az ikiye katlamaya çalışıyoruz."

Liang, şahsen yaklaşık 3 milyar dolar — 200 milyar yuan — katkıda bulundu ve bu, toplam fonlamanın yaklaşık yüzde 40'ını oluştururken, kontrol hissesini korudu. İnternet devi Tencent ve batarya üreticisi Contemporary Amperex Technology, Çin Ulusal Yapay Zeka Endüstrisi Yatırım Fonu ile birlikte kurumsal yatırımcılar olarak katıldı ve bu da güçlü bir hükümet desteğine işaret ediyor. Şirket, geliştirme mühendisleri, veri mühendisleri, yapay zeka ürün yöneticileri ve operasyon personeli dahil olmak üzere 27 tür teknik ve kurumsal pozisyon için hemen başvuru almaya başlıyor; tüm pozisyonlar stajyer öğrencilere de açık.

Bu fon toplama, DeepSeek için stratejik bir dönüşümü işaret ediyor. Şirket, Liang'ın 2023'teki potansiyel yatırımcılarla yaptığı toplantıların, şirketin ticarileşme veya ürün yol haritası olmadığını söylemesiyle sonuçsuz kalmasının ardından üç yıl boyunca kendi kendini finanse eden bir araştırma laboratuvarı olarak faaliyet göstermişti. Yaklaşımdaki bu değişiklik, rekabet baskısıyla tetiklendi: Nisan ayında önizlenen Anthropic'in Claude Mythos'u, devasa hesaplama gücü ve veri üzerine inşa edilmiş yetenekler sergiledi ve Liang, DeepSeek'in önemli ölçüde daha büyük bir sermaye tabanı olmadan bununla rekabet edemeyeceği sonucuna vardı.

Huawei Çip Takası

DeepSeek'in modellerini yerel Huawei çipleri için uyarlama taahhüdü önemli bir maliyetle geldi. Şirketin eğitim ve dağıtım sistemleri Nvidia'nın CUDA yazılımı etrafında inşa edilmişti ve mühendislerin, Huawei donanımında verimli çalışması için temel yazılımı yeniden yazmaları gerekti. Bu çaba, herhangi bir yeni nesil model yayınlamadan 15 aylık bir boşluğa yol açtı — en iyi laboratuvarların her iki ila üç ayda bir yeni modeller gönderdiği bir çağda alışılmadık derecede uzun bir duraklama.

Bu boşluk, DeepSeek'in geçen yılın ikinci yarısında Anthropic'in Claude Code lansmanını takip eden kodlama araçları patlamasını kaçırmasına neden oldu. Liang, fon toplama roadshow'u sırasında yatırımcılara, kodlama araçlarının ve yapay zeka sohbet robotlarının, yapay genel zekaya giden yolda geçici durak noktaları olduğunu ve kısa vadeli ürünlere ağırlık vermenin nihai hedeften uzaklaştıracağını söyledi.

Liang, Huawei'in çiplerinin birkaç yıl içinde Nvidia'nın performansına yetişeceğine ve DeepSeek'in uyarlama çalışmalarını bu zaman çizelgesinden önce tamamlaması gerektiğine inanıyor. Huawei, DeepSeek'in çiplerini geçen yıl özel olarak test ettiğini ancak daha sonra öğrendi ve ardından iki şirket doğrudan birlikte çalışmaya başladı.

ABD'de Pazar Payı Kazanımları

Model yayınlama boşluğuna rağmen, DeepSeek'in mevcut modelleri ABD'li geliştirici pazarında ivme kazanıyor. Şirketin Nisan ayında yayınlanan amiral gemisi modeli V4, Mayıs ayında Vercel'in AI Gateway platformunda token kullanımının yüzde 17'sini yakaladı ve bir önceki aya göre yüzde 1'in altından yükseldi. Bu, DeepSeek'i platformda Anthropic ve Google'ın ardından üçüncü en büyük model sağlayıcısı yaptı.

Hafif V4 Flash varyantı, karşılaştırılabilir Anthropic modellerinden 20 ila 50 kat daha ucuz fiyatlandırılıyor — Liang'ın sürdüreceğini söylediği bir fiyatlandırma stratejisi. Platform verilerine göre, büyüme Haziran ayında da devam etti.

DeepSeek, tüm modellerinin temel kodunu tamamen açık kaynak olarak sunan tek büyük yapay zeka laboratuvarı olmaya devam ediyor — Liang'ın, yapay zekanın az sayıda şirket tarafından kontrol edilmesini önlemek için gerekli olduğunu tanımladığı bir felsefe. Şirket, fonlama değerlemesinde hisse tahsis eden bir çalışan hisse senedi sahipliği planı oluşturdu.

Yatırımcılar için sonuçlar açıktır. DeepSeek'in agresif genişlemesi ve ultra düşük fiyatlandırma stratejisi, OpenAI ve Anthropic dahil olmak üzere ABD'li yapay zeka liderlerinin marjlarına baskı yaparken, yerel çiplere geçişi Çin'in yarı iletken kendi kendine yeterlilik anlatısını güçlendiriyor. H100 ve Blackwell GPU'ları çoğu büyük yapay zeka eğitim sürecine güç veren Nvidia, Çinli laboratuvarlar ekosisteminden başarıyla ayrışırsa uzun vadeli bir riskle karşı karşıya — ancak DeepSeek'teki 15 aylık model boşluğu, bu geçişin zorluğunu gösteriyor.

Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.