ByteDance, yapay zeka video üretiminde 30 saniyelik engeli aştı ve Claude Opus 4.7'yi beşte biri fiyatına kodlama yeteneğiyle yakalayarak, 23 Haziran'da düzenlenen yıllık FORCE konferansında beş yeni modelini tanıttı.
"Seedance 2.5, tek bir komuttan doğal 30 saniyelik klipler üreten ilk video üretim modelidir ve sahne değişiklikleri ile tempo geçişleri yerleşik olarak gelmiştir," dedi ByteDance'in bulut iş birimi Volcano Engine'in başkanı Tan Dai, Pekin'deki konferansta. "Aynı anda 50'ye kadar çok modlu referans girdisini kabul edebiliyor — görseller, ses, 3D modeller — ve görsel tutarlılığı bozmadan üretim sonrası yerel düzenlemeyi destekliyor."
Sürümün merkezindeki Seedance 2.5, doğal 4K çözünürlükte ve 10-bit renk derinliğinde 30 saniyeye kadar tek video klipleri üretiyor. Bu, çoğu AI video aracını sınırlayan 15 saniyelik tavanın önemli ölçüde üzerinde bir sıçrama. Model ayrıca, CEO Liang Rubo'ya göre bir film yönetmeninin ByteDance ile işbirliği sırasındaki talebinden ilham alan 3D beyaz model ön görselleştirme özelliğini de tanıtıyor. Kullanıcılar, tüm klibi yeniden oluşturmadan arka plan veya ürün gibi bireysel öğeleri düzenleyebiliyor. ByteDance bu yeteneği, sahneyi değiştirmeden bir reklam filmindeki ruj tonunu değiştirerek gösterdi. Modelin Temmuz başında piyasaya sürülmesi bekleniyor.
Rekabetçi hamleler videonun çok ötesine uzanıyor. ByteDance'in amiral gemisi dil modeli Doubao 2.1 Pro, SciCode bilimsel akıl yürütme kıyaslamasında 59,8 puan alarak hem Claude Opus 4.7'yi hem de GPT-5.5'i geride bıraktı ve NL2Repo depo düzeyinde kod üretiminde 47 puana ulaştı — GPT-5.5 ve Gemini 3.1'in önünde. Volcano Engine'e göre, milyon girdi token başına 6 yuan (0,83 $) ve milyon çıktı token başına 30 yuan (4,14 $) fiyatlandırması, Anthropic'in Claude Opus serisine kıyasla yaklaşık %80 maliyet avantajı sağlıyor. Pro kademesinin yarısı fiyatına sunulan bir turbo varyantı, yüksek frekanslı kurumsal iş yüklerini hedefliyor.
Tam kapsamlı AI atağı
ByteDance, metin ve video ile sınırlı kalmadı. Şirket ayrıca görsel üretimi için Seedream 5.0 Pro'yu ön gösterime sundu. Bu model, etkileşimli düzenleme — kullanıcılar belirli öğeleri değiştirmek için oklar çizebilir veya bölgeleri daire içine alabilir — ve arka planları otomatik doldururken görüntü katmanlarını yinelemeli olarak ayıran çok katmanlı ayırma özelliklerini ekliyor. Model, İngilizce, İspanyolca, Arapça ve Japonca dahil 10'dan fazla dilde yüksek yoğunluklu metin düzenlerini kültürel olarak uyarlanmış tipografiyle destekliyor.
Ses cephesinde, Doubao Ses Üretim Modeli 1.0, yalnızca metinden eksiksiz sinematik film müzikleri oluşturuyor; tek geçişte karakter ses özelliklerini, duygusal tonlamayı, lehçe aksanlarını, arka plan ortamını ve ses efektlerini otomatik olarak çıkarıyor. Bir demo, yaklaşık bir dakikalık bir dövüş sanatları sekansında tutarlı karakter sesleri, yağmur ortamı ve silah çarpışma sesleri gösterdi — tümü manuel katmanlama olmadan model tarafından üretildi.
Şubat ayında piyasaya sürülen önceki model Seedance 2.0, duyuru kapsamında doğal 4K yükseltmesi aldı.
Ticari ivme ve kurumsal benimseme
Tan'a göre, Volcano Engine'in bulut işi artık Çin'in kamu bulut pazarının %49,5'ine sahip. ByteDance'in Doubao model ailesi genelinde günlük token çağrıları 180 trilyona ulaştı; bu, iki yıl öncesine göre 1.500 kat ve yalnızca geçen yıla göre on kat artış anlamına geliyor. Yılda 1 trilyon token'ın üzerinde harcama yapan kurumsal müşteri sayısı Aralık ayından bu yana iki katına çıkarak 200'e yükseldi.
ByteDance ayrıca, Hong Konglu film yapımcısı Stephen Chou'un ilk ortak olduğu bir AI telif hakkı ticarileştirme platformu başlattı. Tan'a göre, kullanıcılar Douyin, Jimeng ve Jianying'deki resmi şablonları kullanarak Chou'un "Yemek Tanrısı" ve "CJ7" gibi klasiklerinden kliplerini yeniden düzenleyebiliyor — ilk günde 10.000'den fazla içerik oluşturuldu.
Kurumsal benimseme birden fazla sektöre yayılıyor. Tesla, tüm araç serisinde ses tabanlı araç kontrolleri için Doubao'yu entegre etti ve ByteDance'in gerçek zamanlı konuşma modelini kullanıyor. Mercedes-Benz'in yeni elektrikli CLA'sı da doğal dil etkileşimi ve duygu tanıma için Doubao'yu kullanıyor. Finansal hizmetlerde CICC, ByteDance'in HiAgent platformunda 300'den fazla analistin araştırmasını damıtarak dijital bir yatırım danışmanı ajanı oluşturdu. China Mobile, devlet ve finans müşterileri için yerel bilgi işlem altyapısını kullanarak ortaklaşa gizli bir model hizmeti başlattı.
Yatırımcılar için anlamı
ByteDance'in metin, video, görsel ve ses alanlarını kapsayan tam kapsamlı AI sürümü, hem Batılı AI liderlerine hem de Çinli rakiplere baskı uygulayan bir fiyatlandırma ve yetenek savaşına işaret ediyor. Doubao 2.1 Pro'nun Claude Opus 4.7 ile %80 daha düşük maliyetle kodlama paritesi, premium katman model sağlayıcılarının marjlarını sıkıştırırken, Seedance 2.5'in 30 saniyelik üretim yeteneği, OpenAI'in Sora'sı ve 15-20 saniyede sınırlı kalan diğer rakiplerin önüne geçiyor. Şirketin %49,5 kamu bulut pazar payı ve günlük 180 trilyon token çağrısı, kurumsal benimsemenin çoğu analistin öngördüğünden daha hızlı hızlandığını gösteriyor. AI altyapı inşasını takip eden yatırımcılar için ByteDance'in, agresif fiyat noktalarında çoklu modalitelerde modelleri birleştirme yeteneği — Douyin, Jimeng ve Jianying üzerinden dağıtımıyla birleştiğinde — herhangi bir Batılı AI platformunun ölçeğine rakip olacak dikey olarak entegre bir rakip oluşturuyor.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.