Çin yapay zeka başlangıcı Perşembe günü Deepseek, amiral gemisi V3 modelinin yükseltilmiş bir versiyonunu açıkladı ve Çin yapımı çiplerde performansı optimize eden ve daha hızlı işlem hızları sunan bir özellik içerdiğini söyledi.
Yurtiçi çip uyumluluğuna odaklanma, Deepseek’in AI modellerinin, Pekin’in Washington’un ihracat kısıtlamaları karşısında ABD teknolojisini değiştirmeye zorladığı için Çin’in ortaya çıkan yarı iletken ekosistemiyle çalışacak şekilde konumlandırıldığını gösterebilir.
Deepseek, bu yıl teknoloji dünyasını salladı ve daha düşük operasyonel maliyetler sunarken Openai’nin chatgpt gibi Batılı olanlarla rekabet eden AI modelleri yayınladı.
Deepseek’in V3 modeline yükseltme, temel modellerinde son iki güncellemeyi takip ediyor – Mayıs ayında bir R1 model güncellemesi ve Mart ayında daha önceki bir V3 geliştirmesi.
Yerli Chip desteği için Deepseek, bir Wechat Post’ta Deepseek-V3.1 modelinin UE8M0 FP8 hassas formatının “yakında piyasaya sürülecek yeni nesil yerli yongalar” için optimize edildiğini söyledi.
Şirket, hangi belirli çip modellerinin veya üreticilerinin destekleneceğini belirlemedi.
FP8 veya 8 bit kayan nokta, AI modellerinin geleneksel yöntemlerden daha hızlı çalışırken daha az bellek kullanarak daha verimli çalışmasını sağlayan bir veri işleme formatıdır.
Deepseek-V3.1, Perşembe günü bir WeChat postasında, modelin hem akıl yürütme hem de mantıksız modlarda çalışmasını sağlayan hibrit bir çıkarım yapısına sahip.
Kullanıcılar, şirketin resmi uygulaması ve web platformunda “derin düşünme” düğmesini kullanarak bu modlar arasında geçiş yapabilir, bu da her ikisi de V3.1 sürümünü çalıştırır.
Şirket ayrıca, diğer uygulamalar ve web ürünlerinin geliştiricilerinin 6 Eylül’den itibaren AI modellerini entegre etmesine izin veren bir platform olan modelin API’sini kullanma maliyetlerini ayarlayacak.