DeepSeek yeni modelini tanıttı: NVIDIA’ya kötü haber!


Çin merkezli yapay zeka şirketi DeepSeek, NVIDIA CUDA ekosistemine bağımlılığı azaltacak yeni bir adım atarak DeepSeek-V3.2-Exp modelini piyasaya sürdü. Model, Huawei’nin Ascend hızlandırıcıları ve şirketin CANN yazılım yığını için ilk günden itibaren optimize edilmiş halde sunuldu. Böylece Çin merkezli teknoloji firmalarının, ABD merkezli donanım ve yazılım ekosistemlerinden bağımsızlaşma süreci hız kazandı.

DeepSeek, modeli 29 Eylül 2025’te duyurdu ve teknik raporla birlikte Hugging Face üzerinde kod ve kontrol noktalarını paylaştı. Şirket, V3.2-Exp’yi “uzun bağlamlı çıkarımlarda maliyetleri düşürmek için tasarlanmış, yeni nesil mimarimize geçişte bir ara adım” olarak tanımlıyor. Model, çıktı kalitesini korurken bellek ve işlem gücü gereksinimlerini azaltan seyrek dikkat (sparse attention) mekanizmasıyla dikkat çekiyor.

Huawei’nin Ascend ekibi ve daha geniş vLLM-Ascend topluluğu, modele hızlı şekilde uyum sağladı. Ascend NPU’lar üzerinde çalıştırılabilmesi için özel operatör kurulum adımları ve çekirdek paketleme yönergeleri yayınlandı. Ayrıca CANN ekibi, Huawei donanımında doğrudan çalıştırılabilecek çıkarım tarifini kullanıcılarla paylaştı.

DeepSeek, Çinli üreticiler tarafından destekleniyor

Sadece Huawei değil, diğer Çinli yonga üreticileri de sürece hızla katıldı. Cambricon, kendi hızlandırıcıları için vLLM-MLU sürümünü güncelledi ve modelin seyrek dikkat yapısının uzun dizilerde maliyet avantajı sağladığını duyurdu. Hygon ise DCU hızlandırıcılarını DTK yazılım yığını aracılığıyla “sıfır gecikme” ile dağıtıma hazır hale getirdiğini açıkladı.

DeepSeek Çin NVIDIA CUDA

Aynı zamanda SGLang, Ascend dahil olmak üzere farklı donanımlarda V3.2-Exp desteğini onayladı. DeepSeek’in GitHub üzerindeki notları, modelin vLLM ile eşdeğer performans sunduğunu ortaya koyuyor. Şirket, hem TileLang hem de CUDA çekirdeklerinden bahsederek araştırmacıları TileLang’ı prototipleme için kullanmaya davet ediyor. Bu yaklaşım, aynı modelin yalnızca küçük değişikliklerle hem NVIDIA GPU’larda hem de Çinli hızlandırıcılarda çalıştırılmasını mümkün kılıyor.

Bu gelişmeler, Çin’in yapay zeka ekosisteminin NVIDIA donanımına erişimin garanti edilemeyeceği bir geleceğe hazırlanmakta olduğunu net şekilde ortaya koyuyor. CUDA hala küresel ölçekte hakimiyetini sürdürse de, DeepSeek’in yeni modeli ilk günden itibaren CUDA dışı platformlara optimize edilen nadir büyük ölçekli Çinli girişimlerden biri oldu.

DeepSeek sudan ucuz!

DeepSeek sudan ucuz!


DeepSeek yapay zeka sektöründeki maliyetleri alt üst etti. Sınırlı çiplerle elde edilen bu başarı, Çin’in yükselişini gözler önüne seriyor.

Huawei, Cambricon ve Hygon’un eşgüdümlü çalışması, Pekin’in “teknolojik egemenlik” hedeflerinin şirketler tarafından ciddiyetle benimsendiğini gösteriyor. Çinli üreticiler artık yalnızca NVIDIA tabanlı sistemlere uyum sağlamakla yetinmiyor; kendi donanım ve yazılım platformlarını birinci sınıf hedefler olarak konumlandırıyor.





Haber Kaynak Linki

Related Posts

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir