Nvidia Blackwell GPU’larında karşılaşılan verimlilik sorunlarına dair detaylı bir inceleme. Sorunların nedenleri, etkileri ve çözüm süreçleri hakkında bilgi edinin. Performans iyileştirmeleri için öneriler ve stratejiler.
Son zamanlarda Nvidia’nın yeni nesil suni zeka GPU’ları olan Blackwell serisinde bazı sorunların yaşandığına dair iddialar ortaya atılmıştı. Şirket, 28 Temmuz’da nihayetlenen 2025 mali yılının ikinci çeyreğinde Blackwell tabanlı ürünlerinin düşük verimlilik sorunları yaşadığını resmen kabul etti. Nvidia, bu sorunları gidermek amacıyla B200 işlemcisinin bazı katmanlarını tekrardan tasarlamak zorunda kaldığını da altını çizdi.
Şirket, 2024’ün son çeyreğinde Blackwell üretim sürecini hızlandırmayı ve senenin bu döneminde milyarlarca dolar değerinde Blackwell GPU sevkiyatı gerçekleştirmeyi planlıyor. Bu bağlamda, Nvidia’nın açıklamasında şu ifadelere yer verildi: “Blackwell GPU üretim verimliliğini çoğaltmak için maske değişikliği gerçekleştirdik. Blackwell üretim artışı, dördüncü çeyrekte başlamış olacak ve mali 2026 yılına kadar devam edecek. Dördüncü çeyrekte, birkaç milyar dolarlık Blackwell geliri elde etmeyi bekliyoruz.”
Ek olarak, Nvidia, Blackwell GPU’larını ikinci çeyrekte müşterileriyle kontrol ettiğini doğruladı, sadece talebi karşılamak için ‘düşük verimli Blackwell malzemesi’ üretmek zorunda kaldıklarını kabul etti. Bu durum, Nvidia’nın brüt kar marjlarını negatif yönde etkiledi.
Nvidia CEO’su Jensen Huang, firmanın Blackwell B100 ve B200 GPUlarının tasarımında lüzumlu tüm değişimleri yaptığını ve bu ürünlerin dördüncü çeyrekte seri üretime geçmeye hazır bulunduğunu belirtti. Nvidia’nın B100 ve B200 GPU’larının, TSMC’nin CoWoS-L paketlemesini kullanan ilk işlemciler olduğu ifade edildi. Bu paketleme yöntemi, chipletlerin bir RDL interposer kullanılarak birbirine bağlandığı ve ortalama 10 TB/s aktarım hızı elde eden mahalli silikon ara bağlantı (LSI) köprüleri ile desteklendiği anlamına geliyor.
Sadece, GPU chipletleri, LSI köprüleri, RDL ara bağlantı ve anakart substratı içinde termal genişleme katsayısındaki uyumsuzluk sebebiyle çeşitli biçim bozuklukları ve sistem arızaları yaşandığı iddiaları gündeme geldi. Bu problemler, Nvidia’nın GPU silikonu üstündeki üst metal katmanlarını ve bağlantı noktalarını tekrardan tasarlamasını mecburi kıldı. Şirket, düzeltmeler hakkında fazla detay vermedi ve yalnızca yeni maskeler oluşturduğunu belirtti.
Nvidia, Blackwell silikonunda işlevsel bir değişim yapılmasına gerek olmadığını, meydana getirilen tüm değişikliklerin verimliliği çoğaltmak ve B100 ve B200 GPU’larının istikrarlı bir halde tedarik edilmesini sağlamak amacıyla gerçekleştirildiğini açıkladı.