Skip to content Skip to sidebar Skip to footer

Yüksek Performanslı Bilgi İşlem (HPC) alanı, yapay zekanın patlayıcı büyümesiyle birlikte köklü bir dönüşüm geçiriyor.

Veri merkezleri, yapay zeka teknolojilerinin geleneksel altyapının sınırlarını zorlamasıyla birlikte güç taleplerinde benzeri görülmemiş bir artış yaşıyor. Hesaplama devrimi artık yalnızca işlem hızıyla ilgili değil, aynı zamanda son teknoloji yapay zeka iş yükleriyle birlikte gelen muazzam elektrik gereksinimlerini yönetmekle ilgilidir.

Bu zorluğun merkezinde çarpıcı bir gerçek yatıyor: Yapay zeka, veri merkezi enerji tüketimini temelden yeniden şekillendiriyor. Goldman Sachs Research, yapay zekanın 2023 ile 2030 yılları arasında veri merkezi güç tüketimini yılda yaklaşık 200 terawatt-saat artırabileceğini tahmin ediyor. Enerji yoğunluğu dikkat çekici – tek bir ChatGPT sorgusu, standart bir Google araması için sadece 0,3 watt-saat ile karşılaştırıldığında 2,9 watt-saat elektrik tüketiyor. Bu üstel artış yalnızca teknik bir nüans değil, aynı zamanda tüm teknolojik ekosistem için kritik bir dönüm noktası.

Veri merkezleri bu nedenle güç yönetiminin merkezi stratejik husus haline geldiği karmaşık bir dönüşümle karşı karşıyadır. Ancak Northern Data Group’ta Veri Merkezleri Müdürü olan Gary Tinkler, Northern Data Group’un yapay zekanın veri merkezleri üzerinde baskı yaratması gibi yeni bir zorluğun üstesinden gelmek için stratejilere nasıl öncülük ettiğini açıklıyor.

HPC bağlamında veri merkezlerinin karşı karşıya olduğu mevcut zorluk nedir?

HPC’den bahsettiğimizde, AI ve hesaplama gücünün birleşimi inanılmaz yenilikleri yönlendiriyor. Geçmişte, sistemlerin sorunsuz çalışmasını sağlamak için esas olarak soğutma çözümlerine odaklandık.

Ancak şimdi, AI destekli HPC sistemlerinin çok daha fazla güç gerektirmesiyle, asıl zorluk sadece donanımı serin tutmak değil; muazzam bir elektrik talebini yönetmektir. Sektördeki bu önemli değişim bize önemli bir şey söylüyor: artık bir soğutma sorunu değil, bir güç sorunu.

Özellikle yapay zeka açısından veri merkezlerinin mevcut güç gereksinimleri nelerdir?

Örnek olarak, HPC dünyasının devlerinden NVIDIA’ya daha yakından bakalım. Bize iyi hizmet eden popüler hava soğutmalı sistemler yarattılar. Ancak, AI modelleri daha karmaşık hale geldikçe, güç gereksinimleri hızla artıyor.

Raporlar, AI eğitim görevlerinin geleneksel veri merkezlerinin işlemek üzere tasarlandığından 10-15 kat daha fazla güç kullandığını gösteriyor. Bir zamanlar raf başına 5-8 kW ile çalışan tesisler hızla güncelliğini yitiriyor. NVIDIA yakın zamanda yeni GPU’ların büyük bir lansmanını duyurdu ve bu artan güç taleplerini karşılamak için ileri teknolojiye acil ihtiyaç olduğunu vurguladı.

Veri merkezi operatörleri artan güç taleplerine nasıl yanıt veriyor?

Veri merkezi operatörleri artık güç stratejilerini yeniden değerlendiriyor çünkü mevcut kurulumları buna ayak uyduramıyor. Örneğin, raf başına 8 kW ile iyi çalışan bir tesis artık bunun yeterli olmadığını görüyor.

Yapay zeka gelişmeye devam ettikçe, raf başına 50-80 kW arasında güç ihtiyacının arttığını görüyoruz. Bu sadece küçük bir değişiklik değil; veri merkezlerinin nasıl tasarlanması gerektiği konusunda büyük bir değişiklik.

Veri merkezleri daha yüksek güç taleplerine geçişi yönetmek için hangi adımları atabilir?

Bu geçişteki en büyük zorluklardan biri güç kaynağı sistemlerini güncellemektir. Geleneksel Güç Dağıtım Birimleri (PDU’lar), bu yeni AI destekli sistemlerin taleplerini karşılamak için üretilmemiştir. Gerekli güç seviyelerini karşılamak için veri merkezleri, genel verimliliği artırırken daha ağır yükleri yönetebilen daha gelişmiş PDU’lara yatırım yapabilir.

Günümüzdeki birçok kurulum için bu, her biri 63 amper güç sağlayabilen altı ünitenin kurulması anlamına gelir. Bu değişim yalnızca veri merkezlerinin nasıl inşa edildiğini değiştirmekle kalmaz, aynı zamanda her şeyin rafların içinde nasıl düzenlendiğine de karmaşıklık katar.

Veri merkezlerinde hangi yenilikçi çözümler hayata geçiriliyor?

Elbette, tesisler bu yeni güç ihtiyaçlarını karşılamak için acele ederken, yenilikçi çözümlerin ortaya çıktığını görüyoruz. Örneğin Ultrascale Digital Infrastructure, veri merkezlerinin %99 bitki bazlı sıvılarla çalışabilmesi için Cargill ile ortaklık kurdu ve soğutmada her yıl kullanılan milyarlarca galon suya olan ihtiyacı ortadan kaldırdı ve özellikle operasyonlarında suya güvenmek üzere tasarlanmış veri merkezleri için su tasarrufu için yeni fırsatlar sundu.

Artan güç taleplerini karşılamak için veri merkezi tasarımları nasıl gelişiyor?

Güç talepleri arttıkça, standart 1200 mm derinliğindeki raflar modası geçiyor. Bu artışı karşılamak için 1400 mm derinliğindeki raflara geçiş görmemiz muhtemel. Bu sadece şeyleri büyütmekle ilgili değil; esnekliği ve kapasiteyi en üst düzeye çıkarmakla ilgili. Son raporlar, 800 mm’den 1000 mm’ye kadar değişen daha geniş raf seçeneklerinin daha popüler hale geldiğini ve tesislerin daha etkili bir şekilde ölçeklenmesine yardımcı olan standartlaştırılmış 52 Raf Ünitesi (RU) sağladığını gösteriyor.

Raf tasarımındaki bu değişiklik, veri merkezlerinin AI ve HPC’nin gelişen taleplerini nasıl destekleyebileceğini doğrudan etkilediği için kritik öneme sahiptir. Tesisler, rafların boyutunu optimize ederek hava akışını iyileştirebilir, güç dağıtımını kolaylaştırabilir ve nihayetinde operasyonel verimliliği artırabilir.

Veri merkezleri “sıkışmış alan” konusunda hangi zorluklarla karşı karşıya?

Geleneksel iş yükleri için tasarlanan tesisler yeni HPC altyapısına uyum sağlamaya çalışırken, kendilerini sıklıkla boşa harcanmış alanla karşı karşıya buluyorlar. Eski veri merkezleri, modern AI iş yüklerinin yoğunluk ve güç ihtiyaçlarını karşılamak için inşa edilmemişti. Raf başına 30 kW’ı destekleyebilen dolaylı soğutma çözümleri gibi yükseltilmiş kurulumlara sahip olanlar bile, talepler artık sıklıkla 60 kW’ı aştığı için yetersiz kalıyor. Tesis operatörleri yalnızca soğutma yöntemlerini değil, aynı zamanda artan güç taleplerine hazırlanırken mevcut alanlarını en iyi şekilde nasıl kullanacaklarını da yeniden düşünüyorlar.

Geleneksel veri merkezleri güç ihtiyaçları hakkında belirli varsayımlarla inşa edildi – genellikle raf başına 5-8 kW civarında. Bu, artan taleplere yanıt olarak soğutmayı iyileştirmek için tasarlanmış koridor sınırlaması gibi yeniliklere yol açtı. Ancak, AI sınırları zorlamaya devam ettikçe, bu eski varsayımlar artık yeterli değil. HPC dağıtımları artık raf başına 80 kW’a kadar veya daha fazla güç çıkışını kaldırabilen tesisler gerektiriyor.

Yapay Zeka ve HPC bağlamında veri merkezlerinin geleceği nasıl olacak?

Çok farklı görünen yeni bir gelişmiş veri merkezi dalgasının ortaya çıktığını görmeye başlıyoruz. Bu tesisler, baştan sona bu artan talepleri karşılamak üzere tasarlanmış ve gelecekteki büyüme için esneklik sağlarken çeşitli güç gereksinimlerini karşılayabiliyor.

HPC sektörünün karşı karşıya olduğu genel zorluk nedir?

Yapay zeka HPC’de mümkün olanı yeniden şekillendirmeye devam ederken, sektör özünde önemli bir zorlukla karşı karşıya: güç sorunu. Soğutmaya geleneksel odaklanma artık yeterli değil. Heyecan verici yeni teknolojiler her zamankinden daha hızlı bir şekilde geliştirilirken, dikkat bu yeni sınırı destekleyebilecek sağlam bir güç altyapısı oluşturmaya kayıyor.

Bu güç zorluğunu bir engel olmaktan çıkarıp bir fırsata dönüştürmek için tasarım, düzen ve operasyonel stratejilerinde evrim geçiren veri merkezleri, yüksek performanslı bilgi işlemde yapay zekanın tüm potansiyelini açığa çıkarabilir. HPC’nin geleceği parlak görünüyor, ancak her şey bu yeni taleplere uyum sağlama yeteneğimize bağlı.