Pertumbuhan pesat kecerdasan buatan (AI) mendorong pusat data hingga mencapai batas termalnya. Meskipun sebagian besar GPU dan CPU telah beralih ke pendingin cair untuk mendapatkan kinerja optimal, sistem penyimpanan masih tertinggal, sehingga menciptakan arsitektur hibrid yang tidak efisien sehingga melemahkan manfaat solusi pendinginan modern. Ini bukan sekedar masalah biaya; hal ini merupakan tanggung jawab struktural mendasar yang memengaruhi kepadatan rak, keberlanjutan, dan pada akhirnya, kemampuan untuk meningkatkan penerapan AI.
Inefisiensi Pendinginan Hibrid
Saat ini, banyak penerapan AI yang mengandalkan sistem tambal sulam: prosesor berpendingin cairan dan penyimpanan berpendingin udara. Pendekatan ini tidak efisien secara operasional. Organisasi akhirnya mempertahankan dua infrastruktur pendinginan yang sepenuhnya terpisah dan mahal – liquid loop untuk komputasi dan unit CRAC tradisional untuk penyimpanan – tanpa sepenuhnya menyadari manfaat total biaya kepemilikan (TCO) dari sistem terpadu.
Masalah ini diperburuk oleh kendala fisik. Komponen pendingin cair berukuran besar menghalangi aliran udara di dalam sasis server, memusatkan tekanan termal pada drive berpendingin udara, memori, dan perangkat keras jaringan. Kipas kesulitan menghilangkan panas secara memadai di sekitar pipa cair, sehingga memaksa komponen yang paling sensitif terhadap panas berada dalam lingkungan termal yang paling buruk.
Konsumsi Air: Krisis yang Terabaikan
Selain biaya dan kinerja, dampak lingkungannya juga signifikan. Sistem berpendingin udara sangat bergantung pada menara pendingin evaporatif, yang dapat mengonsumsi jutaan galon air seiring waktu. Ketika kepadatan daya rak meningkat, hukuman air ini menjadi tidak berkelanjutan. Menurut Hardeep Singh, manajer tim perangkat keras mekanis termal di Solidigm, ketergantungan saat ini pada pendinginan evaporatif “tidak dapat dipertahankan secara lingkungan dan ekonomi” dalam jangka panjang.
Pergeseran ke Desain Termal Tingkat Sistem
Infrastruktur AI modern tidak dibangun server demi server; ini dirancang sebagai sistem tingkat rak dan pod yang terintegrasi erat. Penyaluran daya, distribusi pendinginan, dan penempatan komponen kini tidak dapat dipisahkan. Artinya arsitektur penyimpanan yang dirancang untuk pusat data yang bergantung pada aliran udara menjadi faktor pembatas. Saat GPU beralih ke desain berpendingin cairan dan tanpa kipas, penyimpanan harus beradaptasi atau menjadi hambatan.
Penyimpanan: Dari Peserta Pasif ke Aktif
Secara historis, penyimpanan diperlakukan sebagai subsistem pasif. Hal ini sudah tidak dapat dilakukan lagi. Penskalaan AI kini bergantung pada apakah penyimpanan dapat diintegrasikan dengan baik ke dalam sistem GPU berpendingin cairan tanpa memecah-mecah arsitektur pendingin atau membatasi desain tingkat rak.
Scott Shadley, direktur narasi kepemimpinan dan penginjil di Solidigm, menekankan bahwa perlombaan untuk meningkatkan skala AI bukan lagi hanya soal jumlah GPU. Ini tentang siapa yang dapat menjaga GPU tersebut tetap dingin, andal, dan efisien. Teknik seperti pembongkaran cache KV, yang memindahkan data antara memori GPU dan penyimpanan berkecepatan tinggi, menjadikan latensi penyimpanan dan performa termal penting untuk efisiensi penyajian model.
Jalan Menuju Pendinginan Cairan Terintegrasi
Peralihan ke rak berpendingin cairan yang terintegrasi penuh meningkatkan efisiensi penggunaan daya (PUE) dan mengurangi biaya operasional. Hal ini juga menghilangkan kebutuhan akan pengendali udara ruang komputer (CRAH) yang bising, sehingga berpotensi menggantikannya dengan unit distribusi pendingin cair (CDU) yang modern dan efisien yang mampu mendinginkan rak pada suhu setinggi 45° Celcius.
Namun, integrasi yang lancar memerlukan desain ulang penyimpanan yang mendasar. Desain SSD tradisional mengasumsikan aliran udara untuk manajemen termal dan sering kali mendistribusikan komponen di kedua sisi PCB – asumsi yang tidak berlaku di lingkungan berpendingin cairan. Kemudahan servis juga penting; pendingin cair tidak boleh menimbulkan risiko kebocoran selama pemasangan atau pelepasan drive.
Masa Depan Penyimpanan: Didesain Ulang untuk Cairan
Solidigm telah berkolaborasi dengan NVIDIA untuk mengatasi tantangan ini, dengan fokus pada kompatibilitas hot-swap dan solusi pendinginan satu sisi. Perusahaan menganjurkan untuk mendesain ulang SSD dengan jalur perpindahan panas dengan resistansi rendah agar dapat menghantarkan panas secara efisien ke pelat dingin khusus.
Industri ini bersatu dalam standar untuk memastikan interoperabilitas. Solidigm memimpin upaya ini, bekerja sama dengan SNIA dan Open Compute Project (OCP) untuk mengembangkan desain siap produksi yang terintegrasi dengan baik ke dalam platform GPU berpendingin cairan.
Pergeserannya jelas: penyimpanan bukan lagi masalah teknik tersendiri. Hal ini merupakan variabel langsung dalam pemanfaatan GPU, keandalan sistem, dan efisiensi operasional. Masa depan penskalaan AI bergantung pada penerimaan kenyataan ini.


















