Kuyruk Bilgisi#
ARF ACC hesaplama kümesinde, GPU tabanlı iki ana kuyruk bulunmaktadır: kolyoz-cuda ve palamut-cuda. Bu kuyruklar, yüksek performanslı GPU hesaplama gereksinimleri için özel olarak ayrılmıştır ve yalnızca yetkili kullanıcılar tarafından kullanılabilir.
Erişim Politikası
kolyoz-cuda ve palamut-cuda kuyrukları, yalnızca araştırma merkezleri tarafından yürütülen altyapı projeleri ve TÜBİTAK ULAKBİM ile sözleşmeli projeler kapsamında erişime açıktır. Diğer kullanıcılar için barbun-cuda ve akya-cuda kuyrukları önerilir.
Kuyrukların teknik ve donanım özellikleri aşağıda özetlenmiştir:
Kuyruk Adı |
Yıl |
Sunucu Adet |
Sunucu Modeli |
CPU /GPU |
İşlemci Modeli |
Bellek |
Ağ Kartı |
İşletim Sistemi |
Max Süre |
|---|---|---|---|---|---|---|---|---|---|
palamut-cuda |
2021 |
9 |
HP Proliant XL675d Gen10 Plus |
128 çekirdek & 8x NVIDIA A100 GPU |
AMD EPYC 7742 2.24GHz |
1 TB & 8x80 GB HBM |
4x HDR (200Gbps) Infiniband |
Rocky Linux 9.4 |
3 gün |
kolyoz-cuda(H100) |
2024 |
24 |
Lenovo ThinkSystem SD650-N V3 |
64 çekirdek & 4x NVIDIA H100 GPU |
Intel Xeon GOLD 6548Y+ 2.5GHz |
1 TB & 4x80 GB HBM3 |
4x NDR (200Gbps) Infiniband |
Rocky Linux 9.4 |
3 gün |
kolyoz-cuda(H200) |
2025 |
48 |
Lenovo ThinkSystem SD650-N V3 |
64 çekirdek & 4x NVIDIA H200 GPU |
Intel Xeon GOLD 6548Y+ 2.5GHz |
1 TB & 4x141 GB HBM3e |
4x NDR (200Gbps) Infiniband |
Rocky Linux 9.4 |
3 gün |
Not
Her iki kuyrukta da iş gönderimi için en az 16 çekirdek ve en az 1 GPU talep edilmelidir. GPU kullanılmayan işler bu kuyruklarda çalıştırılamaz.
Çoklu GPU ve sunucu kullanımı için, her bir GPU başına 16 çekirdek ve katları talep edilmelidir. Örneğin, toplamda 8 GPU olmak üzere 2 sunucuda 4’er görev ve 4’er GPU kullanmak için:
srun -N 2 -n 8 -c 16 --gres=gpu:4 <komut>
sbatch -N 2 -n 8 -c 16 --gres=gpu:4 <betik_dosyasi>
Kolyoz-cuda kuyruğundan bu şekilde iş gönderirken GPU tipini -C parametresiyle H100 veya H200 olarak belirtebilirsiniz.
srun -N 2 -n 8 -c 16 --gres=gpu:4 <komut> -C <GPU tipi>
sbatch -N 2 -n 8 -c 16 --gres=gpu:4 <betik_dosyasi> -C <GPU tipi>
Not
Kolyoz-cuda kuyruğuna göndereceğiniz işlerinizde kullanmak istediğiniz GPU’ya göre SLURM betiklerinizi düzenlemeniz gerekmektedir.
#!/bin/bash
#SBATCH -p kolyoz-cuda
#SBATCH -A kullanici_adi
#SBATCH -J jobname
#SBATCH -N 1
#SBATCH -n 1
#SBATCH -c 16
#SBATCH -C H100 # <<< Bu satır H100 GPU'sunu belirtiyor.
#SBATCH --time=0-00:05:00
#!/bin/bash
#SBATCH -p kolyoz-cuda
#SBATCH -A kullanici_adi
#SBATCH -J jobname
#SBATCH -N 1
#SBATCH -n 1
#SBATCH -c 16
#SBATCH -C H200 # <<< Bu satır H200 GPU'sunu belirtiyor.
#SBATCH --time=0-00:05:00
Yüksek I/O Gereksinimi:
palamut-cuda: Her sunucuda 12 TB NVMe disk /localscratch altında sunulmaktadır.
kolyoz-cuda: Her sunucuda 7 TB NVMe disk /tmp altında sunulmaktadır.
Geçici dosya ve veri işlemlerinizde bu dizinleri kullanarak I/O performansınızı artırabilirsiniz.
Kuyruk ve donanım detaylarının güncel durumunu görmek için cuda-ui arayüzünde aşağıdaki komutu kullanabilirsiniz:
scontrol show partition=<kuyruk_adi>
Daha fazla bilgi ve güncel kullanım politikaları için sistem yöneticinizle iletişime geçebilirsiniz.