Kuyruk Bilgisi

Kuyruk Bilgisi#

ARF ACC hesaplama kümesinde, GPU tabanlı iki ana kuyruk bulunmaktadır: kolyoz-cuda ve palamut-cuda. Bu kuyruklar, yüksek performanslı GPU hesaplama gereksinimleri için özel olarak ayrılmıştır ve yalnızca yetkili kullanıcılar tarafından kullanılabilir.

Erişim Politikası

kolyoz-cuda ve palamut-cuda kuyrukları, yalnızca araştırma merkezleri tarafından yürütülen altyapı projeleri ve TÜBİTAK ULAKBİM ile sözleşmeli projeler kapsamında erişime açıktır. Diğer kullanıcılar için barbun-cuda ve akya-cuda kuyrukları önerilir.

Kuyrukların teknik ve donanım özellikleri aşağıda özetlenmiştir:

Kuyruk ve Donanım Özellikleri#

Kuyruk Adı

Yıl

Sunucu Adet

Sunucu Modeli

CPU /GPU

İşlemci Modeli

Bellek

Ağ Kartı

İşletim Sistemi

Max Süre

palamut-cuda

2021

9

HP Proliant XL675d Gen10 Plus

128 çekirdek & 8x NVIDIA A100 GPU

AMD EPYC 7742 2.24GHz

1 TB & 8x80 GB HBM

4x HDR (200Gbps) Infiniband

Rocky Linux 9.4

3 gün

kolyoz-cuda(H100)

2024

24

Lenovo ThinkSystem SD650-N V3

64 çekirdek & 4x NVIDIA H100 GPU

Intel Xeon GOLD 6548Y+ 2.5GHz

1 TB & 4x80 GB HBM3

4x NDR (200Gbps) Infiniband

Rocky Linux 9.4

3 gün

kolyoz-cuda(H200)

2025

48

Lenovo ThinkSystem SD650-N V3

64 çekirdek & 4x NVIDIA H200 GPU

Intel Xeon GOLD 6548Y+ 2.5GHz

1 TB & 4x141 GB HBM3e

4x NDR (200Gbps) Infiniband

Rocky Linux 9.4

3 gün

Not

Her iki kuyrukta da iş gönderimi için en az 16 çekirdek ve en az 1 GPU talep edilmelidir. GPU kullanılmayan işler bu kuyruklarda çalıştırılamaz.

Çoklu GPU ve sunucu kullanımı için, her bir GPU başına 16 çekirdek ve katları talep edilmelidir. Örneğin, toplamda 8 GPU olmak üzere 2 sunucuda 4’er görev ve 4’er GPU kullanmak için:

srun -N 2 -n 8 -c 16 --gres=gpu:4 <komut>
sbatch -N 2 -n 8 -c 16 --gres=gpu:4 <betik_dosyasi>

Kolyoz-cuda kuyruğundan bu şekilde iş gönderirken GPU tipini -C parametresiyle H100 veya H200 olarak belirtebilirsiniz.

srun -N 2 -n 8 -c 16 --gres=gpu:4 <komut> -C <GPU tipi>
sbatch -N 2 -n 8 -c 16 --gres=gpu:4 <betik_dosyasi> -C <GPU tipi>

Not

Kolyoz-cuda kuyruğuna göndereceğiniz işlerinizde kullanmak istediğiniz GPU’ya göre SLURM betiklerinizi düzenlemeniz gerekmektedir.

#!/bin/bash
#SBATCH -p kolyoz-cuda
#SBATCH -A kullanici_adi
#SBATCH -J jobname
#SBATCH -N 1
#SBATCH -n 1
#SBATCH -c 16
#SBATCH -C H100  # <<< Bu satır H100 GPU'sunu belirtiyor.
#SBATCH --time=0-00:05:00
#!/bin/bash
#SBATCH -p kolyoz-cuda
#SBATCH -A kullanici_adi
#SBATCH -J jobname
#SBATCH -N 1
#SBATCH -n 1
#SBATCH -c 16
#SBATCH -C H200   # <<< Bu satır H200 GPU'sunu belirtiyor.
#SBATCH --time=0-00:05:00

Yüksek I/O Gereksinimi:

  • palamut-cuda: Her sunucuda 12 TB NVMe disk /localscratch altında sunulmaktadır.

  • kolyoz-cuda: Her sunucuda 7 TB NVMe disk /tmp altında sunulmaktadır.

Geçici dosya ve veri işlemlerinizde bu dizinleri kullanarak I/O performansınızı artırabilirsiniz.

Kuyruk ve donanım detaylarının güncel durumunu görmek için cuda-ui arayüzünde aşağıdaki komutu kullanabilirsiniz:

scontrol show partition=<kuyruk_adi>

Daha fazla bilgi ve güncel kullanım politikaları için sistem yöneticinizle iletişime geçebilirsiniz.