Hesaplama Kümeleri
TRUBA hesaplama kümeleri, her yıl geliştirilerek güncellenmektedir. Yapılan her güncelleme, zamanın ihtiyaçları ve mevcut sunucu teknolojileri gözüne alınarak yapıldığından, alınan hesaplama sunucularının modelleri, işlemcileri, çekirdek sayıları ve bellek miktarı farklılık göstermektedir.
Bu kılavuz aşağıdakileri kapsamaktadır:
TRUBA Kaynakları
2003 yılında faaliyete geçen TÜBİTAK ULAKBİM Yüksek Başarımlı ve Grid Hesaplama Merkezi’nde bulunan kaynaklar TRUBA’ya dahildir. Günümüzde TRUBA > 80.000 işlemci çekirdeği, 312 adet GPU ve toplamda 7.5PByte yapılandırılmış yüksek performanslı Lustre ve WEKA dosya sistemi ile araştırmacılarımıza hizmet vermektedir.
Yıl |
Adet |
CPU/GPU |
İşlemci Modeli |
SPECfp_rate_base2006 |
Teorik Gflops |
Bellek |
Tanımı |
---|---|---|---|---|---|---|---|
2003 |
128 |
1 çekirdek x 1 CPU |
Pentium IV 2.66 GHz |
- |
- |
1 GB |
Kullanım Dışı |
2006 |
64 |
2 çekirdek x 2 CPU |
Xeon 5110 1.60 GHz |
17 |
- |
4 GB |
Kullanım Dışı |
2006 |
36 |
2 çekirdek x 2 CPU |
Xeon 5110 1.60 GHz |
17 |
- |
4 GB |
Kullanım Dışı |
2007 |
30 |
4 çekirdek x 2 CPU |
Xeon X5355 2.66GHz |
56.3 |
- |
16 GB |
Kullanım Dışı |
2008 |
16 |
4 çekirdek x 2 CPU |
Opteron 2356 1.15GHz |
81.3 |
36.8 |
16 GB |
Kullanım Dışı |
2009 |
154 |
4 çekirdek x 2 CPU |
Xeon X5550 2.67GHz |
184 |
85.44 |
24 GB |
Kullanım Dışı |
2010 |
52 |
12 çekirdek x 4 CPU |
Opteron 6174 2.20GHz |
574 |
422.4 |
128 GB |
Grid Sitesi&Federe Bulut |
2011 |
192 |
12 çekirdek x 2 CPU |
Opteron 6176 2.30GHz |
294 |
220.8 |
128 GB |
Kullanım Dışı |
2013 |
128 |
8 çekirdek x 2 CPU |
Xeon E5-2690 2.90GHz |
487 |
371.2 |
256 GB |
Özel Küme |
2014 |
48 |
12 çekirdek x 2 CPU |
Xeon E5-2680 v3 2.50GHz |
763 |
960 |
256 GB |
Kullanım Dışı |
2014 |
16 |
12 çekirdek x 2 CPU & 2 x Nvidia M2090 |
Xeon E5-2680 v3 2.50GHz |
763 |
960 Gflops & 2x1330 Gflops |
256 GB & 2x 6GB GDR5 |
Kullanım Dışı |
2016 |
1 |
14 çekirdek x 16 CPU |
Xeon E7-4850 v3 2.20GHz |
- |
7.9 Tflops |
4 TB |
orkinos |
2017 |
128 |
14 çekirdek x 2 CPU |
Xeon E5-2690 v3 2.60GHz |
970 |
1164 Gflops |
256 GB |
sardalya |
2018 |
120 |
20 çekirdek x 2 CPU |
Xeon 6148 2.40GHz |
1400 |
2048Gflops |
384 GB |
barbun |
2018 |
24 |
20 çekirdek x 2CPU & 2xNvidia P100 GPU |
Xeon 6148 2.40GHz |
1400 |
2048Gflops & 9400Gflops |
384 GB & 2x16 GB HBM2 |
barbun-cuda |
2018 |
24 |
20 çekirdek x 2CPU & 4xNvidia V100 GPU |
Xeon 6148 2.40GHz |
1400 |
2048Gflops & 4x7800Gflops |
384 GB & 4x16 GB HBM |
akya-cuda |
2021 |
144 |
28 çekirdek x 2 CPU |
Xeon 6258R 2.70GHz |
- |
3.234 Tflops |
192 GB |
hamsi |
2021 |
9 |
64 çekirdek x 2CPU & 8xNvidia A100 GPU |
AMD 7742 2.24GHz |
- |
4.600Gflops & 8x9.7Tflops |
1 TB & 8x80GB HBM |
palamut-cuda |
2023 |
504 |
56 çekirdek x 2CPU |
Intel(R) Xeon(R) Platinum 8480+ 2.0GHz |
- |
7 Tflops |
256 GB |
orfoz |
2024 |
24 |
32 çekirdek x 2CPU & 4xNvidia H100 GPU |
Intel(R) Xeon(R) GOLD 6548Y+ 2.5GHz |
- |
5Tflops & 4x34Tflops |
1 TB & 4x80GB HBM |
kolyoz-cuda |
Güncel Sunucu Aileleri
Güncel olarak kullanımda olan hesaplama kaynakları aşağıdaki gibidir.
Orkinos
Sunucu üzerinde 4128 GB bellek, 224 adet Intel Xeon e7-4850 V4 çekirdeği bulunmaktadır. Yüksek belleki bir SMP sunucusudur. Üzerinde Redhat 7.2 işletim sistemi bulunmaktadır. Ortak dosya sistemine Infiniband ağ katmanı ile bağlıdır. Ortak dosya sistemi üzerindeki uygulamaların büyük bir çoğunluğu bu sistem üzerinde çalışabilir durumdadır. Ancak uygulamaların yüksek verimde çalışması için Intel derleyiciler ve MKL kütüphanesi ile ya da GCC derleyicileri ve kütüphaneleri ile derlenirken V3 işlemcilerin vektör komut setlerinin (AVX2) kullanılması için özellikle parametre girilmesi gerekmektedir.
Barbun ve Barbun-cuda
Barbun sunucuları 120 adet Dell R640, Barbun-cuda sunucuları R740 model sunuculardan oluşmaktadır. Her bir sunucu üzerinde 2 adet Intel Xeon Scalable Gold 6148 işlemci ve toplam 40 adet işlemci çekirdeği bulunmaktadır. Sunucular birbirlerine EDR (100Gbps) Infiniband ağ kartları ile non-blocking yapıda bağlıdırlar. Barbun-cuda sunucularının her birinde 2 adet NVIDIA P100
GPU kartı bulunmaktadır.
Mevcut durumda barbun bölümlendirmesinde 3 kuyruk tanımı bulunmaktadır: mid2, long ve barbun. Öncelik sıralaması da yüksekten düşüğe dogru mid2, long ve barbun şeklindedir. İşlerinizin tahmini çalışma süresine göre SLURM betik dosyanızda mid2 (maksimum 8 gün) veya long (maksimum 15 gün) kuyruklarını tanımlayabilirsiniz.
Not
barbun-cuda sunucularında NVIDIA 565.57.01 sürücüsü bulunmaktadır:
NVIDIA-SMI 565.57.01
Driver Version: 565.57.01
CUDA Version: 12.7
NVIDIA 565.57.01 sürücüsü CUDA 12.x versiyonu ile uyumludur .
Akya-cuda
Akya-cuda sunucuları 24 adet Supermicro 1029GQ-TRT model sunuculardan oluşmaktadır. Her bir sunucu üzerinde 2 adet Intel Xeon Scalable Gold 6148 işlemci ve toplam 40 adet işlemci çekirdeği ve 4 adet NVIDIA Tesla V100
(16GB, NVLink) GPU kartı bulunmaktadır. Sunucular birbirlerine EDR (100Gbps) Infiniband ağ kartları ile non-blocking yapıda bağlıdırlar.
Not
akya-cuda sunucularında NVIDIA 550.90.07 sürücüsü bulunmaktadır:
NVIDIA-SMI 565.57.01
Driver Version: 565.57.01
CUDA Version: 12.7
NVIDIA 565.57.01 sürücüsü CUDA 12.x versiyonu ile uyumludur .
Hamsi
Hamsi sunucuları 144 adet INSPUR NF5180M5 sunuculardan oluşmaktadır. Her bir sunucu üzerinde 2 adet Intel(R) Xeon(R) Gold 6258R CPU @ 2.70GHz işlemci ve toplam 56 adet işlemci çekirdeği bulunmaktadır. Sunucular birbirlerine HDR100 (100Gbps) Infiniband ağ kartları ile non-blocking yapıda bağlıdırlar.
Orfoz
Orfoz sunucuları 504 adet Lenovo ThinkSystem SR630 V3 sunuculardan oluşmaktadır. Her bir sunucu üzerinde 2 adet Intel(R) Xeon(R) Platinum 8480+ CPU @ 2.0GHz işlemci ve toplam 112 adet işlemci çekirdeği bulunmaktadır. Sunucular birbirlerine 200Gbps Infiniband ağ kartları ile bağlıdırlar.
Orfoz sunucularının yer aldığı ARF hesaplama kümesi hakkındaki ayrıntılı bilgilere ARF Hesaplama Kümesi sayfasından erişim sağlayabilirsiniz.
Kolyoz-cuda
Kolyoz sunucuları 24 adet Lenovo ThinkSystem SD650-N V3 sunuculardan oluşmaktadır. Her bir sunucu üzerinde 2 adet Intel(R) Xeon(R) GOLD 6548Y+ CPU @ 2.5GHz işlemci ve toplam 64 adet işlemci çekirdeği ve 4 adet NVIDIA H100 (80GB, NVLink, HBM3, SXM5) GPU kartı bulunmaktadır. Sunucular birbirlerine 4 adet 200Gbps Infiniband ağ kartları ile bağlıdırlar.
Not
kolyoz-cuda
kuyruğunda Rocky Linux (BLue Onyx) 9.4 işletim sistemi ve hesaplama sunucuları üzerinde NVIDIA 560.35.03 sürücüsü bulunmaktadır. NVIDIA 560.35.03 sürücüsü CUDA 12.* versiyonu ile uyumludur .
NVIDIA-SMI 565.57.01
Driver Version: 565.57.01
CUDA Version: 12.7
Kolyoz sunucularının yer aldığı ARF ACC hesaplama kümesi hakkındaki ayrıntılı bilgilere ARF ACC Hesaplama Kümesi sayfasından erişim sağlayabilirsiniz.
Palamut-cuda
Palamut sunucuları 9 adet HP Proliant XL675d Gen10 Plus model sunuculardan oluşmaktadır. Her bir sunucu üzerinde 2 adet AMD EPYC 7742 2.24GHz işlemci ve toplam 128 adet işlemci çekirdeği ve 8 adet Nvidia Tesla A100 (80GB, NVLink ) GPU kartı bulunmaktadır. Sunucular birbirlerine 4xHDR (200Gbps) Infiniband ağ kartları ile non-blocking yapıda bağlıdırlar.
Not
Palamut-cuda kuyruğunda Rocky Linux (BLue Onyx) 9.4 işletim sistemi ve NVIDIA 565.57.01 sürücüsü bulunmaktadır. NVIDIA 565.57.01 sürücüsü CUDA 12.X versiyonu ile uyumludur .
NVIDIA-SMI 565.57.01
Driver Version: 565.57.01
CUDA Version: 12.7
Not
kolyoz-cuda ve palamut-cuda hesaplama kümeleri özel küme olup sadece araştırma merkezleri tarafından yürütülen alt yapı projeleri (İlgili altyapı projeleri T.C. Cumhurbaşkanlığı Strateji ve Bütçe Başkanlığı, Strateji ve Bütçe Başkanlığı tarafından desteklenen projelerdir) ve de sözleşmeli proje araştırmacıları (TÜBİTAK ULAKBİM ile proje kapsamında sözleşmesi olan projeler) tarafından kullanılabilmektedir. Barbun-cuda ve akya-cuda hesaplama kümeleri tüm kullanıcılarımızın erişimine açıktır.
Mevcut durumda kolyoz-cuda ve palamut-cuda kuyrukları öncelikli olarak belirli araştırma gruplarına hizmet vermektedir. Bu araştırma gruplarında hesapları tanımlı olan kullanıcılar
kolyoz-cuda
ve/veyapalamut-cuda
hesaplama kümesine iş gönderebileceklerdir.kolyoz-cuda ve palamut-cuda hesaplama kümeleri için ayrı bir kullanıcı arayüzü kurulmuştur (
cuda-ui
). İlgili cuda kuyruklarına sadececuda-ui
arayüzü üzerinden iş gönderilebilecektir.
*cuda-ui
kullanıcı arayüzü üzerinde Rocky Linux 9.2 işletim sistemi bulunmaktadır.
kolyoz-cuda ve palamut-cuda hesaplama kümelerine erişim izni olan proje kullanıcıları aktif bir OpenVPN bağlantıları mevcut iken
cuda-ui
arayüz sunucusuna172.16.6.16
IP adresine veyacuda-ui.yonetim
adresine ssh ile bağlanabilirler.
ssh username@172.16.6.16
veya
ssh username@cuda-ui.yonetim
Veya aktif bir OpenVPN bağlantısı ile arf-ui kullanıcı arayüz sunucularından birisine bağlı iken ilgili kullanıcı arayüzü üzerinden cuda-ui arayüz sunucusuna ssh ile geçiş yapabilirler. SSH anahtalarını henüz oluşturmamış kullanıcılar, bu sunucuya arf-ui üzerinden geçiş yapabilmek için ssh anahtarlarını ssh-keygen
ile aşağıdaki gibi oluşturabilirler:
$>ssh-keygen (Sorulan tüm soruları “Enter” tuşuna basarak geçiniz)
$>cp -p .ssh/id_rsa.pub .ssh/authorized_keys
Uyarı
Her bir GPU icin kullanıcılar 16 çekirdek talep etmelidir. Örneğin: 2 sunucu üzerinde 4’er görev ve 4’er GPU kullanabilmek icin:
srun -N 2 -n 8 -c 16 --gres=gpu:4 <komut>
sbatch -N 2 -n 8 -c 16 --gres=gpu:4 <betik_dosyasi>
Kullanılacak toplam çekirdek sayısı = n x c
N : kulllanılacak node sayısı
n : çalıştırılacak görev sayısı
c : her bir görev için kullanılacak çekirdek sayısı (varsayılan 1)
gres=gpu:x : her bir node üzerinde kullanılacak GPU sayısı
Kuyruklar (partitions)
Her iki kümede iş kuyruğu adları ve özellikleri aynı şekilde yapılandırılmıştır.
Zaman zaman bazı kuyruklardaki kaynak miktarı arttırılabilir ya da azaltılabilir, bazı kuyruklar kullanımdan kaldırılabilir. Herhangi bir kuyruğun bilgisine aşağıdaki komutla erişilebilir:
scontrol show partition=kuyruk_adi
Kuyrukların kullanım durumuna, paylaşılan, dolu ya da boş olan node ve çekirdeklerin durumuna sinfo
komutu ile erişilebilir.
Tüm kuyrukların varsayılan çalışma süresi 2 dakikadır. Betik dosyasında zaman bilgisi girilmeyen işler 2 dakika sonunda otomatik olarak sonlandırılmaktadır. Slurm betik dosyasında #SBATCH --time komutu ile hesaplama için öngörülen zaman bilgisi girilen işler, belirtilen zaman sonunda otomatik olarak sonlandırılmaktadır.
Her sunucu ailesinde, sunucu üzerindeki çekirdek sayısına ve bellek miktarına bağlı olarak bellek sınırlamaları mevcuttur. Eğer betik dosyalarında (ya da srun komutunda) herhangi bir bellek değeri girilmemişse, ilgili iş için, çekirdek sayısı x DefMemPerCore
kadar bellek ayrılır. Betik dosyalarında (ya da srun komutunda) işler için --mem-per-core
ya da --mem
parametreleri ile daha fazla bellek talebinde bulunulabilir, ancak talep edilen bellek miktarı hiçbir koşulda maxMemPerCore degerini geçemez. MaxMemPerCore ve DefMemPerCore değerleri her sunucu ailesi için farklıdır. Tüm sunucular için bu verilere aşağıdaki tablodan erişilebilir.
partitions |
nodes |
#nodes |
max run time |
min core |
defMemPerCore |
maxMemPerCore |
Bilgi |
---|---|---|---|---|---|---|---|
single |
levrekv2 |
8 |
15-00:00:00 |
1 |
9500MB |
10500MB |
Kullanım Dışı |
debug |
orfoz, hamsi, barbun, barbun-cuda, akya-cuda, orkinos |
238 |
00-04:00:00 |
1 |
8000MB |
9500MB |
Aktif |
mid2 |
barbun |
189 |
08-00:00:00 |
4 |
8000MB |
9000MB |
Kullanım Dışı |
long |
barbun |
189 |
15-00:00:00 |
4 |
8000MB, 8500MB |
9000MB, 9500MB |
Kullanım Dışı |
interactive |
levrekv2 |
14 |
15-00:00:00 |
1 |
8000MB |
9000MB |
Aktif |
smp |
orkinos |
1 |
3-00:00:00 |
4 |
17000MB |
18400MB |
Özel Kuyruk |
sardalya |
sardalya |
100 |
15-00:00:00 |
4 |
8000MB |
9000MB |
Kullanım Dışı |
barbun |
barbun |
119 |
03-00:00:00 |
4 |
8500MB |
9500MB |
Aktif |
barbun-cuda |
barbun-cuda |
24 |
03-00:00:00 |
20 |
8500MB |
9500MB |
Aktif |
akya-cuda |
akya-cuda |
24 |
03-00:00:00 |
10 |
8500MB |
9500MB |
Aktif |
palamut-cuda |
palamut |
9 |
03-00:00:00 |
16 |
7500MB |
16384MB |
Özel Kuyruk |
hamsi |
hamsi |
144 |
03-00:00:00 |
28 |
3400MB |
3400MB |
Aktif |
orfoz |
orfoz |
504 |
03-00:00:00 |
56 / 55 |
2000MB |
2295MB |
Aktif |
kolyoz-cuda |
kolyoz |
24 |
03-00:00:00 |
16 |
16GB |
16GB |
YZ Çalışmaları |
Uyarı
Short
ve mid1
kurukları 1 Aralık 2021 tarihinde kapatılmıştır. Kısa süreli işlerinizi daha yeni nesil işlemcilere sahip olan ve daha çok sayıda sunucu içeren hamsi
kuyruğuna gönderebilirsiniz.
Uyarı
barbun-cuda, akya-cuda, palamut-cuda ve kolyoz-cuda kuyruklarına gönderilen işlerin GPU kullanabilecek ve GPU talep eden işler olması zorunludur. GPU kümelerinin kullanımı ile ilgili dokümantasyon GPU Kılavuzu sayfamızı inceleyebilirsiniz.
Bu kuyruğa tek çekirdeklik (genelde seri) işler gönderilir. Toplam çekirdek sayısı 1’den fazla ise, iş başka bir kuyruğa gönderilmiş olsa bile, otomatik olarak bu kuyruğa yönlendirilir.
Bu kuyruktaki herhangi bir işin çalışma süresi en fazla 15 gündür. 15 gün içinde tamamlanmamış işler sistem tarafından otomatik olarak sonlandırılmaktadır.
Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=singlekomutu ile görülebilir.
Debug
Bu kuyruğa test amaçlı kısa süreli işler (öreneğin SLURM betik dosyanızın, kodunuzun doğru çalıştığından emin olmak için) gönderilir. Bu kuyruktaki herhangi bir işin çalışma süresi en fazla 15 dakikadır. 15 gün içinde tamamlanmamış işler sistem tarafından otomatik olarak sonlandırılmaktadır.
Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=debug
komutu ile görülebilir. İlgili kuyrukta barbun, barbun-cuda, akya-cuda ve orkinos sunucuları tanımlıdır. Bu kuyruklara gönderilecek işlerin belli bir sunucu ailesi üzerinde çalışması isteniyorsa, betik dosyalarına aşağıdaki tanımlar yazılmalıdır:
Barbun için
#SBATCH --constraint=barbun
Barbun-cuda için
#SBATCH --constraint=barbun-cuda
Akya-cuda için
#SBATCH --constraint=akya-cuda
Orkinos için
#SBATCH --constraint=smp
Not
--contstraint parametresi yerine -C de kullanılabilir.
Mid2
Mid2 kuyruğundaki işlerin çalışma süresi en fazla 8 gündür. 8 gün içerisinde tamamlanmamış işler sistem tarafından otomatik olarak sonlandırılmaktadır.
Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=mid2
komutu ile görülebilir.
Long
Long kuyruğundaki işlerin çalışma süresi en fazla 15 gündür. Bu süre zarfında tamamlanmamış işler sistem tarafından otomatik olarak sonlandırılmaktadır.
Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=long
komutu ile görülebilir.
Interactive
Interaktif işler çalıştırmak için kullanılır. İnteraktif işler Ondemand
üzerinden ya da SSH terminalinden srun
, salloc
ile kuyruğa gönderilebilir. Bu kuyrukta levrekv2 sunucuları kullanılmaktadır.
Smp
Smp kuyruğunda sadece orkinos1 sunucusu bulunmaktadır. Kuyruk rezervasyon yönetimi ile çalıştırılmaktadır. Bu kuyruğu kullanmak isteyen kullanıcıların e-posta ile başvuruda bulunarak sistemi ne kadar süre ile kullanacaklarını, ne kadar kaynağa (işlemci/bellek) ihtiyaç duyduklarını bildirmeleri ve ihtiyaçlarına göre bir rezervasyon yaptırmaları gerekmektedir.
Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=smp
komutu ile görülebilir.
Barbun
Her bir sunucuda 40 çekirdek ve 384GB bellek bulunmaktadır. Kuyrukta işlerin en fazla çalışma süresi 15 gündür. Sistemin verimli kullanılabilmesi için gönderilecek işler en az 20 çekirdek talep etmelidir. Kuyruğa gönderilebilecek işlerin minimum çekirdek sayısı 4’tür.
İşlerde bellek sınırlaması kullanılmaktadır. Gönderilen işlerin sunucuların bellek sınırlamalarına uygun olarak gönderilmesi gerekmektedir. Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=barbun
komutu ile görülebilir.
Barbun-cuda
Her bir sunucuda 40 çekirdek ve 384GB bellek ayrıca 2’şer adet Nvidia P100 16GB GPU kartı bulunmaktadır. Kuyrukta işlerin en fazla çalışma süresi 15 gündür. Sistemin verimli kullanılabilmesi için gönderilecek işler en az 20 çekirdek ve 1 GPU talep etmelidir.
Aynı sunucuda çalışmaya başlayan birden fazla iş aynı GPU kartını paylaşabilmektedir.
İşlerde bellek sınırlaması kullanılmaktadır. Gönderilen işlerin sunucuların bellek sınırlamalarına uygun olarak gönderilmesi gerekmektedir. Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=barbun-cuda
komutu ile görülebilir.
Akya-cuda
Her bir sunucuda 40 çekirdek ve 384GB bellek ayrıca 4’er adet Nvidia V100 16GB GPU (NVLink) kartı bulunmaktadır. Kuyrukta işlerin en fazla çalışma süresi 15 gündür. Ayrıca sistemlerde scratch olarak kullanılmak üzere 1.4TB NVME disk /tmp dizinine bağlanmıştır. Yüksek I/O gerektiren işlerin /tmp dizininde çalıştırılması gerekmektedir.
İşlerde bellek sınırlaması kullanılmaktadır. Gönderilen işlerin sunucuların bellek sınırlamalarına uygun olarak gönderilmesi gerekmektedir. Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=akya-cuda
komutu ile görülebilir.
Hamsi
Her bir sunucuda 56 çekirdek ve 192GB bellek bulunmaktadır. Kuyrukta işlerin en fazla çalışma süresi 3 gündür. Sistemin verimli kullanılabilmesi için gönderilecek işler en az 28 çekirdek talep etmelidir. Kuyruğa gönderilebilecek işlerin minimum çekirdek sayısı 28’dir.
İşlerde bellek sınırlaması kullanılmaktadır. Gönderilen işlerin sunucuların bellek sınırlamalarına uygun olarak gönderilmesi gerekmektedir. Bu kuyruk ile ilgili ayrıntılı bilgi
scontrol show partition=hamsi
komutu ile görülebilir.
orfoz
Her bir sunucuda 112 çekirdek ve 256GB bellek bulunmaktadır. Kuyrukta işlerin en fazla çalışma süresi 3 gündür. Sistemin verimli kullanılabilmesi için gönderilecek işler en az 56 çekirdek talep edilmelidir. Kuyruğa gönderilebilecek işlerin minimum çekirdek sayısı 56’dır.
İşlerde bellek sınırlaması kullanılmaktadır. Gönderilen işlerin sunucuların bellek sınırlamalarına uygun olarak gönderilmesi gerekmektedir. Bu kuyruk ile ilgili ayrıntılı bilgi ilgili kullanıcı arayüzüne bağlandıktan sonra
scontrol show partition=orfoz
komutu ile görülebilir.
Palamut-cuda
Her bir sunucuda 128 çekirdek ve 1TB bellek ayrıca 8’er adet Nvidia A100 80GB GPU (NVLink) kartı bulunmaktadır. Kuyrukta işlerin en fazla çalışma süresi 3 gündür. Sistemin verimli kullanılabilmesi için gönderilecek işler en az 16 çekirdek ve 1 GPU talep etmelidir. Ayrıca sistemlerde scratch olarak kullanılmak üzere 12TB NVME disk /localscratch dizinine bağlanmıştır. Yüksek I/O gerektiren işlerin /localscratch dizininde çalıştırılması gerekmektedir.
İşlerde bellek sınırlaması kullanılmaktadır. Gönderilen işlerin sunucuların bellek sınırlamalarına uygun olarak gönderilmesi gerekmektedir. Bu kuyruk ile ilgili ayrıntılı bilgi palamut-ui kullanıcı arayüzüne bağlandıktan sonra
scontrol show partition=palamut-cuda
komutu ile görülebilir.
Kolyoz-cuda
Her bir sunucuda 64 çekirdek ve 1TB bellek ayrıca 4’er adet NVIDIA H100 80GB GPU (NVLink) kartı bulunmaktadır. Kuyrukta işlerin en fazla çalışma süresi 3 gündür. Sistemin verimli kullanılabilmesi için gönderilecek işler en az 16 çekirdek ve 1 GPU talep etmelidir. Ayrıca sistemlerde tmp olarak kullanılmak üzere 7TB NVME disk / dizinine bağlanmıştır. Yüksek I/O gerektiren işlerin / dizininde çalıştırılması gerekmektedir.
İşlerde bellek sınırlaması kullanılmaktadır. Gönderilen işlerin sunucuların bellek sınırlamalarına uygun olarak gönderilmesi gerekmektedir. Bu kuyruk ile ilgili ayrıntılı bilgi cuda-ui kullanıcı arayüzüne bağlandıktan sonra
scontrol show partition=kolyoz-cuda
komutu ile görülebilir.