Yüksek Performanslı Dosya Sistemleri

Hesaplama kümelerindeki sunucuların üzerinde bulunan yerel disklerden bağımsız olarak, sunucular kullanıcı verilerinin saklanması ve kullanıcı işlerinin çalıştırılması amacı ile paylaştırılmış merkezi dosya sistemlerini kullanırlar. Merkezi dosya sistemleri yüksek başarımlı LUSTRE paralel dosya sistemi kullanarak yapılandırılmıştır. Hesaplama kümelerinde farklı tipte ve özelliklerde yüksek performanslı dosya sistemleri kullanılmaktadır. Bu kılavuz dosya sistemleri hakkında aşağıdaki başlıkları kapsamaktadır:

Önemli Notlar

Öncelikle aşağıdaki uyarıyı vurgulamak isteriz.

Uyarı

Yüksek başarımlı hesaplama merkezimizde bulunan dosya sistemleri kesinlikle kalıcı bir dosya depolama alanı olarak düşünülmemelidir. Dosya sistemindeki verilerin güvenliğinden kullanıcının kendisi sorumludur.

  • Kullanıcı ev dizinleri ve merkezimiz tarafından sağlanan yazılımların (derleyici, uygulama ve kütüphaneler) kaydedildiği alan için “kullanıcı ev dizini” terimi kullanılmaktadır. Kullanıcı ev dizinleri için iki farklı dosya sistemi kullanılmaktadır. Kullanıcı dizinleri ../home dosya sistemi altında bulunmakla birlikte işlerini çalıştırırken yüksek performanslı dosya sistemi ../scratch dosya sistemi altında bulunmaktadır.

  • /truba ve /arf dosya sistemlerinde kullanıcılar için kota uygulaması söz konusudur. Tüm kullanıcıların disk kotaları eşit olarak ayarlanmıştır. ARDEB vasıtası ile hesap açılan ve projeleri kapsamında işlerini çalıştıran kullanıcılar için, standart kota miktarından farklı olarak, projelerinde öngörülen disk kotası miktarı uygulanmaktadır. Detayları aşağıdaki tablolardan erişebilirisiniz.

  • Kullanıcı ev dizinlerinin yedekleri alınmamaktadır. Bu nedenle buradaki kullanıcı verilerinin düzenli olarak kullanıcılar tarafından kendi kişisel bilgisayarlarına aktarılması, önemsiz verilerin ise yine kullanıcının kendisi tarafından silinmesi beklenmektedir. Kullanıcı ev dizinleri kesinlikle uzun vadeli bir depolama alanı olarak düşünülmemelidir.

  • Kullanıcı ev dizinleri standart olarak sadece dizinin sahibi tarafından erişilebilecek şekilde oluşturulurlar. Ancak zamanla kullanıcılar dizin erişim haklarını bilerek ya da bilmeyerek değiştirebilirler. Kullanıcı ev dizinlerindeki verinin güvenliğinden yine kullanıcın kendisi sorumludur.

  • Kümelerde kullanılan ortak yazılımlar /truba/sw ve /arf/sw dizininde tutulurlar. Bu dizine tüm kullanıcıların read-only erişimleri vardır. Bu dizindeki yazılımlar genel olarak ücretsiz lisanslı yazılımlardır ve tüm TRUBA kullanıcılarının yazılımın lisans haklarına uyulması şartı ile kullanımına açıktır.

ARF Dosya Sistemi

ARF hesaplama kümesi için /arf/home, /arf/scratch ve /truba/home dosya sistemleri hakkında detaylı içerik tablo içerisinde belirtilmiştir. Bu dosya sistemlerine bağlı bulunan suncular üzerinden iş gönderilebilir. İşler çalışırken sadece beliritlen dosya sistemlerine erişimi mevcuttur.

ARF Hesaplama Kümeleri Dosya Sistemleri

Dizin adı

Kullanım

Kotası

İşlevi

Açıklama

Bağlı bulunduğu sunucular

/arf/home

Ev dizini

Bellek: 100GB
Dosya Sayısı: 100K(inode)

Araştırmacının önemli gördüğü,
kalıcı dosyalarının bulunacağı
hızlı ana dizin.

Uygulama kurulumları,
Betik dosyaları,
İşlerin girdi dosyaları
Yeniden kullanılabilir,
Küçük boyutlu çıktı dosyalarının bulunacağı dizindir.
Herhangi bir kota arttırımı söz konusu değildir.
Proje kotaları ayrıca belirlenmektedir.

arf-ui1
arf-ui2
OpenOndemand
orfoz

/arf/scratch

Scratch dizini

Bellek: 1TB
Dosya Sayısı: 200K(inode)

Araştırmacının işlerini,
çalıştırmak için kullanacağı
hızlı ana dizin

Çalışan işler için kullanılacak dizin,
Çalışan işin geçici dosyalarının kullanabileceği dizin,
Çalışan işlerin çıktı dosyalarının depolanabileceği dizindir.
Bu dizin içerisinde uzun süreli veri depolaması gerçekleştirilemez.
Dosyalar periyodik olarak sistem tarafından otomatik silinecektir.
Herhangi bir kota arttırımı ve süre uzatımı söz konusu değildir.
Proje kotaları ayrıca belirlenmektedir.

arf-ui1
arf-ui2
OpenOndemand
orfoz

/truba/home

Depolama

Bellek: 2TB
Dosya Sayısı: 100K(inode)

Araştırmacının verilerini
geçici olarak depolayacağı dizin

/arf/scratch dizini
otomatik olarak temizleneceği için;
girdi ve çıktı dosyalarının
proje süresi boyunca depolanabileceği ev dizinidir.

arf-ui1
arf-ui2
OpenOndemand
orfoz

TRUBA Dosya Sistemi

TRUBA hesaplama kümesi için /truba/home ve /truba/scratch dosya sistemleri hakkında detaylı içerik tablo içerisinde belirtilmiştir. Bu dosya sistemlerine bağlı bulunan suncular üzerinden iş gönderilebilir. İşler çalışırken sadece beliritlen dosya sistemlerine erişimi mevcuttur.

Uyarı

/truba/home ve /truba/scratch dizinleri için kota hesaplaması bu iki dizinin toplamı üzerinden gerçekleştirilmektedir.

Not

barbun, hamsi, barbun-cuda, akya-cuda, palamut-cuda kümelerinin işletim sistemleri güncellenerek bu sunucular ARF kümesine dahil edilecektir. Bu güncelleme takvimi ayrıca duyurulacaktır. Güncelleme gerçekleştiğinde, tüm sunucular için ev dizini /arf/home, scratch dizini /arf/scratch ve depolama dizini /truba/home olacaktır. Bu geçiş sonrasında /truba/scratch dizini kullanımdan kaldırılacaktır.

TRUBA Hesaplama Kümeleri Dosya Sistemleri

Dizin adı

Kullanım

Kotası

İşlevi

Açıklama

Bağlı bulunduğu sunucular

/truba/home

Ev dizini

Bellek: 2TB
Dosya Sayısı: 100K(inode)

Araştırmacının verilerini
geçici olarak depolayacağı dizin.

/truba/scratch dizini
otomatik olarak temizleneceği için;
girdi ve çıktı dosyalarının
proje süresi boyunca depolanabileceği ev dizinidir.

barbun1
OpenOndemand
barbun
hamsi
barbun-cuda
akya-cuda
palamut-cuda

/truba/scratch

Scratch dizini

Araştırmacının işlerini,
çalıştırmak için kullanacağı
hızlı ana dizin

Çalışan işler için kullanılacak dizin,
Çalışan ışın geçici dosyalarının kullanabileceği dizin,
Çalışan işlerin çıktı dosyalarının depolanabileceği dizindir.
Bu dizin içerisinde uzun süreli veri depolaması gerçekleştirilemez.
Dosyalar periyodik olarak sistem tarafından otomatik silinecektir.

barbun1
OpenOndemand
barbun
hamsi
barbun-cuda
akya-cuda
palamut-cuda

Sunucular ve Kullanıcı Arayüzleri

ARF ve TRUBA hesaplama kümelerinde bulunan sunuculara iş gönderebilmek için bağlı bulundukları kullanıcı arayüzleri kullanılmalıdır. İki sistem için merkezi kurulumlar ve erişebildikleri dosya sistemleri farklıdır. Hangi sunucuların veya kuyrukların işleriniz için uygun olduğu bilgisi hesaplama kümeleri sayfasından detaylı bilgilere erişilerek karar verilebilir.

ARF Sistemi

Sunucu Türü

Ev Dizini

Scratch

Depolama

Yerel

Kullanıcı Arayüzü

orfoz

/arf/home

/arf/scratch

/truba/home

/tmp - 800GB

arf-ui1
arf-ui2
OpenOndemand

TRUBA Sistemi

Sunucu Türü

Ev Dizini

Scratch

Yerel

Kullanıcı Arayüzü

barbun

/truba/home

/truba/scratch

/tmp - 1TB

barbun1
OpenOndemand

hamsi

/truba/home

/truba/scratch

/tmp - 1TB

barbun1
OpenOndemand

barbun-cuda

/truba/home

/truba/scratch

/tmp - 1TB

barbun1

akya-cuda

/truba/home

/truba/scratch

/tmp - 1.4TB

barbun1

palamut-cuda

/truba/home

/truba/scratch

/tmp - 800GB
/localscratch - 12TB

palamut-ui

Dosya Sayısı (inode)

Kullanıcının ev dizinlerinin (../home/$USER ve ../scratch/$USER) boyutundan bağımsız olarak kullanıcı dizinlerindeki dosya sayısı da Dosya Sistemi’nde aşırı yük yaratmaktadır. Özellikle kurulum dosyalarının (source code) kurulumdan sonra silinmemesi, ya da anaconda gibi uygulamaların merkezi versiyonu yerine kullanıcı ev dizinlerine kurulması dosya sisteminin aşırı dolmasına ve sistem performansının düşmesine neden olmaktadır. Bu sorunlardan dolayı 1 Mayıs 2022 tarihinden itibaren dosya sayısı kotası (inode) uygulanmaya başlanmıştır. Kullanıcılar

lfs quota -gh $USER /truba

komutu ile kullandığı dosya sayısını(inode) öğrenebilir. Ayrıca terminalden barbun1 kullanıcı arayüzüne bağlantı sağladıktan sonra login ekranına dökülen kota bilgilerine dosya kotası da % olarak eklenmiştir. Bu değerin %100’un altında olması gerekmektedir.

Dosya Sayısı için çözüm önerileri

Not

Kullanıcılarımızdan

  • kullandıkları uygulamaların merkezi versiyonu varsa (module vb.) merkezi versiyonlarını kullanmalarını

  • merkezi kurulumda olmayan uygulamaların konteyner teknolojilerinden faydalanarak tek bir imaj dosyası ile konteyner oluşturmaları(bkz. konteyner kullanımı),

  • merkezi versiyonu olmayan ve konteyneri bulunmayan uygulamaların kendi ev dizinlerine kurulması gerekiyorsa, kurulum sonrasında kaynak dosyaları silmelerini

  • yapay zeka veya diğer alanlarda sıklıkla kullanılan ilgili veri setleri herhangi bir lisans sözleşmesi gerektirmeden doğrudan sayfa üzerinden açık olarak paylaşılan bir veri seti ise kullanıcı ev dizinleri yerine grid-teknik@ulakbim.gov.tr ile iletişime geçerek merkezi TRUBA Veri Setleri dizine oluşturulması için bildirilmesi,

  • /arf ve /truba depolama sistemlerine anaconda, miniconda, conda veya herhagi bir Python kütüphanesi kesinlikle yüklenmemelidir, pip ve türevleri kullanılmamalıdır. Küçük boyutlu yüzbinlerce dosyadan oluştuğu için, her kullanıcının kendi ev dizinine kurduğu bu tip kütüphaneler dosya sistemlerinin performanslarını büyük ölçüde düşürmekte ve çalışan işlerin yavaşlamasına neden olduğundan özellikle Anaconda kullanıcılarının merkezi Anaconda kurulumunu kullanmalarını (bkz. Anaconda Kullanımı)*

  • ihtiyaç duymadıkları her türlü dosyayı silmelerini

  • saklanması gereken dosyaları kendi bilgisayarlarına indirmelerini

  • sadece kısa zaman icinde kullanacakları dosyaları sistemde tutmalarını

  • herhangi bir sebepten silemedikleri dosya ve dizinleri tar komutu ile arşivleyerek tek bir dosya haline getirmeleri ve mümkünse ilgili arşiv dosyalarını kendi bilgisayarlarına indirmelerini

önemle rica etmekteyiz.