Dosya Sistemleri ve Depolama#
Hesaplama kümelerinde, kullanıcı verileri ile hesaplama çıktılarının yönetimi için yüksek performanslı merkezi dosya sistemleri kullanılmaktadır. Bu sistemler, paralel dosya sistemi altyapısı ile yapılandırılmış olup, farklı kullanım amaçlarına yönelik üç ana dosya sistemi sunmaktadır: WEKA tabanlı ev dizini (/arf/home), scratch alanı (/arf/scratch) ve LUSTRE tabanlı merkezi depolama alanı (/truba/home).
Önemli
Kritik Güvenlik Uyarısı: Bu dosya sistemleri kalıcı veri depolama amacıyla tasarlanmamıştır. Tüm veri güvenliği ve yedekleme sorumluluğu kullanıcılara aittir. Ev dizinlerinin merkezi yedeklemesi yapılmamaktadır.
Dosya Sistemleri Genel Bakış#
Hesaplama kümelerinde bulunan dosya sistemleri, farklı performans karakteristikleri ve kullanım amaçlarına göre tasarlanmıştır:
Dosya Sistemi |
Kullanım Amacı |
Kota |
Performans |
Yaşam Süresi |
|---|---|---|---|---|
|
Ev dizini |
100 GB |
Yüksek hız |
Kullanıcı kontrolü |
|
Geçici hesaplama |
1 TB |
Yüksek hız |
En fazla 1 ay |
|
Merkezi depolama |
2 TB |
Orta hız |
Geçici depolama |
Dosya Sistemi Detayları#
ARF Ev Dizini (/arf/home/$USER)#
Ev dizini, kullanıcıların kişisel dosyaları, uygulama kurulumları ve betiklerini saklamak için tasarlanmıştır.
Önerilen Kullanım:
Betik dosyaları ve konfigürasyon dosyaları
Küçük boyutlu uygulama kurulumları
Girdi dosyaları ve parametre dosyaları
Kalıcı olarak saklanması gereken küçük çıktı dosyaları
Kullanım Kısıtlamaları:
Büyük veri setleri saklanmamalıdır
Yoğun I/O gerektiren hesaplamalar çalıştırılmamalıdır
Uzun süreli veri arşivleme yapılmamalıdır
ARF Scratch Dizini (/arf/scratch/$USER)#
Scratch dizini, aktif hesaplama işleri için yüksek performanslı geçici depolama alanıdır.
Önerilen Kullanım:
Aktif hesaplama işlerinin çalıştırılması
Geçici çıktı dosyalarının saklanması
Büyük veri setleri üzerinde işlem yapılması
Paralel I/O gerektiren uygulamalar
Kritik Uyarılar:
Dosyalar sistem tarafından periyodik olarak silinir
Önemli veriler mutlaka başka konuma kopyalanmalıdır
Uzun süreli veri saklanamaz
TRUBA Merkezi Depolama (/truba/home/$USER)#
Merkezi depolama alanı, projeler boyunca geçici veri saklamak için kullanılır.
Önerilen Kullanım:
Proje verilerinin geçici depolanması
Scratch alanından çıktıların transferi
Büyük veri setlerinin geçici saklanması
Kota Aşım Çözümleri#
Kota limitine yaklaştığınızda veya aştığınızda:
Gereksiz dosyaları silin:
# Büyük dosyaları bul find /arf/home/$USER -type f -size +100M -ls # Eski dosyaları bul (30 günden eski) find /arf/scratch/$USER -type f -atime +30 -ls
Dosyaları arşivleyin:
# Sıkıştırılmış arşiv oluştur tar -czf arsiv.tar.gz klasor_adi/ # Orijinal dosyaları sil rm -rf klasor_adi/
Verileri yerel bilgisayara indirin:
Veri transferi için Dosya Transferi bölümündeki yönergeleri takip edebilirsiniz.
Dosya Sayısı (inode) Yönetimi#
Dosya sayısı limiti, sistem performansını korumak için kritik önem taşır.
İnode Optimizasyon Stratejileri#
1. Merkezi Yazılımları Kullanın:
module loadsistemini kullanınKonteyner teknolojilerini tercih edin
2. Dosya Birleştirme:
# Küçük dosyaları birleştir
cat dosya1.txt dosya2.txt > birlesik_dosya.txt
# Çoklu dosyaları tek arşivde topla
tar -czf veri_seti.tar.gz *.dat
3. Anaconda/Conda Kullanımından Kaçının:
Uyarı
/arf ve /truba dosya sistemlerine Anaconda, Miniconda, conda veya pip ile paket kurulumu yapılmamalıdır. Bu araçlar binlerce küçük dosya oluşturarak sistem performansını ciddi şekilde düşürür. Kullanım detayına Python Kılavuzu bölümünden ulaşabilirsiniz.
Veri Güvenliği ve Politikalar#
Yedekleme Sorumlulukları#
Tehlike
Veri Kaybı Riski: Dosya sistemlerinde hiçbir otomatik yedekleme hizmeti bulunmamaktadır. Tüm veri güvenliği kullanıcının sorumluluğundadır.
Kullanıcı Sorumlulukları:
Önemli verilerin düzenli yerel yedeklemesi
Scratch alanındaki geçici dosyaların zamanında silinmesi
Dosya erişim haklarının korunması
Lisans şartlarına uygun yazılım kullanımı
Veri Yaşam Döngüsü Politikaları#
Ev Dizini (``/arf/home``):
Kullanıcı kontrolünde yaşam süresi
Düzenli temizlik önerilir
Kritik veriler için yedekleme zorunlu
Scratch Alanı (``/arf/scratch``):
Maksimum 30 gün yaşam süresi
Otomatik temizleme uygulanır
Geçici dosyalar için tasarlanmıştır
Merkezi Depolama (``/truba/home``):
Proje süresi boyunca geçici depolama
Uzun vadeli arşivleme için uygun değil
En İyi Uygulamalar ve Öneriler#
Performans Optimizasyonu#
1. Doğru Dosya Sistemi Seçimi:
Hesaplama işleri için
/arf/scratchkullanınKüçük dosyalar için
/arf/hometercih edinBüyük veri setleri için
/truba/homedeğerlendirin
2. Geçici Dosya Yönetimi:
# İş bitiminde geçici dosyaları temizle
export TMPDIR=/arf/scratch/$USER/tmp
mkdir -p $TMPDIR
# İş sonunda temizlik
trap 'rm -rf $TMPDIR' EXIT
Sorun Giderme ve Destek#
Yaygın Sorunlar ve Çözümleri#
1. Kota Aşım Hatası:
# Disk kullanımını kontrol et
du -sh /arf/home/$USER
# Büyük dosyaları bul
find /arf/home/$USER -type f -size +100M -exec ls -lh {} \;
2. İnode Limiti Aşımı:
# Dosya sayısını kontrol et
find /arf/home/$USER -type f | wc -l
# Küçük dosyaları birleştir veya sil
3. Erişim İzni Sorunları:
# Dosya izinlerini kontrol et
ls -la /arf/home/$USER
# Gerektiğinde izinleri düzelt
chmod 755 /arf/home/$USER
İyi Uygulamalar ve Kullanıcı Sorumlulukları
Ev dizinlerinizin erişim haklarını değiştirmeyiniz; yalnızca size açık olmalıdır.
Gereksiz dosyaları ve kullanılmayan uygulamaları düzenli olarak siliniz.
Büyük veri setleri veya çok sayıda küçük dosya gerektiren işler için merkezi kurulumları veya konteynerleri kullanınız.
Scratch alanı geçici amaçlıdır; önemli verilerinizi kendi bilgisayarınıza indiriniz.
Dosya ve dizinlerinizi arşivleyerek (örn. tar ile) saklamak inode kullanımını azaltır.
Ev ve scratch dizinlerinizde kota ve dosya (inode) limiti uygulanmaktadır. Limit aşıldığında yeni dosya oluşturamaz, iş başlatamaz veya veri kaybı yaşayabilirsiniz.
Herhangi bir sorun yaşarsanız, yardım ve destek almak için lütfen Teknik Destek Talebi sayfasındaki teknik destek iletişim bilgilerini kullanarak bizimle iletişime geçiniz.