2 - Veri Kaynakları

Makine öğrenmesi uygulamaları için spark.ml kapsamında Parquet, CSV, JSON and JDBC gibi genel veri kaynak yapıları desteklenmektedir. Bunların yanı sıra Image data source paketi ile jpeg, png gibi sıkıştırılmış görüntü dosyalarının ve LibSVMDataSource paketi ile libsvm formatındaki verilerin kullanılması mümkün olmaktadır.


Bu Türkçe notlar Prof. Pınar KARAGÖZ tarafından kaynak olarak Apache Spark web sitesindeki bilgilerden faydalanılarak hazırlanmıştır. Scala kodlama örnekleri aynı kaynaktan alınmıştır.