Eğitimler
Eğitim takvimi Workshop Takvimi
Temel PySpark Eğitimi
Bu program süresince elde edeceğiniz alan bilgisiyle kariyeriniz ve çalıştığınız kurumda fark yaratacaksınız.
EĞİTİM DETAYLARI
Eğitim takvimi açıklanacaktır.
Eğitimi takip ederek gelişmelerden haberdar olabilirsiniz.
36 Saat
Online Eğitim

Uzaktan Eğitim

Canlı Sınıf

KAYIT VE ÖDEME DETAYLARI
Program Ücreti
.00 + %10 KDV
GROWTH Üye Ücreti - GROWTH Üye Ol
.00 + %10 KDV

Tüm sorularınız için : 444 1 476 veya info@mindset.com.tr

Temel PySpark Eğitimi

444 1 476
EĞİTİM İÇERİĞİ

Genel Bilgi

Bu program, büyük veri işleme ve analizinde endüstri standardı haline gelen Apache Spark'ın Python API'si olan PySpark'ın temel ve orta düzey kullanımını kapsamlı şekilde öğretmeyi hedefler. Katılımcılar, dağıtık veri işleme mantığını, Spark mimarisini ve PySpark'ın DataFrame API'sini kullanarak veri dönüşümleri, analizler ve makine öğrenmesi iş akışlarını uygulamalı olarak deneyimleyeceklerdir. Eğitim, veri mühendisleri, veri analistleri ve büyük veri alanında kariyer hedefleyenler için tasarlanmış olup, gerçek dünya veri setleri üzerinde çalışmayı içerir.

Genel Bilgi
PySpark’a Giriş ve Temel Kavramlar
  • Büyük veri ve dağıtık hesaplama nedir?
  • Apache Spark mimarisi (Driver, Executor, Cluster Manager)
  • PySpark kurulumu ve ortam ayarları (Local mode, Databricks, Google Colab)
  • SparkSession oluşturma ve basit işlemler
PySpark DataFrame API
  • DataFrame oluşturma (CSV, JSON, Parquet okuma/yazma)
  • Temel operasyonlar: select(), filter(), groupBy(), agg()
  • Sütun işlemleri ve UDF (User Defined Functions) yazma
  • Veri tipleri (Schema tanımlama, type casting)
Veri Temizleme ve Dönüşümler
  • Eksik veri yönetimi (fillna(), dropna())
  • Pivot tablolar ve window fonksiyonları
  • Joins (inner, outer, cross join) ve veri birleştirme
  • Performans optimizasyonu (caching, partition ayarları)
Spark SQL ile Sorgulama
  • DataFrame’leri SQL tablosu olarak kaydetme
  • Kompleks SQL sorguları çalıştırma
  • Performans ipuçları ve query plan analizi
Temel Makine Öğrenmesi ile PySpark (MLlib)
  • MLlib kütüphanesine giriş
  • Özellik mühendisliği (StringIndexer, VectorAssembler)
  • Basit regresyon ve sınıflandırma modelleri (Linear Regression, Decision Tree)
  • Model değerlendirme (RMSE, Accuracy) 
Dağıtık Sistemlerde PySpark
  • Cluster’a bağlanma (Standalone, YARN, Kubernetes)
  • Kaynak yönetimi ve konfigürasyon ayarları
  • AWS EMR veya Databricks üzerinde uygulama 
Genel Bilgi

Bu program, büyük veri işleme ve analizinde endüstri standardı haline gelen Apache Spark'ın Python API'si olan PySpark'ın temel ve orta düzey kullanımını kapsamlı şekilde öğretmeyi hedefler. Katılımcılar, dağıtık veri işleme mantığını, Spark mimarisini ve PySpark'ın DataFrame API'sini kullanarak veri dönüşümleri, analizler ve makine öğrenmesi iş akışlarını uygulamalı olarak deneyimleyeceklerdir. Eğitim, veri mühendisleri, veri analistleri ve büyük veri alanında kariyer hedefleyenler için tasarlanmış olup, gerçek dünya veri setleri üzerinde çalışmayı içerir.

PySpark’a Giriş ve Temel Kavramlar
  • Büyük veri ve dağıtık hesaplama nedir?
  • Apache Spark mimarisi (Driver, Executor, Cluster Manager)
  • PySpark kurulumu ve ortam ayarları (Local mode, Databricks, Google Colab)
  • SparkSession oluşturma ve basit işlemler
PySpark DataFrame API
  • DataFrame oluşturma (CSV, JSON, Parquet okuma/yazma)
  • Temel operasyonlar: select(), filter(), groupBy(), agg()
  • Sütun işlemleri ve UDF (User Defined Functions) yazma
  • Veri tipleri (Schema tanımlama, type casting)
Veri Temizleme ve Dönüşümler
  • Eksik veri yönetimi (fillna(), dropna())
  • Pivot tablolar ve window fonksiyonları
  • Joins (inner, outer, cross join) ve veri birleştirme
  • Performans optimizasyonu (caching, partition ayarları)
Spark SQL ile Sorgulama
  • DataFrame’leri SQL tablosu olarak kaydetme
  • Kompleks SQL sorguları çalıştırma
  • Performans ipuçları ve query plan analizi
Temel Makine Öğrenmesi ile PySpark (MLlib)
  • MLlib kütüphanesine giriş
  • Özellik mühendisliği (StringIndexer, VectorAssembler)
  • Basit regresyon ve sınıflandırma modelleri (Linear Regression, Decision Tree)
  • Model değerlendirme (RMSE, Accuracy) 
Dağıtık Sistemlerde PySpark
  • Cluster’a bağlanma (Standalone, YARN, Kubernetes)
  • Kaynak yönetimi ve konfigürasyon ayarları
  • AWS EMR veya Databricks üzerinde uygulama 
KAYIT ve ÖDEME

KAYIT ve ÖDEME

Bilgi ve Kayıt için lütfen form bilgilerini eksiksiz doldurun. En kısa zamanda size dönüş yapıp gerekli işlemlerle ilgili olarak bilgi verilecektir.

Ödeme Seçenekleri:

Kredi Kartıyla Peşin Ödeme

Kredi Kartına Taksitli Ödeme ( Online / Bonus – Maximum – Paraf – World )

EFT / Havale ile ödeme.

KURUMSAL BAŞVURU
Bu eğitimi kurumsal olarak planla ve uygula Mindset Institute kalitesi ve denetimi altında takımın veya şirketin için eğitim planla. Yeni beceriler kazanmanıza, çalışanlarınızın gelişimini yönetmenize ve işgücünüzü eğitmenize nasıl yardımcı olabiliriz?