Türkiye Üniversite Bölüm Verileri (2019–2024)

Python Pandas CSV ETL Data Cleaning Normalization
Proje Bilgileri
Kategori
Dataset / Veri Seti
Tarih 2025-09

Detaylar ve Dokümantasyon

Kapsamlı Dokümantasyon

Bu proje için detaylı kullanım kılavuzu, API referansı ve geliştirme notları GitHub'da bulunan README dosyasında yer almaktadır.

Proje Hakkında

Türkiye Üniversite Bölüm Verileri (2019–2024)

YÖK Atlas ve ÖSYM’den toplanan verilerin temizlenip standardize edildiği, analize hazır veri seti.

Amaç (Kısaca)

Bu veri seti, 2019–2024 arasındaki üniversite bölümü verilerini tek bir havuzda toplayıp temizlemek, isim ve yazım farklılıklarını birleştirerek tutarlı bir yapı oluşturmak için hazırlandı. Böylece araştırma yapmak, uygulama geliştirmek ve tablolarla hızlıca inceleme yapmak çok daha kolay hale geliyor. 2025 yılı için şimdilik sadece program listeleri bulunmaktadır; puan ve diğer istatistik alanları boş bırakılmıştır. Veri seti hem GitHub’da hem de Kaggle’da yayınlanmıştır ve Kaggle sayfasında hazırladığım notebooklar ile detaylı bir analiz akışı da sunuyorum.

Özet İstatistik

  • 128.352 satır / 32.505 program (program_code)
  • 235 üniversite / 733 bölüm adı
  • Veriler sinavizcisi.com’da kullanılıyor

Kaggle Performansı

Kaggle tarafında veri seti güçlü geri dönüşler aldı ve bazı projelerde referans veri seti olarak kullanıldığını duymak benim için çok değerliydi. Toplamda 3.500+ görüntülenme ve 600+ indirme sayısına ulaştı.

Kaggle Notebookları

Teknik Detaylar

Veri Modeli (Kısa)

  • Normalize çekirdek: departments_normalized.csv, department_stats.csv
  • Lookup/köprü: department_names, faculty_names, score_types, universities_normalized, department_tags vb.
  • Hızlı EDA: data/all_in_one_denormalized.csv

ETL Adımları

  • remove_2025_from_departments.py → 2025 ayıklama
  • process_raw_data.py → normalize tablolar
  • build_all_in_one_denormalized.py → tek tablo

Örnek Kullanım

import pandas as pd

# Denormalize dosya ile hızlı filtre
eda = pd.read_csv('data/all_in_one_denormalized.csv')
q = (
    (eda['year'] == 2024) &
    (eda['city'] == 'İSTANBUL') &
    (eda['university_type'] == 'vakif') &
    (eda['department_name'] == 'Bilgisayar Mühendisliği')
)
print(eda.loc[q, ['university_name','scholarship_type','total_quota','total_enrolled']])

Diğer Projeler

Geliştirdiğim diğer projelere de göz atın

Sınavİzcisi

YKS yerleşme verilerinin ve üniversite yorumlarının yapay zekâ ile analiz edilip kullanıcıya sunduğum web platformu.

Django PostgreSQL Transformers

YokAPI

YÖK Atlas verilerini normalize eden ve tek API'de sunan veri katmanı. Asenkron yapıya sahip toplu hızlı veri çekme işlemleri için …

Python Requests Aiohttp

EBA Puan Botu

EBA'da puan kasmayı sağlayan masaüstü arayüze sahip bir bot.

Python Selenium PyQt5