Türkiye Üniversite Bölüm Verileri (2019–2024)
Detaylar ve Dokümantasyon
Kapsamlı Dokümantasyon
Bu proje için detaylı kullanım kılavuzu, API referansı ve geliştirme notları GitHub'da bulunan README dosyasında yer almaktadır.
Proje Hakkında
Türkiye Üniversite Bölüm Verileri (2019–2024)
YÖK Atlas ve ÖSYM’den toplanan verilerin temizlenip standardize edildiği, analize hazır veri seti.
Amaç (Kısaca)
Bu veri seti, 2019–2024 arasındaki üniversite bölümü verilerini tek bir havuzda toplayıp temizlemek, isim ve yazım farklılıklarını birleştirerek tutarlı bir yapı oluşturmak için hazırlandı. Böylece araştırma yapmak, uygulama geliştirmek ve tablolarla hızlıca inceleme yapmak çok daha kolay hale geliyor. 2025 yılı için şimdilik sadece program listeleri bulunmaktadır; puan ve diğer istatistik alanları boş bırakılmıştır. Veri seti hem GitHub’da hem de Kaggle’da yayınlanmıştır ve Kaggle sayfasında hazırladığım notebooklar ile detaylı bir analiz akışı da sunuyorum.
Özet İstatistik
- 128.352 satır / 32.505 program (program_code)
- 235 üniversite / 733 bölüm adı
- Veriler sinavizcisi.com’da kullanılıyor
Kaggle Performansı
Kaggle tarafında veri seti güçlü geri dönüşler aldı ve bazı projelerde referans veri seti olarak kullanıldığını duymak benim için çok değerliydi. Toplamda 3.500+ görüntülenme ve 600+ indirme sayısına ulaştı.
Kaggle Notebookları
- [EDA] Exploring Turkish University Admissions (2019-2024) : Yıllık kontenjan ve yerleşen trendleri, en rekabetçi bölümler, alan bazlı popülerlik değişimleri ve devlet-vakıf karşılaştırmaları.
- YÖK Atlas Veri Seti - Tutarlılık ve Veri Kalitesi Analizi : Kontenjan-yerleşen tutarlılığı, cinsiyet verisi anomalileri, eksik veri desenleri ve hesaplama farklılıklarının detaylı incelemesi.
Teknik Detaylar
Veri Modeli (Kısa)
- Normalize çekirdek: departments_normalized.csv, department_stats.csv
- Lookup/köprü: department_names, faculty_names, score_types, universities_normalized, department_tags vb.
- Hızlı EDA: data/all_in_one_denormalized.csv
ETL Adımları
- remove_2025_from_departments.py → 2025 ayıklama
- process_raw_data.py → normalize tablolar
- build_all_in_one_denormalized.py → tek tablo
Örnek Kullanım
import pandas as pd
# Denormalize dosya ile hızlı filtre
eda = pd.read_csv('data/all_in_one_denormalized.csv')
q = (
(eda['year'] == 2024) &
(eda['city'] == 'İSTANBUL') &
(eda['university_type'] == 'vakif') &
(eda['department_name'] == 'Bilgisayar Mühendisliği')
)
print(eda.loc[q, ['university_name','scholarship_type','total_quota','total_enrolled']])
Diğer Projeler
Geliştirdiğim diğer projelere de göz atın
Sınavİzcisi
YKS yerleşme verilerinin ve üniversite yorumlarının yapay zekâ ile analiz edilip kullanıcıya sunduğum web platformu.
YokAPI
YÖK Atlas verilerini normalize eden ve tek API'de sunan veri katmanı. Asenkron yapıya sahip toplu hızlı veri çekme işlemleri için …
EBA Puan Botu
EBA'da puan kasmayı sağlayan masaüstü arayüze sahip bir bot.