İşe alım süreçlerinde adayları yalnızca CV’lerine göre değerlendirmek çoğu zaman yanıltıcı olabilir. Peki ya işe alım kararlarını desteklemek için makine öğrenmesini kullanmak mümkün olsaydı? Bu yazıda, adayların tecrübe yılı ve teknik sınav puanı gibi iki temel özelliği kullanarak bir adayın işe alınıp alınmayacağını tahmin eden bir makine öğrenmesi projesini (SVM ile) adım adım değerlendireceğiz.

Modelimiz, bir adayın:

  • Toplam yazılım deneyimi (0–10 yıl)

  • Teknik sınavdan aldığı puan (0–100 arası)

özelliklerine bakarak işe alım durumunu (etiket = 0: işe alındı, etiket = 1: işe alınmadı) tahmin ediyor. Ana kuralımız ise şu:

2 yıldan az tecrübesi olan ve teknik puanı 60’ın altında olanlar işe alınmıyor.

Bu kuralı veri setimize yansıtarak etiketleme yaptık ve ardından sınıflandırma modellerimizi eğittik.

Veri Üretimi ve Görselleştirme

Veri üretiminde Faker kütüphanesinden faydalandık. Toplam 200 sahte aday bilgisi oluşturduk. Adayların deneyim yılı ve teknik puanlarına göre etiketlendikten sonra aşağıdaki gibi görselleştirdik:

Adayların Tecrübe ve Teknik Puanlarına Göre İşe Alım Durumu

Yeşil noktalar işe alınan adayları, kırmızı noktalar ise reddedilenleri temsil ediyor. Görselde gözle görülür bir sınır olması, sınıflandırma için uygun bir veri yapısına sahip olduğumuzu gösteriyor.

Model Eğitimi: SVM (Support Vector Machine)

İlk olarak linear kernel kullanarak bir SVC (Support Vector Classifier) modeli eğittik. Özellikler StandardScaler ile normalize edildi. Eğitim sonrası karar sınırı şu şekildeydi:

SVM Karar Sınırı
SVM Karar Sınırı

Modelin doğruluk skoru: %95

Ayrıca confusion matrix ve classification report çıktıları modelin güçlü performansını gösteriyor:

Classification Report:
precision    recall    f1-score    support
İşe Alındı (0)                   1.00          0.94        0.97           18
İşe Alınmadı (1)               0.67          1.00       0.80            2

Daha Esnek Sınırlar İçin: RBF Kernel

Linear kernel yeterli performans gösterse de, daha esnek bir karar sınırı için rbf kernel kullandık.

En İyi Modeli Bulmak: GridSearchCV

Modeli optimize etmek için GridSearchCV ile farklı C, gamma ve kernel değerlerini test ettik.

Bu modelin doğruluğu da %95 seviyesinde çıktı. Bu, modelin hem esnek hem de güçlü genelleme yeteneğine sahip olduğunu gösteriyor.

Sonuç olarak bu proje sayesinde:

  • Sıfırdan veri üretmeyi,

  • SVM algoritmasını farklı kernel’larla kullanmayı,

  • Karar sınırlarını görselleştirmeyi,

  • Modeli optimize etmek için GridSearchCV kullanmayı öğrendik.

Makine öğrenmesi, işe alım süreçlerinde karar destek sistemi olarak kullanılabilir. Ancak etik ve adalet kavramlarını unutmadan, modelin önyargı barındırmamasına dikkat etmek çok önemli. Eğer bu projeyi daha ayrıntılı incelemek isterseniz GitHub linkini burada bulabilirsiniz.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir