Karmaşıklık matrisi, sınıflandırma problemlerinde model performansını değerlendirmek için kullanılan önemli bir araçtır. Ayrıca “hata matrisi” veya “karmaşıklık tablosu” olarak da adlandırılır. Bu matris, tahmin edilen sınıf etiketleri ile gerçek sınıf etiketlerinin karşılaştırılmasını sağlar ve sınıflandırma modelinin ne kadar doğru çalıştığını, hangi sınıfların karıştırıldığını ve diğer performans ölçütlerini anlamamıza yardımcı olur.
Karmaşıklık Matrisi Bileşenleri
Bir karmaşıklık matrisi genellikle 2×2 veya daha fazla sınıf durumu için genişletilmiş hali olan NxN şeklinde olabilir. Ancak en yaygın olarak kullanılan hali, 2×2 matristir ve temel olarak dört bileşenden oluşur:
- True Positive (TP – Gerçek Pozitif): Modelin doğru bir şekilde bir sınıfı pozitif olarak tahmin ettiği durumu ifade eder. Yani, gerçek etiket pozitif iken model de pozitif tahminde bulunmuştur.
- False Positive (FP – Yanlış Pozitif): Modelin aslında negatif olması gereken bir sınıfı pozitif olarak tahmin ettiği durumu ifade eder. Yani, gerçek etiket negatif iken model pozitif tahminde bulunmuştur.
- True Negative (TN – Gerçek Negatif): Modelin doğru bir şekilde bir sınıfı negatif olarak tahmin ettiği durumu ifade eder. Yani, gerçek etiket negatif iken model de negatif tahminde bulunmuştur.
- False Negative (FN – Yanlış Negatif): Modelin aslında pozitif olması gereken bir sınıfı negatif olarak tahmin ettiği durumu ifade eder. Yani, gerçek etiket pozitif iken model negatif tahminde bulunmuştur.
Karmaşıklık Matrisi Örnekleri ve Performans Ölçütleri
Karmaşıklık matrisi, sınıflandırma modelinin performansını değerlendirmek için çeşitli ölçütlerin hesaplanmasına olanak tanır:
- Doğruluk (Accuracy): Toplam doğru tahminlerin toplam veri sayısına oranını gösterir.
(TP + TN) / (TP + TN + FP + FN)
- Hassasiyet (Precision): Pozitif olarak tahmin edilen örnekler arasında gerçekte pozitif olanların oranını gösterir.
TP / (TP + FP)
- Duyarlılık (Recall): Gerçek pozitiflerin tüm gerçek pozitifler içindeki oranını gösterir.
TP / (TP + FN)
- F1-Skoru: Hassasiyet ve duyarlılık arasındaki dengeyi sağlamak için kullanılır.
2 * (Precision * Recall) / (Precision + Recall)
Karmaşıklık matrisi ve bu performans ölçütleri, farklı sınıf dengeleri veya hataların hangi sınıflarda olduğu gibi modelin performansını daha ayrıntılı bir şekilde anlamamıza yardımcı olur.
Uygulama ve Yorumlama
Karmaşıklık matrisi, sınıflandırma modelinin gücünü anlamak ve geliştirmek için kullanılır. Özellikle dengesiz veri kümelerinde (örneğin, nadir sınıfların olduğu durumlar) modelin performansını daha iyi değerlendirmemizde yardımcı olur. Karmaşıklık matrisinin sağladığı ölçütler, modelin hangi sınıfları karıştırdığını ve hangi alanlarda daha iyi veya daha kötü performans gösterdiğini belirlememize olanak tanır.
Sonuç olarak, karmaşıklık matrisi, sınıflandırma modellerinin performansını anlamak ve iyileştirmek için vazgeçilmez bir araçtır. Bu matrisi doğru bir şekilde yorumlayarak modelin gücü hakkında daha derinlemesine bilgi edinebiliriz.