Derin öğrenme modellerinin performansı, değerlendirme ölçütleri kullanılarak ölçülür. Modelin başarısını ölçmek için kullanılan değerlendirme ölçütleri arasında:
- Doğruluk: Modelin doğru tahmin yapabilme oranıdır. Örneğin, %90 doğruluk, modelin %90 oranında doğru tahmin yaptığı anlamına gelir.
- Hassasiyet: Modelin gerçek pozitif örnekleri doğru olarak pozitif olarak tahmin edebilme oranıdır.
- Geri Çağırma: Modelin tüm pozitif örnekleri doğru olarak pozitif olarak tahmin edebilme oranıdır.
- F1 Puanı: Hassasiyet ve geri çağırma oranının harmonik ortalamasıdır.
- Kayıp Fonksiyonu: Modelin tahminleri ile gerçek değerler arasındaki farkı ölçen bir fonksiyondur.