딥러닝

[Deep Learning] F1 Score 이란

bluetag_boy 2024. 3. 12. 15:29
반응형

 F1 점수(F1 Score)는 분류 작업에서 정밀도(Precision)재현율(Recall)의 조화 평균을 사용하여 모델의 정확성을 평가하는 지표다. 이 지표는 데이터셋에 불균형이 있을 때, 즉 어떤 클래스의 샘플이 다른 클래스 샘플 수 보다 훨씬 많아 불균형을 이룰 때 유용하다. F1 점수는 0부터 1 사이의 값으로 표현되며, 1에 가까울수록 모델의 성능이 뛰어남을 의미한다.

 

※ 조화 평균 : 주어진 수들의 역수의 산술 평균의 역수를 말한다. 평균적인 변화율을 구할 때에 주로 사용

 

 

F1 Score expression

 

 

※ 정밀도(Precision) :  모델이 양성이라고 예측한 것들 중 실제로 양성인 비율

재현율(Recall) : 실제 양성 중 모델이 양성으로 올바르게 예측한 비율

 

 

  • True Positive (TP, 진짜 양성): 모델이 양성이라고 예측하고 실제로 양성인 경우의 수
  • False Positive (FP, 거짓 양성): 모델이 양성이라고 예측했지만 실제로는 음성인 경우의 수
  • True Negative (TN, 진짜 음성): 모델이 음성이라고 예측하고 실제로 음성인 경우의 수
  • False Negative (FN, 거짓 음성): 모델이 음성이라고 예측했지만 실제로는 양성인 경우의 수

 

 

Example

 어떤 질병을 진단하는 분류 모델의 성능을 평가하기 위한 F1 점수를 계산해보자. 이 모델은 환자가 질병에 걸렸는지(양성) 아닌지(음성)를 예측한다. 모델의 성능을 평가하기 위해 다음과 같은 결과를 얻었다고 가정해 보자.

  • TP : 80
  • FP : 20
  • TN : 90
  • FN : 10

 

Precision = 80 / 80 + 20 = 0.8

Recall = 80 / 80 + 10 0.89

 

F1 =  2 x 0.8 x 0.89 / (0.8 + 0.89)  ≈ 0.712 / 1.69 0.84

 

 따라서, F1 Score는 약 0.84임을 알 수 있다. 모델의 정밀도와 재현율이 상대적으로 높으며, 두 지표 사이에 균형이 잘 맞춰져 있다는 것을 보아 좋은 성능 지표를 띄고 있다.

'딥러닝' 카테고리의 다른 글

L1 Loss & L2 Loss  (0) 2024.03.22