그러나 나는, 내가하기로 결정 임계 값을 변경하려면, sklearn를 사용하여 모델을 학습하려고 노력하고 훈련 모델을. SO에서 찾은 대부분의 결과는 테스트 세트에 대한 예측입니다.
확률 적 분류 자 훈련 (scikit-learn 또는 기타 프레임 워크에 의한) 에는 임계 값 이 없습니다 .
확률 적 예측을 하드 라벨로 변환하기 위해 추론 시간에 임계 값이 필요하며, 이는 정확도, 정밀도, 재현율 등과 같은 본질적으로 비즈니스 측정 항목 을 계산하는 데 필요 합니다. 그러나 이러한 측정 항목 은 모델 학습에서 역할을 하지 않습니다 . 여기서 중요한 (그리고 모델 피팅 중에 최소화되는) 수량은 손실 뿐입니다 . 그리고 손실 계산에는 임계 값이 포함되지 않습니다.
즉, 하드 클래스 예측 (임계 값 만 필요한 경우)은 모델 학습에서 전혀 역할을하지 않으므로 학습 중에 임계 값이 전혀 관련되지 않습니다.
손실과 정확성 사이의 관계를 명확히하기 위해 다음 답변을 읽는 것이 좋습니다 (제목에도 불구하고 Keras에만 국한되지는 않지만 원칙적으로 이진 분류 문제가 있음).
교차 검증 스레드에서 인용하면 분류 확률 임계 값 감소 :
운동의 통계적 구성 요소는 새 샘플의 각 클래스에 대한 확률을 출력 할 때 종료됩니다. 새로운 관측치를 1 대 0으로 분류하는 임계 값을 선택하는 것은 더 이상 통계의 일부가 아닙니다 . 결정 구성 요소의 일부입니다 .
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다