ufris
상황에 따른 데이터 분류와 모델 학습 본문
데이터가 섞여 있는 상태에서, 어떤 상황에서 어떻게 쓰일 것인지 정하고 모델을 학습시켜야 한다
예를 들어 어깨 x-ray에 대해 normal/abnormal을 분류하고 싶을 때, 상황에 따라 abnormal의 기준을 어디까지 할 것인지 정하는 것이 좋다
만약 응급실에서 사용할 경우 어깨 탈골, 골절 등과 같은 abnormal만 학습시키면 된다
하지만 재활센터나 보건소 같은 곳에서는 퇴행성 관절염과 같은 abnormal을 위주로 학습시키면 된다
위의 모든 abnormal을 포함한 전체적인 모델을 만들면 좋겠지만 데이터가 한정되어 있는 상태에서
퇴행성 관절염의 데이터가 탈골과 골절과 같은 주요 abnormal에 비해 수가 부족하다면 퇴행성 관절염을 구분하기가 어렵다
결론적으로 데이터에 대한 분석이 필요하고 어디서 어떻게 쓰일 것인지에 따라 학습할 데이터를 분류해야 모델의 성능이 조금이라도 더 나아진다(즉, simple하고 specific하게 학습을 할수록 성능이 좋아진다)
'기타 > 개인 생각' 카테고리의 다른 글
공개 데이터 url (0) | 2019.02.14 |
---|---|
이미지 학습 시, 제한된 data에서 성능을 높이는 방법(데이터 일반화) (0) | 2019.01.10 |