ufris
카테고리를 나눠 놨지만 사용 목적에 따라 달라질 수 있습니다 ganHuman pose dataset sports pose dataset classificationarm x-ray abnormal dataset chest x-ray abnormal dataset mammography cancer dataset grand challenge https://grand-challenge.org/challenges/
overfitting이 났을 때 train data 수를 늘리라는 것이 일반적인 방법이다 하지만 제한된 resource 안에서 data 수를 늘리는 것은 쉽지 않다 공장에서 물건 생성 시 불량품을 검출하는 모델을 만들고 싶은데 실제로 불량품은 1% 이내이다 정상 제품 1000장을 얻을 수 있다면 불량 제품은 10장밖에 얻지 못한다는 것이다 이러한 상황 속에서 어떻게 성능을 높일 수 있을까 한가지 방법으로는 이미지를 일반화 시키는 것이다 예를 들어 진돗개와 시바견을 구분하는 모델을 만들고자 한다 이미지를 살펴보면 진돗개 데이터에는 목줄을 한 데이터가 1000장 옷을 입은 데이터가 100장이라고 하고 이와 반대로 시바견 데이터에는 목줄을 한 데이터가 100장 옷을 입은 데이터가 1000장이라고 한다 이미지의..
데이터가 섞여 있는 상태에서, 어떤 상황에서 어떻게 쓰일 것인지 정하고 모델을 학습시켜야 한다 예를 들어 어깨 x-ray에 대해 normal/abnormal을 분류하고 싶을 때, 상황에 따라 abnormal의 기준을 어디까지 할 것인지 정하는 것이 좋다만약 응급실에서 사용할 경우 어깨 탈골, 골절 등과 같은 abnormal만 학습시키면 된다하지만 재활센터나 보건소 같은 곳에서는 퇴행성 관절염과 같은 abnormal을 위주로 학습시키면 된다 위의 모든 abnormal을 포함한 전체적인 모델을 만들면 좋겠지만 데이터가 한정되어 있는 상태에서퇴행성 관절염의 데이터가 탈골과 골절과 같은 주요 abnormal에 비해 수가 부족하다면 퇴행성 관절염을 구분하기가 어렵다 결론적으로 데이터에 대한 분석이 필요하고 어디서..