오늘 협업하는 분과 이야기 나누니까 A 분류가 80% B 분류가 10% C 분류가 10%이고 각 분류에 대한 여러가지 특징을 넣고 딥러닝했더니 컴퓨터가 아, 그럼 무조건 A라고 하면 80%는 맞추는 거네? 하고 전부 A라고 답했다고 ㅋㅋㅋㅋㅋ
도메인이 비슷한 이미지들이면 많은 애들 label smooting이나 적은 애들 augmentation만 좀 해줘도 오버피팅은 좀 줄일 수 있을겁니다.
'이런 구조에선 이런 형태로 최종 결론(형태)가 되겠지...' 라는 사람의 생각이 참 허망하다 싶곤 하더라고요.
실제로 많은 분류 예측 대회 상위권은 딥러닝이 아닌경우가 많습니다.