모델 학습을 공부하고 계시는 분들에게 도움이 될지는 모르겠습니다만, 제가 사용하였던 dataset을 올려두었습니다.
https://huggingface.co/datasets?search=bebechien
512는 SD 1.5용, 768은 SD 2.1용, 그리고 xl은 SDXL용으로 준비만 해 두고 아직 메모리 부족으로 학습은 못시킨 자료입니다. SDXL은 colab에서 학습시키는 코드들을 찾아보는 중이네요.
원본 이미지는 모두 공유마당에서 받았는데, 화질이 별로 만족스럽지 않은 자료들도 섞여있습니다. SD 2.1을 학습시키는 중에는 노이즈가 눈에 띄게 심해져서 768이상에서는 GIMP로 noise reduction 처리를 거친 이미지들입니다.
이 이미지들로 학습시킨 모델은 civit과 huggingface에 올라가 있습니다.
https://civitai.com/models/27670
https://huggingface.co/bebechien/shinyunbok
모델중에 제일 처음 만들었던 v1.0의 경우는 dataset을 따로 올리지 않았는데, 단순하게 그림 전체를 resize/crop 만으로 집어넣어서 만든 것으로, 인물의 detail을 그리지 못하는 모델이었습니다.