정규화 이미지를 안 넣었다가 넣어보니 좀 근사치에 가깝게 나오게 되네요
근데 많이 일그러지게 나와서 좀 문제인데요
아니메 스타일인데도 이러네요.
여튼
학습시키고나면 safetensors 파일들이 하나가 아니고 여러개가 생기는데 각 각 다 다른 건가요?
하나로만 통합했으면 하는데 어디서 설정을 바꿔야 하나요
감사합니다.
정규화 이미지를 안 넣었다가 넣어보니 좀 근사치에 가깝게 나오게 되네요
근데 많이 일그러지게 나와서 좀 문제인데요
아니메 스타일인데도 이러네요.
여튼
학습시키고나면 safetensors 파일들이 하나가 아니고 여러개가 생기는데 각 각 다 다른 건가요?
하나로만 통합했으면 하는데 어디서 설정을 바꿔야 하나요
감사합니다.
trainin images/ repeats 부분에 총 학습 횟수는 repeats * 학습용 이미지 숫자 * epoch가 되고 정규화 이미지와 같은 숫자를 입력한다고 설명이 되있는던데 이 부분이 조금 이해가 어렵네요 ㅠ
https://www.clien.net/service/board/cm_aigurim/18004978CLIEN
제 경우는 정규화 이미지를 사용하지 않았고, 137개 이미지에 총 학습 스텝 수는 2290이었네요. 학슴 내용에 따라 다르겠지만, 기본 learning rate 값이 보통 1500 step을 기준으로 했던 것으로 기억합니다. 만약 총 스텝 수가 이보다 많이 크다면 학습 이미지 수를 줄이거나 learning rate를 줄여보는 것도 방법일 것 같습니다.
정규화 이미지 숫자는 보통 학습 이미지의 10배를 준비하고, epoch도 기본값이 10이라서 "학습용 이미지 숫자 * epoch" 가 정규화 이미지 숫자와 같아지기는 하는데, 말씀하신 설명 부분은 조금 이해가 안되긴 하네요. 저처럼 총 학습 수가 num train images * repeats와 다를 경우도 있는데, 이는 학습하는 환경의 스펙에 맞춰 자동으로 계산해주는 값이 우선적으로 적용(override)되어서이고요.
https://github.com/kohya-ss/sd-scripts/blob/main/train_network.py#L231
xyz 테스트 돌려서 여러개 나온것들 중 가장 원하는 결과가 잘 나오는 것으로 선택해서 사용하시면 됩니다.