일반적인 확산 노이즈 일정 및 샘플 단계에 결함있다는 논문이 발표했습니다.
Common Diffusion Noise Schedules and Sample Steps are Flawed
소개 글
우리는 일반적인 확산 잡음 스케줄이 신호 대 잡음비(SNR)가 0이 되도록 마지막 타임스텝을 강제하지 않으며 확산 샘플러의 일부 구현이 마지막 타임스텝에서 시작하지 않는다는 것을 발견했습니다. 이러한 설계에는 결함이 있으며 모델에 추론 시 순수한 가우시안 노이즈가 주어져 교육과 추론 간에 불일치가 발생한다는 사실을 반영하지 않습니다. 우리는 결함이 있는 디자인이 기존 구현에서 실제 문제를 일으킨다는 것을 보여줍니다.
논문페이지 : https://arxiv.org/abs/2305.08891
PDF 링크 : https://arxiv.org/pdf/2305.08891.pdf
그 결과 사람들은 어두운 이미지를 얻는데 힘들어 하고 있으며 SD는 프롬프트를 제대로 반영하지 않는것을 확인 하였습니다.
Stable Diffusion Dynamic Thresholding (CFG Scale Fix)
이에 다들 쓰고 있는 Dynamic Thresholding에 포크해서 추가메뉴를 탑재한 확장이 나왔습니다.
코드페이지 : https://github.com/ashen-sensored/sd-dynamic-thresholding-rcfg
당연한 얘기지만 DT를 대체하는 확장이기 때문에 기존의 DT를 삭제하고 설치한 후 CMD창을 껐다 다시 켜야 한다고 합니다.
이렇게 설정하면 좀더 확장된 색공간을 쓸 수 있나봅니다.
위에 PDF도 받았으나... 음.. 영어군요... 음..