상업적 용도로 활용해보려는 입장입니다.
컴을 새로 맞출 생각입니다.
그래픽카드가 중요하다고 하니 4070 이상을 생각하고 있습니다.
그런데, 여기서 멈출지 더 올릴지 결정할 정보가 부족합니다.
예를 들어 일전에 코랩으로 돌려 본 결과 제 눈높이에 맞지 않는 퀄리티와
해상도였습니다. 속도도 느리고...
모델 훈련을 하게 되면
모델을 선택한 후 훈련한 로라를 몇가지 다중 선택할 수 있다고 하더군요.
이런 훈련에 필요한 성능도 고려해야 할 것이고..
두번째로는 모델의 라이선스 같은 것들이 얼마나 제한적인지..
즉, 제가 훈련도 시키고, 몇가지 확장 기능을 가져와서
어떤 이미지를 만들어서 상용으로 사용할 때
활용된 여러가지 기능들이 있을 텐데...각각 라이센스가 다르면..
스테이블디퓨전 및 AI관련 정보는 대략적으로 파악하고 있으나
실제 활용하는 방법 에선 아직 대부분 모르다 보니
위 질문 외에도 여러 조언을 부탁드립니다.
4070 12기가로 로컬 돌려보니 뽑는 속도는 약간 더 빠르지만 그림 퀄리티 차이가 나진 않고요
오히려 코렙보다 hires fix 에서 메모리 부족 에러를 잘 냅니다 램용량이 더 적으니까요
더 크게 뽑으시려면 또는 3090, 4090 24기가 말고는 답이 없습니다. 학습도 마찬가지 같더라고요
그리고 1.5모델 기반의 한계성도 존재해요 주로 512 X 512 크기 이미지들로 학습된 모델들의 정보량
라이선스 추가 제한 요약의 약간 상충되는 듯한 항목이 있는데,
1) Use the model without crediting the creator (원저자 크레딧)
2) Sell images they generate (생성 이미지 판매 가능여부)
3) Run on services that generate images for money (상용 서비스를 위해 사용 가능 여부)
4) Share merges using this model (이 모델을 사용한 병합 모델 공유 가능 여부)
5) Sell this model or merges using this model (모델 혹은 병합 모델 판매 여부)
6) Have different permissions when sharing merges (병합을 공유할 때 다른 권한을 가질 수 있는지 여부)
판매 혹은 무료 공유를 구분하는 듯한 내용인 듯 한데,
예를 들어, 6)번이 가능하다면, 병합 모델을 공개하여 6)에 의한 5), 2), 3) 항목등을 무력화시키는 것이 가능합니다.
(이 부분은 라이선스 원문에 어떤 식으로 되어있는지 확인해 보아야 할 것으로 생각되는데, chilled_remix에서는 이게 가능하다고 보고 있습니다. https://huggingface.co/sazyou-roukaku/chilled_remix )
활용하시려고 하는 최종 목표에 따라 달라지긴 하겠지만, 비용적인 측면에서는 대기업 제품을 사용하는 것이 제일 합리적이라고 생각합니다. 굳이 커스텀 모델이 필요한 상황이라면, 학습된 내용을 확인할 수 있게 개선한 SD 2.1 모델을 기반으로, 저작권에 문제 없는 이미지들만으로 추가학습을 진행할 것 같습니다. 다만 이 경우에도 법적 내용과 상관 없이, 상업적 이용에 있어서 비난을 받을 가능성은 여전히 존재합니다.
두번째의 모델 라이선스는 제작자가 추가 제한을 둘 수 있어서 모두 다르다고 보셔야 합니다. 기본적으로 CreativeML OpenRAIL M license를 따라가긴 합니다만, 상업적 사용을 금지하고 있는 모델도 있습니다.
해상도 문제는 dizzy 님이 언급하신것처럼 hires fix나 upscaler를 사용하셔야합니다. 보통 SD 1.5는 512x512, SD 2.1은 768x768 생성에 최적화 되어 있기 때문입니다.
음... 제 생각을 일부 말씀드리자면,
실제 촬영된 실제 인물을 학습시킬 예정이고,
그림 자체를 판매하려는 것은 아니고요.
Stable diffusion의 표준 프로세싱 이미지 해상도는 512x512 / 512x768 수준에서 거의 벗어나지 않습니다. (메모리가 충분하면 640x640, 768x768도 어떤 모델을 사용하느냐에 따라 가능)
이보다 더 큰 이미지 생성은 hires.fix 혹은 콘트롤넷 tiled sampling의 방식을 써서 2배~2.5배로 해상도를 키워 최종 이미지 해상도를 1024x1024, 1024x1536 ~ 1280x1280, 1280x2304 로 만들고, 이를 한번 더 업스케일링하면 2배/4배의 해상도를 얻습니다. (마지막 스케일러 단계는 디테일등의 해상도가 올라가는 것은 아님)
얼굴이 자꾸 깨진다면, ADetailer 혹은 DDetailer 등을 써야만 합니다. (Detailer는 내부적으로 얼굴 부위만 확대한 후에 다시 샘플링하여 디테일을 향상시킨 후에 얼굴 부위를 원 위치에 가져다 붙이는 방식을 사용)