한줄요약 : 그래픽카드가 3060 이상이라면 colab보단 nvme 용량을 비우고 SDwebUI로 운용하는것이 훨씬 편하다.
요새 Stable Diffusion (이하 SD)이 여기저기서 난리입니다.
보통은 colab이나 huggingface에서 시작하는데 어렵고, 많이 느리고, 조금만 사용해도 API 제한에 걸리기도 합니다.
그래서 PC 성능이 여유가 되는 사람은 SD webUI로 넘어가게 되는데요.
어느정도 성능이 되야 만족스러운 성능을 내는지 체크해봤습니다.
1. 그래픽카드
그래픽카드는 일본의 위키에서 집단지성의 힘으로 벤치마크 데이터를 수집하고 있습니다.
로컬 PC 사양 상담 - NovelAI 5ch 위키 (seesaawiki.jp)
물론 4090이 좋지만 (9초대) 3060으로도 충분히 타협 가능한 결과(37초대)를 보여줍니다.
학습도 하려면 스펙이 좋아야 하지만, 잘 만든 체크포인트를 가져다 쓰는게 시간도 줄이고 결과도 보장 할 수 있다고 봅니다.
다만 엔비디아 이외 제품은 추천하지 않습니다.
2. 램
학습 용도가 아니라면 16gb정도로도 충분하다고 봅니다.
다다익램입니다. 요새 램값도 싸졌으니 32GB로 스타트 해보시기 바랍니다. (스페어 램을 고점에서 샀는데 반토막이 났습니다..)
3. CPU
생각보다 중요도가 높습니다.
동일스펙에서 i7-10700K는 30초, i9-12900K는 23초로 7초 차이 납니다.
4. 저장공간
체크포인트 하나가 4gb에서 많게는 10gb까지 먹습니다. 용량을 아끼려고 정밀도를 줄인 모델을 쓰기도 하는데요. 결과물에서 차이가 꽤 느껴집니다.
용량이 부족하다보니 HDD에서 돌려볼까도 싶어서.. 테스트 해봤습니다.
980pro는 속도저하가 없는 편이고, SN750 SE는 특정 용량 이상이면 속도가 급격히 떨어집니다.
체크포인트 로딩하는 시간과 이미지 5개 만드는 시간을 재봤는데요.
이미지 생성엔 큰 차이가 없었습니다. 다만 체크포인트 부를때 차이가 있는데요, 체크포인트 로딩뿐만이 아닌 프로그램 전체 로딩에 영향을 끼치기 때문에 차이는 더 크다고 보시면 됩니다. 읽기 속도에 비례해서 로딩 속도가 차이가 납니다. HDD는 사용 불가 수준입니다. 램이 넉넉하다면 체크포인트를 램에 프리로드 하는 방법도 있는데 모델 3개만 불러도 300초 가량 되고 램은 20GB 정도 먹힙니다.
저장공간은 DRAM 있는 좋은 스펙의 nvme를 강력 권장합니다.

AI쪽은 항상 메모리를 많이 쓰더군요. 그래서 제10년 넘은 컴퓨터도 당시에 64기가 램과 엔비디아 테슬라 카드를 단 워크스테이션으로 했습니다. 같이 일하시던 다른 분은 128기가 램의 서버로 하시더군요.
램을 잔뜩 넣어서 인지 아직까지도 잘 씁니다. 램은 꼭 머신 러닝이 아니더라도 여러모로 많을수록 좋더군요.
옛날에 1메가당 $100에 샀던 기억이 납니다. 당시 윈도2.1 돌리려고 출혈이 꽤 컸었습니다. 🙂
궁금한게 있어서 여쭤봅니다.
1.맥은 용도에 안 맞을까요? 맥북에어 M2 램 8기가 모델입니다.
2.윈도 노트북 기준으론 3070 이상잡으면 될까요?
데탑쓸 환경이 아니어서요.
/Vollago
오히려 저도 궁금해지네요 ㅎㅎ 한번 시도해보시는건 어떠신가요?다만 실리콘맥은 램쉐어하는걸로 기억하기때문에 8기가면 vram 제한 플래그등을 줘야 할거 같습니다
장비걱정말고 일단 돌려보겠습니다
AMD그래픽카드로 돌리는거 어제 겨우 세팅해서 해봤는데...하나 뽑을 때 7~8분걸리네요.
그냥 CPU(AMD 2700)로만 할 때보다 더 느려요.
문제는 시퓨가 i7-8086k네요.. ㅎㅎㅎ
글카빨로 밀어붙히고 있긴 합니다. ㅎㅎ
https://arca.live/b/aiart/67595800
해당 국가에서 사용할 수 없다고 나올텐데 아카 라이브 회원 가입하고 보시면 보입니다(나무위키 회원과 별도입니다).
아카 라이브라서 내용을 퍼올 수는 없는데.. 여튼 제시된 방법대로 하니 꽤 잘되었습니다.
라이젠 5600X, 32GB 메모리, RX570 4GB, Windows 11 환경이었습니다.
(비디오메모리가 모자라서 lowvram 옵션을 주기는 했습니다만..)
... 하다보니까 N당으로 전향을 하고 싶긴 했습니다...
(근데 AMD를 최근에 구입한 적이 없긴 합니다 ㅎㅎ)
제 환경은 5600X, 32GB, RTX 3060 Ti, 256GB SSD.
놀고 있던 SSD 하나를 통째로 AI 그림 놀이에 할당 중입니다.
흔히 많이들 쓰는 512x768로 하여 그냥 돌리면, 장당 10초 이내.
업스케일링 하여 2x로 하면 장당 20초 정도 걸리더라구요.
딱히 불만 없이 잘 돌아갑니다. 기본 해상도로 한장에 7~8초 정도...?
그런데 한번도 보지 못했던 전력이 들어갑니다. 180W 이상... ㄷㄷㄷ