(2월 15일 오후 6시 본문 내용 추가)
안녕하세요,
AI 그림으로 엔터 대표 놀이했던 사람입니다.
지금이 적기라 생각하여 행동에 나섭니다.
소모임도 준비한다 하고 많은 이들의 관심이 있을 때
한 번 정리를 하여 접근성을 높이는 게 좋다 생각했습니다.
최근 일주일 정도 열심히 AI 그림 뽑기를 하면서 느낀 것들과
클리앙에 올라와 있는 좋은 글들을 한 번에 모았습니다.
혹시 본인 글이 올라왔는데 불편하시면 댓글이나 쪽지로 알려주세요.
바로 삭제 해 드리겠습니다.
참고로 제가 올렸던 AI 그림 뽑기 글입니다.
주의사항!😡
- 이건 중복성이 꽤 강합니다.
- 괜히 FM, 문명 게임 같다고 하는 게 아닙니다.
- 10분이 3시간으로 왜곡되기 시작합니다.
- 모바일 게임 뽑기를 좋아한다면 조심하세요.
- 한 장만 더, 한 장만 더…를 중얼거립니다.
- 자기도 모르게 수면 시간을 줄이고 있을 겁니다.
- 자기도 모르게 영어 단어를 찾고 있을 겁니다.
- 자기도 모르게 의상, 배경, 개체들에 관심이 갈 것입니다.
아래와 같은 사람들에게 추천합니다.😍
- 예술적인 감각이 있음
- 표현력이 뛰어남
- 새로운 것에 관심이 많음
- 시간적인 여유가 많음
- 개발자 마인드를 가짐
- 버그 수정을 좋아함
- 아름다운 것을 좋아함
- 이성, 동성, 사람을 좋아함
- 디테일한 것을 좋아함
- 이상형을 만나고 싶음
- 고사양 GPU가 놀고 있음
- 새로운 활력이 필요함
아래와 같은 사람들에게는 권하지 않습니다.😥
- AI에 거부감이 있음
- 아름다운 손가락을 사랑함
- 정상적인 인체 구조에 진심
- 진짜 사람에게만 관심 있음
간단히 용어 정리
- stable-diffusion-webui : 내 컴퓨터에 설치하는 AI 그림 뽑기 툴
- Google colab : 구글 서버로 하는 AI 그림 뽑기 툴
- 모델 : 정확히는 stable diffusion checkpoint지만, 선구자들이 이 단어를 써서 그런지 통상적으로 [모델 = 체크포인트]
- 프롬 : 정확히는 Prompt, 어떤 그림을 뽑을지 입력하는 명령어
- 긍정 프롬 : 이것을 바탕으로 그림을 뽑아달라는 명령어
- 부정 프롬 : 이것은 빼고 뽑아달라는 명령어
- 와일드카드 : 문법은 wildcard name, 특정 텍스트 파일의 문구를 랜덤으로 선정
- t2i : Text to Image, 명령어를 입력하여 그림 뽑기
- i2i : Image to Image, 그림으로 새로운 그림 뽑기
- 로라 : LORA(Low-Rank Adaptation of Large Language Models), 특정 인물이나 캐릭을 학습 시킨 것
설치
- 참고로 제가 설치한 환경을 말씀드리면,
- AMD 5600X, 32GB RAM, RTX 3060 Ti, SSD 256GB
- 쓰지 않는 SSD가 있어서 stable-diffusion-webui만 설치했습니다.
- 가급적 SSD에서 하는 것을 권합니다.
- RTX 3060 정도가 편히 돌릴 최소 기준이라 봅니다.
- 512x768 해상도 기준, 1장 뽑기 시간 : 10초 이내
- 업스케일 2x(1024x1536)로 했을 경우, 1장 뽑기 시간 : 20초 이내
- 물론 1000이나 2000 시리즈에서도 하는 분도 있지만 시간이 다릅니다.
- 다른 분이 올리신 스펙 관련 글입니다.
- Stable Diffusion webUI를 돌리려면 스펙이 얼마나 좋아야 할까? - lemontwist님
- https://www.clien.net/service/board/lecture/17906406?od=T31&po=0&category=0&groupCd=
- 여러 툴들이 있지만, 그냥 아래 딱 2가지 선택지에서만 고르면 됩니다.
- 내 컴퓨터 성능이 좋고, GPU도 RTX 3000 시리즈 이상이다 : stable-diffusion-webui 추천
- 제가 처음에 봤던 유튜브 영상 : https://www.youtube.com/watch?v=WySi5vzi29s&t=467s
- 영상이 싫다면 글 : https://blog.naver.com/lovingmin2/222998853089
- 최근에는 따로 통합팩도 있다 하니, 위 방법이 어렵다면 이것도 확인해 보세요.
- 컴퓨터 성능 별로다, 좋은 컴 있지만 전기요금 무섭고 팬소음과 더워지는 거 싫다 : colab 추천
- 구글 colab 활용 AI 그림 쉽게 무료로 그리기 입문 (문명하셨습니다) - HTR님
- https://www.clien.net/service/board/park/17908357?po=0&sk=title&sv=ai&groupCd=community&pt=0
설치완료
- 툴은 준비 된 상태입니다.
- 이제 AI 그림 뽑기를 바로 할 수 있습니다.
- 아래 설명은 stable-diffusion-webui을 기준으로 합니다.
모델
- 모델 검색은 아래 사이트에서 확인하세요.
- 모델은 딱 이것만 기억하세요.
- 반실사, 실사가 좋다 : basil_mix
- 반실사, 실사 좋은데 한국 인스타 스타일이 좋다 : ChilloutMix
- 2D가 좋다 : AbyssOrangeMix2
- https://huggingface.co/WarriorMama777/OrangeMixs
- hard, nsfw, sfw와 같이 종류별로 있으니 알아서 고르세요.
- 모델 병합 같은 건 나~~중에 알아보세요.
- 확장자는 ckpt, safetensors, 이렇게 2가지이나 최근 툴에서는 다 지원합니다.
- 사용하는 폴더는 다음과 같습니다.
- 모델 파일 넣기 : stable-diffusion-webui/models/Stable-diffusion
- vae 파일 넣기 : stable-diffusion-webui/models/vae
- 로라 파일 넣기 : stable-diffusion-webui/models/lora
- vae 파일도 기본적으로 필요하니 아래에서 받아 넣어주세요.
- 모델 설정은 webui 상단에 있는 체크포인트에서 선택, 안 보이면 오른쪽 새로고침 선택
- vae 설정은 Settings ⇒ Stable Diffusion ⇒ SD VAE에서 선택 ⇒ 상단의 Apply settings 선택
- 모델과 vae 준비 끝!
- 로라는 나~~중에 해 보세요.
프롬
- 아직 프롬은 모르니깐 남의 껄로 공부해야죠.
- 프롬을 아는 방법은 다음과 같습니다.
- AI 그림을 올린 사람에게 직접 물어보기
- 이미지 파일에서 정보 추출하기(exif 정보)
- PNG Info : stable-diffusion-webui 상단 탭에서 확인
- https://jimpl.com/ : 해당 웹사이트에 방문하여 파일을 올려서 확인
- https://exiftool.org/ : Windows Executable를 받아 로컬에서 확인, 이미지 파일을 exe 파일에 드래그 하면 끝!
- 3가지나 있으니 상황에 맞게 사용하세요.
- 그렇지만, 기본적인 프롬은 존재합니다. 강조 비율은 한 번 변경해 보세요.
- 긍정 : (best quality, masterpiece, high resolution:1.4), high_quality, 1girl,
- 부정 : (low quality:1.4), (worst quality:1.4),
기타 설정
- 개인적인으로 추천하는 기본 설정입니다.
- Sampling method : DPM++ 2M Karras
- Sampling steps : 20
- 해상도 : 512x768 or 768x512
- 배치는 모두 1
- CFG Scale : 7
- 클리앙에 올라온 다른 분의 추천 세팅입니다.
- 제가 주로쓰는 스테이블 디퓨전 AI 세팅값입니다 - 바이데이님
- https://www.clien.net/service/board/park/17907453?po=1&sk=title&sv=ai&groupCd=community&pt=0
뽑기 시작
- 일단 모든 준비는 끝났으니, 오른쪽 상단에 Generate를 선택하여 돌리세요.
- 계속 계속 돌립니다. 마음에 드는 게 나올 때까지.
- 끝입니다. 고생하셨습니다!
일주일간의 개인적인 경험에 의한 팁
(빠르게 쓰다보니 경어체가 아닌 점 넓은 마음으로 양해 부탁드립니다)
- 최강 조합 : webui + DeepL + chatGPT + Google 이미지 검색 결과 + 노션(or 구글 시트)
- 모델마다 권장하는 설정값이 있다. 처음에는 그것 위주로 돌리자.
- Restore faces는 거의 쓸 일이 없다. 정 얼굴이 이상하면 한 번씩 체크해서 돌려보자.
- 취향저격 고화질을 빠르게 뽑으려면, Hires. fix를 체크하지 않고 돌리자.
- 그러다가 마음에 드는 것이 뽑히면 Hires. fix를 체크하여 업스케일 해 주자.
- 개인적인 추천값은 ESRGAN_4x + steps 2 + strength 0.3 + Upscale by 2
- 프롬은 최대한 짧게 하자. 고봉밥(긴 프롬) 준다고 잘 나오는 거 아니다. 고봉밥은 옛날 얘기다.
- 프롬은 긍정/부정 각각 75자 단위로 끊어진다. 최대한 짧게 하자.
- 프롬이 짧을수록 생성 속도도 빠르다.
- 구체적인 프롬은 원하는 결과에 가깝게 간다. 그러나 자율성을 잃는다.
- 간단한 프롬은 원하는 결과와 조금 멀어지지만 더욱 다채로운 결과를 보여준다.
- 프롬은 문장으로도 가능하고 단어로도 가능하다.
- 결과값은 모델과 프롬에 따라 좌우된다. 한계란 없다.
- 너무 인스타 느낌이 싫다면, https://civitai.com/에서 날 것 그대로 보여주는 모델을 찾자.
- 진짜 평상시에 많이 보이는 사람들의 얼굴이 나올 것이다.
- 손가락이 이상하다면, best ratio four finger and one thumb를 프롬에 넣어주자.
- 그래도 이상하다면, waving hand을 넣어주자.
- 그래도 이상하다면, 위에껄 빼고 arms behind head 혹은 hands in pockets을 넣어보자.
- 프롬의 단어 연결이 띄우기라면 실사를 강조한다(arms behind head).
- 프롬의 단어 연결이 _라면 2D를 강조한다(arms_behind_head).
- 남의 프롬을 쓰다가 스스로 작성하는 순간, 정리할 필요를 느낄 것이다.
- 노션을 이용하거나 구글 시트를 이용하여 정리하자.
- 프롬은 다음과 같이 강조된다.
- (명령어:강조비율), 강조비율은 0.0~1.4 범위 내에서만 하자. 0.05도 가능하다.
- 명령어, (명령어), ((명령어))와 같이 괄호로 강조할 수도 있다.
- (명령어, 명령어:1.2)와 같이 쓸 수도 있다.
- 실사와 2D에서 쓰는 프롬은 다소 다르니 참고하자.
- CFG Scale과 Sampling steps은 각각 30, 150까지만 가능하다.
- 이 2개의 값은 상관관계를 갖는다. 하나만 너무 높거나 너무 낮으면 안 된다.
- 개인적으로은 3배수를 추천한다. CFG Scale 7이라면, steps는 20.
- 이 2개의 값이 낮을 때는 보다 실사와 유사하게 보여주나, 디테일과 개성이 약하다.
- 이 2개의 값이 높을 때는 보다 2D와 유사하나, 디테일과 개성이 강해진다.
- 마음에 드는 결과가 뽑혔다면 여러 옵션을 변경해서 시도해 보자.
- seed 고정은 seed 오른쪽에 재활용 아이콘이다.
- 다시 랜덤으로 돌리려면 그 왼쪽 주사위 아이콘을 선택하자.
- 마음에 드는 결과를 돌릴 때 귀찮다면, 다음과 같이 해 보자.
- Seed 아래 Script를 선택 => X/Y/Z plot 선택 => X, Y 타입을 각각 선택하여 values를 적어주자.
- values에는 20,30,40,50,60와 같이 넣을 수 있다.
- 6번 돌려서 볼 것을 한 번에 돌려서 결과값을 비교할 수 있다.
- webui의 Extensions에서는 이것을 기본적으로 설치해 주자. sd-dynamic-prompts, Lora.
- 해당 탭의 Available에서 설치할 수 있고, 보이지 않는다면 그 아래 tags의 체크를 해제 해 보자.
- 임베딩, 로라 선택을 하려면 Generate 아래 화투패 이미지를 선택하자.
- 임베딩과 로라는 프롬으로 직접 입력할 수도 있다.
- Styles로 여러 타입의 프롬을 저장할 수 있지만, 개인적으로는 노션이나 구글 시트가 편했다.
- 특정 국가의 인물이나 개체를 원하지 않으면 (thai, thai style, thai makeup), (chinese, chinese style, chinese makeup)와 같은 프롬을 부정에 넣어주자.
- Clip은 1~2로 설정하자. settings => stable diffusion에서 할 수 있다.
클리앙 팁 모음
- 심심하면 모공에 올라오는 AI 반실사 그림체 뽑기 - 아름다운별님
- Chat GPT와 Stable Diffusion을 이용해서 소녀 사진을 뽑아보자. - 평양시청민원과님
- AI 그림 정보글 - 외않됬데?님
진짜 끝입니다.
읽어주셔서 감사합니다!
조만간 더 좋은 AI 그림으로 돌아보겠습니다.
빠잉!
https://www.tomshardware.com/news/stable-diffusion-gpu-benchmarks
- Prompt 그림을 그리는 방법, 영문 : 그림을 좋아하는 사람으로 본인이 원하는 걸 그릴려면 읽어보세요. 처음에는 다른 사람들이 그린 것을 참조해서 비슷한 값을 넣고 수정할 수도 있지만, 백지부터 그려서 원하는 걸 얻는 건 쉽지 않습니다. 조카 별명이 오리 부리를 가진 토끼라서 AI로 그려줬는데 이걸 해석해서 알려주면서 같이 그렸더니 많이 좋아하더군요.
https://openart.ai/promptbook
- 본인이 그린 그림 또는 다른 사람이 그린 그림이 마음에 들면 예제처럼 저장해놓고 나중에 불러와서 어떤 Prompt를 입력했는지 알수 있습니다. 별도 폴더를 만들어서 저장해놓으면 그림만 보면 알수 있고 불러와서 자동입력 시킬 수 있어서 유용합니다. 단지 모든 그림에 유용한 정보가 들어 있지는 않습니다. 정보를 지우고 올려놓는 경우도 많고요.
- 활성화 된지 그리 오래되지 않아서 인지 하루하루 계속 기술이 개선되고 발전합니다. 얼마전에 그림에서 포즈같은 것을 더 쉽게 추출할 수 있는 기능이 올라와서 핫 하더군요.
좋은 정보 감사합니다!
다만... GUP가 GPU인데... 수정 부탁합니다. ㅎㅎ
네 수정했습니다.
저도 겪은 이슈인데요.
윈도우의 고급 시스템 설정 - 환경변수 - 시스템 변수에서 Path 선택 후에 편집.
거기에 파이썬 설치 폴더를 추가했었습니다.
아래 페이지도 참고해 주세요.
https://somjang.tistory.com/entry/Windows-Windows%EC%97%90%EC%84%9C-Python-%ED%99%98%EA%B2%BD%EB%B3%80%EC%88%98-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0
파이선 설치시 네모박스 체크 문제였네요. 친절히 답주셔서 감사드립니다.
저도 amd 유저 인데 어떻게 설치 및 실행하셨나요? 궁금합니다
저는 본문에 적은 것처럼 stable diffusion webui로 하고 있습니다.
혹시 GPU는 어떤 걸 쓰시나요?
라데온은 엔비디아에 비해 어려움이 있고, 따로 설정할 게 있다고 해서요.
엔비디아를 쓰시면 위에 적은대로 시도해 보시면 되겠습니다.
서브 노트북은 엔비디아라 stable diffusion webui 무리없이 설치하고 실행했는데
메인컴은 라데온 RX580 이라 진행이 안돼네요.
설령 어떻게 webiu 설치하더라도 AMD 버젼은 모델 합치는 체크포인트 머지는 아직 구현이 안된것 같습니다 ㅠ
따로 소개할만큼 특별한 게 없어서요.
노션에 페이지 하나 만들어서 Database - Inline 추가하고,
컨셉별 페이지로 관리하고 있습니다.
컨셉별 페이지에는 긍정, 부정 프롬 정리하고
특이사항 있거나 맘에 든 seed 있으면 따로 기록하기도 합니다.
다만, 이 방식은 페이지마다 선택을 해야하기 때문에
그냥 DB 리스트에 바로 넣어도 되고
아니면 구글 시트에서 한 방에 정리하는 것도 좋아 보입니다.
전 이거 자주 사용하고 있어요. 요기서 남들이 올린 그림 프롬 볼 수 있고 그림 exif등 다양한 기능이 있어서 좋습니다
https://pixai.art/ 도 있답니다.
시간이 되면 꼭 트라이 해볼게요 꾸벅
감사합니다. ^^
감사합니다 ㅎ
https://www.clien.net/service/board/cm_aigurimCLIEN