간만에 복귀해보니 노벨AI 3.0이 나오고 핫하더군요.
데이터셋을 늘리고 입력도 간단하면서 잘 알아먹게 만들어서 사용자들 사이에서 꽤 좋은 평을 받고 있습니다.
하지만 노벨AI가 좋다한들 로컬로 돌릴 수 없습니다. 1.0처럼 유출되지 않는한요, 쿨럭.
그래서 로컬에서 열심히 돌려보실 4090 혹은 4080 보유자들을 위해서 가져왔습니다.
Animagine XL 3.0입니다.
이 모델은 기본적으로 SDXL 모델입니다. 가장 널리 보급된 SD1.5가 아닙니다.
XL인만큼 기본 학습 이미지 크기가 1024*1024이기에 업스케일링 없이도 퀄리티 좋은 그림을 뽑을 수 있습니다.
게다가 3.0으로 오면서 학습데이터량을 획기적으로 늘렸기에
훨씬 더 좋은 이미지를 뽑아낼 수 있다고 합니다. (아래 표 참조)
데이터셋 항목을 보면 학습에 사용된 이미지 수가 대폭 증가 한 걸 볼 수 있습니다.
고화질의 이미지를 500시간 이상 A100 2개를 사용해서 학습한 결과이기에
애니 스타일 그림을 잘 뽑아낼 수 있습니다.
그럼에도 몇 가지 한계점은 있습니다.
1. 컨셉은 잘 뽑지만 아트스타일에 치중해서 뽑는 건 다소 부족함
2. 애니에 최적화돼서 실사 혹은 반실사 이미지에는 부적합
3. 빡센 포즈를 그릴 때 인체 구조가 잘 안 나올 수 있음
4. 모든 애니/작가 스타일을 커버할 데이터 량은 아니었음(NAI 3.0은 수백만장이라고 합니다).
5. 자연어보다는 단부루식 프롬프트(masterpiece, shirt 같은 명령어 방식)를 입력해야 함
6. 후방의 위험: 퀄리티 프롬프트인 masterpiece, best quality를 입력하면 후방짤이 의도치 않게 나올 위험
위 한계점을 뒤집어서 보면 장점이 됩니다.
사용자가 원하는 컨셉에 충실한 애니 이미지를 다양한 스타일로 프롬프트 입력으로 뽑을 수 있습니다.
다운로드 링크는 아래와 같습니다.
기본적으로 SDXL이기 때문에 VRAM이 최소 8기가 이상은 되어야 시도라도 해볼 수 있고
안정적으로 하려면 그 이상을 권장합니다.
사실 저도 3060 12기가라서 아직 SDXL은 찍먹도 안 해봤습니다.
이 모델로 시도해볼까 합니다.