개인적으로 제일 좋아하는 이미지 생성 모델은 Stable Diffusion 1.5 계열입니다.
뭐랄까.. 살면서 가장 흔하게 볼 수 있는 보정 들어간 애니메이션은 아니고 그렇다고 실사는 아닌 그 어딘가의 그림체를 만들어주는 모델이라고 해야 할까요.
극 실사 위주로 가면 로컬에서도 좋은 모델들이 많은데 그쪽으로는 크게 관심이 없어서 다시 SD1.5를 쓰기도했는데 SD1.5는 태생적으로 손가락 같은 말단 부위는 그냥 포기해야 하는 모델입니다.
그래서 기가 막히게 그림체나 분위기, 톤은 유지하고 손가락만 고쳐주는 모델 없나 했는데 나노 바나나가 그걸 가능하게 해주네요.
고치고 싶은 부위(손가락이나 손)를 그냥 대충 마스킹해서 마스킹 한 부분을 알아서 채워달라고 하면 매우 높은 확률로 쓸만하게 채워줍니다.
단점은 출력해상도가 720p라는거고 색이 8비트로 처리되는것 같아서 조금 아쉽긴합니다.
여기서 FHD로만 올라가도 필요 컴퓨팅 파워가 확 올라가니 이해는 됩니다.
그리고 API로 지금 성능 그대로 혹은 더 개선해서 정식출시가 될지 모르겠습니다.
분명히 이정도 모델이면 안좋은 쪽으로 100000% 사용될게 뻔하거든요.
당장에 어떤 기술을 사용했는지는 알려져서 이걸로 로컬 모델에 적용한 케이스도 있다고 하네요.
아마도 구글이 출시를 안한다면 중국에서 출시를 하긴 할거라 봅니다.
어쨌든 안좋은 쪽으로 사용될수있는 기술에 철퇴를 가한게 최근에 친구나 지인 사진 도용해서 이상한데 합성하는데 사용하는 서비스에 필요한 리포지토리를 마이크로소프트가 깃허브에서 일괄 삭제 시키기도 했구요.
끝으로 이번이 디지털 쓰레기(AI이미지를 그렇게 부르더군요)를 업로드 하는건 마지막 입니다.

여러가지 해보다가 물웅덩이에 반사되는 걸 만들어봤는데 놀랍도록 정확하게 만들어줍니다.
비록 이 이미지는 손가락이 망해서 못 쓰는 이미지지만 제가 원하는 컨셉에 맞는 반사된 상을 정확하게 만들어주는거에 엄청 놀랐습니다.
다음 2개는 그냥 제가 좋아하는 분위기의 평범한 이미지입니다.


진짜 '딸각'의 시대가 오는 거 같아요.
고수들이 프롬프트 깎아서 로컬 모델로 쥐어 짜던게 진짜 딸깍이에요.
물반사가 ㅎㄷㄷㄷㄷ
하긴 사람 얼굴이 눈두개 코하나 입하나.... 인데 왜 난 차은우와 다르게 생긴거냐 yo~ㅠㅠ
AI는 AI나름대로 판타지 같은 면이 있어야 한다고 생각해서요.