https://twitter.com/googleaidevs/status/2071988368808763690?s=20
구글이 빠른 처리 속도와 낮은 비용에 초점을 맞춘 이미지 생성 모델 '나노 바나나 2(NB2) 라이트'를 공개했습니다.
API상 정식 명칭은 '제미나이 3.1 플래시-라이트 이미지'로, 1,000장당 0.034달러라는 파격적인 가격에 이미지 한 장을 4초 만에 생성할 수 있어 구글의 크리에이티브 모델 라인업 중 가장 빠르고 저렴한 옵션으로 자리 잡았습니다.
구글 AI 스튜디오, 제미나이 API, 제미나이 엔터프라이즈 에이전트 플랫폼(GEAP)을 통해 즉시 제공되며, 같은 날 공개된 대화형 비디오 생성·편집 모델 '제미나이 옴니 플래시'의 퍼블릭 프리뷰와 함께 발표되었습니다.
옴니 플래시가 에이전트 기반 비디오 조작을 겨냥한 장기 전략이라면, 나노 바나나 2 라이트는 대량의 이미지를 빠르게 처리해야 하는 상업용 애플리케이션과 자동화된 워크플로우를 위한 실용적인 도구로 포지셔닝되어 있습니다.
이 모델은 '제미나이 3.1 플래시 라이트'를 기반으로 만들어져, 속도와 비용 사이의 균형을 잡도록 설계됐습니다.
기존의 크고 무거운 이미지 모델들은 처리하는 데 몇 초씩 걸리고 비용도 많이 들던 것과 달리, 나노 바나나 2 라이트는 이런 문제를 해결해, 표준 크기(1k) 이미지를 4초 안에 만들어냅니다.
또한 이전 모델인 나노 바나나(제미나이 2.5 플래시 이미지)에 비해 성능이 크게 개선되었으며, 상황에 맞는 장면과 레이아웃을 그려내는 세상에 대한 지식, 연속된 이미지에서 동일 인물이나 사물을 유지하는 캐릭터 일관성, 현지화된 언어의 타이포그래피 렌더링 기능을 갖췄습니다.
다만 해상도는 1k로 제한되어 있어 1k, 2k, 4k를 모두 지원하는 일반 나노 바나나 2, 나노 바나나 프로와는 차이가 있습니다.
성능 면에서는 이런 제약에도 불구하고 눈에 띄는 결과를 보였습니다.
내부 벤치마크에서 텍스트-투-이미지 아레나 Elo 점수 1251점을 기록해 기존 NB1의 1151점을 크게 웃돌았고, 더 무겁고 비싼 나노 바나나 프로의 1245점마저 근소하게 앞섰습니다.
편집 작업에서도 단일 이미지 편집 1308점, 다중 이미지 편집 1294점을 기록하며 실시간 애플리케이션에 적합한 균형점을 보여주었습니다.
이는 빠른 반복 작업이 중요한 소프트웨어 개발, 프로그래매틱 광고, 디지털 커머스 분야에서 활용 가능합니다.
수천 개의 광고 변형을 실시간으로 A/B 테스트하거나, 여러 지역의 온라인 상점 레이아웃을 즉시 조정하는 식의 활용이 가능합니다.
구체적으로는 정확한 장면과 위치 기반 목업을 즉시 만들어낼 수 있는 점, 스토리보딩이나 디지털 패션 피팅처럼 연속된 이미지에서 대상의 일관성을 유지해야 하는 작업에 강점을 보이는 점, 그리고 개선된 텍스트 렌더링으로 여러 언어의 광고 카피를 빠르게 삽입하고 레이아웃 호환성을 바로 확인할 수 있는 점이 강조됩니다.
다만 신규 이미지 생성은 지연 시간이 가장 짧지만, 기존 이미지를 수정하는 조건부 편집 작업은 추가 처리 단계가 필요해 응답 시간이 다소 길어질 수 있습니다.
이 모델은 오픈소스 라이선스로 로컬에서 구동 가능한 오픈 가중치 모델들과 달리, 구글의 관리형 클라우드 API를 통해서만 독점적으로 제공됩니다.
기업 입장에서는 별도의 하드웨어 호스팅 부담 없이 사용할 수 있지만, 구글의 종량제 요금 체계에 종속된다는 한계도 있습니다.
가격은 1,000장당 0.034달러로, 성능이 더 낮은 구형 NB1(0.039달러)보다도 저렴하며, 표준 나노 바나나 2(0.067달러)와 나노 바나나 프로(0.134달러)에 비하면 절반 이하 수준입니다.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/