본문 바로가기
- 오늘의 관심사와 나의 생각

구글의 AI 이미지 모델 '나노 바나나', 포토샵의 종말일까?

by 브로맨스 일상다반사 2025. 8. 31.
반응형

나노바나나


2025년 8월 26일, 구글 딥마인드가 공개한 구글 제미나이(Gemini)의 이미지 모델 ‘나노 바나나(nano-banana)’, 정식 명칭 Gemini 2.5 Flash Image에 대한 관심이 뜨겁죠. 포토샵이 이제 AI에게 명령하기만 하면 되는 수준으로 점점 향해가고 있는 것 같은데요.

Gemini 2.5 Flash Image(코드명 나노 바나나)는 캐릭터 일관성과 멀티턴 편집, 자연어 기반의 정밀 제어까지 갖춘 혁신적인 AI 이미지 편집 모델입니다. 사진 합성, 스타일 적용, 인테리어 디자인, 교육 콘텐츠 제작 등 다양한 응용 가능성을 열어둔 한편, 워터마크 처리 및 세부 편집 한계 등은 지속적으로 개선 중입니다. 크리에이터와 개발자 모두에게 큰 기대를 모으는 도구입니다.

자세히 알아보겠습니다.


나노 바나나란?

2025년 8월 26일, 구글 딥마인드가 새롭게 선보인 Gemini 2.5 Flash Image, 코드명 "나노 바나나(nano-banana)"가 제미나이 앱과 각종 플랫폼(Gemini API, Google AI Studio, Vertex AI)에 통합되었습니다.

이 모델은 텍스트 기반 지시만으로 이미지를 생성하거나 기존 이미지를 정교하게 편집할 수 있으며, 특히 편집 대상의 일관된 모습 유지(character consistency) 기능에 특화되어 있습니다.


주요 특징

1. 캐릭터 일관성 유지

원본 인물이나 반려동물의 주요 특징을 편집 과정 내내 유지하며, 다양한 의상이나 배경 변화를 자연스럽게 표현합니다.

2. 자연어 기반 정밀 편집

텍스트 명령만으로 특정 요소를 편집할 수 있습니다. 예를 들어, 배경 흐리기, 얼룩 제거, 사람 삭제, 포즈 변경, 흑백 사진 색채화 등이 가능합니다.

3. 다중 이미지 융합 & 스타일 전이

여러 이미지를 결합해 새로운 장면을 생성하거나, 한 이미지의 스타일을 다른 객체에 입히는 것도 간단히 처리할 수 있습니다.

4. 멀티턴(multi-turn) 편집

단계별로 텍스트 명령을 이어가며 이미지 일부만 수정하는 등, 복잡한 편집 흐름도 일관성 있게 수행할 수 있습니다.

5. 실제적 세계 지식 활용

Gemini의 세계 지식을 활용해, 손으로 그린 다이어그램 인식, 교육 콘텐츠 생성 등 컨텍스트 기반 편집이 가능합니다.

6. 높은 벤치마크 성능

LM Arena 플랫폼에서 이미지 생성 및 편집 부문 모두 1위를 달성한 것으로 나타났습니다.

7. 워터마크 & SynthID

생성 또는 편집된 모든 이미지에는 눈에 보이는 워터마크와, AI 식별용 SynthID 디지털 워터마크가 포함됩니다.


활용 사례

의상·배경 변경 ’60년대 헤어스타일’, 털옷을 입힌 반려동물 등 다양한 스타일 적용에도 원본 특성을 유지
사진 합성 반려동물과 함께 농구장에 있는 듯 자연스럽게 합성
인테리어 편집 빈 방 사진에 가구나 벽지 등을 단계별로 추가하는 멀티턴 편집
마케팅 및 상품 디자인 제품 이미지의 다양한 각도 제작, 브랜드 일관성 유지, 광고나 웹 콘텐츠 활용 등.
교육 및 인터렉티브 콘텐츠 손그림 분석, 튜토리얼 이미지 생성 등 교육적 활용 
 

장점과 개선 과제

장점

  • 캐릭터 일관성 유지로 높은 실험 만족도.
  • 멀티턴 편집을 통한 창의적 편집 워크플로우.
  • 복잡한 명령도 자연어로 직관적 처리.

개선 과제

  • 정확한 크롭 기능 부재: 기초적인 자르기 기능(예: 16:9 조정)이 지원되지 않습니다.
  • 워터마크 취약성: 워터마크가 너무 미묘해 쉽게 편집될 수 있어, SynthID 접근성 확대 필요.
  • 디테일 약한 사례 존재: 반복 편집 시 인물 얼굴의 왜곡, 이미지 해상도 저하 발생 가능. 업스케일 기능 필요.
반응형