AI 활용법

Gemini에서 Imagen 3 로 이미지 생성하는 방법 (프롬프트 작성 팁)

Duck후 2024. 9. 8. 00:05
반응형

최근 Google은 Imagen 3라는 이미지 생성 모델을 선보였습니다. 기존의 유명 모델들과 비교했을 때 Imagen 3는 어떤 점이 뛰어나고, 어떻게 하면 원하는 이미지를 쉽게 만들 수 있을까요?

Imagen 3 사용법

사용법은 매우 간단합니다. Gemini 웹사이트나 앱을 열고 원하는 이미지를 텍스트로 설명하면 됩니다. "이미지 생성해 줘" 같은 말을 굳이 덧붙이지 않아도 Imagen 3는 사용자의 의도를 파악하여 이미지를 생성합니다.

Imagen 3의 특징

Imagen 3는 사진처럼 생생하고 품질 높은 이미지를 만드는 데 뛰어납니다. 사용자가 일상적인 언어로 작성한 설명도 잘 이해하고, 작은 디테일과 복잡한 질감까지 섬세하게 표현합니다. 이미지 안에 들어가는 텍스트도 자연스럽게 어우러지도록 개선되었습니다.

다양한 그림 스타일과 형식을 지원하며, Google의 AI 생태계인 Gemini 및 Vertex AI와 연동되어 더욱 강력한 기능을 제공합니다.

Imagen 3로 생성한 이미지. Dream Big 이라는 텍스트를 입력해 달라고 했는데 잘 반영됐다.

 

 

Imagen 3 프롬프트 작성 팁

Imagen 3를 최대한 활용하려면 효과적인 프롬프트 작성이 중요합니다. 몇 가지 팁을 알려드릴게요.

 

  • 구체적인 묘사: "강아지" 대신 "갈색 눈을 가진 흰색 푸들"처럼 세부적으로 묘사하세요.
  • 쉬운 언어: 전문 용어 대신 일상적인 표현을 사용하세요.
  • 시각적 요소: 색상, 질감, 조명, 구도 등을 구체적으로 설명하세요.
  • 그림 스타일: 원하는 스타일을 명확하게 지정하세요 (예: 유화, 만화).
  • 카메라와 원근법: "넓은 풍경", "클로즈업" 등으로 구도를 조절하세요.
  • 조명: "부드러운 빛", "강렬한 그림자" 등으로 조명 효과를 설명하세요.
  • 고해상도: "4K", "8K" 등으로 선명한 이미지를 요청하세요.
  • 다양한 설명: 쉼표, 이야기 등 다양한 방식으로 설명해 보세요.
  • 텍스트: 이미지에 글자가 필요하면 글꼴과 위치를 지정하세요.
  • 창의성과 제약: AI의 자유로운 해석을 허용하면서도 필요한 정보는 충분히 제공하세요.

 

처음에는 어려울 수 있지만, 위의 팁들을 참고하여 나만의 프롬프트를 만들다 보면 점점 더 높은 퀄리티의 원하는 이미지를 생성할 수 있을 겁니다. 백문이 불여일견! 실제로 Imagen 3를 사용해 보면서 감을 잡아가 봅시다. 

최초 프롬프트: 따뜻한 햇살 아래 낮잠 자는 강아지

"따스한 햇살 아래 곤히 잠든 골든 리트리버 강아지, 폭신한 담요 위에서 몸을 둥글게 말고 쌔근쌔근 숨을 쉬는 모습. 부드러운 털의 질감과 햇빛에 반짝이는 금빛 털을 강조하여 따뜻하고 평화로운 분위기의 유화 스타일로 묘사. 클로즈업하여 강아지의 평온한 표정과 귀여운 발바닥을 자세히 보여주세요."

Imagen 3로 생성한 강아지 이미지

귀엽나요? 제 눈에는 뭐가 어색하네요. 유화가 아니라 다른 스타일로 바꿔보죠.

 

프롬프트 수정:
따스한 햇살 아래 곤히 잠든 골든 리트리버 강아지, 폭신한 담요 위에서 몸을 둥글게 말고 쌔근쌔근 숨을 쉬는 모습. 부드러운 털의 질감과 햇빛에 반짝이는 금빛 털을 강조하여 따뜻하고 평화로운 분위기의 실사 스타일로 묘사. 원거리에서 강아지의 평온한 모습을 보여주세요.

 

Imagen 3로 생성한 강아지 사진2

유화에서 실사로, 클로즈업에서 원거리로 프롬프트 내용을 수정했더니 결과물이 확실히 바뀌었네요. 

 

이왕 강아지 이미지 생성한 김에 말티즈도 한 번 그려보죠.

 

프롬프트 2: 

앙증맞은 크기의 말티즈 강아지가 두 앞발을 가지런히 모으고 앉아 간식을 기다리는 모습. 촉촉한 눈망울과 살짝 벌어진 입, 쫑긋 세워진 귀를 통해 간절함과 기대감을 표현. 털 한 올 한 올까지 섬세하게 묘사한 고해상도 이미지로, 강아지의 흰 털과 까만 눈동자의 대비를 강조하여 사랑스러움을 극대화. 배경은 깔끔하게 처리하여 강아지에게 시선이 집중되도록.

Imagen 3로 생성한 말티즈 이미즈. 진짜 동네 사진관에서 찍은 실사같다.

 

정말로 실사 같은 퀄리티의 이미지가 잘 생성된 게 보입니다. 구글 공식 블로그에 가 보면 여러 프롬프트가 소개되어 있는데 그걸 참고로 다양하게 자신만의 프롬프트를 만들어보면 좋을 것 같습니다.

 

한 가지 아쉬운 점은 이미지 생성속도가 그렇게 빠르지는 않네요. Gemini 기본과 프로 모두 사용해 보았는데 둘 다 15~25초 정도 걸리는 것 같네요. ChatGPT나 미드저니에 비하면 너무 느린 게 아닌가 하는 생각이 드는데 이 부분은 구글에서 점차 개선해 주면 좋겠습니다. 

 

읽어 주셔서 감사합니다!

좋아요와 댓글은 언제나 환영입니다:)

반응형