Qwen-Image-Edit, OmniGen2 - Multi Image Input

배움/작업기 2025. 8. 26. 22:06

1. Qwen-Image-Edit

지난번엔 고퀄리티 이미지 생성기인 Qwen-Image 모델을 추가했다면,

이번엔 고퀄리티 이미지 편집기인 Qwen-Image-Edit 모델을 추가하였다.

Qwen-Image 모델은 텍스트 프롬프트를 입력하는 반면,

Qwen-Image-Edit은 이미지를 입력해서 이미지를 출력하는 모델이다.

단순히 인물이나 사물의 색이나 형태를 바꾸는 것을 넘어서서,

아예 구도나 스타일 자체를 바꾸거나

캐릭터를 전후좌우 모든 방향으로 볼 수 있게 하여 3D 모델의 참고자료로 쓰는 등

광범위한 활용이 가능하다.

다음과 같이 Qwen-Image Edit 모델을 선택하고,

입력 이미지로 하얀 머리의 남자 사진을 넣었다.

그리고 프롬프트로는 '빨간 머리, 자연스러운 미소, 중무장 갑옷'을 넣었다.

거의 다른 사람이 나온 것 같긴 하지만 어쨌든 결과는 이렇게 나왔다.

그 다음으로 위의 갑옷 이미지를 넣고는,

A T-pose full body shot of a female character with long red hair wearing a heavy full-plate armor, front view, in a clean white studio background, 4k, cinematic lighting

라는 텍스트 프롬프트를 넣었다. 즉 T-pose를 한 전신샷의 빨간 긴 머리를 가진 여성 캐릭터의 전면 이미지를 생성해달라고 하였다.

전면부뿐 아니라 후면부, 우측면, 좌측면까지도 따로 프롬프트를 넣어 네 개의 이미지를 생성하였다.

방향이 완벽히 맞지는 않지만, 그건 프롬프트를 조금만 수정해서 한두번 더 시도해보면 될 것 같다.

어쨌든 Character consistency도 훌륭하고, 이미지 디테일이 좋다.

2. Omnigen2 - Multi Image Input

또한 기존에도 Omnigen2 모델은 추가했었지만 이미지를 하나만 입력할 수 있었는데,

이제는 이 기능은 Qwen에게 넘기고 Omnigen2는 두 개의 이미지를 입력해서 결과물을 출력하는 역할을 주기로 하였다.

그래서 workflows 테이블에 requiredImageCount 라는 속성을 추가하였다.

워크플로우 템플릿을 생성할 때 입력 이미지를 두 개로 설정하였고, 프론트도 수정하여 이미지 입력 그리드를 동적으로 생성하였다.

그 결과 아래와 같이 두 개의 이미지를 넣고

'클럽에서 춤추는 두 캐릭터'와 같은 텍스트 프롬프트를 넣으면..

위와 같은 결과가 나온다.

저작자표시 비영리 (새창열림)

'배움 > 작업기' 카테고리의 다른 글

Wan 2.2 14B image-to-video model 추가 (4)	2025.08.28
Wan 2.2 14B text-to-video model 추가 (2)	2025.08.27
Qwen-Image 모델 추가 완료, OmniGen2 모델과의 비교 (2)	2025.08.18
Gemini CLI, Github MCP, Mermaid, Docusaurus를 활용한 유기적 문서화 (1)	2025.07.11
OmniGen2 model 추가 (0)	2025.07.10

ABOUT ME

jaytsol jaytsol

1. Qwen-Image-Edit

2. Omnigen2 - Multi Image Input

'배움 > 작업기' 카테고리의 다른 글

티스토리툴바

ABOUT ME

1. Qwen-Image-Edit

2. Omnigen2 - Multi Image Input

'배움 > 작업기' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바