-
Qwen-Image-Edit, OmniGen2 - Multi Image Input배움/작업기 2025. 8. 26. 22:06반응형
1. Qwen-Image-Edit
지난번엔 고퀄리티 이미지 생성기인 Qwen-Image 모델을 추가했다면,
이번엔 고퀄리티 이미지 편집기인 Qwen-Image-Edit 모델을 추가하였다.
Qwen-Image 모델은 텍스트 프롬프트를 입력하는 반면,
Qwen-Image-Edit은 이미지를 입력해서 이미지를 출력하는 모델이다.
단순히 인물이나 사물의 색이나 형태를 바꾸는 것을 넘어서서,
아예 구도나 스타일 자체를 바꾸거나
캐릭터를 전후좌우 모든 방향으로 볼 수 있게 하여 3D 모델의 참고자료로 쓰는 등
광범위한 활용이 가능하다.
다음과 같이 Qwen-Image Edit 모델을 선택하고,
입력 이미지로 하얀 머리의 남자 사진을 넣었다.
그리고 프롬프트로는 '빨간 머리, 자연스러운 미소, 중무장 갑옷'을 넣었다.


거의 다른 사람이 나온 것 같긴 하지만 어쨌든 결과는 이렇게 나왔다.
그 다음으로 위의 갑옷 이미지를 넣고는,
A T-pose full body shot of a female character with long red hair wearing a heavy full-plate armor, front view, in a clean white studio background, 4k, cinematic lighting
라는 텍스트 프롬프트를 넣었다. 즉 T-pose를 한 전신샷의 빨간 긴 머리를 가진 여성 캐릭터의 전면 이미지를 생성해달라고 하였다.
전면부뿐 아니라 후면부, 우측면, 좌측면까지도 따로 프롬프트를 넣어 네 개의 이미지를 생성하였다.

방향이 완벽히 맞지는 않지만, 그건 프롬프트를 조금만 수정해서 한두번 더 시도해보면 될 것 같다.
어쨌든 Character consistency도 훌륭하고, 이미지 디테일이 좋다.
2. Omnigen2 - Multi Image Input
또한 기존에도 Omnigen2 모델은 추가했었지만 이미지를 하나만 입력할 수 있었는데,
이제는 이 기능은 Qwen에게 넘기고 Omnigen2는 두 개의 이미지를 입력해서 결과물을 출력하는 역할을 주기로 하였다.
그래서 workflows 테이블에 requiredImageCount 라는 속성을 추가하였다.
워크플로우 템플릿을 생성할 때 입력 이미지를 두 개로 설정하였고, 프론트도 수정하여 이미지 입력 그리드를 동적으로 생성하였다.
그 결과 아래와 같이 두 개의 이미지를 넣고

'클럽에서 춤추는 두 캐릭터'와 같은 텍스트 프롬프트를 넣으면..

위와 같은 결과가 나온다.
반응형'배움 > 작업기' 카테고리의 다른 글
Wan 2.2 14B image-to-video model 추가 (4) 2025.08.28 Wan 2.2 14B text-to-video model 추가 (2) 2025.08.27 Qwen-Image 모델 추가 완료, OmniGen2 모델과의 비교 (2) 2025.08.18 Gemini CLI, Github MCP, Mermaid, Docusaurus를 활용한 유기적 문서화 (1) 2025.07.11 OmniGen2 model 추가 (0) 2025.07.10