ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Qwen-Image-Edit, OmniGen2 - Multi Image Input
    배움/작업기 2025. 8. 26. 22:06
    반응형

     

    1. Qwen-Image-Edit

     

    지난번엔 고퀄리티 이미지 생성기인 Qwen-Image 모델을 추가했다면,

    이번엔 고퀄리티 이미지 편집기인 Qwen-Image-Edit 모델을 추가하였다.

    Qwen-Image 모델은 텍스트 프롬프트를 입력하는 반면,

    Qwen-Image-Edit은 이미지를 입력해서 이미지를 출력하는 모델이다.

    단순히 인물이나 사물의 색이나 형태를 바꾸는 것을 넘어서서,

    아예 구도나 스타일 자체를 바꾸거나

    캐릭터를 전후좌우 모든 방향으로 볼 수 있게 하여 3D 모델의 참고자료로 쓰는 등

    광범위한 활용이 가능하다.

     

    다음과 같이 Qwen-Image Edit 모델을 선택하고,

    입력 이미지로 하얀 머리의 남자 사진을 넣었다.

    그리고 프롬프트로는 '빨간 머리, 자연스러운 미소, 중무장 갑옷'을 넣었다.

     

     

     

    거의 다른 사람이 나온 것 같긴 하지만 어쨌든 결과는 이렇게 나왔다.

    그 다음으로 위의 갑옷 이미지를 넣고는,

    A T-pose full body shot of a female character with long red hair wearing a heavy full-plate armor, front view, in a clean white studio background, 4k, cinematic lighting

    라는 텍스트 프롬프트를 넣었다. 즉 T-pose를 한 전신샷의 빨간 긴 머리를 가진 여성 캐릭터의 전면 이미지를 생성해달라고 하였다.

    전면부뿐 아니라 후면부, 우측면, 좌측면까지도 따로 프롬프트를 넣어 네 개의 이미지를 생성하였다.

     

    방향이 완벽히 맞지는 않지만, 그건 프롬프트를 조금만 수정해서 한두번 더 시도해보면 될 것 같다.

    어쨌든 Character consistency도 훌륭하고, 이미지 디테일이 좋다.

     

     

    2. Omnigen2 - Multi Image Input

     

    또한 기존에도 Omnigen2 모델은 추가했었지만 이미지를 하나만 입력할 수 있었는데,

    이제는 이 기능은 Qwen에게 넘기고 Omnigen2는 두 개의 이미지를 입력해서 결과물을 출력하는 역할을 주기로 하였다.

    그래서 workflows 테이블에 requiredImageCount 라는 속성을 추가하였다.

    워크플로우 템플릿을 생성할 때 입력 이미지를 두 개로 설정하였고, 프론트도 수정하여 이미지 입력 그리드를 동적으로 생성하였다.

    그 결과 아래와 같이 두 개의 이미지를 넣고

    '클럽에서 춤추는 두 캐릭터'와 같은 텍스트 프롬프트를 넣으면..

     

     

    위와 같은 결과가 나온다.

     

    반응형

    댓글

Designed by Tistory.