'분류 전체보기' 카테고리의 글 목록

생각/덩어리 2025. 11. 24. 22:37

우리가 매일 살아가고 숨 쉬는 이 거대한 경제 시스템을 잠시 비유적으로 바라봅시다. 눈에 보이지 않지만, 우리의 삶을 지탱하고 때로는 위협하는 이 복잡한 금융 시스템은 마치 쉼 없이 공기를 주입받는 하나의 거대한 고무 풍선과 같습니다. 이 풍선이 바로 우리가 이해하고자 하는 ‘풍선경제론’의 핵심입니다. 1. 풍선의 기초: 질소, 인플레이션의 안정된 압력풍선의 내부를 채우는 가장 기본적인 기체는 질소(N)입니다. 질소는 바로 은행 시스템의 근간이 되는 기초 통화량을 상징합니다. 중앙은행이 발행하는 본원 통화, 혹은 금융기관들이 안정적으로 보유하는 예금 기반 유동성 등이 여기에 해당합니다.질소는 그 성질상 지속적이고 안정적인 팽창 압력을 풍선에 가합니다. 이 압력은 쉽게 사라지지 않으며, 시간이 지남에 따라..

FastAPI 서버 및 AI 채팅 기능 추가

배움/작업기 2025. 9. 10. 18:06

FastAPI랑 LangChain 도 써볼겸 AI 채팅 기능을 추가하였다.아직 메모리 기능도 없어 그냥 chatGPT를 쓰는 게 더 낫겠지만..아무래도 상업적 용도의 사이트가 아니다 보니 유지비용이 추가되는 것에 굉장히 보수적이게 될 수밖에 없는 것 같다.이미지/비디오 생성에 대한 연산 서버가 거의 닫혀 있는 것도 같은 이유에서다. 아무튼 새로운 comfy-langchain repository를 만들었고,FastAPI 기반으로 서버를 만든 후 chat API를 추가했다.이 파이썬 서버를 바로 프론트로 연결하기보다는 기존의 NestJS 서버를 매개로 하는 것이 관리 면에서 좋을 것 같기에,프론트엔드(Next.js) - 백엔드(Nest.js) - LangChain용 파이썬 서버 이런 식으로 아키텍처를 구성하..

Wan 2.2 14B image-to-video model 추가

배움/작업기 2025. 8. 28. 20:48

Wan 2.2 모델에 대한 간략한 소개와 대략적인 내용은 다음 글을 참고할 것 (https://jaytsol.tistory.com/entry/Wan-22-14B-text-to-video-model-%EC%B6%94%EA%B0%80). 지난번엔 text-to-video 모델을 추가하였고, 이번엔 image-to-video 모델을 추가하였다.text-to-video 모델과 워크플로우 자체는 비슷하나 wan2.2_t2v 가 아닌 wan2.2_i2v 모델을 써야 한다.역시 마찬가지로 high-noise part에 GGUF를 사용하였고 wan2.2_i2v_lightx2v_lora 를 추가해 속도를 향상시켰다. 비디오 생성에는 다음과 같은 텍스트 프롬프트, 이미지가 각각 입력되었다.1. 텍스트 프롬프트 (한국어..

Wan 2.2 14B text-to-video model 추가

배움/작업기 2025. 8. 27. 16:40

가장 최신의 비디오 생성기 중 하나인 알리바바 그룹의 Wan 2.2 text-to-video 모델을 추가하였다.(참고: https://docs.comfy.org/tutorials/video/wan/wan2_2)처음에는 그냥 Wan2.2 T2V fp8_scaled 모델만으로 비디오 생성을 시도했으나나의 RTX 3060ti GPU로는 지나치게 많은 시간이 걸리는 탓에 시간을 줄일 방법을 알아보았다.그러다 생성 속도 향상 방법을 알게 되었고 (https://youtu.be/EuZCxMtwIOk?si=2sCZurMa9_yq5tZS) 이를 적용하였다. 내용을 간략히 설명하면..Wan 2.2는 high_noise와 low_noise로 나누어서 샘플링을 진행한다.high_noise sampling의 경우엔 이미지의 ..

Qwen-Image-Edit, OmniGen2 - Multi Image Input

배움/작업기 2025. 8. 26. 22:06

1. Qwen-Image-Edit 지난번엔 고퀄리티 이미지 생성기인 Qwen-Image 모델을 추가했다면,이번엔 고퀄리티 이미지 편집기인 Qwen-Image-Edit 모델을 추가하였다.Qwen-Image 모델은 텍스트 프롬프트를 입력하는 반면,Qwen-Image-Edit은 이미지를 입력해서 이미지를 출력하는 모델이다.단순히 인물이나 사물의 색이나 형태를 바꾸는 것을 넘어서서,아예 구도나 스타일 자체를 바꾸거나캐릭터를 전후좌우 모든 방향으로 볼 수 있게 하여 3D 모델의 참고자료로 쓰는 등광범위한 활용이 가능하다. 다음과 같이 Qwen-Image Edit 모델을 선택하고,입력 이미지로 하얀 머리의 남자 사진을 넣었다.그리고 프롬프트로는 '빨간 머리, 자연스러운 미소, 중무장 갑옷'을 넣었다. 거의 다른..

Qwen-Image 모델 추가 완료, OmniGen2 모델과의 비교

배움/작업기 2025. 8. 18. 02:26

간만에 몇 가지 작업을 추가하였다.먼저 지금까지는 연산 서버가 꺼져있어도 WebSocket: '연결됨'으로 표시되어 있었기에,이를 고치고, 단어 또한 연산 서버: 온라인 혹은 오프라인으로 표시되도록 바꿨다.또한 연산 서버가 꺼져있을 때는 '이미지 생성' 버튼이 disabled 되도록 하여 불필요한 이미지 생성 시도를 하지 않도록 하고,무엇 때문에 disabled 되어 있는 것인지 마우스 오버 시 툴팁이 나타나도록 하였다. 그리고 가장 최신의 이미지 생성 모델 중 하나인 Qwen-Image 모델을 추가하였다.Qwen-Image 모델은 지금까지 나온 그 어떤 모델보다도 가장 높은 정확도로 이미지 속의 텍스트를 잘 표현해준다. 내 서비스의 이름인 Surfai를 넣어서 생성한 편의점에 진..

Gemini CLI, Github MCP, Mermaid, Docusaurus를 활용한 유기적 문서화

배움/작업기 2025. 7. 11. 18:05

프로젝트를 진행하는 데 있어 문서화는 필수적이다.기능 구현 이전에 미리 설계를 마치기 위해서도 필요하고,기능 구현 이후라도 팀원을 위해 혹은 미래의 나를 위해서도 필요하다.하지만 동시에 문서화는 비용 소모적이다.상세하고 직관적으로 쓰면 쓸수록 좋은 문서이겠지만 동시에 많은 시간을 쓰게 된다.따라서 그 둘 사이에 적절한 저울질을 할 수 밖에 없게 된다.그렇기에 나는 최근 출시된 Gemini CLI를 활용해 일종의 '문서 자동화'를 시도해보았다.내가 고민하고 마주한 문제에 대해 흐름대로 서술해보겠다. 목표- 기술문서 작성 목표 실현에 따른 문제상황 문제 1: 사람이 일일이 기술문서를 쓰는 것은 번거롭고 많은 시간과 노력이 필요하다.문제 2: 기술문서에 필요한 다이어그램이나 도표 등을 구성하는데도 많은 시..

OmniGen2 model 추가

배움/작업기 2025. 7. 10. 21:30

새로운 모델 추가. OmniGen2 의 text-to-image 모델과 image edit (image-to-image) 모델. 지금까진 모두 입력 형식이 텍스트였지만 이제 이미지로 입력을 받는 첫 모델을 탑재해야 하기에 꽤 수정할 사항이 많았다. 프로젝트 자체의 main.ts에서 body를 50MB 제한으로 늘려 받도록 하였고, 연산 서버로의 데이터 요청 크기 제한도 nginx config를 통해 50MB로 늘렸다. 그 외에 프론트쪽도 UI 수정 및 양단 모두에 대한 버그 수정. 아래는 OmniGen2 모델의 Image edit feature를 통해 'Crying apple, human face, sadness' 프롬프트로 이미지를 생성한 모습.crying apple

ABOUT ME

jaytsol jaytsol

티스토리툴바