ComfyUI + FLUX 설치 및 Text to Image 사용법

1. FLUX
FLUX는 독일의 Black Forest Labs에서 개발한 텍스트-투-이미지(text-to-image) 생성 모델로, 자연어 프롬프트를 기반으로 고품질의 이미지를 생성하는 데 특화되어 있습니다. FLUX는 다양한 버전으로 제공되며, Schnell 버전은 Apache 2.0 라이선스로 공개되어 개인, 학술, 상업적 용도로 자유롭게 사용할 수 있습니다.
텍스트 표현과 정확한 손 표현이 강점이라고 알려져 있습니다. Stable Diffusion, Stable Diffusion XL 등과 비교하여 고품질의 이미지를 생성할 수 있지만, 고성능 GPU를 필요로 합니다. 일반적으로 FLUX를 구동하기 위해서 12GB이상의 VRAM이 장착된 Nvidia 그래픽 카드가 장착되어 있어야 합니다. 이미지를 생성하는 시간도 일반적인 Stable Diffusion에 비해 평균 2~3배, 혹은 5배까지도 차이가 날 수 있습니다.
FLUX 모델의 버전별 차이는 다음과 같습니다.
- FLUX.1 Schnell: 빠른 이미지 생성을 목표로 한 경량화 모델로, Hugging Face에서 다운로드 가능
- FLUX.1 Dev: 개발자 및 연구자를 위한 버전으로, 비상업적인 목적으로 사용 가능
- FLUX.1 Pro: 상업적 사용을 위한 고급 버전으로, API 형태로 제공되며 라이선스 계약이 필요
2. ComfyUI 설치
ComfyUI 설치 방법은 이전 WAN Image to Video 설명글에 자세하게 적혀 있습니다.
최신 버전의 Portable 버전을 다운로드 받아 설치하시면 됩니다.
3. 파일 준비
다양한 버전의 FLUX 모델들이 존재하고 있는데, 먼저 FLUX를 이용하기 위해서는 기본 모델 파일, CLIP 모델 파일, VAE 파일 등을 다운받아야 합니다. CLIP 및 VAE를 합친 체크포인트 모델도 존재하지만, 현재 일반적으로 오픈소스 커뮤니티에서 공유되고 있는 형태는 순수 모델 파일을 위주로 배포가 되고 있기 때문에, 모델 파일, CLIP 파일, VAE 파일을 각각 따로 다운로드 받는 것을 권장합니다.
3.1. FLUX 모델 파일
3.1.1. 고성능 GPU 사용 (16GB+ VRAM)
일반적으로 사용할 수 있는 버전은 Schnell 및 Dev 버전입니다. Dev가 Schnell에 비해 품질이 좀 더 좋지만, 더욱 고성능 GPU를 요구하며 상업적으로 사용이 불가합니다.
공식 UNET 모델 파일은 Schnell 버전은 이곳에서 다운로드 하시면 되며, Dev 버전은 이곳에서 다운로드 가능합니다.













