파라미터
12B
회사
Black Forest Labs
오픈소스
Schnell (Apache 2.0)
Pro 가격
$0.04/image
아키텍처
DiT + Flow Matching
최대 해상도
4MP (2048x2048)
소개
Flux는 Stable Diffusion을 만든 연구원들이 설립한 팀인 Black Forest Labs가 개발한 생성적 AI 이미지 생성 분야에서 중요한 도약을 나타냅니다. Flux는 출시 이후 텍스트 설명을 기성 플레이어에 필적하거나 능가하는 놀라운 시각적 요소로 변환하는 것으로 빠르게 인정을 받았으며, 특히 이미지 내의 명확하고 읽기 쉬운 텍스트를 렌더링하는 데 탁월한 능력을 발휘했습니다. 이는 다른 AI 이미지 생성기를 괴롭혀온 지속적인 과제입니다.
Flux의 기술적 기반은 DiT(확산 변환기) 접근 방식을 사용하여 변환기와 확산 모델을 결합한 정교한 120억 매개변수 하이브리드 아키텍처입니다. 이는 기존 확산 기술에 비해 더 효율적이고 고품질의 이미지 생성을 가능하게 하는 "흐름 매칭" 방법과 결합됩니다. 그 결과 탁월한 신속한 준수, 사실적인 출력, 정확한 인체 해부학(특히 손과 얼굴), 그리고 무엇보다도 AI 이미지 모델 중 최고의 텍스트 렌더링이 가능해졌습니다.
Flux는 다양한 요구 사항을 충족할 수 있는 계층형 모델 제품군을 제공합니다. 완전한 오픈 소스 라이선스를 갖춘 초고속 생성을 위한 Schnell, 고품질 비상업적 실험을 위한 Dev, 전문 상업용 애플리케이션을 위한 Pro, 최대 해상도 및 포토리얼리즘을 위한 Ultra/Raw. 이 접근 방식을 통해 Black Forest Labs는 오픈 소스 커뮤니티 채택을 촉진하는 동시에 프리미엄 기능으로 수익을 창출하여 애호가와 기업 모두가 Flux에 액세스할 수 있도록 합니다.
장점
- +생성된 이미지의 업계 최고의 텍스트 렌더링
- +뛰어난 사실적 표현과 인체 해부학적 정확성
- +강력하고 신속한 준수 및 지시 따르기
- +전체 오픈소스 상업 라이선스를 갖춘 무료 Schnell 모델
- +고해상도 4MP 출력을 위한 울트라 모드
- +LoRA 성장 및 생태계 미세 조정
- +모든 계층에 걸쳐 경쟁력 있는 API 가격
- +다중 액세스 옵션(웹, API, 로컬 배포)
단점
- -전체 모델에는 로컬 사용을 위해 상당한 하드웨어가 필요합니다.
- -Stable Diffusion보다 작은 생태계(더 적은 커뮤니티 모델)
- -개발 모델 라이선스 복잡성(로컬 규칙과 플랫폼 규칙이 다름)
- -Midjourney에 비해 예술적 스타일이 덜함
- -영어가 아닌 텍스트 렌더링의 안정성이 떨어짐
- -커뮤니티 튜토리얼 및 리소스가 더 적은 최신 모델
주요 기능
업계 최고의 텍스트 렌더링
이미지 내에서 명확하고 읽기 쉽고 철자가 정확한 텍스트를 생성하는 탁월한 기능은 이전 모델에 비해 크게 발전한 것입니다. 표지판, 로고, 포스터 및 브랜드 콘텐츠에 대한 신뢰성
강력한 포토리얼리즘
정확한 인체 해부학, 자연스러운 피부 질감, 적절한 조명 물리학, 전문 사진에 필적하는 일관되고 미세한 디테일을 통해 매우 사실적인 이미지를 생성합니다.
탁월한 신속한 준수
여러 요소가 포함된 복잡하고 상세한 프롬프트를 정확하게 해석하고 따릅니다. 구성, 스타일, 색상 및 공간 관계에 대한 구체적인 지시에 잘 반응합니다.
Schnell(빠른) 모델
속도에 최적화된 Apache 2.0 오픈 소스 모델입니다. 단 4단계(초)만에 고품질 결과를 생성합니다. 제한 없이 완전한 상업적 사용이 허용됩니다.
개발 모델
개발 및 실험을 위해 Pro에 가까운 품질을 제공하는 개방형 모델입니다. Pro 모델에서 직접 증류되었습니다. 비상업적 로컬, API 플랫폼을 통한 상업용
Pro 및 Pro 1.1 모델
최고의 품질, 최고의 신속한 준수, 최고의 디테일을 갖춘 상용 플래그십 모델입니다. Pro 1.1은 더 빠른 생성 시간으로 향상된 품질을 제공합니다.
울트라 모드(4MP)
탁월한 디테일, 고급 조명 효과 및 고해상도의 정확한 텍스트 렌더링을 통해 최대 2048x2048(4메가픽셀)의 이미지를 생성합니다.
원시 모드
진정한 사진의 미학을 만들어내는 특수 모드. "AI 룩"을 피하는 인물 사진, 제품 사진 및 사실적인 이미지에 적합합니다.
LoRA 미세 조정
10~20개의 이미지를 사용하여 사용자 정의 스타일, 캐릭터 또는 브랜드 아이덴티티를 교육합니다. Replicate, Together.ai, 로컬 설정을 통해 사용할 수 있습니다. 여러 LoRA를 결합할 수 있습니다.
FLUX.1 도구 및 ControlNet
생성된 이미지에 대한 정밀한 구조 제어를 위한 인페인팅, 아웃페인팅, redux 변형 및 ControlNet 지원(Canny edge, Depth map)
추천 대상
텍스트가 많은 디자인 및 브랜딩
명확하고 읽기 쉬운 텍스트가 필요한 로고, 포스터, 소셜 미디어 그래픽, 제품 모형 및 마케팅 자료를 만듭니다. Flux의 텍스트 렌더링 기능은 타의 추종을 불허하므로 티셔츠 디자인부터 이벤트 배너까지 이미지와 타이포그래피를 결합한 모든 디자인에 이상적인 선택입니다.
사실적인 콘텐츠 제작
사실적인 제품 사진, 스톡 스타일 이미지, 인물 사진, 편집 콘텐츠를 생성합니다. Raw 모드는 진정한 사진 미학을 구현하는 반면 Ultra 모드는 인쇄 및 대형 디스플레이에 적합한 고해상도 출력을 제공합니다.
맞춤형 AI 모델 개발
10~20개의 훈련 이미지만으로 특정 스타일, 캐릭터 또는 브랜드 아이덴티티에 대한 LoRA 적응을 훈련합니다. Flux의 오픈 소스 에코시스템은 여러 플랫폼을 통한 미세 조정을 지원하며 모델은 API를 통해 배포하거나 로컬에서 실행하여 완전한 제어를 수행할 수 있습니다.
로컬 및 개인 이미지 생성
완벽한 개인정보 보호를 통해 무제한 세대 동안 Schnell 또는 Dev 모델을 자체 하드웨어에서 로컬로 실행하세요. ComfyUI는 복잡한 파이프라인을 위한 노드 기반 워크플로 편집기를 제공하는 반면, 양자화된 버전은 소비자 GPU에 도달할 수 있는 하드웨어 요구 사항을 제공합니다.
요금제
FLUX.1 Schnell
- Apache 2.0 오픈 소스 라이선스
- 4단계 빠른 생성(초)
- 전체 상업적 사용 허용
- 로컬 또는 API 배포 옵션
- 매우 빠른 속도에서도 좋은 품질
- 커뮤니티 LoRA 지원
FLUX.1 Dev
비상업적인 지역; 플랫폼을 통한 상업
- Hugging Face의 오픈 웨이트
- Near-Pro 품질 출력
- 로컬 사용을 위한 비상업적 라이센스
- Replicate/Fal.ai API를 통한 상용화
- 개발 및 프로토타이핑에 적합
- LoRA 훈련 지원
FLUX 1.1 Pro
BFL API 또는 파트너 플랫폼을 통해
- 최고 품질의 출력 가능
- 최고의 신속한 준수 및 세부 사항
- 전체 상용 라이센스 포함
- 원래 Pro보다 빠른 생성
- 여러 API 파트너를 통해 액세스
- 엔터프라이즈급 안정성
FLUX 1.1 Pro Ultra
최대 4MP의 고해상도 모드
- 최대 4MP 해상도(2048x2048)
- 뛰어난 디테일과 질감
- 고급스러운 조명과 분위기
- 이미지 생성당 ~10초
- 고해상도의 텍스트 렌더링
- 상업용 라이센스 포함
Web Platforms
Flux1.ai, FluxPro.ai, getimg.ai 등
- 기술적인 설정이 필요하지 않습니다.
- 사용자 친화적인 웹 인터페이스
- 다중 Flux 모델 액세스
- 상업용 라이센스 포함
- 무료 등급 또는 평가판 이용 가능
- 신용 기반 결제 시스템
비교
Flux vs Stable Diffusion
Flux와 Stable Diffusion은 모두 국소적으로 사용할 수 있지만 서로 다른 장점을 제공합니다. Flux는 훨씬 더 나은 출력 품질, 텍스트 렌더링 및 즉각적인 준수를 제공합니다. Stable Diffusion은 커뮤니티 모델, LoRA 및 확장으로 구성된 훨씬 더 큰 생태계를 갖추고 있으며 이전 버전에 대한 하드웨어 요구 사항도 더 낮습니다.
Flux이(가) 뛰어난 점
- +생성된 이미지의 텍스트 렌더링이 훨씬 향상되었습니다.
- +광범위한 조정 없이 기본 품질 향상
- +뛰어난 신속한 접착력과 포토리얼리즘
- +흐름 일치를 통해 더욱 효율적인 아키텍처
Stable Diffusion이(가) 뛰어난 점
- +Stable Diffusion은 훨씬 더 큰 모델 생태계(수천 개의 모델)를 가지고 있습니다.
- +SD 1.5는 훨씬 낮은 수준의 하드웨어(6GB VRAM)에서 실행됩니다.
- +Stable Diffusion에는 더 많은 ControlNet 변형 및 확장 기능이 있습니다.
- +더 많은 튜토리얼과 리소스를 갖춘 대규모 커뮤니티
Flux vs Midjourney
Flux와 Midjourney는 다양한 창의적 요구 사항을 목표로 합니다. Midjourney는 뛰어난 구도와 분위기로 가장 미적으로 아름답고 예술적인 이미지를 만들어냅니다. Flux는 텍스트 렌더링, 포토리얼리즘, 신속한 준수, 해부학적 정확성 등 기술적 정확성이 뛰어납니다. Midjourney는 구독 전용입니다. Flux는 무료 오픈 소스 옵션을 제공합니다.
Flux이(가) 뛰어난 점
- +이미지에서 훨씬 뛰어난 텍스트 렌더링
- +무료로 로컬에서 사용할 수 있는 오픈 소스 모델
- +더 나은 사실감과 해부학적 정확성
- +유연한 이미지별 API 가격과 구독 비교
Midjourney이(가) 뛰어난 점
- +Midjourney는 예술적 품질과 미학이 뛰어납니다.
- +Midjourney는 일관성을 위해 스타일 및 문자 참조를 제공합니다.
- +Midjourney는 더욱 세련된 사용자 경험을 제공합니다.
- +Midjourney에는 더 큰 창작 커뮤니티가 있습니다.
