目前最火、最知名的 AI 文生图「Stable Diffusion」其中的一位开发者独立创业新公司 Black Forest Lab 黑森林实验室,开发了一款新的文生图模型项目「FLUX.1」并且支持中文输入,拥有超强的语言理解和文本控制能力,共 3 款图片生成模型,其中有 2 个开源。
模型对比
用 Midjourney 最新的 v6.1 模型与 FLUX.1 Pro 进行了出图对比。虽然 FLUX.1 在艺术性和风格多样性上不及 Midjourney 丰富,但在清晰度、细节逼真度,复杂场景生成等方面与最新的 v6.1 模型不相上下,甚至在一些方面的表现超过了 v6.1。对比来源:优设 @夏花生。
尤其是在复杂英文文本生成、多人场景、提示词理解遵循等方面,FLUX.1 Pro 的表现会明显比 v6.1 好。Pro 可以准确处理多人场景,面部、手部细节不会扭曲崩坏;生成超长文本的时候,无论是内容还是排版都非常标准到位;还能有效防止提示词泄露的情况发生,准确生成画面内容。
一键整合包
一键整合包「FLUX.1」的 WebUI 就是基于 Stable Difussion WebUI forge,模型是 nf4 量化版轻量模型,nf4 比 nf8 在更小的体积下,实现了比 nf8 更好的生成效果,实测 6G 显存可玩,20 步出图大概在 30 秒左右。
下载好后解压出来,然后运行"启动webui.bat",等待自动跳转到 webui 界面,然后 Checkpoint 选择 FLUX.1 的 nf4 模型。
在线体验
如果你的电脑配置跑不动「FLUX.1」模型,也可以通过在线的方式来体验文生图,提供了三个版本 pro、dev、schnell,你可以输入文本内容、设置图像比例来生成图片。
https://pan.quark.cn/s/951a7d85d800