国内网络环境下,从魔搭下载 → 格式转换 → ComfyUI 配置的完整流程
Z-Image-Turbo 是通义实验室(Tongyi-MAI)推出的高效图像生成模型,采用单流 Diffusion Transformer(DiT)架构,6B 参数,仅需 8 步推理 即可生成高质量图片,可在 16G 显存设备上运行。
模型有两个来源:
| 来源 | 地址 | 格式 | 说明 |
|---|---|---|---|
| 官方原版 | Tongyi-MAI/Z-Image-Turbo | Diffusers 格式 | 需转换才能在 ComfyUI 使用 |
| ComfyUI 预制版 | Comfy-Org/z_image_turbo | ComfyUI 原生格式 | 开箱即用,但国内下载困难 |
pip install -U huggingface_hub
export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download Comfy-Org/z_image_turbo --local-dir ./z_image_turbo
结果:国内网络无法连接 huggingface.co。即使使用 hf-mirror.com,其 CDN(CloudFront/Xet Bridge)对大文件传输频繁超时,10 个文件中有 7 个反复断连,无法完成下载。
pip install modelscope
modelscope download --model Tongyi-MAI/Z-Image-Turbo --local_dir ./z_image_turbo
结果:魔搭国内镜像稳定,约 12 分钟下载完 26 GB(32 个文件),全程无断连,支持断点续传。
| 维度 | HuggingFace | hf-mirror | 魔搭 ModelScope |
|---|---|---|---|
| 连通性 | ❌ 被墙 | ⚠️ 镜像可达但 CDN 超时 | ✅ 稳定 |
| 大文件支持 | ❌ | ⚠️ 频繁断连 | ✅ 支持断点续传 |
| 下载速度 | — | 5~15 MB/s(不稳定) | 8~15 MB/s(稳定) |
| 格式 | ComfyUI 原生 | ComfyUI 原生 | Diffusers 格式需转换 |
pip install modelscope safetensors
modelscope download --model Tongyi-MAI/Z-Image-Turbo --local_dir ./z_image_turbo
下载后的文件结构:
z_image_turbo/
├── transformer/ ← 3 个分片(主模型,共 ~22.8 GB)
│ ├── diffusion_pytorch_model-00001-of-00003.safetensors (9.29 GB)
│ ├── diffusion_pytorch_model-00002-of-00003.safetensors (9.29 GB)
│ └── diffusion_pytorch_model-00003-of-00003.safetensors (4.35 GB)
├── text_encoder/ ← 3 个分片(文本编码器,共 ~7.4 GB)
│ ├── model-00001-of-00003.safetensors (3.69 GB)
│ ├── model-00002-of-00003.safetensors (3.71 GB)
│ └── model-00003-of-00003.safetensors (95 MB)
├── vae/ ← VAE(即 Flux VAE,160 MB)
│ └── diffusion_pytorch_model.safetensors
├── tokenizer/ ← 分词器
└── z_image_convert_original_to_comfy.py ← 官方转换脚本
使用项目自带的转换脚本,将 diffusers 格式的 key 命名转换为 ComfyUI 认识的形式:
python z_image_convert_original_to_comfy.py \
z_image_turbo_bf16.safetensors \
transformer/diffusion_pytorch_model-00001-of-00003.safetensors \
transformer/diffusion_pytorch_model-00002-of-00003.safetensors \
transformer/diffusion_pytorch_model-00003-of-00003.safetensors
脚本做了三件事:
all_final_layer.2-1. → final_layer. 等ComfyUI 要求文本编码器为单文件 qwen_3_4b.safetensors,而魔搭版是 3 个分片:
python -c "
import safetensors.torch as st
shards = [
'text_encoder/model-00001-of-00003.safetensors',
'text_encoder/model-00002-of-00003.safetensors',
'text_encoder/model-00003-of-00003.safetensors',
]
out = {}
for f in shards:
out.update(st.load_file(f))
st.save_file(out, 'qwen_3_4b.safetensors')
print('合并完成:', len(out), 'keys')
"
输出:qwen_3_4b.safetensors(约 8.04 GB,398 个 key)
魔搭的 VAE 配置显示 "_name_or_path": "flux-dev",即它就是 Flux VAE。ComfyUI 期望文件名是 ae.safetensors,直接重命名:
mv vae/diffusion_pytorch_model.safetensors ae.safetensors
| 文件 | 目标路径(ComfyUI 目录下) |
|---|---|
z_image_turbo_bf16.safetensors | models/diffusion_models/ |
qwen_3_4b.safetensors | models/text_encoders/ |
ae.safetensors | models/vae/ |
注意:主模型不是放在checkpoints/,而是diffusion_models/—— 这是 ComfyUI 新版对不同架构模型的区分。
ComfyUI/models/
├── diffusion_models/
│ └── z_image_turbo_bf16.safetensors (12.3 GB)
├── text_encoders/
│ └── qwen_3_4b.safetensors (8.04 GB)
└── vae/
└── ae.safetensors (160 MB)
supported_models.py 中有 ZImage 类),无需额外安装自定义节点qwen25_tokenizer/ 已内置于 comfy/text_encoders/ 中TextEncodeZImageOmni 已内置在 nodes_zimage.py 中| 参数 | 推荐值 | 说明 |
|---|---|---|
| 采样器 | DPM++ 2M / DDIM | 蒸馏模型专用 |
| 步数 | 8 | 蒸馏模型,多步不提升质量 |
| CFG | 1.0 | 蒸馏模型不使用 CFG |
| VAE | ae.safetensors | 即 Flux VAE |
| 分辨率 | 1024×1024 | 推荐分辨率 |
官方工作流示例:ComfyUI Z-Image Examples
原因:模型文件放在了 checkpoints/ 目录。Z-Image 的 DiT 架构需要放在 diffusion_models/。
解决:移动到 models/diffusion_models/ 即可。
魔搭天然支持断点续传,重新执行同样的命令会自动续传。
使用模型自带的 VAE(即 Flux VAE),重命名为 ae.safetensors 放入 models/vae/ 即可。
# 1. 安装依赖
pip install modelscope safetensors
# 2. 从魔搭下载模型
modelscope download --model Tongyi-MAI/Z-Image-Turbo --local_dir ./z_image_turbo
# 3. 转换主模型
cd z_image_turbo
python z_image_convert_original_to_comfy.py z_image_turbo_bf16.safetensors \
transformer/diffusion_pytorch_model-00001-of-00003.safetensors \
transformer/diffusion_pytorch_model-00002-of-00003.safetensors \
transformer/diffusion_pytorch_model-00003-of-00003.safetensors
# 4. 合并文本编码器
python -c "
import safetensors.torch as st
shards = ['text_encoder/model-00001-of-00003.safetensors',
'text_encoder/model-00002-of-00003.safetensors',
'text_encoder/model-00003-of-00003.safetensors']
out = {}
for f in shards:
out.update(st.load_file(f))
st.save_file(out, 'qwen_3_4b.safetensors')
"
# 5. 重命名 VAE
mv vae/diffusion_pytorch_model.safetensors ae.safetensors
# 6. 复制到 ComfyUI
copy z_image_turbo_bf16.safetensors ComfyUI/models/diffusion_models/
copy qwen_3_4b.safetensors ComfyUI/models/text_encoders/
copy ae.safetensors ComfyUI/models/vae/
📅 2026-06-09 · 🤖 Z-Image-Turbo (6B, 8-step distilled) · 🖥️ ComfyUI 内置 ZImage 支持 · 🪟 Windows 11 + Python 3.11