基于 S3-DiT 架构的 60 亿参数大模型。原生支持中英双语,捕捉微小纹理与光影。 不管是古诗词意境还是现代设计,Z-Image 都能精准呈现。
拒绝妥协的 60 亿参数规模,为您带来壁纸级精度的创作体验。
未经蒸馏的 Base 版本,捕捉 Turbo 版本可能忽略的微小纹理、光影过渡和背景细节。
文本与图像特征同流处理。比以往更“懂”你的提示词,复杂逻辑不再混淆。
庞大中文数据集原生训练。无论是古诗词意境还是汉字排版,都能精准呈现。
拥有更完整的特征空间,让你的 LoRA 和微调训练收敛更快、泛化性更强。
得益于 S3-DiT 架构,Z-Image 能像 GPT 处理文本一样处理图像。颜色绑定、空间关系、多主体互动,一切尽在掌控。
Prompt:
"一只猫坐在红色的椅子上,旁边放着蓝色的球,窗外是下雪的森林"
分享你的 Z-Image 创作