Z-Image 造相-阿里开源的快速文生图模型,拥有60 亿个参数,轻松适配16G 显存的消费级设备

项目介绍

Z-Image 是一款功能强大且高效的图像生成模型,拥有60 亿个参数。目前有三种变体:

  • 🚀 Z-Image-Turbo – Z-Image 的精简版,仅需8 次函数评估 (NFE),即可达到甚至超越领先竞争对手的性能。它在企业级 H800 GPU 上可实现⚡️亚秒级推理延迟⚡️,并能轻松适配16G 显存的消费级设备。它在照片级图像生成、双语文本渲染(中英文)以及强大的指令执行能力方面表现卓越。
  • 🧱 Z-Image-Base – 未经精简的基础模型。通过发布此版本,我们旨在充分释放社区驱动的微调和自定义开发的潜力。
  • ✍️ Z-Image-Edit – Z-Image 的一个衍生版本,专为图像编辑任务而优化。它支持创意图像到图像的生成,并具备强大的指令跟随功能,允许根据自然语言提示进行精确编辑。

展示

📸照片级真实感Z-Image-Turbo能够生成逼真的照片级图像,同时保持优异的美学品质。

Z-Image 造相-阿里开源的快速文生图模型,拥有60 亿个参数,轻松适配16G 显存的消费级设备

📖精准的双语文本渲染Z-Image-Turbo擅长精准渲染复杂的中文和英文文本。

Z-Image 造相-阿里开源的快速文生图模型,拥有60 亿个参数,轻松适配16G 显存的消费级设备

💡 提示增强和推理:提示增强器赋予模型推理能力,使其能够超越表面描述并挖掘潜在的世界知识。

Z-Image 造相-阿里开源的快速文生图模型,拥有60 亿个参数,轻松适配16G 显存的消费级设备

🧠创意图像编辑Z-Image-Edit对双语编辑指令有很强的理解力,能够进行富有想象力和灵活的图像变换。

Z-Image 造相-阿里开源的快速文生图模型,拥有60 亿个参数,轻松适配16G 显存的消费级设备

🏗️ 模型架构

我们采用了一种可扩展的单流数字图像处理(S3-DiT)架构。在该架构中,文本、视觉语义标记和图像VAE标记在序列级别上连接起来,作为统一的输入流,与双流方法相比,最大限度地提高了参数效率。

Z-Image 造相-阿里开源的快速文生图模型,拥有60 亿个参数,轻松适配16G 显存的消费级设备

项目链接

模型下载

⏬ 下载

pip install -U huggingface_hub
HF_XET_HIGH_PERFORMANCE=1 hf download Tongyi-MAI/Z-Image-Turbo

开源地址

https://github.com/Tongyi-MAI/Z-Image

demo

Hugging Face昨天还可以,今天就删了,大家用来生成色图,导致最开始没限制的模型demo,开始限制,到现在直接删了

modelscope魔搭:https://www.modelscope.cn/aigc/imageGeneration?tab=advanced&versionId=469191&modelType=Checkpoint&sdVersion=Z_IMAGE_TURBO&modelUrl=modelscope%3A%2F%2FTongyi-MAI%2FZ-Image-Turbo%3Frevision%3Dmaster

免责声明:

本站提供的资源,都来自网络,版权争议与本站无关,所有内容及软件的文章仅限用于学习和研究目的。不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,我们不保证内容的长久可用性,通过使用本站内容随之而来的风险与本站无关,您必须在下载后的24个小时之内,从您的电脑/手机中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。侵删请致信E-mail:i@zcjun.com

其他:  侵删处理  – 关于本站   –  版权声明  –  隐私政策

AI工具实用工具推荐

闪电说:AI语音输入法,比打字快 4 倍,完全免费,无需注册

2025-12-4 18:21:06

AI工具实用工具推荐

灵光全模态AI助手-支付宝蚂蚁推出的 AI 助手,30秒即可生成应用,网页端手机端都支持

2025-12-4 18:22:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧