北门坛

搜索
查看: 379|回复: 0

PixArt-Sigma:华为发布的AI生图模型! 可直出4K图像!

[复制链接]

7563

主题

8559

帖子

2万

积分

超级长老

Rank: 8Rank: 8

积分
25850

活跃会员宣传达人优秀版主论坛元老

发表于 2024-3-13 19:50:10 | 显示全部楼层 |阅读模式
PixArt-Sigma:华为发布的AI生图模型! 可直出4K图像!PixArt-Sigma: Huawei's released AI raw image model! Can straighten out 4K images!
[color=rgba(0, 0, 0, 0.9)]这个由华为诺亚方舟实验室联合多个研究机构共同开发的项目,推出了一款名为PixArt-Σ的扩散变换器模型(DiT),它能够直接根据文本提示生成高达4K分辨率的图像。
[color=rgba(0, 0, 0, 0.9)]









[color=rgba(0, 0, 0, 0.9)]与之前的模型PixArt-α相比,PixArt-Σ在图像保真度和文本提示对齐方面都有了显著提升。它的训练效率也是一个亮点,通过从基础预训练开始,逐步引入更高质量的数据,实现了从“弱”到“强”的模型进化。






[color=rgba(0, 0, 0, 0.9)]两大进步:
[color=rgba(0, 0, 0, 0.9)]高质量训练数据:引入了更高质量的图像数据,配合更精确和详细的图像标题。
[color=rgba(0, 0, 0, 0.9)]高效的令牌压缩:在DiT框架内提出了一个新的注意力模块,能够压缩键和值,显著提高效率,从而支持超高分辨率图像的生成。
[color=rgba(0, 0, 0, 0.9)]这些改进使得PixArt-Σ在模型大小(0.6B参数)上远小于现有的文本到图像扩散模型,如SDXL(2.6B参数)和SD Cascade(5.1B参数),同时在图像质量和用户提示遵循能力上都有了显著提升。此外,PixArt-Σ生成4K图像的能力,为电影和游戏等行业的高质量视觉内容制作提供了强大支持。
[color=rgba(0, 0, 0, 0.9)]项目地址:
https://pixart-alpha.github.io/PixArt-sigma-project/


+10
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2025 beimen.alte.ca
快速回复 返回顶部 返回列表