4步出声单卡0.24秒，Noiz AI联合港科大清华开源音频生成大模型

2026-06-19

音频生成大模型开源

Noiz AI联合香港科技大学和清华大学开源了一款高性能音频生成大模型。该模型仅需4步即可生成高质量音频，在单张显卡上仅需0.24秒即可完成推理，效率极高。模型还能理解时间戳，实现精准的音频时序控制。这一开源成果大幅降低了音频AI应用的技术门槛，将使音乐创作、音效制作和语音合成等领域的AI应用更加普及。高校与企业联合开源的创新模式也值得行业借鉴。

AI资源导航

资源分类

4步出声单卡0.24秒，Noiz AI联合港科大清华开源音频生成大模型

音频生成大模型开源