2026-06-19
音频生成大模型开源
Noiz AI联合香港科技大学和清华大学开源了一款高性能音频生成大模型。该模型仅需4步即可生成高质量音频,在单张显卡上仅需0.24秒即可完成推理,效率极高。模型还能理解时间戳,实现精准的音频时序控制。这一开源成果大幅降低了音频AI应用的技术门槛,将使音乐创作、音效制作和语音合成等领域的AI应用更加普及。高校与企业联合开源的创新模式也值得行业借鉴。
2026-06-19
Noiz AI联合香港科技大学和清华大学开源了一款高性能音频生成大模型。该模型仅需4步即可生成高质量音频,在单张显卡上仅需0.24秒即可完成推理,效率极高。模型还能理解时间戳,实现精准的音频时序控制。这一开源成果大幅降低了音频AI应用的技术门槛,将使音乐创作、音效制作和语音合成等领域的AI应用更加普及。高校与企业联合开源的创新模式也值得行业借鉴。