6月23日消息,在火山引擎FORCE原动力大会上,豆包大模型2.1 Pro、豆包视频生成模型 Seedance 2.5、Seedance 2.0 4K版、豆包图像创作模型Seedream 5.0 Pro、豆包音频生成模型1.0五大模型集中亮相。
其中,豆包音频生成模型1.0(Seed-Audio 1.0)正式发布,大幅降低高质量语音内容的规模化生产门槛。
豆包音频生成模型1.0支持在一次生成中同步编排角色对白、情绪语气、方言口音、背景音乐及拟音特效,一次性直出影视级的成品音效。
模型实现文生音频与参考音频的深度联动,在有声书、播客、长剧集等长音频创作中保持音色高度统一,大幅减少后期修音工作。
豆包音频生成模型1.0还支持0样本多模态参考,用户仅需输入一段描述,即可推理出与之匹配的声音特征。
整套音频模型补齐了豆包全链路创作的音频板块,搭配同场发布的图文、视频生成工具,文字、画面、音频创作全部实现 AI 一体化,给内容从业者提供了完整高效的一站式创作方案。
文章来源:
我爱百科网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!