您的位置：首页 >综合 > 正文

微软发布AI声音生成工具VALL-E，只需3秒音频即可模仿人说话

来源：IT之家2023-01-10 12:55:01 阅读量：8514

感谢本站的朋友OC_Formula的线索传递！

，微软最近发布了一款名为VALL—E的人工智能工具，它可以只用3秒钟的音频来模仿人类说话。

这个工具由6万小时的英语语音数据训练，使用特定语音的3秒片段生成内容与目前的许多人工智能工具不同，VALL—E可以复制说话者的情绪和语气，甚至说话者自己从未说过的话也可以模仿

本站了解到，康奈尔大学的一篇论文用VALL—E合成了几种声音，你可以在GitHub上听听AI合成的音频。

研究人员指出，在许多情况下，Vall—E的性能优于当前的文本到语音转换模型可是，该研究也写道，目前人工智能模型存在几个问题例如，文本提示中的一些单词可能发音不清楚，被完全省略或在输出中出现两次此外，这种模型目前很难模仿一些声音，尤其是带有口音的声音

像其他新的人工智能技术一样，VALL E也引起了安全和道德方面的担忧微软已经发布了一份关于VALL—E使用的道德声明，但是对于其未来的用途并没有明确的解释

目前微软Vall—E并没有开源微软在GitHub上创建了一个Vall—E资源库，但目前只包含一个描述文件

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。

最近更新

300款零食降价22%，良品铺子砍自己一刀2023-12-01
10月C级车:新能源下跌超两成A6L夺回年度销冠2023-12-01
你知道校宝在线是干什么的吗？下载最新校宝App了解2023-12-01
人人都用得起高阶智驾宝骏云朵灵犀版售价12.58万元起2023-12-01
马自达发布MX-5概念车预告2023-12-01
售15.38万-60.00万江铃福特全顺T8正式上市2023-12-01
售13.79万元，捷途X70PRO悦享MAX版上市2023-12-01
第六届进博会专访万豪国际集团大中华区总裁毛怡冰：今年80%的新开酒店会选2023-12-01
启辰VX6内饰官图正式发布将在年内正式上市2023-12-01
柯锐世携瓦尔塔、劲量汽车蓄电池，助力后市场连锁终端业务新增长2023-12-01
宝马与奔驰联手，在中国设合资公司运营超级充电网络2023-12-01
临洮税务：“精准滴灌”税惠赋能暖民生2023-11-30
领航智能时尚，ID.7VIZZION引领新能源潮流！2023-11-30
售8.88万，五菱缤果新增车型上市，竞争比亚迪海鸥2023-11-30
智享超电SUV领克08，4.6秒破百，续航超1200km2023-11-30
18.58万起，越野性能出色，车机升级，全新BJ40上市2023-11-30
昌联保典：香港保险的收益如何2023-11-30
潜力无限！未来10年，通用航空有望成新兴经济增长点2023-11-30
冬日严寒你的好朋友“火锅”已上线2023-11-30
10月荷兰新车销量同比下滑1.5%2023-11-30

最新资讯

精彩文章

太医管家家庭医生2.0升级重磅推出数字健康档

新疆“八大产业集群”建设开年势正旺

委员建议孕产妇生育医疗费和津贴全部纳入财政保

绿茶餐厅母公司上市在即，前景未卜

小米又入股了一家智能车载芯片公司，造车“芯”

热门文章