随意转换声音,ElevenLabs发布“语音转语音”
语音生成式AI平台Elevenlabs在官网发布了“语音转语音”(STS)功能,可帮助用户将语音自动转换成别的语音,例如,上传了一段男声语音,可以自动转换成女声、老年或者儿童的声音。
传统的语音转换方法是,需要采集音频样本,然后提取基频、共振峰、时域和频域特征等,再进行去噪、归一化,整个流程非常繁琐复杂,而STS直接实现一键语音转换。
此外,STS还能对转换声音的强度、语气、表现力、风格进行可视化控制。不过STS目前只能转换24秒的语音,对于短广告、抖音、快手等短视频平台来说是足够用了。
免费体验地址:https://elevenlabs.io/voice-changer
STS技术简单介绍
Elevenlabs表示,STS的技术灵感来自人脸转换。我们经常会看到人脸合成应用,将自己的图像与某位明星的图像相结合,生成全新的人脸。
简单来说,实现这一技术是获取一张面部图片并映射其属性,然后通过神经网络和深度学习对性别、年龄、发型等属性进行修改、匹配,以完全特定的合成目标。
STS采取了同样的转换策略,提取用户上传语音的情感、语气和表达方式等,然后与转换目标语音进行比对、微调完成音频的过渡与匹配。
同时支持用户对语音进行可视化控制,例如,修改强度、音峰、情感等参数。
STS使用方法
STS的使用方法非常简单全程可视化控制,「AIGC开放社区」根据其免费账号体验了一下。
1)登录https://elevenlabs.io/voice-changer然后选择“Speech to Speech”语音到语音转换。
2)上传你要转换的语音,这里我们选择一个男性声音的三国演义介绍。
三国--原音,AIGC开放社区,23秒
上传的男声原音
3)对转换目标的参数进行设定,包括稳定器、清晰度、相似度、风格等,也可以直接选择“Add Voice”添加系统内置语音。这里我们选择一个Domi女声。
4)全部设定完毕后,点击下方的“Generate”开始自动合成。完毕后,可以直接下载语音。
目前,只能转换24秒的语音,但Elevenlabs表示,未来会突破这个限制。
谷歌10秒视频生成模型破世界记录!LLM终结扩散模型,效果碾压顶流Gen-2
【新智元导读】谷歌全新视频生成模型VideoPoet再次引领世界!十秒超长视频生成效果碾压Gen-2,还可进行音频生成,风格转化。AI视频生成,或许就是2024年下一个最前沿(juan)的领域。回看过去几个月,RunWay的Gen-2、PikaLab的Pika1.0,国内大厂等大波视频生成模型纷纷涌现,不断迭代升级。0002赵丽颖新妆爆火全网,“簪花生意”日入5万?
今生戴花,来世漂亮。一个小渔村,因为簪花的习俗,迎来了新机遇。数据显示,春节期间,以簪花闻名的蟳埔村接待游客36.1万人次,同比增长600%,旅游收入超过7000万元。这阵簪花潮也从春节一直火到了阳春三月,从线下旅拍,延伸出线上的“簪花生意”——在淘宝等电商平台上,仿“泉州簪花围”的饰品月销2000多件,按照108元的客单价算,有商家仅一个SKU就月入20万。0000iQOO12系列手机11月7日发布 首批搭载骁龙8Gen3
iQOO宣布将于11月7日发布iQOO12系列手机,该系列将首批搭载骁龙8Gen3平台。根据此前消息,iQOO12系列将采用居中单孔直/曲屏双方案,不再使用塑料屏幕支架,后置相机Deco采用圆角三摄,直立长焦换成潜望式长焦,支持120W快充。站长网2023-10-26 10:40:100000独立开发变现周刊(第119期):一个自学开发者创建一个月收入12.5万美元的软件公司
分享独立开发、产品变现相关内容,每周五发布(合集:ezindie.com)目录1、mrrartpro:用文本画图表2、talebook:一个简单的在线版个人书库。3、GoFullPage:一个网页截图浏览器扩展插件4、Movie-web:一个小的Web应用,方便观看电影和节目5、一个自学开发者创建一个月收入12.5万美元的软件公司1、mrrartpro:用文本画图表0000Meta 正准备推出新的人工智能聊天机器人角色以吸引年轻用户
据WSJ报道,Meta正在准备推出一款生成式AI聊天机器人,内部称为「GenAIPersonas」,目标用户为年轻人。据悉,这些机器人将以多个「人设」形式推出,旨在通过更加丰富多彩的行为方式吸引年轻用户,而且在过去一年中,聊天机器人应用程序ChatGPT成为增长最快的应用程序之一。报道称,Meta已在Instagram上测试了一些类似的聊天机器人。站长网2023-09-25 09:05:270000