文本转语音AI工具哪个好用?Elevenlabs推新版本:支持28种语言 拥有100万用户
文章概要:
1. Elevenlabs推出新模型“Eleven 多语言v2”,支持28种语言文本转语音。
2. 与上一个版本相比,新模型实现了更好的语音真实性。
3. Elevenlabs计划推出AI语音共享平台,目标受众为媒体、游戏开发商等。
最近,Elevenlabs 推出了新模型“Eleven Multilingual v2”,可自动识别28种语言,并将文本转换为语音。
Elevenlabs表示,与其前一代模型相比,新模型“Eleven Multilingual v2”实现了更高的语音真实性。不管是合成生成的说话者声音还是声音克隆,所有语言中的语音特征都将得到保留,因此一个声音可以用于所有语言。通过Elevenlabs发布的演示视频可以听出新模型语音质量的提升。
随着新模型“Eleven 多语言v2”的发布,Elevenlabs也结束了测试阶段。该公司透露,其技术现已拥有超过100万用户。未来,Elevenlabs还计划推出一项新功能,允许用户在平台上共享语音。其远大的愿景是让所有内容都可以用任意语言和任意声音表达。
Elevenlabs的目标用户包括媒体公司、游戏开发商、出版商和独立作者等。其部分客户包括D-ID、Storytel、ScienceCast、TheSoul Publishing、Embark Studios等公司。Elevenlabs表示,其专有音频技术完全由公司内部开发。
Elevenlabs 现在支持的语言包括:
中文、韩语、荷兰语、土耳其语、瑞典语、印度尼西亚语、菲律宾语、日语、乌克兰语、希腊语、捷克语、芬兰语、罗马尼亚语、丹麦语、保加利亚语、马来语、斯洛伐克语、克罗地亚语、高级阿拉伯语和泰米尔语。英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语过去和现在均受支持。
产品官方网址:
https://elevenlabs.io/blog/multilingualv2/
Hugging Face文生成图模型aMUSEd 几秒钟内就能生成AI图像
划重点:🔍HuggingFace推出的aMUSEd模型可以在几秒钟内生成图像,比其他竞争对手如StableDiffusion更快。🔍aMUSEd使用了一种轻量级的文本到图像模型,基于Google的MUSE模型。🔍aMUSEd采用了MaskedImageModel(MIM)架构,这种架构减少了推理步骤,提高了生成速度和可解释性。站长网2024-01-05 10:03:500000这些行为或将永久封禁账号?抖音这次“憋”不住了
“走过路过机会别错过,机会难得,全场清仓处理,赔钱甩卖……”相信这样震耳欲聋的叫卖词,你一定在大街上听到过,说好的清仓最后一天,却能熬一年,“狼来了”次数一多,我们再也不相信所谓的清仓大甩卖了。站长网2023-09-06 18:51:020000软银 CEO 孙正义表示将从 「防御模式」转向「进攻模式」:聚焦人工智能领域
软银集团董事长兼首席执行官孙正义周三在软银股东大会上表示,该公司计划从「防守模式」转向「进攻模式」,并希望利用人工智能的繁荣。孙正义表示,「现在是转向进攻模式的时候了。过去几年里,我们一直专注于防守。三年前,我们手头现金不多。但由于一直处于防守模式,我们的现金储备已经达到了5万亿日元(约合353亿美元)。现在我们准备转向进攻模式了,我对此感到非常兴奋。」站长网2023-06-22 11:27:200000IBM 推出 watsonx 代码助手:助力企业开发者提升编码效率和准确性
站长之家(ChinaZ.com)10月27日消息:IBM今天推出了watsonxCodeAssistant,这是一个借助生成式人工智能技术,通过自然语言提示帮助企业开发者和IT运营人员更快、更准确地编码的助手。图片来自IBM站长网2023-10-27 09:37:510000流量+补贴+全域,抖音电商为何如此重视「大促重点货品」
年年618,年年有看点。2020年的618,直播电商如火如荼,“电商”从此有了新的内涵和玩法。到了今年,凭借短视频和直播成为行业新生力量的抖音电商,如今逐步深入了“货架”、“全域”新场景。与此同时,整个电商行业,也在迎来新的变化。站长网2023-06-26 00:57:300000