MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
**划重点:**
1. 🔍 **开源创新**:MIT、清华大学与加拿大AI初创公司MyShell联手推出开源语音克隆工具OpenVoice,在克隆用户声音方面,采用了概念简单但高效的方法,大幅减少计算资源消耗。
2. 🌐 **功能强大**:OpenVoice提供几乎即时的语音克隆,同时具备其他克隆平台所不具备的细致控制,包括语调、情感、节奏、停顿和语调等多方面的精确调整。
3. 💼 **MyShell商业模式**:MyShell计划通过开源OpenVoice,通过其Web应用提供月度订阅、第三方机器人创建者推广费用以及人工智能培训数据费用等多方面赚取收入。
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显更少的计算资源。
该工具不仅具备语音克隆的基本功能,而且提供了细致入微的控制选项,涵盖语调、情感、节奏、停顿和语调等多个方面。这意味着用户可以通过OpenVoice生成具有个性化风格的语音克隆,而无需花费大量时间和计算资源。
在作者的非科学性测试中,使用OpenVoice在HuggingFace平台上生成了一个相对令人信服的语音克隆,仅需几秒钟的随机语音即可完成。与其他语音克隆应用不同的是,用户无需朗读特定文本片段,只需随意说几秒钟的话,即可立即生成可播放的语音克隆,读取提供的文本提示。
OpenVoice的背后是两个主要的AI模型:文本到语音(TTS)模型和“音调转换器”模型。TTS模型控制“风格参数和语言”,并且通过来自两名英语演讲者(美国和英国口音)、一名中文演讲者和一名日本演讲者的30,000个句子的音频样本进行训练。与此同时,音调转换器模型则通过来自20,000多名不同演讲者的300,000个音频样本进行训练。
通过将用户提供的录音音频的音调与TTS模型的“基础发声者”结合起来,这两个模型共同可以复制用户的语音,并改变其“音调颜色”或文本所表达的情感表达。与其他方法相比,OpenVoice的方法在克隆语音时大大减少了计算资源的使用,包括Meta的竞争对手Voicebox。
MyShell,作为OpenVoice的推动者,成立于2023年,总部位于加拿大艾伯塔省的卡尔加里,通过由INCE Capital主导的560万美元种子轮融资以及Folius Ventures、Hashkey Capital、SevenX Ventures、TSVC和OP Crypto的额外投资,已经吸引了超过400,000名用户。该初创公司通过其Web应用提供各种基于文本的AI角色和机器人,包括一些带有不同“个性”的角色,还提供动态GIF制作工具和用户生成的基于文本的角色扮演游戏。
尽管MyShell将OpenVoice开源,但该公司仍通过其Web应用的月度订阅、希望在应用程序内推广其产品的第三方机器人创建者费用以及人工智能培训数据费用等多方面赚取收入。这种商业模式旨在为MyShell提供可持续的经济基础,从而在开源和商业利益之间找到平衡。
项目体验网址:https://top.aibase.com/tool/openvoice
论文网址: https://arxiv.org/abs/2312.01479
小米Civi 4 Pro外观揭晓:14 Pro同款微曲屏、14 Ultra同款科纳皮
快科技3月19日消息,小米Civi4Pro已经官宣,将于3月21日正式发布。官方刚刚公布出了新机在设计方面的具体方案,首先是正面采用了小米14Pro同款的全等深微曲屏。这种屏幕在视觉上连贯流畅,同时兼顾了直屏的视觉体验,可以说是终结直曲之争的最完美的形态。更重要的是,全等深微曲屏四边四角等R弯曲,这块屏幕就像微微浮在空中,不仅没有猫耳朵,还做到了几乎零误触。站长网2024-03-19 17:01:280000印度 IT 服务提供商 Wipro 推出 Wipro ai360:未来三年在人工智能领域投资 10 亿美元
印度IT服务提供商Wipro周三宣布计划在未来三年内投资10亿美元用于人工智能(AI)领域。该投资将重点扩展AI、大数据和分析解决方案,以及开发新的研发平台,公司在一份交易文件中表示。图片来自Wipro此前不到一周,竞争对手塔塔咨询服务公司表示计划培训2.5万名工程师,使其获得微软的Azure开放AI认证。站长网2023-07-13 17:55:340000谷歌发布新型 AI 工具「MusicLM」:文字描述生成音乐
谷歌在日前的I/O大会发布了新型AI工具「MusicLM」能把文字描述转化为音乐。在Web、Android或iOS上的AITestKitchen应用程序中,用户可以输入提示,如「晚宴深情爵士乐」或「创建具有催眠效果的工业声音」,让MusicLM将生成多个版本的音乐。站长网2023-05-12 10:47:270000All in短视频?被传面临“生死大考”后,逛逛将改名“淘宝视频”
上线两年多、一直占据首页流量C位的淘宝逛逛,迎来了生死大考。近日,据媒体报道,淘宝逛逛被曝在年底之前被要求完成相应的任务目标,否则将面临让出淘宝App首页tab位、甚至团队命运都岌岌可危的局面。一位知情人士称,逛逛目前距离目标“还相隔甚远”,处于背水一战的状态。而新播场进一步了解到,逛逛或将改名为“淘宝视频”,进一步强调产品属性、全面拥抱短视频。站长网2023-06-29 19:26:280000三星重点推广 Galaxy AI,在 AI 智能手机竞赛中将苹果远远甩在身后
三星公司日前在其Unpacked活动上一开场便直接介绍GalaxyAI功能,这表明该公司认为人工智能对于推动高端设备增长至关重要。在活动开始的近半小时内,三星没有提及新的GalaxyS24系列及其升级功能,而是将最大的关注点放在了GalaxyAI上。GalaxyAI功能介绍站长网2024-01-20 10:30:350000