微软发布声音克隆技术Personal Voice 提供1分钟样本即可生成AI语音
站长网2023-11-17 11:17:141阅
微软近日发布了一项名为Personal Voice的新技术,该技术可以克隆用户的声音,并且能够复制出与原声音完全一致的人工智能语音。用户只需提供1分钟的语音样本,Personal Voice就能在几秒钟内生成相应的AI语音。
这项技术支持多达100种不同语言的语音输出,包括中文、西班牙语、德语等。Personal Voice利用设备端的机器学习技术,确保用户的个人信息安全,并与LiveSpeech进行无缝集成,让用户在与他人交流时可以使用Personal Voice的AI语音。
除了为语音助手、游戏、语言配音等应用提供个性化声音,Personal Voice还在娱乐、媒体领域有着广泛的应用。通过将用户的本声配音应用于故事、有声书、播客、视频等内容,可以使这些内容更加贴近用户,提升沉浸感。
微软还和海尔合作,将个性化声音引入其智能音箱和更智能的家电产品中,为品牌带来了创新的用户体验。微软的Personal Voice功能为用户提供了在短时间内实时复制自己声音的机会,使智能音箱更具家庭氛围,丰富了用户的生活。
该功能将在西欧、美国东部和东南亚地区率先上线,并于12月1日上线公共预览版。
微软强调了Personal Voice的责任使用。用户必须明确同意并录制声明,以确保对个人和社会权益的保护。微软承诺以有限的注册方式提供Personal Voice,仅限于特定用途。符合资格的客户可以将Personal Voice API集成到支持个性化声音的应用中,包括智能设备的语音助手和游戏中角色声音的定制。
此外,微软还在Personal Voice生成的声音中添加水印,以便用户可以识别是否使用了Azure AI Speech,并确定使用的是哪个声音。这为合规性和透明性提供了一层保障。
0001
评论列表
共(0)条相关推荐
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片「Sohu」,2人公司估值3400万刀
【新智元导读】最近,两位哈佛辍学生共同创立的AI芯片公司,估值已达3400万美元,并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍,而单价吞吐量更是高达140倍。像Pika一样的神级创业故事又要再次上演了?两位哈佛退学的年轻人,想要制造一款专用于大语言模型加速的AI加速器芯片,将于2024年第三季度交付,推理性能达H100的10倍。0000智谱AI完成B-4轮融资 腾讯阿里参投
据36氪消息,智谱AI近日完成了B-4轮融资,腾讯和阿里等互联网巨头参与投资,其估值达到了约10亿美元。针对上述信息,智谱AI方不予置评,腾讯集团和阿里云智能集团回复称已参与投资。智谱AI是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型GLM-130B,基于此模型打造了ChatGLM(chatglm.cn)。站长网2023-09-20 08:41:260000《互联网广告管理办法》实施在即,种草营销、直播带货要变天了?
近日,国家市场监管总局公布了最新修订的《互联网广告管理办法》(以下简称《办法》),自2023年5月1日起正式施行。种草营销泛滥、直播带货乱象频出等被社会集中诟病的互联网广告问题,在《办法》中得到明确监管规制。作为此前尚未“收口”的唯一主要内容平台,腾讯微信已于4月25日响应新规,发布《关于微信公众号营销内容合规规范的通知》。可以预料,其他更早“收口”的内容平台也将陆续出台最新管理政策。站长网2023-05-12 20:29:160000谷歌推具备空间推理能力的视觉语言模型SpatialVLM
要点:1、谷歌提出了SpatialVLM,旨在赋予视觉语言模型空间推理能力。2、研究者利用现实世界数据训练SpatialVLM,弥补了常见数据集对空间信息的限制。3、通过生成大规模空间VQA数据集,研究者成功使视觉语言模型具备直接空间推理和链式思维能力。站长网2024-02-18 15:27:180000小米高管上手小米14 最快在本月底正式发布
小米产品经理魏思琪透露,她已经拿到了小米14新品的试用机会,并对其中的人像样张赞不绝口。据悉,小米14预计将成为小米史上性能最强劲的旗舰手机,最快在本月底正式发布。小米14将搭载高通骁龙8Gen3,与高通骁龙8Gen2相比,骁龙8Gen3增加了一个性能核心,减少了一个能效核心,并且超大核升级为CortexX4,使得安兔兔总成绩超过了200万分。站长网2023-10-09 09:53:540000