OpenAI发布升级版ASR模型Whisper3,计划开放API
站长网2023-11-07 15:21:200阅
划重点:
- OpenAI在开发者日发布了一系列开源模型,其中包括升级版的自动语音识别模型Whisper3。
- Whisper3具备多语言支持,可将音频内容转录成文本,还具备独特的时间戳功能,适用于制作字幕。
- OpenAI计划未来向用户开放Whisper3的API,以推动语音处理应用的发展。
在OpenAI的开发者日活动中,该人工智能初创公司发布了一系列开源模型,其中包括了升级版的自动语音识别(ASR)模型——Whisper3。这一模型具备多语言支持,可以将音频内容快速准确地转录成文本,并具备独特的时间戳功能,使其适用于制作字幕等应用。
最初,Whisper模型主要针对英语应用,但随着时间的推移,它经过升级,已经支持多种语言,尽管具体支持的语言并未明确提及。该模型以宽松的许可协议在GitHub上开源,因此开发者可以轻松获取并使用它,被誉为目前最出色的转录工具之一。
Whisper3的工作原理涉及将音频分段成30秒的片段,然后通过编码器和解码器将其转化为文本字幕。此外,该模型还具备语言识别功能,有助于实现多语言语音转录和翻译成英语。有趣的是,最初计划将Whisper模型与ChatGPT集成,使用户能够通过语音直接与聊天机器人交流,但后来OpenAI决定将该模型直接向公众开放。
OpenAI之所以选择开源Whisper3,是为了为构建有用的语音处理应用和进一步的鲁棒语音处理研究提供基础。该模型经过了大规模数据集的训练,包括来自互联网的超过68万小时的数据,其中三分之一来自非英语来源。
OpenAI计划未来将Whisper3的API向用户开放,这将为开发者和研究人员提供更多机会,以创造创新的语音处理应用,推动语音技术的发展。
0000
评论列表
共(0)条相关推荐
Anthropic:Claude已向95个国家/地区的用户开放
人工智能公司Anthropic发文表示,现在95个国家/地区的用户都可以与他们的产品Claude进行交谈,获取专业或日常任务的帮助。据了解,Claude是人工智能初创公司Anthropic发布的一款类似ChatGPT的产品。2023年7月,Anthropic宣布,已发布最新大语言模型Claude2。站长网2023-10-18 21:22:200000巨人网络与阿里云达成合作 共建“游戏+AI”智算平台
今日,巨人网络与阿里云宣布达成“游戏AI”全面合作。根据合作备忘录,阿里云与巨人网络将共建“游戏AI”智算平台。基于巨人网络的游戏研发平台、阿里云通义千问大模型以及AIGC产品能力,双方开展全面合作,打造AI在游戏领域的场景落地标杆项目。站长网2023-07-14 20:07:470000开发者注意!华为宣布新上架应用新规:SDK等级需≥30
快科技9月28日消息,日前,华为应用市场向开发者发布通知称,10月31日起,所有华为应用市场新上架应用的安卓SDK等级需30。官方表示,如未满足targetSdkVersion=30的等级要求,应用市场将不予收录。另外,为推进存量应用完成API升级工作,自2023年12月31日起,在架应用如未满足targetSdkVersion=30的等级要求,则无法完成版本更新。站长网2023-09-28 15:26:530000日本制定AI准则应对过度依赖AI技术和数据偏见
🔍划重点:1.🌐日本政府制定AI准则,旨在减少过度依赖AI技术,并解决数据偏见问题。2.📜政府将在年底前敲定准则,包括10项基本原则,以确保AI公司遵循公平、透明和人权保护原则。3.🤖AI开发者、服务提供商和用户将共同承担责任,开发者需确保数据准确性和防止未经授权的访问,提供商需警告用户有关个人信息,并保证服务的有限使用。站长网2023-10-24 23:46:570000起底ChatGPT账号生意:成本3块卖30 有人月赚20万
ChatGPT火爆的数月间,兴奋与焦虑构成了众生相,明面上,一众科技公司和成名大咖挤进大模型赛道;暗地里,一些普通人在风口下寻觅着赚钱新机。李明飞就是这些普通人中的一员,他从2月份开始售卖ChatGPT账号,“批号”成本两块三,最初能卖出99块的高价。等到ChatGPT的App在美国上市时,账号市场价降到了30元,利润空间依然可观。站长网2023-05-31 09:17:150001