OpenAI发布升级版ASR模型Whisper3，计划开放API

站长网2023-11-07 15:21:200阅

划重点:

- OpenAI在开发者日发布了一系列开源模型，其中包括升级版的自动语音识别模型Whisper3。

- Whisper3具备多语言支持，可将音频内容转录成文本，还具备独特的时间戳功能，适用于制作字幕。

- OpenAI计划未来向用户开放Whisper3的API，以推动语音处理应用的发展。

在OpenAI的开发者日活动中，该人工智能初创公司发布了一系列开源模型，其中包括了升级版的自动语音识别（ASR）模型——Whisper3。这一模型具备多语言支持，可以将音频内容快速准确地转录成文本，并具备独特的时间戳功能，使其适用于制作字幕等应用。

最初，Whisper模型主要针对英语应用，但随着时间的推移，它经过升级，已经支持多种语言，尽管具体支持的语言并未明确提及。该模型以宽松的许可协议在GitHub上开源，因此开发者可以轻松获取并使用它，被誉为目前最出色的转录工具之一。

Whisper3的工作原理涉及将音频分段成30秒的片段，然后通过编码器和解码器将其转化为文本字幕。此外，该模型还具备语言识别功能，有助于实现多语言语音转录和翻译成英语。有趣的是，最初计划将Whisper模型与ChatGPT集成，使用户能够通过语音直接与聊天机器人交流，但后来OpenAI决定将该模型直接向公众开放。

OpenAI之所以选择开源Whisper3，是为了为构建有用的语音处理应用和进一步的鲁棒语音处理研究提供基础。该模型经过了大规模数据集的训练，包括来自互联网的超过68万小时的数据，其中三分之一来自非英语来源。

OpenAI计划未来将Whisper3的API向用户开放，这将为开发者和研究人员提供更多机会，以创造创新的语音处理应用，推动语音技术的发展。

OpenAI发布升级版ASR模型Whisper3计划开放API

0000

评论列表

共(0)条

相关推荐

站长资讯
微软将在印度将为200万人提供人工智能技能培训
划重点:-💡微软首席执行官萨特亚・纳德拉宣布，将为200万人提供人工智能技能培训。-💡纳德拉强调重要性在新时代确保劳动力具备必要技能，并称AI任务为农村印度提供工作机会。-💡他赞扬了印度的数据合作社Karya、Bhashini和Agami等组织的努力，称印度拥有全球第二大人工智能工程师社区。
站长网2024-02-07 15:19:57
0000
每月6元！用户被中国移动多收8年来电显示费上热搜：官方回应了
快科技7月15日消息，据国内媒体报道称，有用户反馈称，自己的父母被中国移动多收8年来电显示费，每月6元累计费用无法退回。报道中提到，这位用户如果不给父母查询手机账单时意外发现，老人至今每月都被收取6元的来电显示”增值业务费。随后这个话题迅速登上了热搜，有不少网友纷纷表示，自己也不知道来电显示费已取消，每月仍被扣除6元费用。
站长网站长资讯2024-07-15 15:08:31
0000
站长资讯
Vizro：一个创建模块化数据可视化应用的工具包
Vizro是一款强大的工具包，旨在帮助用户创建模块化的数据可视化应用。无需深入编程或设计经验，您可以在短短几分钟内快速自助组装自定义仪表板，从而创建灵活且可扩展的Python数据可视化应用。项目地址：https://github.com/mckinsey/vizro
站长网2023-09-28 12:12:30
0003
站长资讯
TikTok Shop今起在印尼正式关闭
TikTok电商业务在印尼市场迎来一次大变动。在最新发给印尼站卖家的邮件通知中，TikTokShop明确表示将于今日（10月4日）印尼西部时间17点正式关闭。此后，TikTok在印尼市场将成为一个不再拥有“电商功能”的短视频内容平台。即卖家可以继续在TikTok平台创建和分享内容来推广产品，但无法直接在平台上销售产品。
站长网2023-10-04 09:12:39
0000
站长资讯
小扎老黄亲密换衣炉边对谈！小扎竟破防爆粗，老黄自曝第一批Blackwell已出炉
【新智元导读】就在刚刚，老黄在SIGGRAPH大会上透露:Blackwell的工程样片，已在本周正式向全世界发送!随后，老黄和小扎展开了炉边对话，并且亲密换衣，说到激动处，小扎气得一度爆粗。惊爆消息来了!刚刚，老黄在SIGGRAPH计算机图形会议上透露:就在本周，英伟达已经开始向全世界发送Blackwell的工程样片了!
站长网2024-07-30 14:39:09
0000