OpenAI 的 ChatGPT 通过新的放射学委员会考试：病患更喜欢 AI 的回答更具同情心

站长网2023-05-18 17:43:460阅

OpenAI 的 ChatGPT 正在通过医学考试，两项最新研究表明，这一次 ChatGPT 在放射学考试中取得了及格分数。

研究人员将 ChatGPT 的 GPT-3.5 版本和 GPT-4 版本评估了放射学考试的 150 个问题。他们发现，在两个版本中，AI 的聊天机器人从 69.3% 的接近及格的分数提高到了 80.7%，在高级别思维问题中表现更为出色，特别是在描述影像发现和应用医学概念方面，GPT-4 版本的表现更好。

这些问题是基于文本的选择题，分为两个大类（高级和低级），以评估技术在回答问题方面的具体优势和劣势。这些问题被选中以匹配加拿大皇家学院和美国放射学委员会考试的风格、内容和难度。

ChatGPT 在医学考试中的应用已经成为一种常见现象。自 ChatGPT 在 2022 年 11 月 30 日发布以来，通过医学认证考试一直是 AI 开发人员的长期目标，尤其是谷歌的医学重点大语言模型（LLM）Med-PaLM。

自当月以来，参与 AI 测试使用于医学认证的研究已成为一种常见实践，特别是通过 ChatGPT 的性能来提升在医学领域的应用。医学认证考试成为了 AI 开发的一个长期目标。

在 2022 年 12 月，研究人员展示了 Med-PaLM 在美国医疗许可考试（USMLE）上获得了 67.6% 的准确率，这是及格分数的普遍门槛，这是 AI 在医学上功能的一个重大里程碑，类似于人工智能在多年中与国际象棋大师的竞争。

此外，ChatGPT 最近还接受了评估其回答患者问题的能力。在与真实医生回答的比较中，经过盲评估的评价者在 75% 以上的时间内更喜欢 ChatGPT 的回答。与医生的回答相比，该 AI 聊天机器人的回答也被评为更具有同情心。

总的来说，现在 AI 模型在医学上能做什么和不能做什么的努力是一个设定基准的过程。Bhayana 表示，目前的重点是确定 ChatGPT 和其他 AI 模型可以在医学上如何使用，但他警告说，由于这些技术往往会「幻觉」或说谎（通常非常自信），因此应用是有限制的。然而，他希望技术能够不断改进，以实现在医学上更广泛的应用。

目标是了解医生可以信任这些工具的程度，然后开始着手改进和优化这些模型，以适用于特定的临床用途。目前，生成式 AI 已经表明在某些用途上是高效的，例如听写和转录，但 Bhayana 认为，在医学上医生将能够信任这些工具，需要更多时间和更新。

他表示:「随着这些工具的出现，重点在于了解它们的性能，寻找它们的应用，并确保人们知道它们的优点和限制，以便医生与技术共同发展。」

OpenAI的 ChatGPT通过新的放射学委员会考试病患更喜欢AI 的回答更具同情心

0000

评论列表

共(0)条

相关推荐

站长资讯
Adobe更新隐私条款意味着有权将用户作品用于训练AI
划重点:🔍Adobe要求用户同意新使用条款，其中包括访问用户创作内容的权利。🔍设计师和艺术家的作品将失去隐私，可能被用于训练人工智能或内容审查。🔍更新后的Adobe隐私条款引发了用户对于设计工作隐私的担忧。
站长网2024-06-06 20:58:05
0000
站长资讯
苹果AI首秀市值蒸发4200亿：还带崩了供应商
快科技6月11日消息，在2024年全球开发者大会上，苹果终于推出了传闻已久的AppleIntelligence（苹果智能），与OpenAI的合作也正式官宣。但令苹果万万没想到的是，其在AI领域的首秀并未能赢得市场喝彩，反而导致自家市值大幅缩水，连带影响了供应商的股价。截至美东时间6月10日收盘，苹果股价下跌近2%，市值蒸发578亿美元（约合人民币4193亿元），再次跌破3万亿美元大关。
站长网2024-06-12 08:39:45
0000
站长资讯
英伟达推AI游戏助手G-Assist：可指导玩家玩游戏并优化设置
划重点:⭐G-Assist是英伟达的游戏AI助手，可指导玩家完成游戏并配置最佳设置。⭐该助手可以通过语音查询回答游戏中的问题，并根据屏幕上的情况进行个性化指导。⭐不仅可以优化和调整PC设置，还可以为游戏性能提出建议，并甚至超频GPU。
站长网2024-06-03 13:21:03
0000
站长资讯
腾讯云联合信通院发布「金融行业大模型标准」
9月18日，腾讯云联合信通院正式发布国内首个金融行业大模型标准。该标准涵盖了金融大模型的关键能力要求，包括场景适配度、能力支持度和应用成熟度三大方面。此外，标准还从金融行业的特性出发，覆盖了投资研究、投资顾问、风险管理、市场营销、客户服务等多个金融应用场景，并详细规定了金融大模型在数据合规性、可追溯性、私有化部署、风险控制等方面的要求。
站长网2023-09-19 08:40:01
0000
站长资讯
知乎盐言故事，正在重塑IP格局
2024年的剧集市场可谓几家欢喜几家愁。长剧陷入内容瓶颈，到了必须适应和求变的时候。短剧则飙得太快，野蛮生长的好景不长，精品化转型迫在眉睫。可以预见的是，这些新的诉求将掀起新一轮的人才资源流动，也将对上游提出新的IP需求。横屏中剧或可成为我们观察大趋势的一个小切口。作为长视频摸索出的短剧形态，它过去可能不如竖屏短剧抢眼，但随着爱优腾芒集体入局，其战略价值越发明确。
站长网2024-12-18 09:25:14
0000