Human or Not游戏测试：三分之一的人分不清人和AI

站长网2023-06-01 16:16:440阅

日前，OpenAI 的竞争对手AI21Labs发布了一项名为“ Human or Not ”的网络游戏社交实验的结果，该游戏发现高达32% 的人无法区分人类和 AI 机器人。

该公司称这款游戏是迄今为止规模最大的图灵测试，它使用基于领先的大型语言模型（LLM）(例如 OpenAI 的 GPT-4和 AI21Labs的Jurassic-2、最终分析了超过一百万次的对话和猜测。

结果令人诧异:一方面，测试表明，人们发现更容易识别对象是不是同类（即人类），参与者猜对率73% 。但在与机器人交谈时，参与者只猜对率只有60% 。

但除了这些数字之外，研究人员还指出，参与者使用了几种流行的方法和策略来确定他们是在与人交谈还是与机器人交谈。例如，他们假设机器人不会犯拼写错误、语法错误或使用俚语，而在游戏中的大多数模型都经过训练可以犯这些类型的错误并使用俚语。

参与者还经常问一些个人问题，例如“你来自哪里?”、“你在做什么?” 或“你叫什么名字?”，相信人工智能机器人不会有个人历史或背景，而且他们的回答将仅限于某些主题或提示。然而，机器人大多能够回答这些类型的问题，因为它们接受过很多个人故事的训练。

在两分钟的对话之后，用户被要求猜测他们一直在人还是机器人对话。经过一个多月的游戏和数百万次对话，结果表明32% 的人无法区分人类和人工智能。

些参与者认为，如果他们的讨论伙伴过于礼貌，他们可能是一个机器人。

Humanor Not游戏测试三分之一的人分不清人和AI

0000

评论列表

共(0)条

相关推荐

站长资讯
4年前的老旗舰还能再战！小米第一款Ultra旗舰喜提澎湃OS
快科技4月22日消息，小米向小米10、小米10Pro和小米10Ultra等机型推送澎湃OS，其中小米10Ultra是小米第一款Ultra机型（小米10Ultra国行版名为小米10至尊版）。该机发布于2020年，出厂预装MIUI12，这次升级到全新的澎湃OS，系统更加流畅易用。
站长网2024-04-22 21:28:55
0000
站长资讯
南京大学发布AvatarBooth 可用文本生成3D人类化身
过去，元宇宙曾经大热，但之后却被冷落。一个很大的原因是生成3D化身的方法大多需要昂贵且复杂的采集设备，以构建高保真的化身模型。因此，对于消费级别的应用开发来说难以负担。
站长网2023-06-28 15:35:25
0000
站长资讯
Headless语言模型：通过捆绑嵌入提高模型的训练速度
要点:1.提出了一种新的预训练方法，称为无预测头语言模型，它移除了对词汇空间概率分布的预测需求，而是关注用对比方式重构表示。2.该方法只需要改变目标函数，可以直接应用于经典语言模型预训练目标。3.在单语和多语编码器以及单语解码器中实验表明，Headless语言模型预训练相比经典方法在给定运算量下表现更好，计算效率更高。
站长网2023-09-20 11:06:29
0002
站长资讯
苹果WWDC 2024即将官宣：iOS 18来了这些机型可升级
快科技3月19日消息，据媒体报道，苹果将在未来两周内宣布WWDC2024举办时间，这场开发者大会将会在6月的第一周举行。本次大会将会发布全新的iPadOS18、iOS18和macOS15、watchOS11等操作系统，其中最受消费者关注的是iOS18。据爆料，iOS18将会集成生成式AI，在今年早些时候，苹果已收购DarwinAI公司，进一步扩充其在AI领域的实力。
站长网2024-03-20 10:01:01
0000
站长资讯
备忘录显示 OpenAI 支持开发先进人工智能系统需要监管许可
据OpenAI起草的一份内部政策备忘录显示，该公司支持要求任何想要开发先进人工智能系统的人获得政府许可的想法。这份文件还表明，该公司愿意公开用于训练图像生成器的数据。
站长网2023-07-21 16:46:47
0000