ChatGPT在32门大学课程中有 9 门的成绩或优于学生

站长网2023-08-26 17:29:090阅

本文概要:

1. 一项研究发现，ChatGPT在32门大学课程中的9门课程的表现可与学生相比或优于学生。

2. ChatGPT在需要广泛事实知识的课程中表现尤为出色，而学生在数学和经济学任务中表现更好。

3. 用于区分人类和机器生成文本的AI文本检测器测试全部失败。

最近一项针对ChatGPT的研究发现，其在32门大学课程的测试中，有9门的表现可与学生相比或甚至优于学生。

在一项实验中，纽约大学阿布扎比分校（NYUAD）的教师首先被要求提供各自讲座中的十个问题，以及每个问题随机选择的三名学生的答案。

然后研究人员使用ChatGPT为每个问题生成三个不同的答案。问题直接输入 ChatGPT，提示中没有任何其他上下文。

尽管参考文献中提到了 GPT-4，但从研究中尚不清楚使用的是GPT-3.5还是GPT-4。如果使用GPT-3.5，则使用 GPT-4的 AI 响应质量可能会更好，尤其是在推理方面。

ChatGPT 回复生成后，将其与学生回复混合，并由三位不同的审阅者评分。ChatGPT 在32个科目中有9个科目的表现与人类学生一样好，甚至更好。这九个科目分别是

数据结构公共政策概论定量合成生物学网络战面向对象编程土木工程材料的结构与性能生物心理学气候/变化管理与组织

在“公共政策概论”课程中，ChatGPT的平均得分是学生的两倍多。另一方面，学生在需要更高认知技能的数学和经济任务中表现优于 ChatGPT。

研究人员还测试了他们是否能够使用 OpenAI 的人工智能文本分类器和GPTZero可靠地区分人类文本和机器文本，该分类器因不可靠而被该公司撤回。

OpenAI 工具将5% 的人类文本错误分类为机器文本，而 GPTZero 将18% 的人类文本错误分类。考虑到所涉学生可能被错误地指控作弊的潜在后果，这是一个灾难性的结果。

相反，OpenAI 工具将49% 的机器生成文本识别为人类文本，而 GPTZero 的这一比例为32%。在这两种情况下，人工智能文本作为人类文本传递的可能性都很高。

ChatGPT在32门大学课程中有9 门的成绩或优于学生

0000

评论列表

共(0)条

相关推荐

站长资讯
Lama Cleaner：完全免费开源的AI图片修复工具支持去水印、老照片修复等
LamaCleaner是一个由SOTAAI模型驱动的图像修复工具。它可以帮助用户从照片中移除任何不需要的物体、缺陷、人物，或者擦除并替换照片中的任何元素（通过稳定扩散算法）。它完全免费、开源，并支持CPU、GPU和M1/2。用户可以通过一键安装程序在Windows上使用，同时还提供了原生的macOS应用程序(仍在开发中)。
站长网2023-07-24 16:09:38
00011
站长资讯
美团、小红书年度报告，年轻人的两种社死
各种App年度报告，藏着多少小秘密?这其中，美团年度报告，不仅能靠备注捉奸，还能记录尴尬瞬间、心机时刻;而下单的地址、时间、商品等，也让一些用户遭遇社死。在另一边，小红书上的熬夜党们，搜索内容被年度报告记录，“小丑派”“焦虑派”“牛马派”“养生派”“归因派”在深夜团聚;年度关键词、评论等内容，同样让网友们感到尴尬。
站长网2024-12-31 09:04:24
0000
站长资讯
继苹果DMA变更后，Opera 将在欧洲推出适用于 iOS 的全新 AI 浏览器
站长之家(ChinaZ.com)1月29日消息:挪威浏览器开发商Opera今天宣布，他们计划在欧洲推出一款全新的人工智能浏览器，该浏览器将基于Opera自家的iOS引擎构建。这一宣布是在苹果公司表示将允许替代浏览器引擎在iOS上运行之后的消息，这一变化是应欧洲数字市场法案（DMA）的要求。
站长网2024-01-29 09:33:59
0001
站长资讯
Java开发人员如何看待生成式AI的兴起？
Python是生成式AI的首选编程语言，随着生成式AI领域的大热，相关的Python框架和库自然也受到了极大关注。“而这对Java开发人员又意味着什么呢”?TheNewStack带着这一疑问询问了Java开发人员对于GenAI以及Python采用率增长的看法。
站长网2023-08-27 11:18:20
0000
站长资讯
Deepmind创始人提出一种新的图灵测试:看AI能否将10万美元变成100万美元
DeepMind的联合创始人MustafaSuleyman在即将出版的书中《即将到来的浪潮:技术、权力和21世纪最大的困境》指出图灵测试已经过，他提出了一个新的基准，称之为"人工智能可行性"（ACI），用来衡量AI独立执行复杂任务的能力。
站长网2023-06-21 16:47:49
0000