复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%
要点:
复旦大学和中国人民大学联合Chat凉宫春日团队发布的研究强调,评价AI角色扮演的关键在于良好的人设还原度,其特质还原率达到82.8%。
使用大五人格的NEO-FFI问卷和MBTI的16Personalities测试,研究人员通过LLM进行引导式开放式问答,对AI角色进行全面的人格测试,从心理学的角度研究角色扮演AI的行为模式。
研究者提出了一套面谈式人格测试框架,利用开放式问答,通过LLM预测角色扮演AI的人格特质,实验结果显示在大五人格和MBTI测试上达到了82.8%的还原率。
近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测试,并通过LLM进行引导式开放式问答,全面测试了AI角色的人格。这一面谈式人格测试框架的提出,为评估角色扮演AI的人格特质提供了新的方法。
项目地址:https://github.com/LC1332/Chat-Haruhi-Suzumiya/tree/main/research/personality
随着大语言模型的发展,基于这些模型的角色扮演聊天机器人在全球范围内引起了广泛关注。相较于传统聊天机器人的繁琐工程,现今的大语言模型能够轻松构建具备不同身份、人格、记忆和语言习惯的角色扮演AI。然而,对于角色扮演AI的分析性研究仍然相当匮乏,尤其是在对它们的评估上。这项研究通过使用心理学的人格相关理论,从大五人格和MBTI等维度对角色扮演AI进行了人格测试,为这一领域的研究提供了新的视角。
研究者提出的面谈式人格测试框架通过开放式问答,使得角色扮演AI的评估更为全面。与传统的Likert Scale相比,这种框架能够更好地激发角色扮演AI的扮演行为,减少对底座LLM训练数据的影响。实验结果显示,现有的角色扮演AI在大五人格和MBTI测试上的还原率达到了82.8%。
研究者指出,这些结果仍受到底座LLM的先验影响,表现为在某些维度上的平均得分与底座模型较为一致。为了研究这一点,研究者比较了不同底座模型对角色扮演AI的影响,发现在某些维度上存在一致性,但在其他维度上并没有明显的相关关系。
综合而言,这项研究为评估AI角色扮演的人格特质提供了新的方法和视角,同时也揭示了在现有技术中存在的一些挑战和限制。未来,随着技术的不断发展,角色扮演AI的人格还原度和表现可能会得到进一步提升。
欧盟扩大对AI初创公司的支持,提供超级计算机进行模型训练
划重点:-欧盟计划通过提供超级计算机的处理能力,支持本土AI初创公司进行模型训练。-这一计划的早期试点阶段已经有法国的MistralAI参与。-该计划需要为AI初创公司提供专门的支持,帮助他们更好地利用欧盟的高性能计算资源。欧盟计划通过提供超级计算机的处理能力,支持本土AI初创公司进行模型训练。该计划于去年9月宣布,并于上个月开始实施。0000蔚来第二品牌乐道ONVO将于今年5月中上旬发布
在今天的蔚来关于长寿命电池技术的战略沟通会上,蔚来公司的首席执行官李斌以及总裁秦力洪接受了媒体的采访。就在最近,蔚来汽车备受瞩目的第二品牌名称终于揭晓,正式命名为“乐道”(英文名为“ONVO”)。据李斌介绍,虽然阿尔卑斯曾作为该项目的代号,但在为新车命名时,他们表现得非常谨慎。他提到,团队为此注册了大量候选名字。去年下半年,经过深思熟虑,他们终于确定了中文和英文的名字。站长网2024-03-14 16:13:230000腾讯视频生成模型DynamiCrafter发布最新高分辨率模型文件 比SVD动态幅度更大
腾讯最新发布了视频生成模型DynamiCrafter的高分辨率模型文件。根据他们自己的测试结果显示,这一版本的模型比SVD的动态幅度要大一些,同时在稳定性方面也表现不错。这一消息对于视频生成技术的发展具有重要意义。项目页:https://top.aibase.com/tool/dynamicrafter站长网2024-02-06 16:27:190005英伟达扩大与越南的合作关系,支持人工智能发展
划重点:👉美国芯片制造商Nvidia的首席执行官周一表示,该公司将扩大与越南顶级科技公司的合作伙伴关系。👉文件显示,Nvidia已经在越南投资了2.5亿美元,并已与领先的科技公司合作。👉首席执行官黄仁勋表示,Nvidia将与Viettel、FPT、Vingroup、VNG等公司加深合作关系。0002今日AI:已有人抢先体验GPT-5;意念操控成真!瘫痪8年小哥秒变X教授;微软也来复刻Sora;谷歌开放Gemini1.5Pro的API支持
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事羡慕!已有人抢先体验GPT-5性能大飞升!【AiBase提要:】⭐️OpenAI向客户提供GPT-5体验版本,红队测试进行中,夏季发布预计最快。站长网2024-03-22 10:03:380000