OpenAI 人工智能文本检测器正确率只有 26% 且有 9% 的误报
OpenAI 日前关闭了一个本应用于区分人类写作和 AI 写作的工具,原因是准确率较低。在一篇(更新后的)博客中,OpenAI 表示决定自 2023 年 7 月 20 日起停用其 AI 检测器。该公司表示:「我们正在努力吸纳反馈意见,并正在研究更有效的文本来源技术。」
在博客文章中,OpenAI 表示,我们的 AI 检测器并不完全可靠。在我们对英语文本「挑战集」的评估中,我们的检测器正确地将 26% 的人工智能编写的文本(真阳性)识别为「可能是人工智能编写的」,而将 9% 的人类编写的文本错误地标记为人工智能编写的(误报)。
虽然关闭了用于捕捉 AI 生成的写作的工具,OpenAI 表示计划「开发和部署机制,使用户能够了解音频或视觉内容是否由 AI 生成。」目前尚不清楚这些机制会是什么样的。
OpenAI 完全承认该检测器从未很好地捕捉到 AI 生成的文本,并警告说它可能会出现误报,即将人类撰写的文本标记为 AI 生成。在关闭该工具之前,OpenAI 表示分类器通过更多数据可能会变得更好。
在 OpenAI 的 ChatGPT 迅速走红成为有史以来增长最快的应用程序之后,人们争先恐后地去掌握这项技术。一些领域对 AI 生成的文本和艺术产生警惕,特别是教育工作者担心学生将不再学习,而只是让 ChatGPT 写作业。在对准确性、安全性和作弊担忧的背景下,纽约的学校甚至禁止在校园内使用 ChatGPT。
AI 传播的错误信息也是一个问题,研究表明,AI 生成的文本(如推文)可能比人类撰写的更具有说服力。政府尚未找到限制 AI 的方法,到目前为止,只能让各个团体和组织制定自己的规则和发展自己的保护措施来处理大量由计算机生成的文本。
目前看来,甚至是帮助开启生成式 AI 热潮的公司,都对如何处理这一切问题没有答案。虽然有些传播错误信息的人会被抓住,但要轻松区分 AI 和人类的工作将变得更加困难。
在 OpenAI 的信任和安全领导人最近离职的同时,联邦贸易委员会正在调查 OpenAI 的信息和数据审核方式。OpenAI 拒绝对其博客文章以外的事情进行评论。
Cohere全面推出微调套件:聊天、重新排序、多标签分类一应俱全
**划重点:**1.🚀Cohere发布全新微调能力,包括聊天微调、重新排序微调和多标签分类微调,助力企业个性化AI应用。2.💻新微调仪表板支持用户轻松管理和运行微调项目,提供测试场地、实时进度监控和价格计算器。3.📈微调加强模型性能,提高60%的生成解决方案准确性和40%的聊天解决方案改进,实现30分钟内微调模型训练和1分钟内上线。站长网2023-11-22 11:35:300001宝剑嫂带货2800万背后,释放了B站商业化的什么信号?
今年618,B站的商业化进程向前迈了一步,其推动力来自于当下各大平台“重注”的直播带货。6月10日,B站头部UP主“宝剑嫂”、“雨哥到处跑”开启直播带货首秀,单场直播总成交GMV超2800万,卖出多个爆款产品。站长网2023-06-16 19:39:570002阅文集团拟收购腾讯动漫业务及资产 扩容升级IP生态链
昨日,阅文集团发布《有关收购资产之关联交易》公告,称将以人民币6亿元代价收购腾讯动漫旗下包含腾讯动漫App平台、其作品知识产权与相关权利、动画及影视项目等在内的相关业务及IP资产。收购完成后,阅文将整合腾讯动漫有影响力的头部IP和成熟的动漫产能,阅文的IP生态链或将迎来扩容升级。站长网2023-12-12 09:06:200000AI视野:百度将推文心大模型4.0;抖音AI中年美女图文爆火;微软Edge集成AI设计工具Designer
1、抖音带货新玩法!有人靠AI中年美女图文日入500元抖音出现新玩法,使用AI生成中年美女图片,配商品照制作成图文视频带货。该玩法流量效果不错,视频点赞数可达万级,日均销售额可达500元。2、OpenAI推出GPT-3.5Turbo微调功能可改进模型性能站长网2023-08-24 16:51:260000家居赛道一片火热,谁吃到了内容红利?
从房屋翻新到卧室改造,一直以来,与“家”相关联的内容总是能够获得年轻人的关注与青睐。打开抖音、B站、小红书等内容平台,与家居、房屋相关的内容有着相当高的热度。抖音话题#旧房改造播放量高达317.6亿;小红书上家居相关的笔记高达2955万篇,相关商品达到517万件,家居改造已经成为当下热门趋势内容,在这个过程中大量家居博主涌现。站长网2024-03-11 09:34:390000