首页站长资讯苹果研究团队揭示WRAP技术：用合成数据进行预训练大模型成本低准确性高

苹果研究团队揭示WRAP技术：用合成数据进行预训练大模型成本低准确性高

站长网2024-02-05 10:42:350阅

**划重点:**

1. 🔄 **预训练效率提升:** WRAP应用于嘈杂的C4数据集，预训练速度提高了近三倍，显著降低了LLM训练的高昂成本和时间投入。

2. 🚀 **模型性能提升:** WRAP在相同计算预算下使模型性能更出色，通过使用Pile的不同子集，减少了超过10%的歧义，并在13种不同活动的零-shot问题回答准确性上提高了超过2%。

3. 📝 **重新构造网络文档:** WRAP使用中等规模的LLM对网络文档进行改写，以多种风格呈现。

近几个月来，大型语言模型（LLMs）在人工智能社区中引起了极大的关注和流行。这些模型在文本摘要、问答、代码完成、内容生成等任务中展示出了强大的能力。

然而，LLMs通常在不充分的网络抓取数据上进行训练。这些数据通常杂乱、无结构，表达不清晰。按照现有的扩展原则，即随着模型规模的增加，计算能力和数据量也应该成比例增加，这带来了挑战。

困扰研究人员的主要问题有两个。首先，预训练涉及显着的计算成本和时间。其次，互联网上高质量数据的稀缺性问题迫在眉睫。在最新的研究中，来自苹果和卡内基梅隆大学的研究团队通过引入Web Rephrase Augmented Pre-training（WRAP）的概念，解决了这些问题。

WRAP是一种创新方法，利用已存在的、经过指令调整的LLM。这个LLM用于将在线页面改写成特定风格，包括模仿维基百科的语气或将文本转换为问答格式。WRAP的主要目标是通过添加真实和人工改写的数据来提高LLMs的预训练效果。

图源备注：图片由AI生成，图片授权服务商Midjourney

WRAP的主要特点包括:

- **预训练效率:** 将WRAP应用于嘈杂的C4数据集，显著加快了预训练速度，约为三倍。这种效果对于减少与LLM训练通常相关的高昂费用和时间投入至关重要。

- **模型性能提升:** WRAP在相同的计算预算下使模型性能更出色。使用Pile的不同子集减少了超过10%的歧义，提高了13种不同活动的零-shot问题回答准确性超过2%。

- **网络文档改写:** WRAP使用中等规模的LLM对网络文档进行改写，呈现多种风格。这种方法不同于创建新数据，而是通过改进已有内容，保持原始信息的质量和多样性。

WRAP生成的合成数据有两个主要好处。首先，它包含反映应用中使用的语言多样性的各种风格。有了这种多样性，LLM更好地为更广泛的实际事件做好准备。其次，WRAP改写的合成数据比原始网络抓取的数据质量更高。这种质量的提升源于语言更有序、更连贯，从而促进更有效的模型学习。

WRAP是LLM预训练领域的一项重大进展。通过使用高质量、不同风格的合成数据，WRAP不仅加速了训练过程，还提高了LLMs的整体性能。考虑到低质量网络数据的丰富性和经典LLM训练方法的资源密集性，这种方法提供了一种可能的前进方式。

论文网址:https://arxiv.org/abs/2401.16380

苹果研究团队揭示WRAP技术用合成数据进行预训练大模型成本低准确性高

0000

评论列表

共(0)条

相关推荐

站长资讯
AI 计算创业公司FlexAI 获得3000万美元种子资金
划重点:⭐️FlexAI获得3000万美元种子资金，走出隐形状态⭐️FlexAI计划推出首个商业产品，提供连接开发者到虚拟计算的云服务⭐️FlexAI的创始人曾在特斯拉、英特尔等公司任职，致力于提供AI训练工作负载的基础设施
站长网2024-04-26 22:26:10
0000
站长资讯
Opera发布为生成式AI功能设计的浏览器Opera One
Opera在今年晚些时候会推出一款完全重新设计的浏览器——OperaOne，现已发布抢先体验版。该版本设计将有一个更简介的外观和模块化设计原则，侧边栏和地址栏中为未来的生成AI功能和扩展提供足够的空间。OperaOne还配备了ChatGPT、ChatSonic和AI提示功能。
站长网2023-04-25 16:20:36
0003
站长资讯
苹果手机几乎没代言却”卖的“很好
一谈到明星代言手机的事情，大家肯定率先想到国产手机的oppo和vivo，明星代言是一个接一个！我都觉得自己也被代入了！苹果手机几乎没代言却卖的最好
站长网2023-05-24 04:21:16
0000
库克三天走访中国三个城市：参观立讯感谢王春来女士
快科技10月18日消息，苹果CEO蒂姆库克在16日晚到访成都，在太古里苹果专卖店与用户互动，还观看了《王者荣耀》比赛。随后库克边开启了紧张的行程，从成都到四川雅安，今天又出现在了立讯精密浙江工厂，三天走访三个城市。库克本人今天还发布点赞立讯，称苹果与立讯已合作十多年，参与了AppleWatch系列和iPhone15ProMax等最先进产品的生产，并且还将在2030年为苹果实现碳中和。
站长网站长资讯2023-10-18 21:38:41
0000
站长资讯
当韩国女团BLACKPINK进军二次元，清华叉院AI神器原来还能这么玩
如果你手机里有一些修图软件，你可能用过里面的「AI绘画」功能，它通常会提供一些把照片转换为不同风格的选项，比如动漫风格、写真风格。但如今，视频也可以这么做了:这些动图来自X平台（原推特）网友@CoffeeVectors生成的一段视频。他把韩国女团BLACKPINK代表作《DDU-DUDDU-DU》的原版MV输入了一个AI工具，很快就得到了动漫版的MV。
站长网2023-11-17 09:08:44
0001