首页站长资讯微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2

微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2

站长网2023-09-18 10:01:440阅

要点:

1、微软研究人员推出了一个仅有13亿参数的LLM模型Phi-1.5。

2、Phi-1.5在常识推理任务上表现优异，优于多个参数量十倍以上的模型。

3、研究表明，模型参数规模不是决定性因素，高质量数据更为重要。

微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5，该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现，因为这是对语言模型能力的重要考验。

论文地址:https://arxiv.org/abs/2309.05463

项目地址:https://huggingface.co/microsoft/phi-1_5

结果表明，Phi-1.5在多个常识推理基准测试数据集上都取得了与参数量是其10倍以上的模型相当或更好的结果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等数据集上的表现，都与Llama2-7B、Falcon-7B和Vicuna-13B相当甚至更好。

这说明模型的参数规模不是决定性因素，采用高质量合成数据进行预训练可能更为关键。研究中，Phi-1.5使用了微软之前提出的Phi-1模型的训练数据，以及新增的“教科书级”合成数据进行训练。

结果表明，Phi-1.5不仅展现出许多大模型所具有的语言理解和推理能力，在控制有害内容生成方面也具有一定优势，这对研究大型语言模型的社会影响意义重大。本研究表明，相比单纯追求模型规模，如何获取高质量训练数据可能更为重要，这为未来语言模型研究提供了新的思路。

微软推出全新预训练模型phi1 5 仅13亿参数常识推理碾压Llama2

0000

评论列表

共(0)条

相关推荐

站长资讯
OpenAI与迪拜G42合作，瞄准扩张中东市场
划重点:1.🤖OpenAI与G42达成合作，旨在在中东地区扩展人工智能能力。2.🌍合作计划在G42的专业领域，如金融、能源、医疗和公共服务中，利用OpenAI的生成式人工智能模型。3.💡合作被视为将AI解决方案带入中东地区，并提升全球扩张计划的关键一步。OpenAI与总部位于迪拜的科技控股集团G42宣布了一项新的合作伙伴关系，旨在扩展中东地区的人工智能能力。
站长网2023-10-19 11:57:58
0000
站长资讯
阿里云发布通义千问2.5版性能赶超GPT-4 Turbo
阿里云今日正式发布通义千问2.5版本，该版本在模型性能上全面赶超了GPT-4Turbo，展现了其强大的技术实力。与此同时，通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩，超越了Meta的Llama-3-70B模型，成为开源领域的新星。
站长网2024-05-09 19:41:54
0000
站长资讯
今年被众多VC一致看好的AI应用，为何是它们？
2023，眼看着只剩下不到两个月的时间了。在今年兴起的这股AI浪潮中，哪种AI应用是最有前景，最值得下注?关于这点，投资界似乎已经达成了一致的共识。最近，一家专注于AI的新闻平台AIbeat统计出了全球10家估值最高的人工智能初创公司。如果人们对表格中的企业进行筛选，就会发现，其中有超过半数以上的产品，都属于同一类AI应用。
站长网2023-11-03 16:37:09
0000
站长资讯
蔚来秦力洪：电动车电池寿命15年蔚来车主的电池则是永生的
快科技6月14日消息，第十六届中国汽车蓝皮书论坛于6月14日-16日在北京举行，主题为想象”，蔚来联合创始人、总裁秦力洪出席并演讲。秦力洪表示，根据今天的可见的技术发展，我们定义的长寿命电池就是15年的使用寿命;并且到了电池寿命终止的时候，它的健康度还要大于等于85%。
站长网2024-06-14 23:51:01
0000
站长资讯
小米MIX Fold 3入网：支持67W快充 8月发布
根据3C认证最新数据显示，型号为2308CPXD0C的新机通过了认证，并支持67W快充，预计这款新机很可能就是小米MIXFold3。
站长网2023-07-12 15:39:58
0000