孟子3-13B大模型正式开源
澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能,特别是在参数量20B以内的模型中,其中英文语言能力尤为突出,数学和编程能力也位于行业前列。
孟子3-13B大模型基于Llama架构,经过高达3T Tokens的数据集训练,该数据集包括网页、百科、社交、媒体、新闻以及高质量的开源数据集。模型在万亿tokens上进行了多语言语料的继续训练,使其中文能力得到显著提升,同时也具备了强大的多语言处理能力。
项目地址:https://github.com/Langboat/Mengzi3
为了便于用户快速部署和使用,澜舟科技提供了简单的两步操作。首先,用户需要进行环境配置,通过pip命令安装必要的依赖。随后,用户可以通过提供的代码快速开始使用模型,进行基础的交互推理。此外,澜舟科技还提供了样例代码和模型微调的相关文件和代码,以便用户根据自己的需求进行定制和优化。
澜舟科技的选择背后有着明确的商业考量。公司专注于服务ToB场景,并在实践中发现,ToB场景中使用频率最高的大模型参数量集中在10B-100B之间。从投资回报率角度出发,这一参数规模范围的模型既能满足场景需求,又具有高性价比。因此,澜舟科技致力于在这一参数规模范围内打造优质的行业大模型。
孟子3-13B大模型的开源,是澜舟科技在大模型领域的又一重要里程碑。去年3月,澜舟科技发布了孟子GPT V1(MChat),今年1月,孟子大模型GPT V2对公众开放。现在,感兴趣的用户可以通过GitHub、HuggingFace、ModelScope和Wisemodel等平台体验和使用孟子3-13B大模型。
随着孟子3-13B大模型的开源,澜舟科技进一步巩固了其在AI大模型行业的领先地位,并为学术研究和商业应用提供了强大的支持。这一举措无疑将推动大模型技术的发展和应用,为AI产业的进步贡献力量。
“景点公主”打卡照生意,走红抖音小红书
“想变美,先变鬼。”如果你打开了一条以此为标题的视频,千万别以为误入了什么惊悚片,因为它呈现的很可能是最近大热的西双版纳妆造。视频中的妆容看上去一言难尽,而搭配亮片、头饰、服装等一整套异域风情装备后,下一秒,一位娇俏可爱的哈尼族公主就这样跃然于镜头前,短短几秒带来了惊艳的反差。自旅游市场复苏之后,来西双版纳打卡特色妆造的游客越来越多。站长网2023-05-06 15:52:480000谷歌推大语言模型VideoPoet:文本图片皆可生成视频和音频
划重点:1.💻GoogleResearch团队推出VideoPoet,一款大型语言模型,旨在解决视频生成领域的挑战。2.🌈VideoPoet支持多种视频生成任务,包括文本到视频、图像到视频、视频风格化、修复和修复以及视频到音频。3.🚀与传统扩散模型不同,VideoPoet将多个视频生成功能融合在一个语言模型中,提供更高的集成度和学习能力。站长网2023-12-20 10:39:020000流量时代落幕,商家豪赌复购
“现在买量太贵了,买到的还都是一些水量,实销数据差,退货率高不说,根本就没有留存和回购这些,老板根本不认,现在都要我们部门拿着损益表和他谈ROI(投资回报率),你说我们还怎么干?”在广州一家化妆品公司做了5年电商营销总监张涛,对近一年多来四处盲目投流买量的实销转化情况很不乐观。站长网2023-09-14 21:35:290000又一开源替代品!Guanaco性能达ChatGPT级别 在单个GPU上训练一天就能搞定
有一种名为QLoRA的新方法可以在单个GPU上微调大型语言模型。目前已经有研究人员用它来训练Guanaco,这是一个性能效果99%接近ChatGPT的聊天机器人。站长网2023-05-26 11:00:550000亚马逊评论区遭AI虚假评价入侵,网购信任危机日益加剧
近日有媒体发现,亚马逊上部分商品的评论被人工智能编写,引起了网购者的震惊和不安。报道指出,一些亚马逊商品的评论开头是“作为一个人工智能语言模型”,这些评论通常只进行了简单、笼统的描述,没有反映真实的使用体验和感受。站长网2023-04-27 09:43:450001