LLM Finetuning Hub开源:提升大型语言模型性能的实用平台
站长网2023-09-06 17:57:010阅
大语言模型微调中心(LLM Finetuning Hub)是一个开源项目,它包含了大规模语言模型(LLM)微调和部署的代码库以及相关研究成果。该项目由Georgian Partners旗下的Georgian IO团队开发,目的是帮助用户轻松地针对具体业务场景对各种LLM进行微调,并根据综合评估结果选择最适合的模型。
项目地址:https://github.com/georgian-io/LLM-Finetuning-Hub
该项目提供了针对多个流行LLM的微调脚本,如Flan-T5、Falcon、RedPajama等,使用户可以通过省时省力的方法,基于LORA和Prefix Tuning等模型微调技术,在自定义数据集上快速微调这些LLM。同时,该项目还提供了丰富的评估指标,允许用户从性能、训练时间、训练成本以及推理等多个维度对LLM进行全面评估,以确定最符合具体业务需求的LLM方案。所有脚本都经过详细注释,可以直接用于生产环境,大大降低了使用LLM的门槛。
该项目源代码托管在GitHub上,采用开源Apache2.0协议。用户可以轻松Fork项目、在本地修改并提交PR,参与到LLM微调相关研究的开源社区当中。该项目预计会持续迭代,支持越来越多前沿的LLM,并公开更多评估实验结果,以造福LLM领域的技术发展。
核心功能:
提供多种流行LLM的微调脚本
支持基于LORA、Prefix Tuning等方法进行模型微调
评估框架全面(性能、耗时、成本、推理)
脚本可直接用于生产环境
开源代码,社区维护
0000
评论列表
共(0)条相关推荐
美国能源部设立新办公室监督人工智能和其它新兴技术
**划重点:**-美国能源部成立了一个新的办公室,专注于协调政府在人工智能和其他尖端技术方面应对气候变化、防范大流行病以及保护国家安全的支持和使用。-新成立的关键和新兴技术办公室将监督人工智能、生物技术、量子计算和半导体等领域,由前国家安全委员会和能源部的高级技术和安全官员赫莉娜·符担任首席人工智能官员。0000新华三集团发布私域大模型“百业灵犀”LinSeer
在近日的2023NAVIGATE领航者峰会上,新华三集团正式发布私域大模型——“百业灵犀”LinSeer。新华三集团表示,将利用大模型的力量,以四个“专”,为垂直行业和专属地域的客户,提供安全、订制、独享、生长的智能化服务。具体来说:行业专注:要和行业伙伴一起,打通垂直应用数据,形成精准、精确、精益的私域垂直智能,培养特定能力,帮助百行百业建设最懂“行”的私域大模型。站长网2023-06-12 16:57:370001消息称苹果将于周二发布第11代iPad:沿用当代设计
10月17日消息,据外媒报道,泄密者MajinBu透露,苹果公司将于当地时间周二推出第11代低成本iPad。他声称,第11代iPad将采用与第10代iPad相同的设计,而且配件“将完全兼容”。上周末,外媒声称,新款iPad将于本周推出。有消息称,苹果正在与特定媒体安排媒体见面会。0000巨人网络:已在大模型定制化训练等方面构建初步平台化能力
8月30日,巨人网络发布2023半年报告。报告期内,公司营收14.43亿元、同比增长35.68%,净利润6.64亿元、同比增长32.95%。巨人网络表示,公司深刻意识到AI技术对游戏行业带来的颠覆性变革,正在积极布局AI相关技术应用,在AIGC降本增效,以及利用“游戏AI”提升用户体验、创新游戏玩法等方面,取得初步进展。站长网2023-08-30 17:45:110000Stability AI 推出稳定视频扩散 API 插件引起争议
站长之家(ChinaZ.com)12月22日消息:StabilityAI,以其稳定扩散文本到图像生成器而著称的公司,近日宣布推出新的基础图像到视频模型——稳定视频扩散(StableVideoDiffusion,SVD),并已在其开发者平台上通过应用程序编程接口(API)提供。这一举措允许第三方开发者将该模型整合到他们的应用程序、网站、软件和服务中。0000