南方科技大学联合IDEA研究院发布 SUS-Chat-34B 双语模型
站长网2023-12-11 09:02:331阅
南方科技大学联合 IDEA 研究院 CCNL 中心发布了 SUS-Chat-34B,这是一个参数规模为340亿的双语模型。该模型在众多中英文任务上表现出色,超越了其他同参数规模的模型。
SUS-Chat-34B基于01-ai/Yi-34B 预训练模型通过数百万高质量、多语言的指令数据进行了微调。
模型具有以下亮点:
大规模复杂指令跟随数据:使用1.4B token的高质量复杂指令数据进行训练,涵盖中英文、多轮对话、数学、推理等多种指令数据;
强大的通用任务性能:SUS-Chat-34B模型在众多主流的中英文任务上表现出色,其效果超越了相同参数规模的其他开源的指令微调模型。即使与更大参数规模的模型相比,SUS-Chat-34B模型也具有不错的竞争力
更长的上下文窗口与出色的多轮对话能力:SUS-Chat-34B原生支持8K的上下文窗口,在大量多轮指令以及单多轮混合数据中进行训练,具有出色的长文本对话信息关注与指令跟随能力。
开源地址:
https://modelscope.cn/models/SUSTC/SUS-Chat-34B/summary
0001
评论列表
共(0)条相关推荐
谷歌DeepMind提出AGI能力与行为分类框架
**划重点:**1.🌐谷歌DeepMind团队提出"LevelsofAGI"框架,类似自动驾驶级别,用于分类人工通用智能(AGI)模型及其前身的技能和行为。2.📈框架基于自主性、普适性和性能等三个维度,提供了一个共同词汇,便于比较模型、评估风险,并跟踪通向人工智能的进展。0000OpenAI 领导者提议 AI 国际监管机构:世界需要「人工智能版国际原子能机构」
站长之家(ChinaZ.com)5月23日消息:人工智能的发展速度足够快,它可能带来的危险也足够明显,以至于OpenAI的领导层认为,世界需要一个类似于管理核能的国际监管机构——而且速度要快。但不能太快。站长网2023-05-23 09:04:060000从iPhone13换Magic5 pro使用半月后感受!
换新机第一感受:屏幕超大,缪斯之眼的星轮三摄辨识度超高,拿在手里朋友一直问你这啥手机摄像头这么大,拍照一定很吧!这次入手的是荣耀Magic5pro亮黑色16512换新机的主要原因还是没用多久,也没拍多少照片感觉就是内存不够用了,还有就是女朋友一直要跟我换手机用,干脆直接给她自己换新手机站长网2023-05-24 15:03:100001一张照片生成3D头像!苹果新模型击败StyleGAN2,表情光线都能调,网友:要用于MR?
随便一张照片,就可生成3D头像。而且光线真实,任意角度可调。这是苹果的最新黑科技生成框架FaceLit。正如其名,FaceLit的特色就是可以将人脸“点亮”。“自带光环”的FaceLit在易用性上也不输同类,甚至更胜一筹——进行3D建模时,需要的照片素材无需专门选择角度,数量上也只需一张。甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。站长网2023-05-02 15:43:020000谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型
划重点:⭐️GoogleAI团队提出了ScreenAI,这是一个视觉语言模型,可以全面理解UI和信息图。⭐️ScreenAI在多个任务上表现出色,包括图形问答(QA),元素注释,摘要生成等。⭐️该团队发布了三个新数据集,为未来研究提供更多资源。站长网2024-02-21 10:08:530004