百川智能发布超千亿大模型Baichuan 3 中文任务超车GPT-4
要点:
1、百川智能发布了基础模型第三代版本Baichuan3,医疗场景、文学创作和逻辑推理能力均获得升级和突破。
2、Baichuan3在医疗领域的评测成绩超越了GPT-4水平,各项评测能力大幅超越GPT-3.5,表现出卓越的逻辑思考和问题解决技能。
3、百川智能Baichuan3模型在MMLU测试集、CMMLU和GAOKAO等中文任务评测中成绩均超越GPT-4,显示出超千亿大模型的强大实力。
百川智能最新发布了基础模型第三代版本Baichuan3,该模型在医疗场景、文学创作和逻辑推理能力等方面均获得了突破性升级。Baichuan3在医疗领域的评测成绩超越了GPT-4水平,各项测能力大幅超越了GPT-3.5,表现出卓越的逻辑思考和问题解决技能。同时,Baichuan3模型在MMLU测试集、CMMLU和GAOKAO等中文任务评测中成绩均超越GPT-4,显示出超千亿大模型的强大实力。
值得注意的是,百川智能的这一代超千亿大模型,在医疗相关评测任务中取得的结果实在令人瞩目,中文相关评测任务超过了GPT-4水准,英文相关评测任务中,也大大缩短了与SOTA的距离。Baichuan3在文学创作方面也表现不俗,但在多轮对话任务上还存在一定的局限性。综合各项数据和具体效果来看,Baichuan3已经完成了全方位升级,在中文能力上有着明显的超越表现。
对于Baichuan3能在中文医疗场景的表现能超过GPT,百川方面并未公布模型具体参数,但明确表示了采用了业内认可的暴力美学,参数出涌现。另外,百川智能在数据的优化和采样方面也有所创新,Baichuan3逐个击破了训练过程中可能面临的问题,进行优化,这才有了评测集上的亮眼成绩。
需要指出的是,百川智能在模型训练过程中采用了渐进式初始化方法和细粒度监控等措施,保证Baichuan3的稳定训练。整体来看,百川智能的路线和OpenAI的路线一致,即参数出涌现,同时进行优化和创新。
快手整治2024年春节网络环境 近一周处置违规账号2391个
快手发布关于开展“清朗·2024年春节网络环境整治”专项行动的公告称,最近一周,平台累计处置违规内容28301条,处置违规账号2391个。重点治理情况如下:(一)宣扬猎奇行为、违背公序良俗问题:1.用户“玩*****琪”在直播中进行低俗PK,言语粗俗,通过夸张的行为博取眼球,违背公序良俗,平台对其采取关闭账号措施。站长网2024-02-06 08:51:130000字节跳动旗下火山引擎发布大模型服务平台“火山方舟”
今日,字节跳动旗下的云服务平台“火山引擎”发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。“火山方舟”实现了大模型安全互信计算,为企业客户确保数据资产安全。基于“火山方舟”独特的多模型架构,企业可同步试用多个大模型,选用更适合自身业务需要的模型组合。站长网2023-06-29 15:59:450000SK 海力士和三星对 HBM 领先地位的竞争随着人工智能的蓬勃发展而升级
站长之家(ChinaZ.com)9月4日消息:在第二季度,长期处于落后地位的SK海力士(DRAM厂商)凭借高价值和高性能的内存HBM产品(由持续热门的生成型AI带动)销售火爆,使其与全球内存领导者三星电子的市场份额差距缩小至6.3个百分点,自2009年以来最小的差距。站长网2023-09-04 10:07:480000服装AI大模型Fashion Diffusion上线 10秒打造小红书爆款小绿裙
只需10多秒,AIGC就能炸出一个小红书爆款!最近,一款由AI打造的小绿裙在小红书上爆火,评论区求同款的网友不在少数。嗅觉敏锐的一批商家迅速拿图去工厂打板、上架预售,将虚拟服饰快速复现,其中一个商家在小红书上挂出的链接已售出近千件。站长网2023-05-24 14:58:460000还争什么「新闻女王」,AI要7x24小时播新闻了
该系统的目的是取代那些只会照着提词器念稿子的主播,而不是真正的记者。「我要做一个星期七天的黄金时段新闻,」这是近期热播剧《新闻女王》里的一句台词。该剧讲述了几位主播在电视台内部明争暗斗的故事。人人都挖空心思,想全年无休连播七天黄金档。观众不禁感慨,他们真的太爱上班了。站长网2023-12-14 15:02:030000