登陆注册

15B击败62B

  • 英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑

    最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8Ttoken上完成了训练。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。论文地址:https://arxiv.org/abs/2402.16819在7个评估基准上,与同等参数规模的模型相比,Nemotron-415B表现出色。甚至,其性能超过了4倍大的模型,以及专用于多语言任务的模型。
    站长网2024-03-01 09:37:30
    0000