登陆注册

8B

  • 阿里云开源通义千问Qwen-72B、Qwen-1.8B、音频大模型Qwen-Audio

    阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio。据悉,阿里云本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向72B、1.8B对话模型提供了4bit/8bit量化版模型,便于开发者们推理训练。
    站长网2023-12-01 09:08:04
    0001
  • Transformer一作公司Adept发布多模态大模型Fuyu-8B 80亿参数,100毫秒极速响应

    要点:1.Transformer一作AshishVaswani所在的AI公司Adept发布了Fuyu-8B,一个多模态大模型,拥有80亿参数,能够理解各种图像类型,包括照片、图表、PDF和界面UI。2.Fuyu-8B采用了一种纯解码器Transformer架构,不使用图像编码器,支持任意图像分辨率,表现在多项任务中优于其他大型模型。
    站长网2023-10-19 15:01:42
    0000
  • Adept AI开源8亿参数语言模型Persimmon-8B

    要点:1、开源了Persimmon-8B,这是目前参数量少于10亿的最强大的完全免许可语言模型2、该模型具有16K的上下文长度,超过了LLaMA2的4倍和GPT-3的8倍3、提供了灵活快速的推理代码,在一块A100GPU上可以每秒生成56个token
    站长网2023-09-13 09:55:13
    0000