登陆注册

demo可玩

  • 字节大模型BuboGPT已开源 demo可玩

    字节推出了一种新的大模型,名为BuboGPT,BuboGPT是一种先进的大型语言模型(LLM),能够将文本、图像和音频等多模态输入进行整合,并具有将回复与视觉对象进行对接的独特能力。它展示了在对齐或未对齐的任意图像音频数据理解方面的出色对话能力。项目地址:https://bubo-gpt.github.io/
    站长网2023-08-19 13:07:07
    0006
  • 字节大模型新进展:首次引入视觉定位,实现细粒度多模态联合理解,已开源&demo可玩

    字节大模型,BuboGPT来了。支持文本、图像、音频三种模态,做到细粒度的多模态联合理解。答哪指哪,什么讲了什么没讲,一目了然:除了有“慧眼”,还有“聪耳”。人类都注意不到的细节BuboGPT能听到:Audio-1-chime-bird-breeze,量子位,20秒前方高能!三模态联合理解,文字描述图像定位声音定位,一键搞定,准确判断声音来源:
    站长网2023-08-15 20:27:17
    0001