登陆注册

音频

  • Meta 宣布开源多感官 AI 模型 ImageBind:整合文本、音频、视觉等六种类型数据

    Meta宣布推出一个新的开源AI模型,可以连接多种数据流,包括文本、音频、视觉数据、温度和动作读数。图片来自Meta该模型目前仅是一个研究项目,没有立即的消费者或实际应用,但它指向了未来可以创建沉浸式、多感官体验的生成式AI系统,并表明了Meta在对手OpenAI和Google日益注重保密的时候仍在分享AI研究。
    站长网2023-05-10 09:09:39
    0001
  • 上海AI实验室等开源,音频、音乐统一开发工具包Amphion

    上海AI实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为Amphion的音频、音乐和语音生成工具包。Amphion可帮助开发人员研究文本生成音频、音乐等与音频相关的领域,可以在一个框架内完成,以解决生成模型黑箱、代码库分散、缺少评估指标等难题。
    站长网站长资讯2024-01-11 09:20:17
    0000
  • 研报显示 AI+3D 模型或成为继 AI+文字/图片/音频/视频后的高门槛的落地场景

    中金公司7月18日研报指出,在工业领域,传统AI模型(如数据分析预测、工业视觉等)应用已经相对成熟,但大语言模型(LLM)应用方兴未艾。中金观察到LLM应用正按照经营管理侧、生产控制侧、研发设计侧的顺序逐步落地,早期落地以企业知识库应用和数据分析应用等业务支持系统为主,尚未涉及核心设计和生产环节。
    站长网2023-07-18 18:29:35
    0000
  • 微信的“音频”野心

    以免费听周杰伦为切入点,微信音乐完成了一次成功的破圈。4月20日,微信在8.0.36版本更新中测试了“微信音乐”和“视频号会员”两项功能。其中,微信音乐在微信内设置了独立频道,提供简易的播放器功能,并向用户提供QQ音乐VIP歌曲的免费收听功能,时间截止到6月30日,其中就包括歌迷心心念念的周杰伦全部歌曲。
    站长网站长资讯2023-04-26 09:24:36
    0000