Hugging Face新价格计算器揭示训练AI成本高昂
文章概要:
1. Hugging Face推出了名为“训练集群即服务”的新AI服务,允许公司进行AI模型训练,无需拥有大量计算资源。
2. 用户可以使用价格计算器根据参数、功能、训练数据量和速度配置所需的模型,价格范围广泛。
3. 尽管提供了这项服务,顶级AI模型如GPT-4或Google的Gemini仍然显著昂贵且强大。未来,处理器进步、更高效的架构和高质量训练数据可能会降低培训成本。
Hugging Face最近推出了一项新的人工智能服务,名为“training cluster”,旨在帮助公司进行AI模型的培训,而无需拥有庞大的计算资源。这一新服务允许用户利用高性能GPU集群,并通过价格计算器根据参数、功能、训练数据量和所需的速度来配置他们所需的模型。
训练AI费用昂贵
根据价格计算器,最便宜的可配置文本模型拥有70亿个参数,估计成本为43,069美元,需要大约四天的培训时间。
而最昂贵的多模态模型(包括文本和图像)将花费高达18,461,354美元,拥有700亿个参数、7万亿个训练数据标记,以及在1000个Nvidia H100GPU上进行了长达184天的培训。这突显了不同模型之间的价格差距。
然而,即使使用Hugging Face的服务培训出拥有70亿参数的最强多模态模型,也很可能在性能上无法与GPT-4或Google的Gemini竞争,这两者拥有约1.8万亿参数,是后者的25倍之多。估计其培训成本在6,800万美元到1亿美元以上。
这表明,尽管提供了新的AI培训服务,但尖端AI模型在财务角度上仍具有强大的竞争力。
尽管存在高昂成本,但未来随着处理器技术的进步、更高效的架构以及高质量训练数据的需求降低,培训价格可能会有所下降。
training cluster网址:https://huggingface.co/training-cluster
报告显示:中国发布79个10亿级以上大模型 地域和领域分布相对集中
据中新网报道,近日在北京举行的中关村论坛平行论坛“人工智能大模型发展论坛”上,中国科学技术信息研究所所长赵志耘发布了《中国人工智能大模型地图研究报告》。报告指出,中国大模型技术路线正在并行突破,特别是在自然语言理解、机器视觉、多模态等方面,出现了多个在行业有影响力的大模型。站长网2023-05-30 14:51:150000匿名论文提出奇招,增强大模型长文本能力居然还能这么做
一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。具体办法就是建一个临时Lora模块,让它仅在长文本生成过程中“流式更新”,也就是用先前生成的内容不断作为输入来充当训练数据,以此保证知识被存进模型参数中。站长网2024-02-04 09:04:3600002022年创业公司CEO薪酬报告:不如打工人
“你以为CEO的薪资多吗?是你想多了。”作者|王王编辑|蔓蔓周首图来源:tnwcdn创业公司的CEO能拿多少薪水?这个问题不光员工关心、VC关心,广大正在创业和想要创业的人也关心。美国一家咨询机构KruzeConsulting对超过250家多个行业的创业公司进行了调研,发布《2022创业公司CEO薪酬报告》,发现了许多有趣的趋势。站长网2023-04-17 18:34:260002SuperCLUE:GPT-4 Turbo中文基准评测领先国内最强模型超过30分
GPT-4Turbo是OpenAI发布的最新ChatGPT模型,具有128K上下文和训练数据知识截止至2023年4月。SuperCLUE表示,GPT-4Turbo在SuperCLUE-OPEN中文通用大模型综合性评测基准上,取得了总分98.4,八项基础能力满分,领先国内最强模型超过30分。站长网2023-11-09 14:37:000001同花顺:大模型产品正在向相关主管部门申请备案阶段
近日,同花顺表示,大模型产品目前正在向相关主管部门申请备案阶段。目前,公司各个业务方和产品都在进行适配工作,主要集中在金融行业,加强现有的应用场景,例如iFind金融数据终端、i问财、智能投研等产品和场景。站长网2023-06-29 11:35:020001