首页站长资讯Groq大模型推理芯片每秒500tokens超越GPU，喊话三年超过英伟达

Groq大模型推理芯片每秒500tokens超越GPU，喊话三年超过英伟达

站长网2024-02-20 14:23:500阅

划重点:

1. Groq公司推出的大模型推理芯片，每秒500tokens的惊人速度超越了传统GPU，挑战谷歌TPU。

2. 该芯片由初创公司Groq研发，由谷歌TPU团队原班人马打造，推理速度提高10倍，成本降低十分之一，支持多种大模型。

3. Groq的目标是在三年内超越英伟达，采用自创的LPU方案，克服计算密度和内存带宽瓶颈，实现18倍于云平台速度的推理性能。

Groq公司推出的大模型推理芯片以每秒500tokens的速度引起轰动，超越了传统GPU和谷歌TPU。该芯片由初创公司Groq研发，其团队成员来自谷歌TPU，包括创始人兼CEO Jonathan Ross，曾设计实现第一代TPU芯片的核心元件。

Groq采用了全球首个LPU（Language Processing Unit）方案，旨在克服计算密度和内存带宽的瓶颈，最终实现大模型推理性能比其他云平台厂商快18倍。据介绍，英伟达GPU需要大约10到30焦耳才能生成响应中的tokens，而Groq仅需1到3焦耳，使得推理速度提高了10倍，成本降低十分之一，性价比提高了100倍。

Groq的芯片采用14nm制程，搭载了230MB大SRAM以保证内存带宽，片上内存带宽高达80TB/s。在算力方面，该芯片的整型（8位）运算速度为750TOPs，浮点(16位)运算速度为188TFLOPs。基于自研的TSP架构，Groq利用机器学习工作负载的并行性对推理进行加速，并支持通过PyTorch、TensorFlow等标准机器学习框架进行推理。

Groq公司在演示中展示了其芯片的强大性能，支持Mixtral8x7B SMoE、Llama2的7B和70B等多种模型，并可直接体验Demo。不仅如此，Groq还喊话各大公司，扬言在三年内超越英伟达。该公司的推理芯片在第三方网站上的售价为2万多美元。

Groq公司以其创新的LPU方案和超越性能的大模型推理芯片，成为大模型推理领域令人瞩目的新兴力量，引领着技术的飞速发展。

Groq产品的特色亮点如下:

1. API访问速度极快:Groq提供了API密钥，可以访问世界上最快的开源大型语言模型（LLM）推理速度。他们的实现在Anyscale的LLMPerf Leaderboard上展示了相较于云服务提供商高达18倍的推理性能。

2. 支持开源LLM模型:*Groq支持Llama2-70B和7B，这两个由Meta AI创建的领先的开源基础LLM模型。这些Groq实现使用4096的上下文长度。

3. 支持其他模型:*除了Llama系列外，Groq还支持Mixtral8x7B，由Mistral AI创建，可根据请求提供。其他模型如Mistral和CodeLlama也可根据特定客户请求提供。

4. 免费试用期: 提供为期10天的免费试用期，可以根据请求进行刷新。在试用期间，用户将获得100万免费令牌，并且API与OpenAI API完全兼容。

5. 价格保证: Groq保证以击败任何已发布的相应模型的百万令牌价格。他们的定价相对较低，可以提供更具竞争力的服务。

6. 早期访问计划: Groq提供了Alpha版本的API的早期访问计划，免费供研究和开发目的使用。公共可用性计划于2024年第二季度。

7. 高性能硬件支持: Groq引擎（LPU™ Inference Engine）在性能上优越，通过硬件支持实现了18倍于云服务提供商的LLM推理性能。

Groq产品以其出色的推理性能、对多种开源LLM模型的支持以及具有竞争力的价格政策等特色，成为一个引人注目的选择。

项目入口：https://top.aibase.com/tool/groq

Groq大模型推理芯片每秒500tokens超越GPU喊话三年超过英伟达

0000

评论列表

共(0)条

相关推荐

站长资讯
在线AI音乐分析工具SONOTELLER：可一键分析YouTube链接中的音乐
SONOTELLER是一个在线AI音乐分析工具，专门用于分析YouTube上的音乐和歌词。该工具提供了丰富的音乐信息，包括歌曲摘要、语言识别、内容标记、主要音乐流派和子流派、主要演奏乐器以及情感分析等等。体验地址：https://sonoteller.ai/#carouselExampleCaptions
站长网2023-10-12 16:45:59
0001
站长资讯
理想汽车辟谣AI医疗领域合作：涉事方已删除不当言论并致歉
快科技7月12日消息，理想汽车法务部针对将与医施德（北京）医疗科技有限公司在AI医疗领域开展商务合作”进行了回应。理想法务部表示：医施德公司的上述宣传内容没有任何事实依据，属于造谣和欺骗消费者。经理想汽车法务部严正警告，医施德公司已删除所有侵权内容，向理想汽车出具书面致歉信。理想汽车特此公开澄清，以防广大消费者产生误解并造成损失。
站长网2024-07-13 10:23:01
0000
站长资讯
80w人疯狂围观，这个赛道开始卷起来了
说起张静初，相信很多人都对她有印象，80后的她，在演艺圈沉寂已久，近日，却因为开直播分享学习生活，吸引了将近80万人在线观看，#张静初考研#的词条一度登上微博热搜。有网友留言:“我都睡了一觉了姐姐还在（学习）”“她写作业已写到‘生无可恋’”。
站长网2024-05-14 14:00:22
0002
站长资讯
好莱坞经纪公司CAA为明星提供管理AI形象方案避免遭滥用
划重点:-💡CAA与AI技术公司Veritone合作，为明星提供数字资产管理解决方案，旨在保护他们的AI形象免遭滥用。-💡CAA为明星建立了虚拟媒体存储系统，名为“theCAAvault”，明星可以在其中存储他们的数字资产，如名字、形象、声音等。-💡CAA的目标是通过创建和拥有自己的数字形象，帮助明星确保AI使用的合法性和保护自身权益。
站长网2024-05-20 13:19:58
0000
站长资讯
百度发布 2023 年第一季度财报：营收311亿元同比增长10%
今日，百度发布了截至2023年3月31日的第一季度未经审计的财务报告。财报显示，第一季度，百度实现营收311亿元，同比增长10%;归属百度的净利润（non-GAAP）达57亿元，同比大幅增长48%。其中，百度智能云营收42亿元，同比增长8%。“百度核心”的营收达230亿元，较上年同期增长8%。截至2023年3月，百度APP月活跃用户达到6.57亿，同比增长4%。
站长网2023-05-16 17:35:26
0000