MLC 项目使得 AMD GPU 在 LLM 推理方面具有竞争力

站长网2023-08-11 17:43:130阅

站长之家(ChinaZ.com) 8月11日消息:AMD GPU 通过 MLC（Machine learning compilation）项目在编译和部署大模型方面取得了进展，实现了与英伟达 GPU 相当的性能。MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的 80%，而价格只有 RTX 4090 的 60%。

MLC-LLM 可以编译 LLM 并将其部署在使用具有竞争性能的 ROCm 的 AMD GPU 上。更具体地说，对于 Llama2-7B/13B，AMD Radeon™ RX 7900 XTX 的速度是 NVIDIA® GeForce RTX™ 4090 的 80%，是 NVIDIA® GeForce RTX™ 3090Ti 的 94%。除了 ROCm 之外，Vulkan 支持还允许我们将 LLM 部署推广到其他 AMD 设备，例如具有 AMD APU 的 SteamDeck。

机器学习编译（MLC）是一种新兴技术，用于编译和自动优化机器学习工作负载。与为每个独立的后端（如 ROCm 或 CUDA）编写特定的内核不同，MLC 解决方案会自动生成适用于不同后端的代码。利用基于 ML 编译的解决方案 MLC-LLM，为 LLMs 提供高性能的通用部署。MLC-LLM 建立在 Apache TVM Unity 之上，它是一种机器学习编译栈，提供了基于 Python 的开发和通用部署。MLC-LLM 为各种后端（包括 CUDA、Metal、ROCm、Vulkan 和 OpenCL）提供了最先进的性能，涵盖了服务器级 GPU 到移动设备（iPhone 和 Android）。

在较高的层次上，该框架允许用户采用基于 Python 的工作流程，包括转换计算图的 API，优化 GPU 内核的布局和调度，并将其在感兴趣的平台上进行本地部署。

MLC项目使得AMDGPU在 LLM推理方面具有竞争力

0000

评论列表

共(0)条

相关推荐

站长资讯
用AI生成！嘲讽特朗普被捕的说唱歌曲登上iTunes排行榜第二
文章概要:1.一首AI生成的嘲笑特朗普被捕说唱歌曲在iTunes说唱歌曲排行榜上名列第二。2.这首歌模仿特朗普的声音，提到他在佐治亚州拘留中心的犯罪照片，并将其作为对抗民主党人的象征。3.该歌曲获得右翼评论员的大力赞扬。最近，一首由艺术家Hi-Rez创作、模仿“特朗普”风格的说唱歌曲《FirstDayOut》在iTunes说唱歌曲排行榜上迅速晋升至第二名。
站长网2023-08-30 15:10:59
0003
站长资讯
抖音旗下公司申请醒言AI、简涌AI商标
天眼查App显示，近日，抖音集团旗下北京有竹居网络技术有限公司申请注册“醒言AI”“简涌AI”“问问子贡”商标，国际分类为科学仪器、网站服务、教育娱乐，当前商标状态均为等待实质审查。股东信息显示，该公司由抖音集团（香港）有限公司全资持股。
站长网2023-10-26 16:43:07
0002
站长资讯
比亚迪王传福与库克在上海见面：展示智能制造技术
据澎湃新闻报道，3月20日下午，比亚迪股份有限公司的董事长兼总裁王传福在上海的苹果中国总部与苹果CEO库克会面。这次会面是在比亚迪电子、蓝思科技、长盈精密等苹果供应商展示智能制造技术以及为苹果生产的零部件和产品之际进行的。在当天的活动中，王传福和库克共同参观了比亚迪的展台，深入了解了比亚迪的技术和产品。
站长网2024-03-21 23:19:59
0000
站长资讯
北京智源发布悟道3.0大模型已全面开源
近日，北京智源人工智能研究院发布悟道3.0大模型系列，包含“悟道·天鹰”（Aquila）语言大模型系列、天秤(FlagEval)开源大模型评测体系与开放平台，“悟道·视界”视觉大模型系列，以及一系列多模态模型成果。据了解，悟道系列模型已发展到“悟道3.0”版本，涵盖语言、视觉、多模态等基础大模型，现在已全面开源。
站长网2023-06-12 16:57:37
0000
我国微短剧用户达6.62亿：59.7%的网民都会看
快科技1月17日消息，根据中国互联网络信息中心发布的第55次《中国互联网络发展状况统计报告》显示，我国网民规模已达到11.08亿人，互联网普及率升至78.6%。截至12月，微短剧用户规模达6.62亿人，网民使用率为59.7%。根据日前中国网络视听协会发布的《2024微短剧行业生态洞察报告》，2024年各平台共上线微短剧3万多部。题材方面，以家庭、都市、情感等为代表的女性题材迅速崛起。
站长网站长资讯2025-01-18 10:41:32
0000