模型

首页标签模型

站长资讯
H100推理飙升8倍！英伟达官宣开源TensorRT-LLM，支持10+模型
声明:本文来自于微信公众号新智元（ID:AI_era），作者:桃子润，授权站长之家转载发布。【新智元导读】H100让模型推理性能最高跃升8倍!英伟达最新开源软件TensorRT-LLM，将彻底改变LLM推理现状。「GPU贫民」即将告别困境!刚刚，英伟达发布了一款开源软件TensorRT-LLM，能够加速H100上大型语言模型的推理。那么，具体能提升多少倍?
站长网2023-09-11 09:13:30
0002
站长资讯
Meta 开源 MusicGen 模型：用 AI 将文本和旋律结合创造全新音乐作品
Meta的MusicGen可以根据文本提示生成短小的新音乐片段，并可选择与现有旋律对齐。与今天的大多数语言模型一样，MusicGen基于Transformer模型。就像语言模型预测句子中的下一个字符一样，MusicGen预测音乐作品中的下一个部分。
站长网2023-06-12 22:57:15
0002
站长资讯
谷歌 DeepMind 推出 NaViT 模型可显著减少训练时间
最近，GoogleDeepMind推出了NaViT:一种新的ViT模型，它在训练过程中使用序列打包来处理任意分辨率和宽高比的输入。该模型将图像分割成小块，并线性投影到令牌上，形成了这个模型的基础。
站长网2023-07-18 06:37:25
0001
站长资讯
网站可以阻止OpenAI网络爬虫避免数据用于训练 GPT 模型
本文概要:1.OpenAI现允许网站屏蔽其网络爬虫，以防止其抓取网站内容训练GPT模型的。2.阻止GPTBot可能是OpenAI允许互联网用户选择不让其数据用于训练其大型语言模型的第一步。3.在获取用于训练AI的数据方面存在争议，一些网站和作者提出限制AI公司使用其内容的要求。
站长网2023-08-08 10:01:43
0001
站长资讯
剑桥初创公司在训练基于物理定律的 AI 模型
剑桥初创公司BeyondMath正在训练基于物理定律的AI模型。他们的目标是建立一个能够理解宇宙的AI，甚至能够提出继爱因斯坦相对论之后的统一理论。
站长网2023-08-02 14:26:43
0001
站长资讯
Anthropic 推出 Claude 3 Haiku：一款最快、最经济的 AI 模型
站长之家(ChinaZ.com)3月14日消息:人工智能技术领域的领先者Anthropic公司最近发布了其最新的Claude3AI模型系列成员，名为Claude3Haiku。这款全新的智能产品被定位为速度最快、成本最实惠的型号，在提供先进的视觉功能和行业标准性能的同时，为企业客户提供了全方位的选择。
站长网2024-03-14 09:33:04
0001
站长资讯
OpenAI、DeepMind 和 Anthropic 将让英国提前获得用于安全研究的 AI 模型
英国首相里希·苏纳克（RishiSunak）在周一向科技界做出了重大承诺，将英国定位为全球人工智能技术和技术监管中心。苏纳克今天早上在Twitter上发帖称，他的AI工作组有1亿英镑可用于资助人工智能安全，并且它正在与DeepMind、OpenAI和Anthropic合作，以获得「早期或优先访问研究模型和安全目的。」
站长网2023-06-13 20:03:51
0001
站长资讯
Meta 宣布开源多感官 AI 模型 ImageBind：整合文本、音频、视觉等六种类型数据
Meta宣布推出一个新的开源AI模型，可以连接多种数据流，包括文本、音频、视觉数据、温度和动作读数。图片来自Meta该模型目前仅是一个研究项目，没有立即的消费者或实际应用，但它指向了未来可以创建沉浸式、多感官体验的生成式AI系统，并表明了Meta在对手OpenAI和Google日益注重保密的时候仍在分享AI研究。
站长网2023-05-10 09:09:39
0001
站长资讯
PyTorch团队重写Meta“分割一切”模型性能提速8倍
要点:PyTorch团队通过对Meta的「分割一切」（SAM）模型进行重写，使其在原始实现的基础上提速8倍，同时保持准确率。优化方法包括采用PyTorch原生特性如Torch.compile、GPU量化、SDPA等，以及使用半精度（bfloat16）、自定义Triton内核、NestedTensor、量化、半结构化稀疏性等操作。
站长网2023-11-22 11:56:36
0001
站长资讯
Meta 发布可以检查其他 AI 模型工作的 AI 模型
Facebook母公司Meta当地时间周五正式发布了一批来自其研究部门的新AI模型，其中包括一个名为「自学评估器」（Self-TaughtEvaluator）的模型，这可能为减少人类在AI开发过程中的参与度提供了一条新路径。
站长网2024-10-20 10:46:14
0000
站长资讯
Mistral 发布其首个代码生成 AI 模型 Codestral
由微软支持、估值高达60亿美元的法国人工智能初创公司Mistral近日发布了其首个用于编码的生成式人工智能模型——Codestral。该模型旨在帮助开发人员编写代码并与代码交互，支持包括Python、Java、C和JavaScript在内的80多种编程语言。Mistral在其博客文章中表示，Codestral能够完成编码功能、编写测试、填写部分代码，并用英语回答有关代码库的问题。
站长网2024-05-30 10:37:49
0000
站长资讯
谷歌推出新的 AI 模型 LearnLM，专注于教育领域
划重点:-🤖LearnLM是谷歌基于其型语言模型Gemini开发的一系列AI模型，旨在帮助学生解决作业问题和提高学习果。-📚LearnLM可以在不同的方式（如照片或视频）中找到和展示专题的例子，辅导学生习，并激发学习的兴趣。
站长网2024-05-15 11:49:16
0000
站长资讯
报告显示：企业尚未准备好部署 AI 模型
划重点:-📊报告显示，企业在有效部署AI模型的基本流程方面存在困难-📉只有少数受访的IT专业人士能够实时运行数据同步，部署高级分析应用的能力也有限-🛠企业在AI策略、部门参与和道德考量方面存在缺失，可能影响AI的全面推广
站长网2024-05-07 12:49:22
0000
站长资讯
魔搭社区开源Data-Juicer 、 lite-Sora 类 Sora 模型
在2024全球开发者先锋大会上，魔搭社区推出了“ModelScope-Sora开源计划”，旨在通过开源力量促进中国类Sora模型的探索与创新。该计划提供一站式工具链，包括数据处理工具、多模态数据集、类Sora基础模型、训练推理工具等。
站长网2024-03-25 11:16:47
0000
站长资讯
微软推出用于 Azure AI Health Insights 的新 AI 模型
站长之家(ChinaZ.com)10月12日消息:微软通过AzureHealthInsights发布了一系列专为医疗保健行业定制的数据和人工智能产品。这些工具旨在帮助医疗机构利用其产生的大量数据，从而改善患者护理并简化运营。利用MicrosoftFabric改善医疗保健
站长网2023-10-12 15:43:49
0000
站长资讯
人工智能写作助手Flot.ai：使用最新GPT-4 模型支持200多种语言
Flot.ai是一款人工智能写作助手，能够帮助用户在任何应用或网站上获得AI的帮助，无需复制粘贴就可以使用ChatGPT。Flot.ai使用OpenAI最新的GPT-4模型，支持200多种语言，真正做到一键使用AI。体验地址：https://flot.ai/
站长网2023-09-11 18:01:10
0000
站长资讯
OpenAI 发布新的文本生成 3D 模型 Shap-E：比 Point-E 更快更好
OpenAI最近分享了他们在将文本提示转化为3D物体方面的最新探索，名为Shap-E。这款生成式AI工具提供了一种新的方式来生成3D物体，其制作的物体比去年发布的Point-E模型更好、更详细、更准确。截自Shap-EGitHub页面
站长网2023-05-09 14:37:32
0000
站长资讯
韩国提出以「GOV-GPT」形式在内部自主开发 AI 模型
据韩联社消息，虽然三星电子等大公司正在限制内部使用生成人工智能(AI)，现在公共部门也出现了抑制AI使用的氛围。日前据业内人士和当局透露，韩国国家情报院提出对各部门公务员的要求注意事项，强调在使用OpenAI的GPT系列时，只能输入公开信息，科学部、信息通信部等部门也向相关部门提供指引，它发布了AI安全指南以供遵循。
站长网2023-05-08 09:47:50
0000
站长资讯
AI初创公司新旦智能完成千万级别天使轮融资用于发展 xDAN 模型
「新旦智能」是一家新兴的人工智能初创公司，最近完成了千万级的天使轮融资。这轮融资是由全球化人工智能企业APUS和AI行业资深投资人周弘扬联合投资的。融资资金将用于进一步发展他们的xDAN模型，这个模型具有独特的高情商和强大的推理能力，旨在打造新一代AI原生产品，构建个性化的多模态智能体，为用户提供专属的智能服务体验。
站长网2024-03-09 17:01:52
0000
站长资讯
零一万物开源 Yi-9B 模型代码数学综合能力全面增强
零一万物团队发布并开源了Yi-9B模型，这是零一万物Yi系列模型中的“理科状元”，在代码和数学能力方面表现最佳，并且具有强大的中文能力。该模型的优势包括:1.代码和数学能力出色，综合实力强劲。在综合能力方面，Yi-9B超越了其他相近尺寸的开源模型，如DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B。
站长网2024-03-07 15:18:44
0000
站长资讯
Midjourney 计划未来几个月推出“文本转视频”模型
**划重点:**1.🎥Midjourney计划在未来几个月推出“文本转视频”模型，将其AI形象生成器扩展到视频创作领域。2.🤖公司将于1月开始培训视频模型，CEODavidHolz表示这是平台的自然发展，将竞争动态引入生成视频行业。3.🌐与竞争对手相比，MidJourney的最新v6更新着重于提高画质和用户体验，预示着AI视频生成领域的激烈竞争。
站长网2024-01-03 14:12:15
0000
魔改Stable Diffusion，开源创新“单目深度估计”模型
单目深度估计一直是计算机视觉领域的难点。仅凭一张RGB图像，想要还原出场景的三维结构，在几何结构上非常不确定，必须依赖复杂的场景理解能力。即便使用更强大的深度学习模型来实现，也面临算力需求高、图像数据注释量大、泛化能力弱等缺点。
站长网站长资讯2024-01-02 09:20:33
0000
站长资讯
Bing Chat 推出 GPT-4Turbo 模型但仅限部分用户试用
据外媒报道，微软正在向BingChat推出ChatGPT的最新模型，GPT-4Turbo。该模型是现有GPT-4模型的升级版，包含截至2023年4月的信息，因此在搜索新事件时可以返回更好的结果。目前，GPT-4Turbo仅适用于选定的随机测试者。微软计划在未来几周内扩大推出范围。
站长网2023-12-25 18:52:27
0000
Gemini 是谷歌迄今为止最佳的 AI 模型但充满希望的基准测试和演示最终引发了批评
谷歌近日公布了其最新的人工智能模型Gemini，旨在缩小与OpenAI之间的差距，并给行业留下深刻印象。该模型展示了强大的基准测试成绩，并通过一段引人注目的视频演示和即时的可用性（尽管是功能受限版本），彰显了谷歌的自信。
站长网站长资讯2023-12-21 11:51:04
0000
站长资讯
埃森哲和谷歌云将提供人工智能托管服务来扩展生成式 AI，包括部署谷歌 Gemini 模型
埃森哲(Accenture)和GoogleCloud今天宣布，为帮助企业采用生成型AI改进运营、创造新的业务线和构建独特的客户体验，双方将建立一个全球性的生成型AI卓越中心（CoE）。这一中心将为企业提供行业专业知识、技术知识和产品资源，使用GoogleCloud的生成型AI产品组合建立和扩展应用程序，并加速实现价值。图片来自Accenture
站长网2023-12-14 11:06:02
0000
站长资讯
魔搭社区上线Mistral AI 首个开源 MoE 模型 Mixtral8x7B
MistralAI近日发布了首个开源MoE模型Mixtral8x7B，并宣布在魔搭社区上线。Mixtral-8x7B是一款混合专家模型（MixtrueofExperts），由8个拥有70亿参数的专家网络组成，在能力上，Mixtral-8x7B支持32ktoken上下文长度，支持英语、法语、意大利语、德语和西班牙语，拥有优秀的代码生成能力，可微调为指令跟随模型。
站长网2023-12-14 09:42:42
0000
站长资讯
微软发布小型语言 AI 模型 Phi-2，性能优于 Llama 2、Mistral 7B
微软研究院当地时间周二宣布其Phi-2小型语言模型（SML），这是一款文本到文本的人工智能程序，据X平台的一篇帖子称，它「足够小，可以在笔记本电脑或移动设备上运行」。Phi-2拥有27亿参数，性能堪比其他更大的模型，包括Meta的Llama2-7B（拥有70亿参数）和Mistral-7B（另一款70亿参数模型）。
站长网2023-12-13 09:04:01
0000
日本科技巨头乐天计划在未来两个月内推出自家 AI 模型
**划重点:**1.📅**发布计划:**日本科技巨头乐天计划在接下来的两个月内推出自家的大型语言模型。2.🌐**数据优势:**乐天拥有从银行到电商和电信等多个业务领域的“独特”大量数据，将用于训练其大型语言模型。3.💼**商业应用:**乐天首席执行官表示，公司计划在内部使用人工智能模型提高运营效率，然后向企业开放，并预计可通过该模型提升营销效果20%。
站长网站长资讯2023-12-11 11:42:47
0000
站长资讯
使用 AI 越狱 AI 模型：新方法可系统地探测 GPT-4 等大型语言模型的弱点，从而使其行为异常
上个月，OpenAI董事会突然解雇了该公司的首席执行官，这引发了人们的猜测：董事会成员对人工智能突飞猛进的发展速度以及过快寻求技术商业化可能带来的风险感到震惊。
站长网2023-12-06 11:49:05
0000
三星即将推出的 Galaxy Book 4 系列规格泄露，可能搭载英特尔 AI 芯片以运行「Samsung Guass」专有 AI 模型
三星正准备在年底前揭晓其全新Windows笔记本电脑阵容。据最近的泄露消息，GalaxyBook4系列的规格和产品图片已经几乎完全曝光。额外的信息显示，三星可能会在GalaxyBook4系列中搭载英特尔最新的AI驱动SoC。
站长网站长资讯2023-12-05 10:32:23
0000
站长资讯
GPT-4在医学问题上击败了专业调优的 MedPaLM 2 模型
在研究中，微软的研究人员展示了GPT-4在医学知识测试中的卓越表现，特别是当结合先进的提示工程技术时，其性能超过了专业调整的MedPaLM2。研究结果显示，相较于费时费力的调优和模型训练，将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径。
站长网2023-12-04 11:17:22
0000
站长资讯
Sam Altman 最新专访：首次回应 Q* 模型，拒绝回答被解雇原因
经历了为期五天的董事会政变尝试后，SamAltman于本周三正式重返OpenAI担任首席执行官。OpenAI的最大投资者微软也计划担任非投票董事会成员。
站长网2023-12-01 11:52:47
0000
站长资讯
日本电信巨头 NTT 将推出面向商业用途的「tsuzumi」的新 AI 模型：日语能力超越 ChatGPT
日本电信巨头NipponTelegraphandTelephone(NTT)宣布将于三月推出面向商业用途的生成式人工智能(AI)平台，以在迅速扩张的市场中追赶国际竞争对手。据NTT本月早些时候透露，该AI平台的日语处理能力超过了美国OpenAI开发的广泛使用的AI聊天机器人ChatGPT。图源备注：图片由AI生成，图片授权服务商Midjourney
站长网2023-11-24 09:35:18
0000
站长资讯
Hugging Face 推出开源多模态 AI 模型 IDEFIX
人工智能创业公司HuggingFace最近推出了一款名为IDEFIX的开源多模态AI模型。IDEFIX可以处理图像和文本输入，并生成连贯的文本输出。
站长网2023-08-24 11:44:08
0000
站长资讯
谷歌认真起来，就没 OpenAI 什么事了！创始人亲自组队创建“杀手级”多模态 AI 模型
谷歌正在计划如何利用即将推出的大型语言模型系列Gemini来取代ChatGPT。截至目前，OpenAI大语言模型在AI竞赛中一直处于领先地位。而强劲优势的背后，离不开微软庞大数据中心基础设施的有力支持。但ChatGPT的主导地位恐怕无法长久持续下去，因为新的、更强大的AI模型正不断涌现，而其中最具战斗力的挑战者就来自谷歌。
站长网2023-08-19 16:16:06
0000
站长资讯
Transformer速查宝典：模型、架构、训练方法的论文都在这里了
论文大合集，一篇文章就搞定。AI发展迅速，这对于刚刚入门或是正想跟上「潮流」的新手们来说并不友好。如果有一份详细全面的知识列表可能会帮助他们更快走上「正途」。今天给大家带来一篇Transformer的综述文章，供大家了解Transformer的来龙去脉及相关技术。
站长网2023-08-14 12:12:10
0000
站长资讯
英伟达 AI Workbench 让任何人都可以训练生成式 AI 模型
站长之家(ChinaZ.com)8月9日消息:除了推出推出更强大的升级款人工智能芯片GH200之外，英伟达还宣布推出AIWorkbench，承诺使生成式人工智能的创建变得更加容易和可管理。据介绍，这个AIWorkbench将允许开发者在各种英伟达AI平台上开发和部署各种模型，包括个人电脑和工作站。
站长网2023-08-09 20:03:25
0000
站长资讯
谷歌推出新的 AI 控制机器人 RT-2 模型：将文本和图像转化为机器人动作
站长之家(ChinaZ.com)7月31日消息:忘记了那些能画画的人工智能，谷歌最新的人工智能模型能够控制机器人。上周五，谷歌推出了RoboticsTransformer2（RT2），这是一个视觉-语言-动作（VLA）模型，可以将文本和图像输出为机器人动作。谷歌表示，RT-2「让我们更接近机器人的未来。」
站长网2023-07-31 09:21:08
0000
站长资讯
Meta 停止披露用于训练巨型生成式 AI 模型 Llama 2 的数据来源
版权问题引发大规模的生成式人工智能争议，Meta试图以不公开训练数据的方式规避争议。周二，社交媒体巨头Meta发布了一款名为Llama2的庞大新模型，但在研究论文中几乎没有透露使用了哪些数据。「新的公开可用的在线数据，」Meta的研究人员在论文中写道，几乎没有其他信息。
站长网2023-07-19 22:07:58
0000
站长资讯
字节团队提出猞猁 Lynx 模型多模态 LLMs 开创理解生成新高度
字节团队最近提出了一种名为猞猁（Lynx）的多模态大语言模型(LLMs)。他们通过对二十多种多模态LLMs变体进行系统实验和评估，确定了以prefix-finetuning为主要结构的Lynx模型，并且还提出了一个新的多模态评估基准Open-VQA。论文:https://arxiv.org/abs/2307.02469网站:https://lynx-llm.github.io/
站长网2023-07-18 17:22:58
0000
站长资讯
微软 Azure 发布能跨多种模态生成内容的 CoDi 模型：同时处理和生成文本、图像、视频和音频
作为人工智能领域的一项显著进步，微软Azure认知服务研究中心和北卡罗来纳大学NLP（自然语言处理）团队的研究人员日前推出了CoDi，这是一种尖端的生成模型，能够跨多个领域无缝生成高质量内容。图片来自Microsoft这一突破性的发展为更全面地理解世界和人类理解提供了新的可能性，为沉浸式人机交互提供了平台，改变了人类与计算机的互动方式。
站长网2023-07-12 11:35:40
0000
站长资讯
中科院发布“分割一切”模型，比Meta原版快50倍
最近，中国科学院的一个团队发布了FastSAM模型的开源版本。通过将任务细分为全实例分割和提示指导选择两个子任务，这个模型能够以惊人的速度实现与原始SAM相近的效果，而且还可以实时推理达到每秒25帧。这个成果在Github上已经获得了2.4K次星标，也在Twitter、PaperswithCode等平台上引起了广泛关注。
站长网2023-06-30 23:54:16
0000
站长资讯
OpenAI 计划为 AI 软件开发应用程序商店：开发者可销售定制 AI 模型
据TheInformation网站周二援引知情人士的消息报道称，OpenAI计划推出一个应用商店，允许开发者在其自家的人工智能技术之上构建的AI模型进行销售。OpenAI是ChatGPT广受欢迎的聊天机器人的开发者。
站长网2023-06-21 16:47:50
0000
站长资讯
LeCun世界模型出场！Meta震撼发布首个「类人」模型，理解世界后补全半张图，自监督学习众望所归
【新智元导读】LeCun的世界模型终于来了，可谓是众望所归。既然大模型已经学会了理解世界、像人一样推理，是不是AGI也不远了?长久以来，LeCun理想中的AI，一直是通往人类水平的AI，为此他提出了「世界模型」的构想。而最近，LeCun在公开演讲中，再次批评了GPT大模型:根据概率生成自回归的大模型，根本无法破除幻觉难题。甚至直接发出断言:GPT模型活不过5年。
站长网2023-06-15 10:10:41
0000
站长资讯
OpenAI 采用新方法训练 AI 模型以应对人工智能产生的「幻觉」
OpenAI于当地时间周三宣布，他们正在采用一种新的方法来训练人工智能模型，以应对人工智能产生的「幻觉」。此项研究的推出正值AI系统产生的错误信息比以往任何时候都更加引发热议，尤其是在生成式AI蓬勃发展的同时，以及2024年美国总统大选临近之际。
站长网2023-06-01 16:16:43
0000
OpenAI 正准备向公众发布新的开源 AI 模型
站长之家(ChinaZ.com)5月16日消息:OpenAI正准备向公众发布一种新的开源语言模型，TheInformation周一的报道援引一位了解该计划的人士的话说。
站长网站长资讯2023-05-16 09:18:48
0000
站长资讯
OpenAI正研究向内容创作者付费的 AI 模型
OpenAI首席执行官SamAltman宣布，该公司正在开发尊重创者版权并在内容或风格被使用时向内容创作者付费的AI模型。实施细节和时间表尚未公布。当OpenAI引入ChatGPT插件时，它表明了解带有工具的大型语言模型对内容生态系统的潜在影响。随着聊天机器人生态系统中发生的互动越多，内容创作者在聊天机器人之外的产品获得的关注度和金钱就越少。
站长网2023-05-11 10:54:44
0000