Perplexity AI 发布 PPLX 在线语言模型,可能取代谷歌搜索引擎
Perplexity AI,这家由前谷歌 AI 研究员 Andy Konwinski、Aravind Srinivas、Denis Yarats 和 Johnny Ho 创立的初创公司,通过结合网络索引和最新信息与会话式 AI 聊天机器人界面,有望颠覆其前东家谷歌在网络搜索领域的领先地位。其聊天机器人 Perplexity Copilot,直到最近一直使用 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作为后台「智能」,付费用户可以在这两者之间切换。
Perplexity AI 网站截图
AI 中的参数指的是每个模型的人工神经元之间的连接数,通常表明模型的强大和「智能」程度,参数越高通常意味着模型更加知识渊博、智能和高效。
为什么 Perplexity 的新在线 LLMs 很重要,它们与 ChatGPT 和其他 LLMs 有何不同?
Perplexity 的新在线 LLMs 之所以重要,以及它们与 ChatGPT 等的区别,在于它们不仅可供其他组织通过 Perplexity 的 API(应用程序编程接口)使用和构建自己的应用程序,而且还旨在提供「有用的、事实和最新的信息」——这是大多数其他领先 LLMs,包括 OpenAI 的 GPT-3.5 和 GPT-4(为 ChatGPT 提供动力)难以做到的。
Perplexity 首席执行官 Aravind Srinivas 在 X 上发布消息称,新的 PPX LLMs 是「首个实时 LLM API,它们基于网络搜索数据,没有知识截止日期!」
GPT-3.5 和 4 的存储知识截止日期直到最近一直限于 2021 年 9 月,直到今年早些时候才有所提升。尽管如此,这与内置了当前事件和最新消息的知识相比还有很大差距,尽管通过 OpenAI 合作伙伴微软必应搜索恢复 ChatGPT 的 Web 浏览功能在一定程度上缓解了这一点,该功能于 2023 年 9 月底恢复。
通过 LLM 聊天机器人提供最新知识的竞赛也在升温。埃隆·马斯克(Elon Musk)夸口他的公司 xAI 的新聊天机器人 Grok 将具备这一能力,这要归功于它与姐妹公司 X(前推特)的直接整合,以及该平台用户发布的所有实时信息。Grok 已经向选定用户提供了有限的测试版,并将在本周推出供任何人使用,前提是用户支付 X Premium 订阅。
其他 LLM 提供商,如加拿大多伦多的企业级 Cohere,旨在通过结合 Web 浏览功能和检索增强生成(RAG),将更多最新知识纳入其 LLMs,这使模型能够借助管理员提供的外部信息来源,如公司文件。
在新的 PPLX 在线 LLMs 的情况下,Perplexity 开发了自己的方法来获取最新信息。正如公司在其博客文章中所写:「我们的内部搜索、索引和爬虫基础设施使我们能够用最相关、最新和最有价值的信息来增强 LLMs。我们的搜索索引庞大,定期更新,并使用复杂的排名算法来确保优先考虑高质量、非 SEO 化的网站。我们向 pplx 在线模型提供的网站摘录,我们称之为『片段』,使其能够用最新的信息做出回应。」
在提供最新信息方面,Perplexity 是否优于 OpenAI 和 Meta?
为了证明其新 LLMs 的有效性,Perplexity 聘请了一些人力承包商根据三个标准评估问题的回答:有用性、事实性(Perplexity 也称之为准确性)和新鲜度(后者指信息的最新程度)。
承包商被要求比较两个模型的回应,其中一些是 Perplexity 的新 PPLX 在线 LLMs,另一些则是 Meta 的 Llama 2 或 OpenAI 的 GPT-3.5 Turbo,选择他们更喜欢的两者之间的回应。
然后,Perplexity 利用称为 Elo 评分的方法从人力承包商的回应中推断出,其模型在「新鲜度」和「事实性」方面的表现优于 OpenAI 和 Meta 的原始模型。在「有用性」方面,即咨询顾问认为 LLM 回应的实用性,GPT-3.5 仍然优于 PPLX 和原始的 Llama 2 模型。
「总的来说,评估结果表明,我们的 PPLX 模型可以与 gpt-3.5 和 llama2-70b 匹敌,甚至在提供准确和最新回应的 Perplexity 相关用例上表现更好,」公司在描述新模型的博客文章中写道。
如何使用和影响
新的 PPLX 在线 LLMs 现在可供个人和组织通过 Perplexity 的 API 网站使用,并按照那里发布的文档操作。此外,Perplexity 在其博客文章中指出,API 正从测试版可用性转向公众普遍可用性。
然而,这是有成本的:尽管是基于免费的开源模型进行培训的,Perplexity 还是在这些模型中加入了其搜索和 Web 索引技术并收费。Perplexity 为其专业订阅级别收取 20 美元/月或 200 美元/年的费用,现在将为用户提供 5 美元/月的信用额度,他们可以将其用于 Perplexity API 以获取 PPLX 模型的访问权限。
除此之外,用户还需要为额外的 API 调用(使用查询或提示访问模型)付费。Perplexity 尚未提供公开的定价信息,而是指示有兴趣的各方直接通过电子邮件与其联系。
虽然个人和企业对新模型的接受程度,无论是直接使用还是在新应用程序中使用,尚待观察,但Perplexity 已经赢得了一些热心粉丝的支持,他们认为这是搜索的未来,包括风投资本家 Jeremiah Owyang of Blitzscaling Ventures,他表示自己与该公司「没有财务联系」。
随着谷歌的 Bard 因一些争议和差评而陷入困境,以及谷歌的后续 GPT 杀手 Gemini 据说被推迟,现在是 Perplexity 确立自己作为搜索未来另一种愿景的大好时机——在这种愿景中,AI 助手与您对话并从网络中提取答案,而不是用户自己对搜索结果进行排序以找到最佳结果。
AIbase 上的 Perplexity AI PPLX 在线语言模型介绍:https://top.aibase.com/tool/pplx-online-llms
互联网兴起“赛博判官”,从美团到小红书,用户为什么入局?
“判官”这个词大家不陌生吧?从诸多争议的青岛地铁判官到传为笑谈的综艺判官,判官,渐渐成为了互联网的一个梗。当判官和外卖联系在一起,又会擦出什么样的流量火花呢?近期,网络上出现了一个新的名词,叫“赛博判官”,判官好理解,赛博为Cyber音译,源于希腊文Kyber,原意为舵手。赛博在现代的词义是电脑仿生,人工智能的意思。两个词连起来的定义是这样的:站长网2023-11-21 16:12:320000Artifact 新闻应用程序强制 AI Snoop Dogg 为用户朗读新闻
据国外媒体报道,周四,Artifact新闻应用程序宣布将添加语音转文本功能,允许用户使用由Speechify提供支持的人工智能语音来收听文章。该更新应该免费提供给所有iOS用户,并且该功能应该会在不久的将来在Android上推出。站长网2023-07-28 14:50:160000ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?
【新智元导读】微软对大语言模型的道德推理能力进行了测试,但在电车问题中大尺寸的模型表现反而比小模型差。但最强大语言模型GPT-4的道德得分依旧是最高的。「模型有道德推理能力吗?」这个问题似乎应该跟模型生成的内容政策挂钩,毕竟我们常见的是「防止模型生成不道德的内容。」但现在,来自微软的研究人员期望在人类心理学和人工智能这两个不同的领域中建立起心理学的联系。站长网2023-10-11 17:28:500000Redmi用户迫不及待想买小米14:表示很着急 度日如年中
快科技10月21日消息,一位RedmiK20Pro用户在酷安发帖表示,他很着急买小米14,度日如年中。据悉,小米14将在本月发布,预计会在下周正式官宣,本次发布会将会同时推出小米14和小米14Pro两款旗舰,其中标准版采用1.5K屏幕,Pro版采用2K屏幕。站长网2023-10-21 14:35:440000支付宝首页新增3个固定流量入口 可直接跳转至短视频、商家商品页
近日,支付宝首页新增了三块核心场景固定流量“入口”,用户在支付宝首页点击卡片即可进入短视频信息流,或直接进入“消费圈”商品卖场,享受优惠购物。把新增的固定卡片入口置于仅次于首页宫格的首屏核心位置,不难看出,支付宝对内容创作者和商家经营的流量开放正在持续加大。站长网2023-09-27 10:56:060000