GPT商店已至，AI的爆款应用还有多远？

站长网2023-11-08 17:02:120阅

什么，还必须要关注“技术”想要什么。

昨天凌晨，整个AI界发生了一场地震，在被视为“首届AI春晚”的OpenA开发者大会上，GPT-4进行了史诗版本的更新。

128K的超长上下文、成本更低的tokens、全新的Assistants API、新增的多模态功能以及文本转语音（TTS）技术，都让新版的 GPT-4Turbo 模型变得性能更强大，同时也更具扩展性。

图源备注:图片由AI生成，图片授权服务商Midjourney

然而，除了上述功能外，最令人惊艳的，莫过于GPT商店的问世。

CEO山姆·奥特曼现场登台演示，全程不到3分钟，无需任何编程操作，只需在对话框内告诉GPT自己的需求，一个“创业导师GPT”就应运而生。

是的，所有想实现的功能，都能通过聊天构建!

不仅如此，OpenAI还宣布，GPT商店将在本月晚一点的时候推出。

这意味着，任何人都能靠制作专属GPT来赚钱了!

此言一出，网友即刻群起沸腾，并纷纷惊觉:AI的致富之路，真的对所有人敞开了!

那么，在这种百花齐放的应用生态中，AI时代的爆款应用，是否会就此诞生?而由此催生的应用生态，又将打造怎样庞大的市场?

如何建立壁垒?

自从互联网时代以来，几乎每一次技术的迭代，都会造就一批爆款。

而总结这些爆款的特征时，人们往往会发现如下的共同点:

它们不仅有长期的留存率，能构建商业模式，且有一定的护城河。虽然当时很难估算市场规模，但未来可能就是千亿美金的公司，可遇不可求。

例如移动互联网时代的抖音，就是个典型的例子。

而现在，GPT商店的推出，无疑为这类AI时代的“抖音”，提供了诞生的土壤。

然而，兴奋过后，冷静下来的人们也发现了个问题，那就是:在目前OpenAI打算构建的GPT商店中，那一个个上架的应用，刚需点和壁垒究竟何在?

是的，无门槛的开发，意味着人人都能上，可既然人人都能上，那谁又会为别人制作的GPT而付费呢?

大家想要什么功能，自己做不就完了吗?

为了解开这一悖论，我们有必要对当前GPT商店所构建的这种UGC生态，与前AI时代的UGC生态进行一个对比。

如果说，要想在前AI时代，为GPT商店的这种UGC模式，找一个最接近的例子，那恐怕最先入选的，就是以Roblox、蛋仔派对为代表的各种游戏类UGC社区。

在Roblox中，用户可以使用平台提供的易用的编辑工具，创建游戏场景、角色和道具，并将这些游戏资产发布到平台上，供其他用户玩耍、购买。

在这样一种生态中，所有的玩家，都是基于同一个平台或工具进行创作，谁也不会比谁拥有更多先天的、硬性的优势。

这样的特点，与GPTs通过对话创建专属GPT，从而抹平用户创作门槛的做法，几乎如出一辙。

而且由于“玩法”、“创意”之类的东西是抽象的，是依赖于用户灵感，而非知识、技能的，因此在Roblox这类UGC社区中，所谓的“壁垒”从根本上说是没有的。

可既然没有壁垒，为何人们仍然愿意为其他玩家/用户创作的内容付费?而不是自己创作?

其实原因很简单，因为在这类UGC生态中，用户创造的内容，是一种“易学难精”的东西。

换句话说，表面上看人人都可以创造，但精品的、高质量的内容，却很难复制。

具体地说，在这类UGC社区中，用户/玩家虽然可以使用游戏内的编辑器，创造出各种道具、地图等虚拟物品，但真正受欢迎的、爆火的内容，往往需要付出很大的心血，或是需要天才的构思。

于是乎，最后懒得细细打磨的人，就会选购买别人创作好的、现成的游戏内容。

然而，尽管Roblox这样的UGC模式，给将来GPT商店上的创作者提供了一个启示，但它同样有回答不了的问题，那就是:

Roblox这类平台，终归是个以娱乐为主的游戏平台，而游戏是不讲究“实用性”的，只要做得有趣，即可让人掏钱。

但在GPT商店这种明显带有工具性、实用性的平台上，各类基于GPT的应用，该怎么找到自己的“刚需”点呢?

“刚需”的误区

很多人在讨论大模型（LLM）与“刚需”问题时，往往会陷入一个误区:那就是以当下的、静止的视角，来看待人们对LLM的需求。

实际上，如果用“刚需”的逻辑来看待当初的抖音、快手，那它们根本就不应该存在。

因为以当时的标准来看，它们根本就不“刚需”。

其实，所谓的需求，不是一成不变的，今天很多理所当然的“刚需”，也不是当时就产生的。

它本质上是一个随着技术逻辑运动，而不断发展的结果。

具体来说，抖音、小红书这样非工具性、非刚需的APP之所以会出现并爆火，本质上是移动互联网技术逻辑的一种运动结果。

在移动互联网的技术逻辑中，最重要的有两点，一是便捷性，二是个性化。

便携性，使得用户可以随时随地访问互联网，获取信息。

这种情况下，用户的时间变得更加碎片化了。在等待、通勤、休息等场景下，用户希望利用碎片时间进行娱乐、学习或购物等活动。

于是，人们使用手机等移动设备的需求，开始变得越来越多样了。那么，面对如此多样的内容，用户该如何选择?

这时，推荐算法和大数据登场了。

移动互联网的普及，使得用户在移动设备上产生了大量的数据，这些数据为推荐算法和大数据分析提供了丰富的数据来源。

通过对这些数据的分析，各大APP可以更好地了解用户的兴趣和需求，从而提供个性化的内容和推荐。

于是乎，在便携性和个性化两大技术逻辑的推动下，抖音、小红书这些爆款APP就诞生了。

它们可以说是移动互联网技术逻辑的一种终极体现，必然结果。

由此可见，在分析某种新兴技术是否能满足“刚需”时，我们除了关注“人”想要什么，还必须要关注“技术”想要什么。

那么，按照这样的逻辑，今天以ChatGPT为首的LLM，究竟想要什么呢?

从最近大半年LLM的发展趋势，以及昨日OpenAI发布会的情况来看，目前的LLM，至少显现出了两大越来越明显的倾向:

一是想“看”到和“听”到更多，即多模态方向的发展;

二是想与更多的“同伴”协作，即智能体（Agent）方向的发展。

而这两大愈发明显的倾向，就构成了未来LLM发展的两大技术逻辑——信息融合和自主决策。

信息融合，意味着LLM可以通过融合多种模态的信息（如视觉、听觉等），实现对跨模态、跨领域任务的深入理解，从而更好地胜任不同场景的需求。

而自主决策，则通过多个智能体之间自动化的协作、配合，使LLM能实现在复杂环境、任务中的自主决策和行动，从而大大地解放了人类的时间、心智。

正如移动互联网的诞生，催生了碎片化时间的场景一样，上述两大逻辑的演化和推进，也终将催生出一些人们从来没见过的，新的场景与需求。

可能的应用形态

在自主决策和信息融合催生的新场景与需求中，最能代表其本质的，就最有可能产生新时代的“抖音”。

从上述技术逻辑的特点来看，至少有两个方向的需求，可能性是最高的。

一是个性化的智能助理。

由于多模态技术的存在，这样的智能助理，将很有可能脱离单一领域，或单一模态的限制，从而最大限度地深入人们的生活。

举例来说，如果某人使用了某个翻译类的GPT，那么该用户也许在翻译之外，还希望该应用兼具机票预订的功能，帮跨境出行做好准备，又或是在此基础上，成为一个智能的跨境电商的助手，对比不同国家、地区的商品。

第二个方向的需求，则是智能决策支持

如果一种技术，用与不用有很大区别时，它就会逐渐成为一种“刚需”。而智能决策，也许正在创造这样的需求。

自动化的智能体系统，最大的意义，不在于让打工人每天节省那么几个小时的时间，干些批量处理文档之类的“牛马活”，而在于其通过快速、高效和多角度的分析，为用户提供“单一大脑”所难以得出的洞见。

例如，最近一家名为Fantsy的企业，就用了类似于ChatGPT和Bard的机器学习技术，创建了一些具有详细背景和思想、性格的智能体，让它们在虚拟的小组中进行讨论，从而对尚未发布的产品进行评估。

同样的，类似的技术思路，也可以用于个人的财务规划、职业规划中，从而为个人在现实中的生活、工作，提供高质量的辅助决策。