Gemini 是谷歌迄今为止最佳的 AI 模型 但充满希望的基准测试和演示最终引发了批评
谷歌近日公布了其最新的人工智能模型 Gemini,旨在缩小与 OpenAI 之间的差距,并给行业留下深刻印象。该模型展示了强大的基准测试成绩,并通过一段引人注目的视频演示和即时的可用性(尽管是功能受限版本),彰显了谷歌的自信。
然而,随着 AI 工程师和爱好者深入探究细节后发现了一些缺陷,这股积极氛围逐渐转变。虽然「Gemini」在技术上令人印象深刻,有望最终挑战 GPT-4 的主导地位,但谷歌模糊不清的信息传达方式使其不得不处于防守状态。
北美某大型零售商的首席 AI 工程师 Emma Matthies 表示:「目前问题多于答案。我发现谷歌宣传视频中的展示与其技术博客中的细节之间存在不一致。」
谷歌陷入困境的演示
Gemini 的演示视频在 YouTube 上发布,题为「亲身体验 Gemini」,视频风格快节奏、友好、有趣,充满易于理解的视觉示例。然而,它对「Gemini」的工作原理有所夸大。谷歌代表声称该演示视频展示了「Gemini」的真实提示和输出,但编辑过程省略了一些细节。例如,与「Gemini」的互动是通过文本进行的,而不是语音,AI 解决的视觉问题是通过图片输入的,而不是实时视频。
此外,AI 开发者迅速意识到「Gemini」的能力并不如最初看起来那样革命性。
性能比较
谷歌在其基准测试数据上也受到批评。家族中最大的模型「Gemini Ultra」宣称在多种基准测试中超越 GPT-4,这在大体上是正确的,但引用的数据是为了将「Gemini」描绘得更加优秀。
谷歌使用与其他公司不同的方法来测量性能,用户提示 AI 模型的方式会影响其性能,只有在使用相同的提示策略时,结果才具有可比性。
尽管如此,「Gemini」的多模态功能仍然令人印象深刻。它能够跨文本、图像、音频、代码和其他媒介进行推理。虽然这并非「Gemini」所独有,但大多数多模态模型要么未公开,要么使用困难,或专注于特定任务。这使 OpenAI 的 GPT-4 在这一领域中占据主导地位。
未来展望
「Gemini」的命运尚未确定,取决于两个未知因素:「Gemini Ultra」的发布日期以及 OpenAI 的 GPT-5。
尽管用户现在可以尝试「Gemini Pro」,但其更强大的兄弟版本将于 2024 年某时发布。AI 领域的快速发展使得人们很难预测 Ultra 发布时的情况,同时也给了 OpenAI 足够的时间来用新模型或对 GPT-4 的适度改进作出回应。
苹果新增118个emoji iOS17.4Beta1开放侧载
站长之家(ChinaZ.com)1月26日消息:苹果在最新发布的iOS17.4Beta1更新中,向27个欧盟国家测试开放侧载和第三方应用商店等重大改进。此外,该更新还新增了多个Emoji表情符号。此次更新中新增的Emoji表情符号包括凤凰、青柠、上下摇头的笑脸,以及一系列指明方向的人物表情符号。这些新表情符号来自Unicode于2023年9月提出的Emoji15.1更新。站长网2024-01-26 08:57:120000小屏党的福音,推荐3款小屏手机,最小的只有4.7英寸
如果您喜欢,可以点击上面的“关注”二字。后续会为您提供更多有价值的内容。参考价格:3759元(4128GB)iPhoneSE3的设计和iPhone8一模一样,乍一看,好像又回到了上一个时代。正面是一块4.7英寸的RetinaHDLCD显示屏,屏幕峰值亮度为625nit。搭载A15芯片,安兔兔跑分在70W左右,日常使用没有问题。站长网2023-04-14 17:01:240000Comfyui更新Stable Cascade 7个模型整合为两个模型文件
Comfyui官方最近更新了StableCascade,原来需要下载7个模型,现在整合为两个模型文件,用户只需选择C阶段和B阶段的模型文件即可。这一更新大大简化了操作流程,提高了用户的便利性。站长网2024-02-20 16:06:010001网易天成刷屏,抖音电商会员日做对了什么?
会员有礼、入会领券、进群拿折扣、升级赢福利……在人们的消费生活中,这些字眼正变得越来越常见。如今,“会员”已然成为电商领域不容忽视的关键词。放眼望去,大小商家们不约而同地投身会员体系建设,摸索出了多种多样的VIP玩法。站长网2023-08-26 17:53:390000首个开源中文金融大模型来了!解释授信额度、计算收益率、决策参考样样通,来自度小满|附下载
金融行业正迎来大模型时代。近日,度小满正式发布千亿级中文对话大模型轩辕,集中文、金融、开源特色于一身。基于BLOOM-176B研发的轩辕大模型,在金融场景中的任务评测中,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。站长网2023-05-27 14:48:320000