刚刚,谷歌弃Bard发布超大杯Gemini,全面对标GPT-4,前2个月免费!
就在刚刚,谷歌深夜搞了个大动作——
Bard现在统称Gemini。
发布Gemini Advanced,由谷歌最强多模态大模型Gemini Ultra1.0支持!
为了防止概念混淆,我们拿OpenAI家的大模型来对比理解:
Gemini是品牌总称,相当于OpenAI的ChatGPT;
Gemini Advanced付费服务,对应ChatGPT Plus;
Gemini Ultra模型,对标的是GPT-4;
切换到Gemini Advanced界面的操作也和ChatGPT类似,只需点击左上角的选项即可:
在价格方面,Gemini Advanced的定价也是颇有意思——19.99美元/月,比ChatGPT Plus(20美元/月)便宜了亿点点。
不过谷歌也给出了一个小福利,订阅后的前两个月,免!费!!
并且不会像GPT-4那样有每小时使用次数限制,可以放开了用。
不仅如此,谷歌这次还顺带在安卓手机里推出了Gemini的APP,特定的安卓机长按电源键等按钮可以“直达”的那种:
iOS用户也不用着急,Gemini将在未来几周会出现在Google App中,届时的打开方式会是这样的:
毕竟谷歌此前发布Gemini Ultra这款大模型之际,便是一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。
现如今产品化的它终于上线,也是让众多网友纷涌而至,一时间也是出现了短暂的宕机。
那么加持了谷歌自家最强大模型的Gemini Advanced,效果到底如何?
我们在第一时间成功开通了试用。
实测Gemini Advanced
虽然谷歌声明目前只开放英语支持,但实测用中文提问,它不但能懂也能用中文回答。
既然是谷歌出品,肯定少不了考验它的联网搜索能力。
本来想试试能不能当吃瓜神器,结果因为谷歌严格的伦理道德限制,Gemini Advanced当场拒绝作答。
那么退而求其次,问问纯事实不带价值判断的,它的表现就非常亮眼了。
回答中,标绿色的语句展开就可以看到引用来源。
标黄色的语句则表示没有找到明确引用来源,可以尝试进一步核实。
AI在回答中生成的表格数据,也可以点击“Export to Sheets”一键导入到Google Docs进一步编辑处理,在工作场景可以说是非常实用了。
接下来,还可以在“扩展程序”中打开对其他谷歌服务的支持,如地图、Gmail邮箱、YouTube视频。
关联邮箱账号后,Gemini Adavanced就成变你的个人AI管家,可以帮你管理不少事情了,如找出可退订垃圾邮件。
不过很可惜,扩展程序目前还不支持中文指令。
用英语“find me youtube videos……”就可以触发搜索视频功能,辅助学习知识也是一把好手。
除了联网搜索、集成应用,谷歌还特别强调了Gemini Advanced的推理能力。
先来一道微软对GPT-4测试时的经典推理题,结果Gemini Advanced不仅成功作答,还考虑了额外的小概率情况。
注意界面中的“Show drafts”按钮,代表Gemini Adavanced每次会生成三个“草稿”,并挑选其中最好的展示出来。
三个草稿或使用不同的推理方式,或试用不同的写作风格,但答案无一例外都是正确的。
如果实在不巧,遇到三个草稿都不满意的情况,也可以选择最右边的全部重来按钮。
再注意答案最后面一排按钮,除了常规的点赞、点踩、分享之外,还有两个不常见的新功能。
中间的滑块按钮代表“修改回答”,可以选择更短、更长、解释更简单、语气更轻松、语气更正式。
尝试选择语气更轻松,整个回答就会变得更口语化。
选择更正式,整个回答就像是在考场上答卷了。
最后的谷歌G图标,代表使用搜索引擎核查AI生成的答案是否准确,结果同样也会用“绿色-有引用来源”,“黄色-无引用来源”的形式标出来。
在更实用的场景中,要求生成一副科技主题春联,Gemini Adavanced也能满足“仄起平收”这个要求。
生成代码也是小菜一碟,还“大义灭亲”,把自家广告也给隐藏了。
一番体验之后,最后总结一下。
Gemini Advanced在超大杯Gemini Ultra模型加持下,能力基本达到GPT-4同级别水平。
设计上也更像一个成熟产品,而不是大模型的技术演示Demo了。
与谷歌强大的互联网服务集成后,实用性上也有独到之处。
另外在这次发布前,量子位也与谷歌Gemini团队有过一次短暂的交流。
团队表示这次发布更专注于把Gemini Ultra的语言能力释放到产品中,未来还会持续更新多模态能力、交互性更强的代码功能,以及上传文件分析数据等功能。
与谷歌产品更深入集成,比如直接在Gmail里使用Gemini来回复邮件,目前还在“Coming soon”状态。
不过我们要到一张示意图,敬请期待。
另外在交流中,谷歌开发团队特别提醒了一点:
由于产品刚刚从Bard改名为Gemini,AI偶尔会出现混乱,需要时间慢慢过渡。
原来AI也像人类一样改名会不适应,也是让人哭笑不得了。
都是20美元,你pick哪一个?
就在这次Gemini Ultra刚刚有消息传出的时候,知名爆料账号Flowers from the future组织了一次投票。
同样20美元,GPT-4和Gemini Ultra你会订阅哪个?
最终2360人参与,有四成坚定的继续留在GPT-4,只有12.3%选择迁移到Gemini Ultra。
不过这次投票是在真正发布之前几天了。
在体验过之后,不知道又会有多少人因为产品的功能体验和服务集成“弃O投G”。
而就在刚刚,沃顿商学院一位教授表示在他已经提前体验了Gemini Advanced长达6周的时间。
他给出的一句评价是:
Gemini Advanced显然处于GPT-4的水平,但并没有明显超过它。
二者在使用过程中各有各的优势。
例如在搜索能力方面,让它俩都去查看一下运动鞋的最新趋势,Gemini Advanced能够搜索YouTube,而ChatGPT使用的是Bing。
这表明Gemini Advanced在搜索集成方面有所不同。
这位教授还认为Gemini Advanced的界面比GPT-4更流畅,技术错误出现的也较少。
它在“个性”上与GPT-4有所不同,更友好和愿意进行文字游戏。尽管两者在个性上有差异,但它们在处理复杂提示时表现出了兼容性。
当然,这并非是教授在拿Gemini Advanced和ChatGPT直接做比较,而是借着二者探讨AI在未来可能发展的方向:
Gemini Advanced与GPT-4相比的独特优势和劣势表明,模型仍有很大的改进空间,未来我们将继续看到快速的进步。AI的发展浪潮尚未达到顶峰,OpenAI的下一步可能是发布传闻中的GPT-4.5或GPT-5。
如今距离ChatGPT发布已经过去14个月还要多,谷歌终于在模型-应用-生态上都准备好了与之竞争的对位产品。
然鹅,老对手OpenAI却已悄然奔向下一个战场。
根据The Information爆料,OpenAI正在开发新一代Agent应用,根据用户请求移动光标、点击、输入文本以及像人类一样使用各种APP。
如将文档中的数据填写到电子表格中进行分析,或在会计软件中自动填写费用报告。
换句话说,下一代ChatGPT将接管你的手机和电脑。
参考链接:
[1]https://blog.google/technology/ai/google-gemini-update-sundar-pichai-2024/
[2]https://blog.google/products/gemini/bard-gemini-advanced-app/
[3]https://www.oneusefulthing.org/p/google-gemini-advanced-tasting-notes
[4]https://www.theinformation.com/articles/openai-shifts-ai-battleground-to-software-that-operates-devices-automates-tasks
报告称,79%高级营销主管使用AI工具提升投资回报率
**划重点:**1.📈79%高级营销领导者表示使用AI工具提高数字广告策略的投资回报率。2.💼85%的营销高管对AI工具表示信心,64%计划在营销活动中增加使用。3.🤖生成AI,尤其是ChatGPT,在调查中成为最受欢迎的技术,64%计划将更多工具整合到工作流中。站长网2023-11-23 17:59:590000百度如流已推出智能编程助理Baidu Comate X以及Comate Stack工具套件
在近日的2023中国数字经济百人会论坛上,百度集团副总裁、百度集团首席信息官李莹表示,百度旗下新一代智能工作平台如流已升级/推出“超级助理”和BaiduComate系列产品,针对企业的沟通、文档、任务、运营、研发等全场景提供高效、专业、实时的智能支持。站长网2023-09-06 17:47:340000大模型走捷径「刷榜」?数据污染问题值得重视
我直接看答案。生成式AI元年,大家的工作节奏快了一大截。特别是,今年大家都在努力卷大模型:最近国内外科技巨头、创业公司都在轮番推出大模型,发布会一开,个个都是重大突破,每一家都是刷新了重要Benchmark榜单,要么排第一,要么第一梯队。在兴奋于技术进展速度之快后,很多人发现似乎也有些不对味:为什么排行榜第一人人有份?这是个什么机制?于是乎,「刷榜」这个问题也开始备受关注。站长网2023-11-09 15:03:110000618前夕,视频号悄悄杀入本地生活
视频号,想要更多。本地生活的战事从未熄火。有的进攻。背靠物流配送,京东试点同城外卖业务,天猫、盒马上线“即时配送”服务;以内容做杠杆,抖音深耕团购到店,快手上线本地生活小程序,小红书尝试种草拔草链路闭环,招募到店餐饮商家。有的防守。美团上线“特价团购”并放在C位展示,进军同城团购配送,重启美团圈圈提供更优惠价格;阿里旗下到店业务口碑APP正式与高德合并。站长网2023-06-15 10:37:030000云服务器对 AI 芯片需求强势推动 三星、SK 预计半导体业务将迎来增长
站长之家(ChinaZ.com)8月2日消息:由于全球科技公司在云服务器业务中对AI芯片的需求不断增加,对于AI芯片所必需的高性能存储半导体的需求呈现爆发式增长。因此,韩国提供这些存储芯片的公司的未来业务前景备受期待。目前,关注点集中在三星电子和SK海力士明年即将推出的下一代高带宽存储器(HBM)芯片相关产品上。站长网2023-08-02 15:02:190000