AI日报:阿里推新多模态大模型Ovis;Kyutai开源实时语音对话模型Moshi;Apple Intelligence测试版现已开放
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、阿里国际推出最新多模态大模型 Ovis,看菜品就能提供烹饪步骤
阿里国际AI团队发布了多模态大模型Ovis,为各行业带来新机遇。Ovis具备强大的图像理解和数据处理能力,可处理文本、图像等多种数据,表现出优秀综合实力。其在OpenCompass评测中获得综合排名第一,超越竞争者。Ovis采用Apache2.0开源协议,开发者可自由使用与改进。
【AiBase提要:】
🌟 Ovis是多模态大模型,处理文本和图像等多种数据,展现综合能力。
🚀 Ovis在OpenCompass评测中获得综合排名第一,超越竞争者。
🔓 Ovis采用Apache2.0开源协议,模型和代码在GitHub上公开,开发者可自由使用与改进。
2、革命性AI对话系统Moshi问世:机器也能说人话了?
在数字化时代,Kyutai实验室开发的全双工语音对话系统Moshi正在颠覆传统语音对话系统,实现更自然、更流畅的人机对话体验。Moshi结合文本语言模型、神经音频编解码器和多流音频语言模型,展现出卓越的性能表现。同时,Moshi注重安全性,确保系统不生成有害内容,保护用户隐私。这标志着人机互动方式的重大革新,展示了未来对话系统的无限可能。
【AiBase提要:】
🌟 Moshi是全双工语音对话系统,将对话视为语音到语音的生成过程,解决了传统语音对话系统的问题。
🔑 Moshi的核心技术包括Helium文本语言模型、Mimi神经音频编解码器和多流音频语言模型,实现了对话中的重叠、打断和插入语处理。
💡 Moshi具备内心独白功能,预测时间对齐文本令牌,提高语音生成质量,增强对话能力。
详情链接:https://huggingface.co/kyutai/moshiko-pytorch-bf16
3、Apple Intelligence测试版现已开放
苹果发布了 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的公开测试版,其中包括即将推出的 Apple Intelligence 功能,如文本重写工具、闪亮的新 Siri 设计、用于从照片中删除对象的“清理”工具等等。用户可通过苹果的测试版软件计划网站注册以获得测试资格,并在设备设置中下载安装测试版更新。新功能仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。
【AiBase提要:】
🔧 文本重写工具、新 Siri 设计、照片清理工具等功能即将推出。
📱 仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。
📅 苹果计划于10月发布 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的正式版本,用户可在正式版本发布后体验新功能。
4、机器人公司1X推出世界模型
1X Technologies推出的新生成模型在机器人系统训练中提高了效率,解决了学习"世界模型"的重要挑战。该模型能预测机器人动作对世界的影响,生成多种未来场景,预测复杂的物体互动。
【AiBase提要:】
🌟 世界模型是能够预测机器人行为与环境互动的虚拟模拟器。
🤖 通过真实数据学习,模型能够在数百万种场景中进行评估,增强了机器人智能。
💰 为推动研究,推出了1X 世界模型挑战赛,并提供奖金激励。
5、亚马逊推出一大波生成式 AI 工具,购物体验全面升级
亚马逊最近发布了一系列令人瞩目的生成式 AI 工具,旨在提升消费者和第三方卖家的购物体验。其中包括个性化产品推荐、免费 AI 视频生成工具以及聊天机器人“阿梅莉亚”,为用户和卖家带来更便捷的购物和营销体验。
【AiBase提要:】
🌟 个性化产品推荐,根据客户的搜索和购买历史提供个性化推荐。
🎥 免费 AI 视频生成工具助力卖家提升视频营销效果,满足消费者对品牌视频内容的需求。
🤖 聊天机器人“阿梅莉亚”提供个性化建议和业务分析,帮助卖家了解业务状况。
6、OpenAI将最新AI模型o1扩展到企业和教育领域
OpenAI推出最新AI模型o1-preview和o1-mini,专为处理复杂推理任务而设计,为企业和教育机构带来新的可能性。这些模型通过模拟人类思维过程,解决复杂问题,提供更严谨的思维方式。企业客户可获得巨大飞跃,将AI视为解决高风险问题的伙伴。教育领域也受益,学生和研究人员可以利用尖端AI工具解决难题。o1模型配备增强安全功能,保障客户数据安全。
【AiBase提要:】
🚀 o1-preview和o1-mini模型专为处理复杂推理任务而设计,模拟人类思维过程,解决难题。
💡 o1模型在回应之前花费更多时间处理信息,o1-preview在数学奥林匹克中解决83%问题。
💻 o1-mini模型专为编程任务设计,提供成本效益选择,适用于生成和调试复杂代码等任务。
7、OpenAI在新一轮融资据悉要求投资者至少出资2.5亿美元
OpenAI正在进行一轮巨额融资的后期谈判,其估值可能达到1500亿美元。据知情人士透露,该公司已要求投资者至少出资2.5亿美元。这表明该公司对这轮融资的需求非常迫切。
【AiBase提要:】
🔍 OpenAI估值或将达到1500亿美元
💰 投资者至少需出资2.5亿美元
🚀 新一轮融资将为OpenAI提供资金支持
8、Instagram宣布将用AI对新的青少年帐户进行年龄验证
Instagram最近宣布将通过人工智能技术对用户进行年龄验证,旨在更好地识别青少年用户,这一举措有望提升用户安全和隐私保护。
【AiBase提要:】
🌟 Instagram推出AI年龄验证,识别青少年用户。
🔒 Yoti合作验证年龄,96%虚报用户被阻止。
🚨 政府可能介入,实施强制措施如果AI效果不佳。
9、OpenAI招募机器学习工程师,开拓多智能体研究新领域
OpenAI最近宣布招募机器学习工程师,成立多智能体研究团队,旨在提升AI推理能力。新推出的o1模型需要用户适应时间,但在科学和数学领域表现出色。
【AiBase提要:】
🔍 OpenAI正在招募机器学习工程师,组建新的多智能体研究团队。
🚀 新推出的o1模型旨在提升AI的推理能力,用户需时间适应。
🏆 o1系列模型在科学和数学领域表现出色,解决复杂问题的能力显著增强。
10、英特尔AI加速器Gaudi3下周发布,挑战NVIDIA统治地位!
英特尔即将发布Gaudi3AI加速器,旨在挑战NVIDIA在AI芯片市场的统治地位。该加速器被称为AI英雄,具备高能效和快速运算能力,预计将超越NVIDIA的H100GPU。英特尔在2024年计划中稳步推进,展望2025年推出的Falcon Shores将进一步提升其在AI领域的竞争力。
【AiBase提要:】
🌟 Gaudi3加速器具备高能效和快速运算能力,预计超越NVIDIA H100GPU。
⚡️ 英特尔声称Gaudi3的能效是前代产品的两倍,将挑战NVIDIA的统治地位。
🚀 展望2025年,Falcon Shores将结合AI能力与强大GPU,增添英特尔在市场上的竞争优势。
《消失的他》蝉联榜首,《逆光绽放》《恋曲1980》强势入围,抖音4月短剧榜发布
近几年,短剧行业发展迅猛,对内容创作者也带来了多方面的影响。与过去的野蛮生长不同的是,2025年的短剧在内容创作上更加用心。不仅题材范围更广,内容质量方面也出现明显提升。为此,「克劳锐」带着大家每月必看的《抖音短剧爆款内容排行榜》4月榜单来了。该榜单不仅揭示了市场热度的迁移轨迹,更折射出观众审美与行业生态的深层变革。00015分半钟 得到一杯机器人“手冲”咖啡
国际在线报道(记者位树理、马嘉欣):在第七届世界智能大会智能科技展上,中国移动研发的“AI咖大师”手冲咖啡机器人吸引了众多观展者的目光。据现场工作人员介绍,这台手冲咖啡机器人根据世界咖啡师大赛冠军的手冲标准设计定义工作流程,从取豆、磨豆、闷蒸再到最后的器具清洗,五分半钟左右就可以制作出一杯香浓的手冲咖啡。0001小米员工有口福了:海底捞入驻小米食堂!
快科技1月7日消息,据媒体报道,近日,海底捞|企业火锅北京小米店开启试营业,为小米园区内上万名员工带来火锅用餐体验。据介绍,在小米公司的补贴下,该门店为小米员工提供专属优惠福利,火锅菜品价格参照临近门店执行88折,在产品上和园区外的海底捞火锅保持一致,菜单会及时更新,所有菜品都以半份菜为标配分量。另外,该店就餐区设有20多个大小不同的餐桌和2个包间,可同时容纳100多人就餐。0000李飞飞「数字表兄弟」破解机器人训练难题!零样本sim2real成功率高达90%
【新智元导读】在用模拟环境训练机器人时,所用的数据与真实世界存在着巨大的差异。为此,李飞飞团队提出「数字表亲」,这种虚拟资产既具备数字孪生的优势,还能补足泛化能力的不足,并大大降低了成本。如何有效地将真实数据扩展到模拟数据,进行机器人学习?最近,李飞飞团队提出一种「数字表亲」的新方法,可以同时降低真实到模拟生成的成本,同时提高学习的普遍性。0000爱情教主小红书:现实恋爱稀碎,网上劝人分手
想分手,就上小红书男朋友七夕节没有给我准备礼物,怎么办?——“分!”、“不要恋爱脑,男人多得是”、“这段恋爱,正在消耗你”、“他不爱你”,“恋爱时这样,结婚后更可怕”,相似的对话不断在小红书情感帖子的评论区上演。站长网2023-08-22 22:30:530000




