登陆注册
13409

AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程

站长网2023-11-27 15:35:110

📰🤖📢AI新鲜事

微软Azure AI新增40种大模型

微软宣布在Azure AI云开发平台中新增40个大模型,包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等,支持文本生成、图像处理、代码编写、语音识别等多种功能。

【AiBase提要:】

🗣 Whisper V3: OpenAI最新语音模型,使用百万小时数据,支持语音翻译和转录。

🎨 Stable Diffusion: 由Stability AI开发,强大的图像生成模型,包括多种类型的图片生成。

🤖 Phi:13亿参数的Transformer架构,成为参数较少但卓越的模型之一。

三星确认Galaxy S24是AI手机

三星确认其即将推出的 Galaxy S24系列将聚焦于人工智能,申请了与 AI 相关的商标,预计在1月17日发布,并计划推出多项 AI 功能。

【AiBase提要:】

🔍 AI聚焦: 三星计划在 Galaxy S24系列中引入人工智能,通过申请商标如 AI Phone 和 AI Smartphone 突显其对 AI 的重视。

📅 发布日期确认: 预计 Galaxy S24将于2024年1月17日发布,展示多项 AI 功能,成为人工智能手机的代表。

🌐 全球申请: 三星不仅在智能手机领域,还在其他类别产品如智能戒指和 AR 眼镜上提交商标申请,展示全球范围内的人工智能布局。

微软谷歌DeepMind推出AI入门课程

谷歌和微软合作发布面向11-14岁初学者的AI入门课程,旨在培养下一代对人工智能的兴趣和理解,强调教育在推动科技领域发展中的重要性。

【AiBase提要:】

🚀 谷歌与Raspberry Pi基金会合作推出「Experience AI」课程,教11-14岁学生基本AI知识。

🌐 微软发布「Generative AI for beginners」课程,重点介绍生成式AI,提供详细教程和GitHub代码库。

🎓 谷歌和微软共同传达AI教育重要性,致力于培养多样化思想家和未来AI领袖。

GPT-4在图灵测试中成功率超过41%,人类保持在63%

最新研究表明,GPT-4在图灵测试中的成功率达到41%,超过传统人工智能模型,但仍低于人类63%的水平,突显了人工智能发展的潜在局限性。

【AiBase提要:】

🧪 图灵测试研究中,GPT-4成功率达到41%,人类有63%。

🤯 对比GPT-3.5和GPT-4,显示付费版本在测试中表现更出色。

🧠 图灵预测的计算能力要求未实现,人工智能仍有进步空间。

OpenAI开发者日干货笔记

本文揭示了OpenAI在ChatGPT产品发展中的团队合作、技术优化以及为创业者提供的工程实践经验,涵盖了产品与研究团队的密切协作、非线性策略优化大模型性能,以及应用从原型到成熟产品的实际指导。

【AiBase提要:】

👥 团队合作创新: OpenAI展示了研究团队和产品团队紧密合作的模式,使ChatGPT从原型到成熟产品的发展更为顺畅,为通用人工智能的目标打下基础。

🔄 非线性策略优化: 在GPT-4的开发中,OpenAI采用了非线性优化框架,包括提示工程、搜索增强生成(RAG)和微调,以更灵活地提升大模型的性能,解决实际问题。

🚀 创业者指南: OpenAI分享了将基于其模型的应用从原型走向完整产品的工程实践经验,强调以人为本的用户体验,减少模型不确定性,提高安全性和可控性。

亚马逊推出全新一代ASR系统

亚马逊的新一代语音基础模型驱动的ASR系统,覆盖100多种语言,提升20%至50%的准确度,支持自动标点、自定义词汇等多种功能,为语音转文本提供更全面、准确的服务。

【AiBase提要:】

🎙️ 多语言支持: 新一代语音基础模型涵盖100多种语言,提供全面的自动语音识别服务。

🚀 性能提升: 利用先进的自监督算法,提高20%至50%的准确度,尤其在电话语音等挑战性领域提高了30%至70%的准确度。

🌐 全面功能: 新ASR系统支持自动标点、自定义词汇、自动语言识别、说话人分离等特性,提供更准确的输出并有效嵌入语音技术。

LeCun:超级AI不会主宰人类,但必须开源

LeCun认为未来可能出现超越人类智能的情景,但这些人工智能不会主宰人类,而是成为与数字世界互动的中介,并强调其必须是开源的,以确保广泛参与学习和优化。

【AiBase提要:】

🌐 LeCun强调超级AI将充当人类智能助手,而非主宰者,成为与数字世界互动的中介。

🤖 他呼吁人工智能系统建立能够预测动作序列后果的世界模型,实现更通用的规划能力。

🌍 LeCun强调人工智能的开源,以避免少数公司垄断,确保多元参与和避免左右个体观点和文化。

Girolamo AI 聊天机器人 Beta 版发布

CardanoGPT推出Girolamo AI聊天机器人Beta版,以Girolamo Cardano命名,标志着Cardano在区块链领域探索人工智能的新阶段,具备实时、语境感知的响应和图像生成解读能力。

【AiBase提要】

🚀 技术融合创新: CardanoGPT发布Girolamo AI聊天机器人Beta版,标志着人工智能与区块链技术的深度融合,为交互性和多功能性的AI应用在区块链框架内开辟新可能。

🤖 功能丰富聊天机器人: Girolamo聊天机器人在Beta测试阶段承诺成为AI集成区块链解决方案中的新成员,提供实时、语境感知的响应,并具备生成和解读图像的能力,增强用户体验。

🔗 参与门槛设定: 参与Girolamo beta测试的用户需持有至少5000CGI代币,通过CardanoGPT Discord服务器验证钱包后,可与聊天机器人直接互动,尽管Girolamo仍处于Beta阶段,信息准确性无法百分之百保证。

斯坦福大学研究NOIR系统:实现用意念控制AI机器人

斯坦福大学研发的NOIR系统通过解码大脑信号,使人类能够用意念来操控机器人,为残障人士和老年人提供支持,同时在危险环境中执行任务,为智能机器人的发展提供新思路。

【AiBase提要:】

🌐 NOIR系统:通过脑电信号实现人类对机器人的指令,涉及解码目标物体、互动方式和位置三个关键阶段。

🤯 应用广泛:不仅支持残障人士和老年人,还可在危险环境中执行任务,为未来智能机器人的发展提供新思路。

👥 技术突破:NOIR的突破性技术使得通过大脑信号操控机器人成为可能,为身体受损的人们提供独立控制环境的新可能性。

维基百科创始人表示,ChatGPT 的维基百科写作“糟糕”且“混乱”

维基百科创始人吉米·威尔士批评ChatGPT的维基百科写作糟糕且混乱,指出存在错误和虚构信息,但对AI在支持维基百科的潜在作用持开放态度。

【AiBase提要:】

🧐 吉米·威尔士批评ChatGPT在维基百科上的写作存在错误和虚构信息,形成混乱。

🌐 尽管批评,威尔士对AI在支持维基百科方面的潜在作用持开放态度,考虑与开源AI公司合作,以识别不准确信息。

🤝 Meta公司展示了PEER和Side等AI模型,但目前尚未与维基媒体建立合作,维基百科领域对AI潜在作用的探索仍在继续。

索尼推出相机内真实性认证技术,应对 AI 合成图像挑战

索尼推出相机内真实性认证技术,通过在拍摄时为图像文件添加基于机器的数字签名,以应对人工智能合成图像的挑战。

【AiBase提要:】

📷 技术原理: 索尼相机内真实性认证技术通过在拍摄时为图像添加数字签名,消除了在拍摄和传输过程中操纵图像的可能性。

🔄 硬件优势: 与莱卡技术不同,索尼的方案基于现有硬件,使得未来相机更易实现,并通过固件更新使旧型号相机向后兼容。

🤝 与美联社合作: 在与美联社的测试中,确保数字签名在新闻摄影工作流程中保持完整,为应对假冒和操纵图像提供更可靠的解决方案。

🤖📈💻💡大模型动态

零一万物Yi-34B-Chat微调模型及量化版开源

零一万物发布了Yi-34B-Chat微调模型,并提供4bit/8bit量化版,在评测中取得优异成绩,可在消费级显卡上使用,已开源并可免费商用。

【AiBase提要:】

🚀 模型开源与微调发布: 零一万物发布Yi-34B-Chat微调模型,同时提供4bit/8bit量化版,在评测中表现优异,已开源并可免费商用。

⚙️ 量化版适用性:4bit量化版模型可在消费级显卡上使用,如RTX3090,提供更高的计算效率。

🏆 评测成绩突出: Yi-34B-Chat在英文知识水平、中文综合考试以及数学推理能力评测中表现出色,为开发者提供强大的语言理解和处理能力。

Inflection推全球计算级别最佳AI模型Inflection-2

Inflection-2是由Inflection AI推出的全球计算级别最佳的语言模型,号称仅次于OpenAI最新模型,在语言理解、生成、事实知识、推理和风格控制等方面表现卓越,通过大规模GPU训练,并强调负责任的模型扩展。

项目网址:https://inflection.ai/inflection-2

【AiBase提要:】

🌟 Inflection-2致力于提升语言理解和生成能力,在科学问答等任务上超越了谷歌和Meta的语言模型。

🤖 通过深度增强事实知识、推理和风格控制,Inflection-2展现出在常识和数学推理方面的出色性能。

💡 公司计划通过扩展GPU集群,大规模培训更大型的模型,同时强调在AI开发中的道德和伦理考虑。

🤖📱💼AI应用

Xboard:一款基于ChatGPT的智能键盘

Xboard是一款基于人工智能技术的先进键盘,旨在提高用户在消息、电子邮件、内容和搜索生成上的智能、迅速和高效体验。该键盘利用ChatGPT技术,能够自动生成多种类型的消息、电子邮件、内容和搜索,并在输入过程中主动纠正拼写和语法错误。

地址:https://play.google.com/store/apps/details?id=com.xboard.keyboard.gpt

【AiBase提要:】

🚀 智能生成: Xboard利用ChatGPT技术,智能生成多种类型的消息、电子邮件、内容和搜索,提升用户生产力。

🔄 上下文学习: 键盘能够学习用户输入习惯和上下文,提供更为精准的建议和预测,使输入体验更高效。

🔐 纠错功能: Xboard不仅生成内容,还主动纠正拼写和语法错误,提供准确的建议和预测,增强用户输入准确性。

爆款短视频利器!Klap可一键生成适用于多平台的短视频

Klap是一款基于人工智能技术的工具,专为内容创作者和社交媒体推广设计。它能将YouTube视频一键转换为适用于多个社交媒体平台的短视频,包括TikTok、Shorts和Reels。Klap支持YouTube视频链接,而文件上传功能即将推出,提供更多选择。

体验地址:https://top.aibase.com/tool/klap

【AiBase提要:】

🚀 Klap可将YouTube视频转换为适用于多平台的短视频。

💡 一键生成视频,具备主题检测和多语言自动字幕功能,支持微调。

🎥 面部聚焦功能使人脸成为焦点,提高视频吸引力。

Janitor AI:一个动漫风格的角色聊天机器人网站

Janitor AI是由janitorai.com开发的AI互动平台,用户可轻松打造具有各种个性的NSFW虚构聊天机器人角色,采用OpenAI的GPT模型提供高质量自然语言交互体验。

体验地址:https://top.aibase.com/tool/janitorai-ai

【AiBase提要:】

🤖 角色创作平台: 用户可在janitorai.com注册账号,通过选择模板和设定性格、语言风格,打造个性化聊天机器人角色。

🔄 API和SDK支持: Janitor AI提供丰富的API和SDK,方便开发者将虚构聊天机器人体验整合到自己的应用程序中。

🌈 个性化交互体验: 平台独特之处在于为用户和开发者提供一站式虚构聊天机器人体验,打开了无限可能。

👨‍💻💡🎯聚焦开发者

Adobe发布创新的DMV3D方法 单个A100生成3D图像只需30秒

Adobe与斯坦福大学合作推出DMV3D方法,利用基于Transformer的单阶段全类别扩散模型,在单个A100GPU上只需30秒生成高保真3D图像,通过稀疏的多视图投影解决传统3D生成方法中的模糊和难以去噪的问题。

论文地址:https://arxiv.org/pdf/2311.09217.pdf

官网地址:https://justimyhxu.github.io/projects/dmv3d/

【AiBase提要】

🚀 创新方法: Adobe与斯坦福大学研究者合作推出DMV3D方法,利用Transformer模型在30秒内生成高保真3D图像。

🔄 全类别扩散模型: DMV3D采用新型单阶段全类别扩散模型,通过2D多视图图像扩散、3D NeRF重建和渲染的端到端训练,避免传统方法问题。

🌐 稀疏多视图投影: 利用稀疏的多视图投影作为训练数据,DMV3D在单个图像或文本输入情况下实现3D生成,超越先前方法,为AI视觉领域带来新可能性。

IDEA提出ToG思维图谱 大模型性能提升214%!

由IDEA研究院等多方合作推出的Think-on-Graph技术,通过深度融合大模型与知识图谱,在多领域取得214%性能提升,解决大模型在金融、法律、医疗等领域的幻觉问题。

论文地址:https://arxiv.org/pdf/2307.07697.pdf

代码链接:https://github.com/IDEA-FinAI/ToG

【AiBase提要:】

😮 创新技术: Think-on-Graph技术通过紧耦合大模型与知识图谱,成功弥补了大模型在各领域幻觉问题的能力短板。

😎 推理链条优化: 采用紧耦合范式,将大模型作为“跑腿”与知识图谱相互协作,提供更清晰、可追溯的推理链条。

🚀 性能突破: 在多个基准数据集上实现巨大性能提升,刷新深度推理领域的性能榜单,为大模型在各领域应用中提供可靠、可解释的推理能力。

腾讯披露最新大模型训练方法:Angel框架升级 效率提升2.6倍

腾讯通过升级自研机器学习框架Angel,成功提升大模型训练效率,千亿级大模型训练成本降低50%,并推出大模型推理框架AngelHCF,提高推理速度1.3倍。

【AiBase提要】

😇 框架升级:腾讯使用Angel框架,通过多维度并行优化存储和软硬件结合解决通讯问题,使大模型训练效率提升2.6倍。

😈 推理框架创新:推出AngelHCF,通过扩展并行和关键能力优化,相较主流框架提高了推理速度1.3倍。

🚀 全面支持:提供一站式训练精调,已有超过300项业务接入,标志着整个生产链路的全面升级,进一步推动大模型应用的发展。

马毅团队5年心血提出白盒Transformer结构CRATE

马毅团队通过提出的CRATE结构,将数据从高维度分布压缩到低维结构,揭示了智能的本质可能是数据压缩,打开了深度学习黑盒。

论文地址:https://arxiv.org/abs/2311.13110

【AiBase提要:】

🧠 智能本质解析: 马毅团队提出的CRATE结构通过将数据压缩到低维结构,揭示了智能可能是数据压缩的结果,从而增强模型可解释性。

💻 黑盒问题突破: CRATE结构作为「白盒」Transformer,解决了大模型的黑盒问题,提升了模型的可解释性,为安全性问题提供了新的解决途径。

🚀 新学习范式: 研究指出「压缩就是一切」,弥合了深度学习理论和实践之间的鸿沟,为构建更智能系统提供了新的学习范式。

芝加哥大学研究人员推出3D画笔:使用文本生成局部风格化纹理的AI方法

3D画笔是一种由芝加哥大学研究人员与SnapResearch合作推出的人工智能方法,通过文本描述能够自动生成网格上的局部语义区域的纹理,为纹理编辑领域带来新的可能性。

【AiBase提要:】

🌐 直观编辑纹理:3D画笔通过文本描述实现在网格上进行纹理编辑,使用户能够直观、自由地控制纹理。

🤖 细节与分辨率提升: 采用级联分数蒸馏和神经场,提高局部纹理区域的细节和分辨率,实现清晰的定位和高分辨率的纹理。

🚀 多层感知器创建神经纹理: 使用多层感知器在3D表面上创建神经纹理,实现平滑变化、减少噪点,并具备超分辨率能力。

0000
评论列表
共(0)条