登陆注册
12752

AI视野:大模型训练芯片H200发布;GPT5已在训练中;阿里发布夸克大模型;GPT-4作弊被抓

站长网2023-11-14 15:44:330

📰🤖📢AI新鲜事

最强大模型训练芯片H200发布

英伟达发布基于Hopper架构的新一代AI处理器H200,内存带宽提升至141GB和4.8TB/s,推理速度提高2倍,将于2024年第二季度开始发货。

【AiBase提要:】

🚀 性能提升: H200采用Hopper架构,内存带宽提升至141GB和4.8TB/s,相较H100推理速度提高2倍。

💡 兼容性升级: H200兼容H100,无需更改现有系统或软件,方便已经使用先前模型进行训练的人工智能公司。

💰 能效提升: H200在保持性能卓越的同时,功耗与H100相同,总拥有成本和能效均有所降低。

最受欢迎的自定义GPT Top9名单发布

在OpenAI推出GPTs后,网友们以惊人速度创造了多样功能的自定义GPT,其中Top9包括设计、音乐、食谱等领域,展现了无限可能性。

【AiBase提要:】

第一名:Designer GPT(帮助用户创建并托管网站)

地址:https://supertools.therundown.ai/content/designergpt

第二名:Spotify Explorer GPT(将 GPT 与在线音乐流媒体平台 spotify 连接起来)

地址:https://supertools.therundown.ai/content/spotify-explorer-gpt

第三名:Grimoire GPT(一句话就能构建网站)

地址:https://supertools.therundown.ai/content/grimoire

第四名:Healthy Chef(食谱大全)

地址:https://supertools.therundown.ai/content/healthy-chef

第五名:Market Analyst GPT(股市趋势图分析)

地址:https://supertools.therundown.ai/content/market-analyst

第六名:Screenplay GPT(看图设计故事)

地址:https://supertools.therundown.ai/content/screenplay-gpt

第七名:Kraftful GPT(可随时咨询的产品经理)

地址:https://supertools.therundown.ai/content/kraftful-gpt

第八名:Drawn to Style(一幅作品生成多种风格)

地址:https://supertools.therundown.ai/content/drawn-to-style

第九名:Recipe Snap GPT(快速根据你上传的实物照片生成菜谱)

地址:https://supertools.therundown.ai/content/recipe-snap

GPT-4作弊被抓

GPT-4因打乱顺序测试而被指作弊,出现吉娃娃or松饼识别错误,LeCun提醒警惕在训练集上测试。

【AiBase提要】

😱 GPT-4在打乱顺序测试中作弊,无法正确识别吉娃娃or松饼。

😯 LeCun敦促注意在训练集上测试,避免模型过度依赖原始数据。

🧐 最新研究指出大型模型存在视觉幻觉问题,GPT-4V在解释多图时易困惑。

vivo首发AI大模型手机

vivo X100系列全球首发,搭载联发科技天玑9300旗舰芯片,引入AI蓝心大模型,蔡司光学摄影系统,独特设计,多种配色选择,续航强大,售价3999元起。

【AiBase提要:】

🚀 旗舰配置: vivo X100搭载天玑9300芯片,全大核CPU设计,LPDDR5T内存,UFS4.0闪存,提供流畅多任务处理。

📸 影像升级: 新蔡司光学摄影系统,支持100倍超清变焦,搭载vivo自研V3影像芯片,拍摄电影级影片。

🎨 设计与续航: 融入东方美学设计,多色选择,配备大电池和快充,vivo X100系列售价3999元起。

B站UP主用AI声音克隆原神各角色 视频播放超136万

B站UP主“小虫哥_”通过使用VITS语音合成模型,创作了一部原神二创视频,让各角色模仿芙宁娜的台词和动作,保留了原声音,吸引了超过136万次播放。

【AiBase提要】

😲 视频创作者“小虫哥_”使用VITS语音合成模型,通过AI声音克隆让原神角色模仿芙宁娜,引发网友亿点点震撼。

🤖 VITS模型工作原理是上传声音文本,提取语言特征,保留原神各角色独特声线,可低成本创造个性化“声库”。

🚀 AI声音克隆技术逐渐普及,如HeyGen、AI Dubbing等降低了普通用户的使用门槛,创作者应关注内容和形式的创新。

AI证件照“AI学院卡”在社交媒体走红

最近,一款名为“AI学院卡”的AI证件照在社交媒体上悄悄走红。这是由韩国潮流眼镜品牌Gentle Monster为了最新系列主题“Gentle High School”打造的AI生图玩法。用户可以进入Gentle Monster官网,点击“领取AI学员卡”,自拍一张露眉照,即可生成一张“亚味十足”的高中生证件照。

【AiBase提要:】

⭐ AI学院卡由韩国潮流眼镜品牌Gentle Monster打造,走红于社交媒体。

⭐ 证件照可在Gentle Monster官网生成,再通过低像素梦核滤镜等应用进行个性化处理。

⭐ 网友对“AI学院卡”的乐此不疲需求,使其在社交媒体上引起一波病毒式传播。

OpenAI创始人透露GPT5已在训练中

OpenAI创始人透露在FT采访中,公司正积极训练GPT-5,与微软合作进展顺利,发布了GPT-4Turbo和GPTStore,计划筹集更多资金解决构建更复杂AI的高成本问题。

【AiBase提要:】

💡 公司规划与合作: OpenAI透露与微软合作进展良好,计划从科技巨头和其他投资者筹集更多资金,解决构建复杂AI的成本问题。

💼 商业模式更新与新工具发布: 公司更新商业模式,发布定制版本ChatGPT和GPT商店,旨在与GPT创建者共享收入,类似于苹果的App Store模式。

🚀 AI技术发展与GPT-5计划: OpenAI积极开发下一代AI模型GPT-5,强调对通用人工智能(AGI)的追求,呼吁征集大规模数据集以训练新模型。

AI高质量训练数据将在2026年前耗尽

人工智能公司可能在不久的将来面临培训数据的枯竭风险,高质量文本培训数据可能在2026年耗尽,而使用合成数据存在风险。

【AiBase提要:】

🚱 数据枯竭危机: AI公司面临培训数据枯竭风险,高质量文本数据可能在2026年前耗尽,低质量数据在2030年至2060年之间可能枯竭。

🔄 合成数据风险: 使用由AI生成的合成数据进行训练可能导致模型内在的畸形效应,使输出变得混乱和怪异。

💼 数据合作伙伴关系: 解决方法可能在于建立数据合作伙伴关系,即公司或机构提供高质量数据,可能以现金交换的方式。

🤖📈💻💡大模型动态

阿里发布夸克大模型

阿里巴巴智能信息事业群发布千亿级参数的夸克大模型,将广泛应用于通用搜索、医疗健康、教育学习、职场办公等场景,同时夸克App将通过大模型全面升级成为年轻人的AI助手。

【AiBase提要:】

🔍 全栈自研大模型发布: 阿里巴巴发布千亿级参数的夸克大模型,将在通用搜索、医疗健康、教育学习、职场办公等领域应用。

🚀 夸克App全面升级: 夸克App将借助自研大模型全面升级,加速成为年轻人工作、学习、生活的AI助手。

🌐 AIGC技术改变搜索产品: 阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的AIGC技术将给搜索产品带来全新变化,加速迈向下一代搜索。

谷歌推新型生成式AI模型IGN

UC伯克利和谷歌合作提出的幂等生成网络(IGN)是一种全新生成式AI模型,通过单步生成逼真图像,不同于传统的生成对抗网络(GAN)和扩散模型,具有潜在的医学图像修复应用。

论文地址:https://arxiv.org/abs/2311.01462

【AiBase提要:】

🔄 模型革新: 谷歌和UC伯克利提出的IGN是一种自对抗模型,与传统GAN不同,单步生成图像,颠覆了传统生成模型的范式。

🌐 全局映射器: IGN旨在成为全局映射器,能够将任何输入数据映射到目标数据分布,提高推理效果,显示出在医学图像修复等领域的潜力。

🏞️ 实验验证: 虽然IGN的生成结果目前无法与先进模型竞争,但在推理方面更有效,能输出一致性更高的结果,为医学图像修复等应用打开可能性。

T3出行联手电信推首个交通出行大模型“阡陌”

T3出行与中国电信携手,推出国内首个出行AI大模型“阡陌”,解决出行行业的智能调度、司乘服务和出行安全等核心问题。

【AiBase提要:】

🚗 首个落地交通出行大模型。

🚗 呈现三个核心数据,共喂给阡陌大模型的是超20亿的出行订单数据和出行服务数据。

🚗 智能调度大模型的用途在于更加精准、实时地预测出行供需的热力变化。

Adobe研究人员研发新AI模型LRM:实现从2D样本瞬时生成3D图像

Adobe与澳大利亚国立大学合作研发的LRM AI模型能够在几秒内从单一2D图像中生成逼真的高质量3D图像,基于大规模训练和包含五亿参数的LRM神经网络。

【AiBase提要:】

💡 Adobe与澳大利亚国立大学联合研发的LRM AI模型是首个能够从单一2D图像生成高质量3D图像的突破性成果。

💻 LRM算法采用了大规模图像样本训练,可在几秒内生成3D图像,使用LRM神经网络包含一百万数据集和五亿参数。

🚀 LRM的成功在于利用数百万图像参数的数据库,通过预测神经辐射场(NeRF)实现从低分辨率的2D图像生成逼真的3D图像。

Silo AI面向欧洲推新开源语言模型“Poro”

Silo AI本周发布了Poro,这是一个旨在提升欧洲语言多语言人工智能能力的新开源大型语言模型,计划涵盖欧盟所有24种官方语言,通过跨语言训练方法,解决为欧洲低资源语言训练性能卓越的核心挑战,发布Poro Research Checkpoints计划记录Poro的训练进展。

【AiBase提要:】

💡 Poro是一个新开源大型语言模型,由Silo AI公司推出,旨在提升欧洲语言多语言人工智能能力,计划覆盖欧盟所有24种官方语言。

💡 该模型使用跨语言训练方法,解决为欧洲低资源语言训练性能卓越的核心挑战。

💡 Silo AI公司将通过Poro Research Checkpoints计划记录Poro的训练进展,提供模型训练的透明度。

👨‍💻💡🎯聚焦开发者

LongQLoRA:提升LLMs上下文理解能力

GitHub上新工具LongQLoRA能够让语言模型(LLMs)理解更长的序列,填补了LLMs在长序列理解方面的空白,为自然语言处理领域带来新可能性。

【AiBase提要:】

🚀 工具介绍: LongQLoRA通过对序列进行切片,独立处理每个切片,扩展了LLMs的上下文理解能力。

📊 性能验证: 在多项基准测试中,LongQLoRA表现优异,为开发者提供了提升LLMs模型性能的利器。

🌐 领域影响: 这一工具的发布填补了LLMs在长序列理解方面的空白,使其在实际应用中表现更出色,为自然语言处理领域带来新的可能性。

VimGPT:GPT-4V和Vimium的结合,让你更高效地浏览互联网

一种新工具在GitHub上流行,名为VimGPT,结合了GPT-4V和Vimium,为用户提供更高效的互联网浏览体验。通过对Vimium进行改动,使其能够与GPT-4V互动,用户可以更快速、高效地处理大量信息,摆脱信息过载。

项目地址:https://github.com/ishan0102/vimGPT

【AiBase提要:】

🚀 利用GPT-4V和Vimium的结合浏览网络: VimGPT整合了GPT-4V和Vimium,提供更快速、高效的互联网浏览体验。

🔧 对Vimium进行改动,实现与GPT-4V互动: VimGPT通过改动Vimium,使其具备与GPT-4V进行互动的能力,提升用户操作体验。

💻 高效处理信息,摆脱信息过载: 结合GPT-4V和Vimium,使用户能够更轻松地处理大量信息,实现更高效的互联网浏览。

0000
评论列表
共(0)条