登陆注册
14733

AI视野:谷歌推大模型VideoPoet;百度灵境矩阵升级;微软把DALL-E3集成到键盘;小红书AI设计服装刷屏

站长网2023-12-20 15:46:210

🤖📈💻💡大模型动态

谷歌推大语言模型VideoPoet

Google Research最近发布了一款名为VideoPoet的大型语言模型(LLM),旨在解决当前视频生成领域的挑战。

项目网址体验:https://top.aibase.com/tool/videopoet

【AiBase提要:】

1. 💻 Google Research团队推出一款名为VideoPoet的大型语言模型,旨在解决视频生成领域的挑战。

2. 🌈 VideoPoet支持多种视频生成任务,包括文本到视频、图像到视频、视频风格化、修复和修复以及视频到音频。

3. 🚀 与传统扩散模型不同,VideoPoet将多个视频生成功能融合在一个语言模型中,提供更高的集成度和学习能力。

百度灵境矩阵升级为文心大模型智能体平台

百度的灵境矩阵平台升级为文心大模型智能体平台,为开发者提供多样化的开发方式,支持开发者根据自身领域和应用场景,选择不同的开发方式,打造大模型时代的应用。

体验地址:https://top.aibase.com/tool/lingjingjuzhen

【AiBase提要:】

⭐ 智能体升级降低了开发门槛

⭐ 提供多种开发模式满足不同需求

⭐ 提供流量分发路径和商业机会

百川智能发布Turbo API

百川智能发布了Baichuan2-Turbo系列API,支持192K超长上下文窗口和搜索增强知识库的能力。

商业体验官网:https://platform.baichuan-ai.com/playground

百川大模型官网:https://www.baichuan-ai.com

【AiBase提要:】

⭐ Baichuan2-Turbo系列API支持192K超长上下文窗口

⭐ API增加搜索增强知识库的能力

⭐ 官网模型体验升级支持多种文本上传和URL输入

斯坦福大学开发AI模型PIGEON 仅通过几张照片找到你的位置

研究生们在斯坦福大学开发出一款 AI 模型,可以通过查看 Google 街景图像,以令人印象深刻的准确率确定具体位置。

论文网址:https://arxiv.org/abs/2307.05845

【AiBase提要:】

📱PIGEON模型可以通过图像准确预测位置,准确率高达92%。

📸模型基于OpenAI神经网络CLIP进行训练,另外还有PIGEOTTO模型。

🔒论文探讨了模型的伦理问题,如隐私问题,但也指出了其积极用途和潜力。

📰🤖📢AI新鲜事

微软把DALL-E3集成到键盘,任何APP中都可生图!

微软将DALL-E3集成到键盘,使用户可以在任何APP中使用该功能,通过输入提示词生成图片并直接嵌入键盘。

【AiBase提要:】

⭐ DALL-E3可以和手机键盘绑定,实现在任何APP中生成图片

⭐ 使用Microsoft Swiftkey输入法,并启用Swiftkey键盘

⭐ 点击表情符号,选择Create图标,输入提示词生成图片,支持iOS版本 Swiftkey 输入法切换至默认输入法。

英特尔第五代至强可扩展处理器发布

英特尔第五代至强可扩展处理器发布,在性能优化方面,英特尔将各种参数做了以下提升:CPU核心数量增加到64个,单核性能更高,每个内核都具备AI加速功能;采用全新I/O技术(CXL、PCIe5),UPI速度提升;内存带宽从4800MT/s提高至5600MT/s。

【AiBase提要:】

第五代至强处理器AI训练和推理性能提升14倍。

处理器采用全新I/O技术,包括CXL、PCIe5。

新处理器在云计算和安全性方面性能提升实测体验。

Stability AI正式推出商业版会员计划

Stability AI正式推出商业版会员计划,针对 AI 模型的商业使用收费。

【AiBase提要:】

⦁ 会员计划分为免费、月费20美元和企业版三个层级。

⦁ Stability AI 希望通过收费会员计划为未来的研发提供资金支持。

⦁ 用户可以提前访问新的 AI 模型,但只有付费层级的会员可以进行商业使用。

小红书涂鸦功能推出新玩法,AI“设计服装”刷屏小红书

小红书推出的AI涂鸦功能让用户将随手涂鸦的草图转化为精美的服装设计图,受到广泛关注和讨论。

【AiBase提要:】

🎨 用户通过AI设计服装,将创意草图转化为实物,引爆小红书涂鸦热潮。

👗 AI设计服装功能在小红书上受欢迎,用户通过涂鸦展现创意,获得数万赞。

🤖 AI涂鸦结果具有一定随机性,成为小红书内容平台的热门“小游戏”。

OpenAI宣布:如GPT-5太危险,董事会有权否决奥特曼的决定

OpenAI宣布董事会有权否决决定,特别是对于GPT-5等前沿模型的安全风险,公司成立安全顾问团队,定期向管理层和董事会报告。

【AiBase提要:】

公司董事会有权否决决定,设立安全顾问团队。

成立三个安全团队,跟踪当下和未来AI风险,设立限制要求模型安全得分达标后才能进行下一开发阶段。

定期进行安全演习,研究风险随模型规模扩大的演变。

研究人员发现,谷歌Gemini表现不如GPT-3.5Turbo

来自卡内基梅隆大学和BerriAI的研究团队对谷歌的GeminiPro进行了深入评估,并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。

【AiBase提要:】

😞研究团队发现谷歌的Gemini Pro在多数任务上的表现不如OpenAI的老款GPT-3.5Turbo。

😯Google宣称即将推出性能更强大的Gemini Ultra,但这一消息并未能完全抚平研究结果带来的打击。

🧐研究发现谷歌的Gemini在人类性、形式逻辑、初等数学和专业医学等领域的表现较差,但在语言翻译领域表现出色。

抖音AI内容生成系统软著权获批

抖音视界有限公司的“基于人工智能的内容生成系统”软件著作权获登记批准,成立于2012年7月,法定代表人为张利东,注册资本3亿美元。

【AiBase提要:】

⭐抖音公司获批“基于人工智能的内容生成系统”软件著作权。

⭐AI绘画在社交媒体平台上引发高关注,对著作权保护具有重要意义。

⭐人工智能生成内容需负责任使用,社交媒体平台应加强管理和提升可信度。

抖音网友发起趣味挑战 AI眼中一万年前的麦当劳长啥样?

一位名为“Lucas的AI探索屋”的抖音网友通过使用ChatGPT,挑战探讨一万年前的麦当劳是什么样子,引起网友热议。

【AiBase提要:】

🍟 网友通过ChatGPT探讨一万年前的麦当劳形象,展示不同年代的变化。

🤖 UGC挑战凸显用户与AI共创在品牌创意营销中的新可能性。

🍔 其他博主也通过ChatGPT挑战,如宇宙大爆炸时期的肯德基,掀起讨论热潮。

🤖📱💼AI应用

Copilot用户可通过Suno AI插件创作AI歌曲

微软的AI聊天机器人Copilot与AI音乐初创公司Suno合作推出插件,使用户能够通过简单文本提示随时创作原创AI歌曲,包括歌词。

【AiBase提要】

🎵 插件合作创新: 微软Copilot与Suno插件合作,让用户通过简单文本提示在Discord上创作AI音乐,包含歌词。

🌐 市场竞争激烈: 多家科技公司如Meta、谷歌也在测试生成式AI音乐工具,展示AI在音乐创作领域的潜力。

💡 版权和使用限制: Suno允许免费用户在非商业平台分享生成的AI歌曲,但商业化权利仅提供给付费用户。

AI视频类工具又出黑马!Tonic可自动选择并转换视频中的片段

一款名为Tonic的AI视频平台具有极低的视频AI转换成本,同时能够自动选择并转换视频的一小段,实现与原视频内容的完美融合。该平台的视觉风格和交互设计特别吸引年轻用户,操作简单,具有创意视频生成能力。

下载地址:https://top.aibase.com/tool/tonic

【AiBase提要】

⭐️Tonic平台拥有极低的视频AI转换成本,呈现出卓越的效果。

🎨平台的视觉风格和交互设计吸引年轻用户,具有创意视频生成能力。

📱Tonic操作简单,能够自动选择并转换视频的一小段,实现与原视频内容的完美融合。

Ludo.ai为游戏开发者推出文生视频生成器工具

这个工具使游戏开发者能够在短短几秒钟内创造游戏玩法视频,开启了快速、流畅地将游戏概念可视化的新时代。

【AiBase提要:】

😃 Ludo.ai已经在游戏开发工具中整合人工智能三年。

😃 Ludo.ai发布了视频生成器工具的测试版,游戏开发者能够在短短几秒钟内创造游戏玩法视频。

😃 Ludo.ai首席执行官认为2024年将是AI生成视频无处不在的一年。

Creatify:用AI做视频广告 便宜且高效

Creatify是一款通过人工智能技术生成高质量营销视频的应用,用户只需输入产品链接或上传相关描述和图片,即可获得便宜且高效的广告解决方案。

官网地址:https://top.aibase.com/tool/creatify

【AiBase提要:】

🚀 快速高效广告生成: Creatify通过AI技术提供快速、高效且高质量的视频广告生成解决方案,为用户节省时间和成本。

💡 定制选择丰富: Creatify不仅提供AI生成的广告文案、一键输出渲染,还有丰富的语音和说话化身选择,满足不同品牌需求。

📈 创意落地优势: 广告业务是AI内容生成理想切入点,Creatify从产品页面获取内容,为广告创意提供便捷解决方案。

👨‍💻💡🎯聚焦开发者

微软Azure发布GPT-RAG,为LLM部署提供超智能解决方案

微软Azure最近推出了GPT-RAG,为大型语言模型提供超智能解决方案,确保在企业中更顺畅地运行,旨在满足对LLMs的需求。

【AiBase提要:】

⚙️ 自适应扩展: 解决方案自动调整大小,高峰期也保持良好性能。

🚀 未来设计: 采用前瞻性设计,包括潜在集成Cosmos DB进行分析存储。

🔒 安全框架: 遵循零信任原则,确保敏感数据得到谨慎处理,提供高度信息安全。

阿里云免费开源数据库AI算法PilotScope

阿里云开源数据库 AI 算法 PilotScope,通过中间件系统平台实现 AI 算法在数据库中的一键部署。使用 PilotScope 将 AI 算法嵌入数据库,查询优化等任务的速度提升了1到2倍。该技术已在阿里云内部试点应用,并通过 GitHub 和 Modelscope 魔搭社区对外免费开源。

【AiBase 提要】

1️⃣PilotScope 是阿里云提出的中间件系统平台,实现 AI 算法在数据库中的一键部署;

2️⃣使用 PilotScope 将 AI 算法嵌入数据库,查询优化等任务速度提升1到2倍;

3️⃣PilotScope 已在阿里云内部试点应用,并通过 GitHub 和 Modelscope 对外免费开源。

2024年最重要AI图引热议 开源AI模型正在超越专有模型

开源本地AI模型正逐步超越大规模云模型,LeCun等专家认可,2024年可能迎来开源AI的重要转折,挑战传统闭源开发模式。

【AiBase提要】

🌐 趋势确认:2024年最重要AI图表显示,开源本地模型在5-Shot MMLU基准测试中超越大规模云模型,LeCun等专业人士认可。

🚀 竞争格局: 预计两年内,开源和闭源模型的性能曲线将相交,突显开源社区推动的生成式AI,可能挑战传统闭源AI开发模式,使人工智能更加民主化。

🤝 全球支持: Meta和IBM牵头成立AI联盟,有50多家科技公司、高校和机构加入,明确支持开放创新和科学,显示全球支持开源的合作势头。

0000
评论列表
共(0)条