首页站长资讯AI视野：OpenAI推新模型GPT-4-0125-preview；阿里Qwen-VL升级更新；苹果播客新增转录功能；AI写真项目InstantID在GitHub爆火

AI视野：OpenAI推新模型GPT-4-0125-preview；阿里Qwen-VL升级更新；苹果播客新增转录功能；AI写真项目InstantID在GitHub爆火

站长网2024-01-31 15:57:510阅

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📱💼AI应用

OpenAI不服GPT-4被Bard反超推出最新模型GPT-4-0125-preview

【AiBase提要:】

😲 Bard搭载了新版大模型Gemini Pro-scale

😠 网友质疑混合在线和离线大模型

🔄 模型GPT-4-0125-preview已入场竞技场

Finalframe即将推出适用于AI生成视频的剪辑界面

要点:

⭐ Finalframe支持文本转视频和图像转视频

⭐ 支持创建、打开、保存项目，以及导出完整时间轴

⭐ 即将推出的新功能让视频剪辑方式更直观方便

官网地址:https://top.aibase.com/tool/finalframe

WhisperKit开源!可在iPhone和Mac流畅体验实时语音转录

【AiBase提要:】

😃Argmax公司将WhisperKit作为首个项目。

😃WhisperKit以MIT许可证的形式开源。

😃WhisperKit实现了实时语音转文本。

项目入口:https://top.aibase.com/tool/whisperkit

苹果iOS17.4更新:播客应用新增转录功能

【AiBase提要:】

⭐ 转录功能自动生成播客节目文字稿

⭐ 初期支持英语、法语、德语和西班牙语

⭐ 转录文本不包含动态插入音频和音乐歌词

Mistral-Medium意外泄露神秘新模型“Miqu”击败GPT-4之外的所有大模型

【AiBase提要:】

🤔 Mistral-Medium模型意外泄露，引发AI社区热议，与名为"Miqu"的新模型有关。

🔥 Miqu在EQ-Bench基准上表现强大，与Mistral-Medium相近，但发布者身份神秘。

💥 Miqu身份存疑，是否Mistral-Medium早期版本或Llama70B。

开源地址:https://top.aibase.com/tool/miqu-1-70b

Vary-toy:具有高级视觉词汇视觉语音模型

【AiBase提要:】

📌 挑战与潜力: 大型视觉语言模型在计算机视觉和自然语言处理任务表现出色，但在图像感知能力方面仍有潜力待发。

📌 模型结构: LVLMs采用图像标记作为前缀或交叉注意力进行特征融合，效率受视觉词汇网络的限制。

📌 解决方案: MEGVII Technology的研究人员提出Vary-toy，用于提高LVLMs的图像感知能力。

项目入口:https://top.aibase.com/tool/vary-toy

阿里巴巴多模态模型Qwen-VL升级更新推出这2个版本

【AiBase提要:】

⭐ Qwen-VL-Plus和Qwen-VL-Max版本推出

⭐ 在多模态任务上与GeminiUltra和GPT-4V相当

⭐ Qwen-VL-Max在视觉推理方面展现卓越能力

试用地址:https://huggingface.co/spaces/Qwen/Qwen-VL-Max

AI实时对话系统WhisperFusion:集成大模型，与AI无缝语音对话

【AiBase提要:】

1. 🎙️ 实时语音转文本:利用OpenAI WhisperLive实现即时将口语转换为文本。

2. 🧠 大型语言模型整合:集成Mistral大型语言模型，提升对转录文本的理解和上下文把握。

3. ⚙️ TensorRT优化:LLM和Whisper均经过TensorRT引擎优化，确保高性能和低延迟处理。

📰🤖📢AI新鲜事

Midjourney使用1.6万名艺术家数据库进行训练遭批判

【AiBase提要:】

📌 艺术家反应:艺术家指责公司侵权

📌 法律诉讼:涉及多方提起集体诉讼

📌 艺术家作品未经许可被用于训练AI程序

Open AI否认报告称ChatGPT泄露了用户密码

【AiBase提要:】

😡 OpenAI否认ChatGPT泄露密码

😡 Ars Technica报道泄露工单及网站登录凭证

😡 ChatGPT遭指控为漏洞百出

AI写真项目InstantID在GitHub引爆热潮

【AiBase提要:】

⭐ AI写真项目InstantID在全网刷屏

⭐ 项目背后是来自小红书的 InstantX 团队

⭐ InstantID出图速度快，不需模型训练，支持多种风格

项目地址:https://top.aibase.com/tool/instantid

微软等公司财报低于预期美股AI相关巨头市值一夜蒸发1900亿美元

【AiBase提要:】

📉 微软、Alphabet和超微公布季度业绩低于预期。

💻 与AI相关的公司市值一夜蒸发1900亿美元。

📉 英伟达的股价在1月份上涨了27%，但在盘后交易中也回落了2%以上。

美国点评网站Yelp将加强AI功能部分功能已在iOS版上线

【AiBase提要:】

👉 Yelp的新功能包括AI生成的摘要和首页重新设计

👉 AI生成的摘要将简洁地介绍商家的特色和服务

👉 摘要功能已在iOS上推出，未来会扩展到Android和网页

MIT最新研究:纯文本模型也能训练出视觉表征用代码就能作画

【AiBase提要:】

👁️ 纯文本模型训练视觉概念表征的新可能性

💻 语言模型无法直接处理像素形式的视觉信息

🌈 语言模型在生成复杂场景方面表现出色

论文地址:https://arxiv.org/pdf/2401.01862.pdf

首个图像序列基准测试Mementos开源 GPT-4V/Gemini竟看不懂漫画!

【AiBase提要:】

🤔 Mementos测试的关键目的是测试多模态大语言模型的推理能力。

😟 对于GPT-4V和Gemini等模型，在图像序列推理中表现不足20%。

🤯 Mementos测试发现模型容易产生对象幻觉和行为幻觉。

项目地址:https://mementos-bench.github.io/

200GB!AutoMathText:专注数学文本的超大规模数据集

【AiBase提要:】

1. AutoMathText是一个庞大的数学文本数据集，总体规模达到200GB，汇聚了来自多个来源的数据，适用于多种应用场景。

2. 数据集包含10亿到100亿的数据量级，提供丰富的资源供大规模模型训练。

3. AutoMathText提供了详细的领域标签，涵盖数学推理、推理、微调等方面。

高效机器人学习软件SERL25分钟学会一个任务

【AiBase提要:】

⭐ 机器人学习软件SERL通过更少的尝试快速学会新任务

⭐ SERL可执行多种复杂任务，如组装电路板、布线或移动物体

⭐ 这一软件工具包已经教会机器人执行多种任务，包括组装电路板、布线或移动物体到新位置

项目地址:https://top.aibase.com/tool/serl

AI视野OpenAI推新模型GPT4 0125preview阿里QwenVL升级更新苹果播客新增转录功能AI写真项目InstantID在GitHub爆火

0000

评论列表

共(0)条

相关推荐

站长资讯
Together AI发布AI模型StripedHyena-7B 性能超越Llama-27B
划重点:1.🌐StripedHyena-7B引领人工智能领域，提供计算效率和性能升级的替代选择。2.🚀采用独特混合结构，StripedHyena在训练、微调和生成长序列时表现出色。3.💡未来研究重点:构建更大的模型、引入多模态支持、提高StripedHyena模型的性能。
站长网2023-12-13 22:45:27
0001
微软“史诗级改进”！Win11安装更新后可不用重启电脑
快科技2月24日消息，据国外媒体报道，微软正计划在Windows11更新中引入热补丁”功能，这样用户在安装每月的累积更新时，安装完成之后就不再需要重启电脑。据了解，热补丁”的工作原理是修补运行进程的内存代码，而无需重启进程”。报道表示，微软打算在Windows11上使用热补丁”功能来提供每月安全更新，这样用户安装之后无需重启。
站长网站长资讯2024-02-24 10:09:34
0003
站长资讯
SciMatch：AI看相为你找灵魂伴侣准确率达87%
要点:1.SciMatch是一款利用"AI社会科学"的应用，通过面相识别人格特征，为用户寻找潜在灵魂伴侣，宣称准确率高达87%。2.用户只需上传一张自拍照，应用使用名为"A.I.Ruby"的AI算法进行面相分析，并根据性格特质匹配约会对象。3.应用提供了不同方式的匹配度计算，包括AI匹配和手动点赞，以及音视频实时聊天功能。
站长网2023-11-03 16:15:36
0001
站长资讯
腾讯诉代练公司案二审维持原判后者被判赔60万元
4月21日上午，江苏省高级人民法院二审公开开庭并当庭宣判，腾讯诉《王者荣耀》代练公司不正当竞争案，维持原判。江苏某网络科技有限公司是一家代练公司，旗下有两款主要业务为代练著名手游《王者荣耀》的APP，注册用户数量达到了三四十万。腾讯公司作为游戏著作权人，认为该公司规模化的代练经营行为影响了游戏平衡，同时，部分未成年人通过代练登录游戏，导致游戏实名制和未成年人防沉迷保护机制失效。
站长网2023-04-21 15:29:14
0000
站长资讯
美团大反攻：大降价给流量用虚拟人，直播一杆子插到了县城
面对抖音凶猛进攻，以及昔日盟友背刺，美团正在绝地反击。日前，美团在App首页上线直播和短视频入口。这或许是“社区团购大战”以来，美团产品较为重磅的一次调整。透过喧闹市声和流量焦虑，这篇小稿将讲述本地生活大变局背后，美团为何要布下渗透至县城的直播网络?它能否成为美团反击的转折点?商家会买账吗?01美团直播已渗透到县城
站长网2023-07-27 10:35:30
0000