今日AI:GPT4强敌Inflection-2.5模型发布;Midjourney要推中国版APP;MovieLLM一句话生成电影
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
📰🤖📢AI新鲜事
媲美GPT4!InflectionAI发布Inflection-2.5版本模型高智商加高情商
【AiBase提要:】
⭐Inflection-2.5在性能上媲美GPT4,仅使用四成训练计算量
⭐结合高智商和高情商,提升编程数学能力同时保持同情心
⭐支持多平台使用,具备实时网络搜索能力,大大提高用户体验
详情:https://top.aibase.com/tool/inflection-2-5
Midjourney计划推出中国版MidjourneyDesktopApp
【AiBase提要:】
⭐与Slack类似的中国版MidjourneyDesktopApp即将推出
⭐新版本应用在总体设计上与官方版一致,但在内容组织和社交功能上有差异
⭐增加更多管理功能以适应当地监管需求
Midjourneyv6版本describe功能上线生成的提示词更长更详细
【AiBase提要:】
⭐️上传图片后会生成更长更详细的提示词
⭐️更符合V6模型的倾向
⭐️不会写提示词也能根据参考图生成类似的图片
Adobe将生成式AI技术Firefly引入移动端 Express应用
【AiBase提要:】
⭐️ Adobe在移动设备上推出Firefly GAI功能
⭐️ 用户只需输入文本提示即可生成所需图像
⭐️ Express移动应用还支持视频编辑和社交内容调度
Firefly产品入口:https://top.aibase.com/tool/adobe-firefly
研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习
【AiBase提要:】
⚙️CyberDemo在各种操作任务中表现更高成功率,尤其在处理未见过的物体时表现出色。
🌐CyberDemo的方法挑战了依赖真实示范数据的传统观念,展示了模拟数据的潜力。
🤖CyberDemo利用模拟人类示范数据完成真实世界机器人操纵任务,提高任务性能和泛化能力。
论文地址https://arxiv.org/abs/2402.14795
项目地址:https://top.aibase.com/tool/cyberdemo
Meta计划到2026年推出生成式AI模型,为Reels等提供支持
【AiBase提要:】
⭕Meta计划推出新AI模型,支持视频内容领域。
⭕目标是提高用户推荐参与度,转变为整体生态系统。
⭕Meta扩大模型规模,希望成为一站式娱乐服务平台。
🤖📱💼AI应用
MyShell多语言、多口音文本转语音库MeloTTS开源
【AiBase提要:】
⭐MeloTTS支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
⭐生成速度贼快,秒级转录
⭐开发人员可以自由使用和修改MeloTTS,还有小部件生成器可扩展功能。
试玩地址:https://top.aibase.com/tool/melotts
MovieLLM:一个词或一句话就能合成电影级视频
【AiBase提要:】
⭐️MovieLLM框架可以从简单文本提示中生成高质量、电影级别视频数据。
⭐️MovieLLM结合GPT-4和文本到图像模型生成详细剧本和视觉内容。
⭐️MovieLLM为AI模型提供训练材料,推动长视频内容生成和理解。
项目地址:https://top.aibase.com/tool/moviellm
NaturalSpeech3:可克隆音色和感情的语音合成系统
【AiBase提要:】
🚀使用神经编解码器进行语音波形分解,实现细致入微的语音建模。
📈NaturalSpeech3在质量、相似度、韵律和可懂度方面优于现有TTS系统。
🔍通过分解扩散模型生成自然语音,在LibriSpeech和Ravdess基准测试上表现出色。
项目网址:https://top.aibase.com/tool/naturalspeech-3
Design2Code:提供设计图,让多模态LLM自动生成前端代码
【AiBase提要:】
⭐️生成AI在多模态理解和代码生成方面取得显著进展,为前端开发带来全新范式。
⭐️研究人员对设计转换为代码任务进行系统研究,提出自动评估指标。
⭐️GPT-4V表现出色,生成网页在视觉和内容方面有望取代原始参考网页。
项目入口:https://top.aibase.com/tool/design2code
——————————-
今日Midjourney提示词分享:3.8女神特辑
3D cartoon style rendering, A beautiful woman stands behind a tulip flower, perfect facial details and exquisite character details. Panorama, large aperture, trendy fashion clothes, new trend portraits, vibrant colors, popMart production, delicate gloss, clean background,8K gradient translucent glass melt, frosted glass --niji6
横版:
图源备注:图片由AI生成,图片授权服务商Midjourney
竖版:
AI前哨|未来你也能影响ChatGPT决策?OpenAI透露重要信息
凤凰网科技讯《AI前哨》北京时间5月23日消息,ChatGPT开发商OpenAI总裁格雷格布罗克曼(GregBrockman)周一表示,该公司正在测试如何在影响其人工智能(AI)的决策中收集广泛意见。周一,高盛集团和天使投资公司SVAngel在旧金山举办了“AI前进”(AIForward)活动。布罗克曼在活动上讨论了OpenAI如何在全球范围内寻求对AI的监管。站长网2023-05-23 09:34:290000微软正在与AMD合作开发Athena AI芯片组
据彭博社报道,微软正在帮助资助AMD向AI芯片领域的扩张。同时,AMD正在与微软合作,为这家软件巨头的数据中心开发代号为Athena的内部芯片组。据了解,Athena旨在成为目前主导该市场的英伟达AI芯片组的经济高效替代品。站长网2023-05-05 09:44:590000做播客,肯定亏钱啊。
2023年7月5号,腾讯旗下的企鹅FM宣布下线,并于9月6日正式停止运营。一边是大厂关停旗下的音频产品,一边是国内收听音频在线人数的不断攀升。而这几年,我们朋友圈里面,不时有很多人分享小宇宙、喜马拉雅这样的音频播客节目。图源备注:图片由AI生成,图片授权服务商Midjourney现在写作难、拍短视频难,于是吸引了很多人纷纷转向音频播客节目。01年代感的产品被激活站长网2023-09-27 09:17:230000独立开发变现周刊(第117期):靠卖Notion模版赚了210万美元
目录1、Amphion:是一个开源的音频、音乐和语音生成的工具包。2、twitterbio:开源的Twitter简介生成工具3、upvoty:一个在线反馈面板小工具4、Pipedream:一个面向开发者的事件流集成平台5、靠卖Notion模版赚了210万美元1、Amphion:是一个开源的音频、音乐和语音生成的工具包。站长网2023-12-22 14:15:030000百度发布生成式商业智能产品“百度GBI”
今日,百度创始人、董事长兼首席执行官李彦宏在百度世界2023现场宣布,百度搜索已经基于AI大模型完成重构,新搜索具有极致满足、推荐激发和多轮交互三个特点。不仅提升了搜索质量,而且突破了搜索的应用范围、扩大了产品边界。李彦宏表示,生成式AI与搜索是天作之合。同时,在大会现场,李彦宏还发布了中国首个生成式商业智能产品——百度GBI。站长网2023-10-18 11:43:010001