南方科技大学推出Track Anything模型 实现高性能交互式视频跟踪和分割
站长网2023-07-27 14:01:260阅
Track Anything Model (TAM) 是南方科技大学 VIP 实验室开发的视频跟踪和分割工具。它具有简单直观的界面,能够在一次推断过程中跟踪和分割视频中的任何对象。
TAM 提供了自适应视频跟踪和分割的多种选择,包括快速轻松的视频转录、长期目标观察、简单易用的视频编辑以及可视化和开发视频相关任务的工具包。
项目地址:https://github.com/gaomingqi/track-anything
核心功能:
1. 快速简便的视频转录:TAM 可以分离视频中感兴趣的区域,并允许用户选择他们想要跟踪和分割的对象,适用于视频标注等任务。
2. 长期目标观察:TAM 能够处理频繁镜头变换的长视频,适用于需要进行长期跟踪的实际应用。
3. 简单易用的视频编辑器:Track Anything Model 可以将物体分为不同的类别,并提供对象分割掩码,使用户可以选择性地裁剪或重新定位视频中的任何对象。
4. 视频相关任务的可视化和开发工具包:团队还提供了可视化用户界面,用于各种视频操作,包括视频对象分割、视频跟踪、视频修复等,以方便用户测试模型在真实场景中的效果。
0000
评论列表
共(0)条相关推荐
宝剑嫂带货2800万背后,释放了B站商业化的什么信号?
今年618,B站的商业化进程向前迈了一步,其推动力来自于当下各大平台“重注”的直播带货。6月10日,B站头部UP主“宝剑嫂”、“雨哥到处跑”开启直播带货首秀,单场直播总成交GMV超2800万,卖出多个爆款产品。站长网2023-06-16 19:39:570002GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。同时,诗中还要包含提供的3个词。对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。站长网2024-01-29 14:22:280000英伟达首席执行官黄仁勋:生成式 AI 时代「人类」会是新的编程语言
在今年于洛杉矶举行的SIGGRAPH2023大会上,英伟达发布了一系列公告,突出了该公司的创新,特别是在生成人工智能(AI)和图形领域。英伟达创始人兼首席执行官黄仁勋表示,该公司在2018年做出了一个重大的商业决策,很少有人意识到这将重新定义其未来并帮助重新定义一个不断发展的行业。站长网2023-08-10 14:55:330000英国监管机构将审查微软与OpenAI的合作
#划重点1.🧐英国竞争监管机构将对微软与OpenAI的合作展开正式调查,关注是否涉及“控制权的收购”。2.🤖由于OpenAI领导层动荡,英国竞争与市场管理局决定审查微软与ChatGPT开发者OpenAI之间的合作。3.💻调查的关键焦点在于微软是否通过合作取得了对OpenAI的实质性控制,并且该合作是否对市场竞争产生影响。站长网2023-12-13 22:19:44000025倍压缩率!HiFi4G渲染技术实现照片级真实人体建模和高效渲染
**划重点:**1.🌐HiFi4G实现了从密集视频中重新创建高保真4D人体表演的全显式和紧凑方法。2.🎮HiFi4G在优化速度、渲染质量和存储开销方面明显优于当前的隐式渲染技术。3.📦研究团队提供了一种压缩方法,使HiFi4G在每帧不到2MB的存储空间下,以约25倍的压缩率,可在各种设备上实现沉浸式观看人体表演。站长网2023-12-13 10:35:360002