更新本周增量:Alibaba Wan-Streamer 与 HUYA VAM 1.0
自动周检
中Real-time Video Model Radar
厂商追踪
技术地图
把视频生成从单次输出推进到可探索、可操作、可持续响应的世界状态。核心共性是用户动作、文本或多模态指令进入闭环,模型持续生成下一段可交互环境。
从文本、图片或场景条件生成可探索环境,重点是空间连续、视角移动和场景持久。
读取当前画面和用户操作,实时预测下一段画面,适合游戏式交互和可玩 demo。
给世界模型加入空间记忆,减少长时间探索中的物体位置漂移和前后矛盾。
面向连续视频流或近实时视频片段生成,重点不只是画质,而是增量生成、低延迟、多条件控制和持续输出能力。适合创作工具、互动内容和实时视频基础设施。
用一个基础模型同时理解和生成声音、画面与互动状态,目标是减少链路拼接延迟。
按时间连续生成视频,强调增量推理、长视频延展、多条件控制和吞吐效率。
面向说话人或角色视频的低延迟生成,重点是口型、表情、反应和对话状态同步。
以已有视频流为输入,在低延迟约束下做风格、语义或画面内容改写。它更像直播/视频生产链路中的实时增强层,不以构建持久世界为第一目标。
读取摄像头或直播画面,在低延迟下做风格、身份、场景或语义层面的实时重绘。
通过 ASR、LLM、TTS、Avatar 渲染、WebRTC/推流等模块组合交付实时数字人体验。优势是产品化快,约束是端到端延迟和跨模块一致性。
把对话、工具调用、语音和视频 Avatar 编排成完整实时 Agent,偏应用平台形态。
提供可嵌入产品的实时数字人视频流,重点是 API、WebRTC、并发和工程稳定性。
从单图或角色素材生成互动数字人,侧重全身动作、表情和语义手势。
更新日志
自动周检
中自动周检
中平台初始化
高