多模态模式v2

VibeSim中文 v2

多模态模拟训练——摄像头肢体语言分析 + 实时语音输入 + AI 教练反馈

📷 摄像头肢体语言分析🎙️ 实时语音输入📊 KSTAR 报告🧠 有状态 NPC

选择训练场景

需要摄像头和麦克风权限(可选)。语音和图像仅在本地处理。