下一代车载语音,为什么要实现音视觉融合?( 三 )


下一代车载语音,为什么要实现音视觉融合?
文章图片

文章图片
比如当副驾驶接电话时 , 车载音乐主动降低音量;当用户不知道附近哪里可以买到苹果充电线时 , 车机主动呈现附近的直营店或便利店;当车内空气质量不佳时 , 主动通风并调整车内温度……这些功能非常细碎 , 可能用户不会每次开?时都用到 , 但当?厂能够有针对性的把用户的时间、场景切分地足够细 , 它所提供的功能足够智能时 , 这些主动式的 AI 能力会给用户带来你确实懂我的感受 。下面再举几个畅想的案例 , 目前并没有被实际量产 , 仅供参考和娱乐 。车厂可以通过「语音+视觉」的能力 , 主动给用户更好的小憩环境 。当用户开启小憩功能后 , 座舱主动播放舒缓的催眠音乐 , 调整座椅模式和空调温度 , 并为用户定上闹钟 。通过「视觉」功能 , 时刻观察用户的入眠状态 , 当用户进入浅睡眠后 , 自动降低音乐音量 , 快到闹钟时间 , 播放轻音乐 , 温柔引导用户迎接清醒 。车厂也可以通过「语音+视觉」的能力 , 稳定宝宝情绪 , 缓解坐在后排安全座椅上的焦虑感 。座舱可以通过语音和后排的小宝?聊天 , 调整宝宝的心情 , 播放合适的幼儿教育故事 , 引导宝宝思考 。当未来可以在风挡上实现 AR 导航 , 用户可以通过「语音交互+视线追踪+AR 导航」的形式 , 根据用户心情推荐周边信息 。比如用户说:我想在附近停?;我想吃罗森家的冰皮蛋糕;哪儿的优衣库正在打折?这附近哪有快速洗?行?前?挡就会标注出哪栋大厦里有相应的店铺 , 还会语音反馈人均消费、是否有新款等信息 。
下一代车载语音,为什么要实现音视觉融合?
文章图片

文章图片
而且座舱可以根据?主的情绪 , 推荐附近的场所 。比如发现用户心情不好 , 主动推荐附近的极限运动馆;根据?主的?色 , 为用户提供可能需要的周边信息 。如果?主是位奶爸 , 会显示 XX 超市的某品牌尿不湿在打折 , XX 商场的进口奶粉补货了 , 家?口开了一家儿童编程教育机构……如今部分车载语音产品已经能实现还不错的交互体验 , 也有越来越多的用户接触并认可这种交互方式 。但这还远不是终点 , 围绕语音我们还能展开更多的想象 , 比如多模态交互、主动式服务等等 。在理顺这一切之前 , 行业仍然要不断加快脚步 。
来源:汽车之家