欢迎来到云栖网

免费注册

他带领团队攻坚克难 让智能汽车更懂人的心

云栖网 2022-05-05 18:10 来源:科技日报

云栖网人在车外也能通过语音唤醒车辆,通过语音让车自动驾驶或开启车门。这款全球首发的车外语音交互系统于今年3月在重庆发布,这一系统来自一支青年人工智能技术团队,这支团队在“80后”青年专家马鸿鹏的带领下,对智能汽车人机交互多项关键技术进行攻关,助力重庆汽车产业发展。

“80后”专家带头突破人车交互难点

“以前汽车的语音交互都在车内,实际上车外智能交互也是用户的需求。”科大讯飞智能汽车重庆分中心总经理马鸿鹏说,车外语音交互相较车内语音交互来说,难点在于如何保障车外噪音等复杂环境下,机器能听清楚并执行指令。为了实现车外的人车交互,他和团队独创了神经网络降噪算法和“冷启动”系统两项技术,让车外语音交互系统做到360度语音降噪和无死角识别覆盖,实现稳定高效的车外语音交互。

从计算机专业毕业到去日本企业深造,再回国带领团队进行研发,马鸿鹏有个振兴自主品牌的汽车梦。2018年,科大讯飞西南总部落地重庆,同时落地的还有科大讯飞智能汽车的重庆分中心,作为领头人,马鸿鹏带领团队在汽车电子智能化的技术研发、产品设计,以及整车应用领域与长安汽车等重庆车企展开合作。

他带领团队攻坚克难 让智能汽车更懂人的心

马鸿鹏(后排)与同事进行智能车载系统测试。受访者供图

“小安你好,帮我查一下北京的天气。”

“好的,北京天气晴,白天气温2度。”

“再帮我订一张去那儿的机票。”

……

这样的对话,在人与人交流中再平常不过,但是对于人机互动而言,想要和机器持续对话,并让机器理解“那儿”就是上文所指的北京,技术难度不言而喻。

马鸿鹏解释,对于机器来说,机器需要记忆和理解当前说话人的意图和场景,就需要覆盖尽可能多的场景和可能问法,这种会呈几何级数增长的算法复杂度,使软件的开发和维护都有较大难度。

为了实现这一智能操作,马鸿鹏带领着20多人组成的团队入驻长安汽车,反复测试形成庞大的场景知识库,“通常车内常用指令不超过2000种,但我们在车机上内置了常用指令近6000条,不常用指令近2万条,才精准实现了用户指令。”马鸿鹏说。

另一项技术难点是,怎样才能让语音控制系统保持收音状态,同时车内对非指令正常交流不做反馈。马鸿鹏说,他们在车内研发设置了声纹识别、声源定位等系统,能够准确识别指令发出者的指令,而非指令者和日常车内交流则不会被接收进语音控制系统,让车内语音操作更加智能和人性化。

打破垄断重庆造汽车走出国门

随着智能汽车产业发展,不少重庆汽车品牌也走向国际市场。马鸿鹏说,智能汽车在海外使用,必须适用当地的语种,而在过去外语的车载语音识别及合成系统被国外企业垄断,国内车企只能使用国外企业的语音技术。为了解决这一卡脖子问题,马鸿鹏团队联合科大讯飞研究院展开长安汽车车载外语语音识别及合成系统研发。

“做车载外语识别,不仅需要听懂,还要理解其他国家的语言文化习惯,甚至同一语种不同地区的口音,这就需要有强大的识别模型和机器学习做支撑。”马鸿鹏说,车载语音的“识别”分为“语音识别”和“语义识别”两个技术层次,“语音识别”相当于人的嘴巴和耳朵,负责表达和获取,而“语义识别”相当于人的大脑,负责思考和信息处理。为此,团队开创性地采用实体抽取加动态模板、融合深度学习的框架,将语言和语义技术剥离,构建出“云+端”多语种语义平台,基于该平台可快速实现多语种的语义理解。

2021年,这套车载外语语音识别系统已实现了国产化,长安汽车海外发行的车型均采用了这一国产系统。“关键技术的国产化不仅更稳定安全,在生产成本上也实现了降低,助力国内自主品牌出海。”马鸿鹏说。

“汽车革命的下半场是智能化、网联化、共享化。”马鸿鹏说,他正在和团队开发多模态交互的新技术,未来的智能汽车除了在语音交互外,还将增加视觉感应交互。他们将发挥人工智能优势,进一步从技术提供商,向信息娱乐系统、音响系统等迈进,走向软硬一体化发展,助力重庆汽车产业智能制造