随着智能设备消费升级大潮的到来,传统的按键遥控器、不灵敏的触摸屏似乎已显得有些不合时宜。为此,很多厂商纷纷加入智能控制研发行列,试图找到人与设备最简单、快捷的对话方式。近期,走在人工智能领域前列的百度推出了“袋鼠开放平台“,通过语音指令识别、手势控制等技术,致力于提升人机交互的体验和效率。据了解,现阶段该平台将免费为企业和开发者提供基础的技术支持与服务。
袋鼠开放平台是一套无接触操控技术解决方案,包含语音控制和手势识别两大功能模块。不难理解,无接触操控指的是用户不需要与设备发生直接接触即可完成相应的指令输入。例如,驾驶者在驾驶过程中用语音控制手机、人们在社交中的语音输入、VR设备中的手势操作都是该类技术的典型应用场景。
自然、直接的手势识别技术
从远古时代起,手势便是人与人之间然而而常见的沟通方式。现如今,在数字时代,手势控制的作用已经延伸到人与设备之间,打破对传统物理介质的依赖,并广泛被应用于电子、医疗、工业制造等各个行业。
袋鼠开放平台中的嵌入式计算机视觉解决方案利用深度学习和计算机视觉技术,提供了无需触摸的手势智能控制技术,以提升用户在VR(虚拟现实)、AR(增强现实)、智能家居和物联网设备、汽车系统以及其他电子产品的使用体验。用户通过比出各种手势,可轻松控制音/视频播放、手势拍照和玩体感游戏等等,且操作简单。借助此技术,用户可在VR/AR世界中看见“双手”。该技术具有诸多优势,例如,使用单目摄像头,无其他额外硬件成本、占用系统资源较少、能耗低、识别度精准度高等等。
精准高效语音控制与输入技术
在中国以中文为基础的对话式人工智能产业的风口已经到来,而世界范围内,对话式人工智能产业也已全面爆发。袋鼠开放平台紧跟风口,研发了袋鼠语音控制系统。
袋鼠开放平台的语音控制系统基于百度语音识别、自然语言处理、机器学习、大数据等技术研发,并深度结合VR、智能家居、汽车系统等不同行业相关词表需求,实现覆盖多行业的可定制词表,力图让人机交互更加自然顺畅。通过该技术,用户可以自如地通过该技术实现语音输入、语音搜索、语音翻译和语音控制等需求。为追求更高的适用性,袋鼠开放平台还为合作企业提供根据实际需求定制的不同行业的专业词库、指令词库等。
袋鼠开放平台的手势控制及语音指令和输入实现了人类与技术交互的更多可能性,使用户真正的享受沉浸式的虚拟现实,同时解放双手让语音交互变得更加准确,流畅、自然。
近年来,手势控制及语音指令和输入的应用越来越受到营销、娱乐、游戏等行业的关注,无接触智能操控必然是未来交互方式的重要发展方向。现阶段,手势控制和语音控制的交互方式还处于快速发展的阶段,并有非常大的发展和完善空间。相信无接触智能操控的发展会给人们带来更多更美好的体验,彻底解放大众的双手,让生活、工作变得更轻松,更智能。
(原标题:百度袋鼠开放平台发布:用语音、 手势操控技术推动交互升级)