搜狗推出“唇语识别”技术
2017-12-16 14:59:06 来源:微迷 评论:0 点击:
从键盘打字到触控屏,再到现在的语音交互和手势交互,人工智能技术的发展正在促使人机交互方式向更加多元化方向变革。日前,搜狗又推出一种人机交互新技术——唇语识别,这也是业内首个公开演示的唇语识别系统。通过机器视觉识别,不用听声音,仅靠识别说话人唇部动作,就能解读说话者所说的内容。
与语音识别不同,唇语识别是一项基于机器视觉与自然语言处理于一体的技术,因此在研发难度上比语音识别大得多。搜狗首创了复杂端到端深度神经网络技术进行中文唇语序列建模,通过数千小时的真实唇语数据训练而成。
在非特定人开放口语测试集上,搜狗唇语识别系统已经达到60%以上的准确率,超过Google发布的英文唇语系统50%以上的准确率。在垂直场景如车载、智能家居等场景下,搜狗唇语识别系统甚至已经达到90%的准确率。搜狗唇语识别技术也在第四届世界互联网大会上亮相,引起广泛关注。
当国内大部分企业都扎堆聚集在智能语音、图像识别等领域时,搜狗唇语识别技术的推出将引领整个行业进入一个全新的发展方向。作为人机交互的形式之一,未来唇语识别技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。例如在车载场景下,周围噪音过大时会对语音指令产生干扰,通过唇语识别技术则可以规避干扰,保证人车交互的准确性和稳定性。在安防领域,由于目前多数监控只有摄像头没有麦克风,给案情分析带来很多难题,唇语识别技术可以帮助公安人员获取重要的讲话信息,为公共安全提供有效支持。此外,唇语识别技术还能发挥巨大的公益价值,帮助先天性听障人群或老年人,让他们更好地理解和表达自己。此外,在日常不便发声的公共场所也可以保证说话内容的私密性。
相关热词搜索:唇语识别
上一篇:耐威科技:非公开发行过会,MEMS龙头蓄势待发
下一篇:SoC与3D SLAM结合,打造芯片级即时定位与地图构建
经典文章回顾
- 惯性传感器厂商mCube更名为Movella,挖掘运动数据价值
- 长沙高新区建成79GHz毫米波雷达生产线,雷达应用遍地开花
- OCT+近红外光谱,SpectraWAVE血管内成像平台获得FDA上市前批准
- 敏芯股份李刚:专注实现MEMS芯片中国造
- 国产MEMS产业正崛起,士兰微凭何立足MEMS IDM之林?
- 硅光子传感技术领先厂商Rockley Photonics申请破产保护
- 安防监控CMOS图像传感器龙头思特威携手合肥晶合布局12寸CIS产线
- Aeva全球首款4D激光雷达芯片模组,交由光电子制造领导者Fabrinet量产
- 新加坡A*STAR助力MetaOptics引领全球超构透镜的创新和制造
- 全球光电行业“奥斯卡”,2022年“棱镜奖”入围名单出炉