
第 21 卷第5 期 系 统 仿 真 学 报© Vol. 21 No. 5 2009 年 3 月 Journal of System Simulation Mar., 2009 • 1384 •一种基于语音交互的虚拟场景漫游系统 王 飞刘惠义王春风 (河海大学计算机及信息工程学院南京 210098) 摘 要将语音技术应用于虚拟环境中实现了一种基于语音交互的虚拟场景漫游系统该系统创建了基于语音交互通道允许用户使用语音命令控制场景漫游可快速...
第 21 卷第5 期 系 统 仿 真 学 报© Vol. 21 No. 5 2009 年 3 月 Journal of System Simulation Mar., 2009 1384 一种基于语音交互的虚拟场景漫游系统 王 飞刘惠义王春风 (河海大学计算机及信息工程学院南京 210098) 摘 要将语音技术应用于虚拟环境中实现了一种基于语音交互的虚拟场景漫游系统该系统创建了基于语音交互通道允许用户使用语音命令控制场景漫游可快速实现自然的人机交互。实验结果表明该系统方便了人机交互给用户带来了更加真实的体验。 关键词虚拟场景人机交互语音识别漫游 中图分类号: TP391.9 文献标识码A 文章编号1004-731X (2009) 05-1384-03 Vagile System Based on Speech Interaction in Virtual Scene WANG fei, LIU Hui-yi, WANG Chun-feng (College of Computer and Information Engineering, Hohai University, Nanjing 210098, China) Abstract: Speech recognition technology to virtual scene was applied and a vagile system in virtual scene was completed based on speech interaction. The system created the channel based on speech interaction, allowed user controlling the scene by speech command, and realized the natural interaction between human and computer quickly. This experiment result indicates that the convenient human-computer interaction has been brought about especially true experiencing by users. Key words: virtual scene; human-computer interaction; speech recognition; vagile 引 言1 以用户为导向自然、高效的多通道人机交互技术是近年来多领域研究与应用的热点[1]。传统的人机交互主要通过鼠标、键盘等设备与计算机进行交互这类交互方式不是以人的自然方式与计算机交互因而缺乏沉浸感。为实现更为自然、高效的交互方式需引入语音等多通道人机交互技术。 某些有特殊要求的系统使用昂贵的硬件设备实现自然的人机交互, 这些设备包括专用语音采集器、高精度摄像机、头戴式显示器以及数据手套等[2]。由于这些设备复杂、昂贵不适用于普通用户使用。用户如能用常用设备(如麦克风)和简单方法通过语音驱动视点的运动实现场景的漫游将突破传统的人机交互方式并显著增强用户的沉浸感。 本文将语音技术应用到虚拟场景的漫游中 针对虚拟场景的漫游设计特定的语音命令 通过对有限个孤立词命令的识别得到相应的语音命令驱动视点的运动实现虚拟场景的漫游取代了传统的鼠标、键盘操作。 1 系统结构 系统的主要功能模块如图 1 所示 语音捕获模块的功能是获取语音并把语音信号转换为计算机易处理的数字信号。核心算法模块的功能是对系统所涉及的端点检测、预加重、分帧、加窗、计算自相关系数等方法加以实现。特征参 作者简介 王飞(1981-), 男, 江苏苏州人, 硕士生, 研究方向为模式识别;刘惠义(1961-), 男, 江苏常州人, 博士, 教授, 研究方向为模式识别、计算机图形学、虚拟现实。 收稿日期2007-08-24 修回日期2008-03-21 数提取模块的功能主要是提取语音特征 可提取的语音特征有线性预测系数(LPC)、LPC 复倒谱、Mel 频率倒谱等。识别模块的功能是对特征参数提取模块提取的语音特征进行识别。 场景驱动模块主要是根据识别模块的识别结果驱动虚拟场景做相应的运动。 界面显示模块主要是以图形化的方式来控制系统以达到更好的交互目的。功能辅助模块主要对系统提供了一些实用工具如语音的回放等另外还包括了一些测试用例用来测试所编写的算法的正确性。 图 1 系统主要功能模块 2 语音识别的关键技术 系统中的语音识别的流程如图 2所用到的关键技术有语音的预处理、特征的提取、模式匹配方法等。 图 2 语音识别流程 基于语音识别的虚拟环境交互系统语音捕获模块 核心算法模块 特征参数提取模块 识别模块 虚拟场景驱动模块 界面显示 功能辅助模块 预处理LPC 系数 LPC 倒谱系数模式匹配 模式库特 征 参 数
2017年北京科技大学马克思主义学院827思想政治教育原理考研强化模拟题
2017年天津财经大学资产评估硕士436资产评估专业基础[专业硕士]之财务管理学考研题库
2017年厦门大学统计系432统计学[专业硕士]之国民经济统计学-国民经济核算原理考研强化模拟题
2017年西北师范大学956软件工程与数据库原理综合之软件工程导论复试实战预测五套卷
2017年西安理工大学743国际贸易之国际贸易理论与政策复试仿真模拟三套题
2017年四川师范大学中外教育史(跨专业加试)之外国教育史教程复试仿真模拟三套题
2017年清华大学经济管理学院431金融学综合[专业硕士]之金融学考研题库



