买球官方网站-买球科技有限公司VR虚拟场景预览入口

网站导航

买球科技有限公司移动端Logo
导航菜单

新闻资讯

当前位置: 首页 > 新闻资讯 > 行业前沿
一种基于语音交互的虚拟场景漫游系统日期:2026-05-14 00:13:33

  

一种基于语音交互的虚拟场景漫游系统(图1)

  第 21 卷第5 期 系 统 仿 真 学 报© Vol. 21 No. 5 2009 年 3 月 Journal of System Simulation Mar., 2009 • 1384 •一种基于语音交互的虚拟场景漫游系统 王 飞刘惠义王春风 (河海大学计算机及信息工程学院南京 210098) 摘 要将语音技术应用于虚拟环境中实现了一种基于语音交互的虚拟场景漫游系统该系统创建了基于语音交互通道允许用户使用语音命令控制场景漫游可快速...

  第 21 卷第5 期 系 统 仿 真 学 报© Vol. 21 No. 5 2009 年 3 月 Journal of System Simulation Mar., 2009 1384 一种基于语音交互的虚拟场景漫游系统 王 飞刘惠义王春风 (河海大学计算机及信息工程学院南京 210098) 摘 要将语音技术应用于虚拟环境中实现了一种基于语音交互的虚拟场景漫游系统该系统创建了基于语音交互通道允许用户使用语音命令控制场景漫游可快速实现自然的人机交互。实验结果表明该系统方便了人机交互给用户带来了更加真实的体验。 关键词虚拟场景人机交互语音识别漫游 中图分类号: TP391.9 文献标识码A 文章编号1004-731X (2009) 05-1384-03 Vagile System Based on Speech Interaction in Virtual Scene WANG fei, LIU Hui-yi, WANG Chun-feng (College of Computer and Information Engineering, Hohai University, Nanjing 210098, China) Abstract: Speech recognition technology to virtual scene was applied and a vagile system in virtual scene was completed based on speech interaction. The system created the channel based on speech interaction, allowed user controlling the scene by speech command, and realized the natural interaction between human and computer quickly. This experiment result indicates that the convenient human-computer interaction has been brought about especially true experiencing by users. Key words: virtual scene; human-computer interaction; speech recognition; vagile 引 言1 以用户为导向自然、高效的多通道人机交互技术是近年来多领域研究与应用的热点[1]。传统的人机交互主要通过鼠标、键盘等设备与计算机进行交互这类交互方式不是以人的自然方式与计算机交互因而缺乏沉浸感。为实现更为自然、高效的交互方式需引入语音等多通道人机交互技术。 某些有特殊要求的系统使用昂贵的硬件设备实现自然的人机交互, 这些设备包括专用语音采集器、高精度摄像机、头戴式显示器以及数据手套等[2]。由于这些设备复杂、昂贵不适用于普通用户使用。用户如能用常用设备(如麦克风)和简单方法通过语音驱动视点的运动实现场景的漫游将突破传统的人机交互方式并显著增强用户的沉浸感。 本文将语音技术应用到虚拟场景的漫游中 针对虚拟场景的漫游设计特定的语音命令 通过对有限个孤立词命令的识别得到相应的语音命令驱动视点的运动实现虚拟场景的漫游取代了传统的鼠标、键盘操作。 1 系统结构 系统的主要功能模块如图 1 所示 语音捕获模块的功能是获取语音并把语音信号转换为计算机易处理的数字信号。核心算法模块的功能是对系统所涉及的端点检测、预加重、分帧、加窗、计算自相关系数等方法加以实现。特征参 作者简介 王飞(1981-), 男, 江苏苏州人, 硕士生, 研究方向为模式识别;刘惠义(1961-), 男, 江苏常州人, 博士, 教授, 研究方向为模式识别、计算机图形学、虚拟现实。 收稿日期2007-08-24 修回日期2008-03-21 数提取模块的功能主要是提取语音特征 可提取的语音特征有线性预测系数(LPC)、LPC 复倒谱、Mel 频率倒谱等。识别模块的功能是对特征参数提取模块提取的语音特征进行识别。 场景驱动模块主要是根据识别模块的识别结果驱动虚拟场景做相应的运动。 界面显示模块主要是以图形化的方式来控制系统以达到更好的交互目的。功能辅助模块主要对系统提供了一些实用工具如语音的回放等另外还包括了一些测试用例用来测试所编写的算法的正确性。 图 1 系统主要功能模块 2 语音识别的关键技术 系统中的语音识别的流程如图 2所用到的关键技术有语音的预处理、特征的提取、模式匹配方法等。 图 2 语音识别流程 基于语音识别的虚拟环境交互系统语音捕获模块 核心算法模块 特征参数提取模块 识别模块 虚拟场景驱动模块 界面显示 功能辅助模块 预处理LPC 系数 LPC 倒谱系数模式匹配 模式库特 征 参 数

  2017年北京科技大学马克思主义学院827思想政治教育原理考研强化模拟题

  2017年天津财经大学资产评估硕士436资产评估专业基础[专业硕士]之财务管理学考研题库

  2017年厦门大学统计系432统计学[专业硕士]之国民经济统计学-国民经济核算原理考研强化模拟题

  2017年西北师范大学956软件工程与数据库原理综合之软件工程导论复试实战预测五套卷

  2017年西安理工大学743国际贸易之国际贸易理论与政策复试仿真模拟三套题

  2017年四川师范大学中外教育史(跨专业加试)之外国教育史教程复试仿真模拟三套题

  2017年清华大学经济管理学院431金融学综合[专业硕士]之金融学考研题库