vc数字语音教室中DirectShow的应用-毕业论文
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
密 惠 保
目录
摘 要 I
Abstract II
1.绪论 1
1.1概念及其现状 1
1.2数字语音教室的概念及其发展 1
1.3 数字语音教室的市场前景 2
1.4 语音教室的市场前景 2
1.5语音处理 2
2.技术基础 3
2.1 COM 3
2.2 Directshow 3
2.3 Multicast 4
3. 语音处理模块 6
3.1处理环节 6
3.2 Graph的构成 7
3.3从始至终的声音样本 8
4. 声音的捕捉和回放 10
4.1声音的捕捉 10
4.1.1 声音捕获过滤器 10
4.1.2 声音捕获属性 10
4.3声音的回放 11
5压缩和解压 12
5.1压缩格式的选择 12
5.2声音的压缩 12
5.3 声音的解压 13
6网络传输 14
6.1组播传输 14
6.2声音的压缩 14
6.2.1 过滤器类型 14
6.2.2 选择父类 16
6.2.3 实现Filter 16
6.3数据的发送 17
6.4数据的接收 18
结论 19
致谢 20
参考文献 21
本文来自think58
[资料来源:http://www.THINK58.com]
数字语音教室的概念及其发展
随着现代信息化得发展,我们也看到了传统的基于硬件的系统所带来的局限性,外围教学工具缺少,媒体应用范围单一,灵活控制不够,课件的传统和单一,这些都逐步突显出来,如何才能更好的组织学生参与到学习过程中成为一个急待解决的问题。从信息理解的角度来看,由视觉传递的信息能被理解的为83%,由听觉传递的信息能被理解的为11%,由触觉传递的信息能被理解的为3%,其余的不到4%,而由视觉和听觉相结合产生的效果大于任何一个前者。显然,从效果来看,想要提高的话,最有效率的途径,也是空间最大的,是加大视觉的输入。,但这也是传统的多媒体教室所不具有的优势,这个时候,出现在人们眼前的PC网络却正好在这方面有着强大的优势,既而由此而产生的数字语音系统正好能给语音教室带来一个全新的诠释。数字语音教室是在建立在PC和网络上的纯数字音频系统,它将人声通过电脑和网络传送到另一端的电脑终端,通过模拟/数字转换实现语音交流,并且在这之上添加一系列权限控制。它具有良好的音质,性价比较高,容易推广,在极大的满足教学需求的同时,又合理的利用了有限的教学资源。它不仅支持传统语音的功能,还支持数字化广播,可视化视音频的点播,上课内容储存等更新的功能。
[版权所有:http://think58.com]
如何将语音教室发展得更为成熟和强大将是未来一个很重要的课题,数字语音所具有的优势还需要我们进一步的发现和集成,在数字语音的研究上面,我们还有很多方面需要改进,如如何将延迟减为更小,如何把混音处理做得更好等一系列难题需要解决。
1.3 数字语音教室的市场前景
总体来说,语音教室在国内外都具有很大的市场价值,由于数字系统不同于硬软或者硬件系统,它并不需要较大的投入,而且它本身由于是依附于PC,因此操作方便,简单,容易推广。从商业和学术上来说,都值得我们投入更多的力量。
1.4 语音教室的市场前景
数字教室作为一个整体的教学辅助手段,与传统的教学方式上有很大的区别。在上课时,学生可以参与分组讨论,在线提问和交流,同步观看老师的教学课件,浏览多媒体教学动画,甚至在PC时进行考试,而老师能在上课时对学生的PC进行远程控制,同时对学生说话的权利能进行有效控制,以保证上课的顺利进行,除此之外,对于外语教学所需要的步进,重复,跟读等有必须有完善的功能提供。但这中间最为关键的还是语音处理这一块,多套系统之间的竞争所凭的质量也就完全靠语音互动的效果。本文提出的基于Directshow的语音处理解决方案也就是完全为了改善语音处理的性能。 think58.com [资料来源:http://think58.com]
1.5语音处理
API 、Directsound、Directshow等各种技术都在语音处理方面有强大的支持。
总体来说,各种处理方案都包括捕获,压缩,传输,回放等步骤。最早出现的是API的方式,其后是Directsound,再后是Directshow。Directshow是3种最为成熟的技术。采用Directshow来实施语音处理从理论上来说是最为理想的。
语音处理模块
3.1处理环节
语音的互动实现是本系统十分关键的部分,对系统的运作性能有至关重要的影响,对于整套声音的处理其实有几套技术方案,以前如API, Direcdsound都在这方面比较成熟,有比较好的语音聊天作品,但是遗憾的是他们对于格式的扩展和灵活转换上支持不强,不同的网络可能需要不同的压缩格式和混音方式,同时,系统可能向视频演进,这样以后的系统开发就不得不重新考虑架构了。
语音互动是通过在网络发送,接收两端共同协作完成的,在一端,声音被捕获,可能经过预处理,然后传送到另一端,又经过预处理,然后被回放。这中间可分为:捕获和回放,压缩,解压,网络传输这几个部分。整个语音处理就可以被封装成一个功能模块,提供说话和收听功能。
think58好,好think58 [资料来源:http://THINK58.com]