首页 -> 2007年第2期
运用语音识别技术干预写作困难学生的研究
作者:胡来林
希金斯和拉斯金德(Higgins and Raskind)报告了一个使用声音识别系统辅助26个学习不良大学生的成功案例,他们平均年龄约25岁。研究者使用了一个称为龙(Dragon)的口述系统(版本1.01),对每个学生进行系统训练约5.8小时。训练结束,系统对每个学生的识别率达到大约80%。每一个大学生在三种条件下写一篇短文:手工、计算机口述和LWP口述。管理和记分程序采用大学写作能力测验。每一篇短文写作大于3个小时,修订的时间也包含在内。短文的质量根据由记分员提供的记分向导1-6分来记录。根据研究者的报告,对两种相对的条件都进行了比较(a)计算机口述对手工;(b)计算机口述对LWP口述;(c)LWP口述对手工。对于(a)的比较,13个学生分数在计算机口述条件下高,5个人在手工下高,8个人在两种条件下相等,剔除其它考虑,发现更多的学生在计算机口述条件下作文有显著性的提高;比较(b)和(c)也有类似的结果。研究发现计算机口述和LWP口述是一致的,并且两种形式的口述作文在质量上都比手写更高[8]。
瑞斯和库明(Reece & Cumming )讨论了两项关于声音识别系统的研究。其中一项包括大学生的研究结果比较乐观,另外一项包括中学生的研究结果不容乐观[9]。
Wetzel和Keith(1996)做了一项研究,目的要确定声音识别技术,是否在帮助中年级具有写作困难的学生在写作方面更有效[10]。三个写作困难的学生被教会使用声音识别技术来完成写作任务。该项研究试图回答三个问题:(a) 小学生能学会使用VoiceType软件吗?(b) 技术有足够的能力来支持学生设法完成写作任务的能力吗?即学生能正确地完成,但技术能精确地反应吗?(c) 整个过程中学生的交流结果提高了吗?如果学生能学会使用技术并且技术能很好地适应,学生能克服写作中的问题,学生的写作的质量与数量有提高吗?
经过10周,每周两次,每次30分钟的实验,Wetzel和Keith并没有得到一个完全肯定的结果,只是对上述三个问题进行了一定程度上的探讨:对于第一个问题,研究者认为,小学生如果学会使用VoiceType软件,就必须掌握词之间停顿的技巧,正确发音单词的技巧,正确使用程序,和控制附加的声音等。实验结果表明,学生能够掌握词之间停顿的技巧和正确发音单词的技巧。对于修正程序的使用和监控附加声音学生掌握有较大的困难;对于第二个问题,实验结果是,口述的74%可以被正确识别,还有26%不能被识别,每分钟可以转译的词可达5.5个。对于第三个问题,实验结果是,整个实验过程中学生的交流结果提高了,但由于VoiceType的局限性,不能得出明确的结论。
虽然,关于语音识别系统对写作困难学生学习的帮助作用有不一致的结论,但是,研究者还是有一些新的发现,这包括:语音识别系统对学习困难学生具有一定治疗的作用,还能增进学习困难学生学习的自信心和动机。
《中国特殊教育》2007年第2期(总第80期)研究发现,声音识别软件对写作困难学生有一定的治疗作用。希金斯和拉斯金德猜想,这种好处是当他们口述作文时,屏幕所写的内容更加能引起他们注意的结果[11]。例如,当计算机在进行转换处理出现错误的时候,学生指导计算机改正这个错误,计算机列出刚输出在屏幕上这个单词的变化的各种可能性,这种变化的形式常常在拼写方面是非常相似的,学生必须注意这个单词的结构,然后选择正确的一个。在一项包含39个年龄9-18岁的学生的研究中,研究者有趣地发现:当学生使用持续的语音识别程序,他们的工作记忆提高了。提高的原因可能是,当学生不断地同语音程序工作时,必须同时全神贯注于他们所说的内容,他们必须记得已经说过什么,并且不断地同屏幕上出现文本进行比较。
随着更有效地使用语音识别程序的指导,学习不良的学生们使用声音识别软件来提高他们的写作较有意义。当学生认识到声音识别软件能让他们用相对较短的时间来写出整洁的作业,他们的写作动机明显增强[12]。
使用语音识别系统来辅助学习困难学生作文,还有另外一些困难[13]:第一,语音识别软件识别学生的声音较难并且比较费时间;第二,学生必须掌握那些成功操作程序的命令,其中有些命令是很难记得的;第三,任何咳嗽声、笑声或其它的噪音都会被计算机解释为胡说的单词并且被加入到学生口述的文本中,如果学生不能改正错误,他们的文字文件将变得混乱,并且他们的口述将不再出现在屏幕上。因此,希金斯和拉斯金德推断,学习不良的学生需要更广泛的指导和监控才能让声音识别软件成为一个有效的工具。
4 语音识别技术辅助学习困难学生口述作文的发展
影响语音识别系统辅助学习困难学生口述作文的最为关键技术是识别率和纠错能力,从某种意义上说,只要这两个关键的技术得到了提高,则其辅助写作的有效性就会得到较大提高。
4.1 系统识别率
近几年,随着多媒体技术和人工智能技术的进步,不仅语音识别系统的识别率得到很大提高,而且多语言的语音识别产品也大为丰富。目前国际商业机器(IBM)公司推出的语音识别软件ViaVoice Pro9.1 for windows,是其第八种语言的产品汉语的语音识别产品,该系统语言模型的创建是以汉语中的词组为最小的语言单位,单个字也看成单字词,这是与英文识别系统的主要差别。该软件具有非特定人,无限词汇量,连续语音识别,高识别率,专业文章智能分析、理解等强大的语音功能。它能解决汉语同音字多、 声调、口音、复杂等难题。该软件通过对个人话语进行测试与分析来适应说话者,适应后的语音识别正确率可以达到95%以上。与过去相比,其识别率提高了很多,已经完全可以接受,这对口述作文者来说无疑是一个福音。同时,它也将大大促进语音识别辅助口述作文的研究和应用。
4.2 智能纠错功能
语音识别系统除了识别率目前已有很大提高外,其智能纠错能力也大为提高。一是纠错的操作变得更加方便和容易,目前的语音识别系统,可以有三种纠错方式:(a)通过键盘输入方式;(b)系统智能化地产生错误词的相近词列出,供修改者选择使用;(3)还可以通过重读来纠错。二是通过纠错,可以让语音识别系统更进一步地熟悉说话者的声音,从而非常有效地提高系统识别率。
随着信息技术的迅速发展,今后的语音识别系统必将是功能更加强大,智能化程度更高,兼容性更强,抗噪音能力更强的系统,其辅助学习困难学生口述作文的有效性也会更强。