【如需代写发表论文请您联系我们】您当前的位置:博学论文网 > 计算机论文 >

语音识别在农产品信息采集中的应用

添加时间:2014-08-25

  随着我国农产品质量安全体系的建立和各项制度的不断完善,农产品质量安全信息的采集成为重要环节; 但信息采集具有实时性强、覆盖面广、传统设备操作性差等特点。如何提高工作效率、减少人工重复劳动,是实现农产品质量安全生产与追溯、农产品市场监控及预警过程中亟待解决的问题。语言是人类沟通的最自然形式,其中蕴含大量的信息,语言交流也是农业生产中重要的通信手段。随着语音识别技术的迅速发展,将语音信息转化为便于计算机的处理文本信息,使得语音信息应用于农业生产成为可能。

  1、语音识别技术

  语音识别( Speech Recognition) ,也称自动语音识别或机器语音识别,是通过计算机将人类语音信号转换为文本序列的过程。它涉及到人工智能与模式识别、数字信号处理、统计与概率、认知心理学、语音学、语言学等学科领域,是一门非常复杂的交叉学科。语音识别的研究已经吸引了 60 年的极大关注。20 世纪 80 年代中期,隐马尔科夫模型( Hidden MarkovModel,HMM) 作为语音信号的一种统计模型,在语音信号处理的各个领域得到广泛应用,进而成为一个公认的研究热点,也是目前语音识别的主流研究途径。

  20 世纪 90 年代,语音识别已从实验室走向实用化,如语音导航、语音听写、电话网络自动呼叫处理及票务查询等。近年来,鲁棒的语音识别、基于语音段的建模方法、隐马尔科夫模型和人工神经网络的结合成为研究的热点; 另一方面,为了语音识别实用化的需要,语者自适应、听觉模型以及进一步的语言模型的课题倍受关注。

  2、语音识别在农业中的应用

  语音识别在农业领域的应用研究较薄弱。由于语音识别的学科综合性较强,加之手持式设备处理能力的限制,农业领域人员开发语音处理系统存在困难;而信息技术领域研究人员多注重通用、大词汇量、连续语音识别方法的研究。虽然目前有不少语音识别方面的研究成果和产品,但仍缺乏基于手持设备的农业语音采集技术、方法或二次开发工具,在移动设备农业语音信息采集方法研究方面,目前仍处于空白。

  2.1、国外研究情况

  尽管如此,近期与语音识别相关的农业应用研究也取得了一定成果。Dux,Singh 等利用研究语音识别系统用于精准农业中的数据采集工作,设计开发了多用途电子控制盒语音控制的农用车辆,用户可以在实验室中控制车辆完成农场经营任务。Plauche等研究了利用语音识别技术为农业地区的文盲用户开发了语音驱动接口来普及计算机的应用。Mporas等在 2009 年对希腊语的语音识别系统在家用电器控制中的应用进行了研究,用户能够通过语音互动实现对各种家电的控制,并且在不同环境下进行试验,语音命令的执行具有很高的准确率。

  2.2、国内研究情况

  国内对农业语音识别的应用研究主要集中在通过研发出语音文本转换系统,使得农民能够基于网络获取实时的和有用的信息。张翠丽等研究了基于统一受理的农业呼叫中心解决方案,将语音识别技术运用到交互式语音应答系统,并解决了来自电话、电子信箱等不同媒体的统一受理问题。欧文浩等提出在农业语音信息识别系统中应用关键词语音识别,基于 Microsoft 语音识别技术和 SAPI 语音识别接口开发了农业语音识别系统,使得用户可以通过口头说明来访问语音信息系统。李桢等为了解决当前农业信息语音服务系统中交互作用少、按键频繁的问题,研究了基于关键词识别的农业信息语音服务系统,提供了一种关键词语音识别引擎,可以简化查询过程,增强了系统的交互性。诸叶平等研究了手持设备连续语音识别在农产品数据采集中的应用,提出了面向数据采集环境的基于向量机的嵌入式语音识别多分类方法和多置信特征融合的鲁棒性据识算法,指出现阶段农业领域内的语音识别应用研究应结合具体语料库特征,以有限词汇量的口语识别和开放环境下的语音识别鲁棒性为突破口。

  3、农产品信息采集的设备及作业场景分析

  3.1、手持式农产品信息采集设备

  信息采集是根据特定的任务需求,将分布在不同时空的相关信息或数据通过特定的方法分类提取和汇总的过程,其目的在于为决策、管理和控制等提供原始的数据。农产品智能信息采集设备是指综合运用自动导航、视觉伺服、嵌入控制、传感检测和无线通信等技术,辅助人类高效、简便、可靠地完成农业特定信息采集任务的硬件或基于硬件的系统总称。采集的信息包括自然资源信息和社会经济信息,这些信息的获取是农业向精准化、集约化发展的必要条件。

  随着我国现代农业进程的不断推进,农产品信息采集设备正在从初级自动化向高级智能化,从小型设备向手持式设备转变,智能信息采集设备的研制成为农村科技领域的重大专项。大量集成多种采集功能和智能控制的便携式信息采集设备被研制开发并逐步应用到农业生产加工销售的各个环节当中,如手持式气象站、便携式多参数农田环境采集器、农用手持 GPS 数据采集仪和农产品价格采集终端等。

  基于上述背景和相关研究产品,开发基于手持式的农产品语音信息采集设备将具有较多的可借鉴路线和良好的前景,是十分必要的。

  3.2、农产品信息采集的作业场景分析

  农产品信息采集作为质量追溯、信息发布的关键和基础,采集技术和作业场景复杂多样。从技术上看,采集方式可分为两类: ①原始信息采集。如生产记录、生长环境、农产品等级和价格等数据,需人工采集。嵌入式手持设备是此类任务的主流硬件平台。

  数字化自动采集。通过传感器自动采集环境信息( 温度、湿度等) ,通过条形码、RFID 等技术自动采集原料信息( 产地、时间等) 。对于已完成数字化处理的数据,现有技术设备已经能够很好地解决其采集的问题,而对于只能通过人工干预进行采集的信息,由于大部分需要在进行农产品生产、管理工作的同时完成信息采集,而现有的设备和系统主要采用基于视觉/手动方式来完成采集,采集信息的同时必然导致工作效率降低。

  从作业场景看,采集环境大多是广阔空间,具有多样性、多变性和分散性等特点。采集作业现场的复杂性表现为: 大多数的采集作业环境以室外为主,手持式设备的屏幕小键盘操作不舒适,在烈日、风沙、雨雪等恶劣天气环境下以及特殊作业需要操作者采取防护措施的操作尤其困难。操作人员在使用设备的同时也承担着农业生产任务,对人机交互的效率要求较高。手持设备移动作业的时间、空间的变化差异造成作业对象的相应变化,即时操作的灵活性不够。普遍采用的传统交互界面需要大量的操作提示信息,对操作者的知识层次和操作水平要求较高。

  多功能的集成导致作业模式、作业对象复杂多变,操作者对信息感知和采集的效率下降。基于以上的客观原因,为降低操作难度、提高采集效率,信息采集设备应该具备操作方便性和良好的人机接口,尽可能使操作者不必为繁琐低效的交互分心,把注意力集中在要采集信息本身。从实现这一目标的可行性方法看,语音是人类最自然地信息载体和交流方式,农业生产中离不开大量的语音信息交流,利用语音识别技术来获取这些信息将是切实可行的。

  4、解决方案及技术路线

  基于上述对设备和作业场景的分析,结合当前语音识别技术的发展情况,来解决实际应用场景下语音信息采集问题。

  4、1、模型训练阶段

  模型训练包括声学模型的训练和语言模型训练两部分。声学模型当前主要采用国际上主流的上下文三音子为建模单元,通过人工采集大量的语音样本建立语音语料库,采用 Baum - Welch 等算法进行模型的训练,得到稳定的声学模型。在声学训练之前,需要对声音信号进行预处理、提取稳定的声学特征,当前主流的特征为 MEL 频率倒谱系数( Mel - FrequencyCepstral Coefficients ,MFCC ) 或感知线性预测系数( Perceptual Linear Prediction,PLP) 等,较好地解决了特征提取问题。语言模型的训练主要是文本信息的处理,首先对特定的应用场景用文本提取工具提取大量的文本,建立语料库,并对其语义分析和语法结构进行推断,进而形成一系列的语法规则,即语言模型。

  4.2、识别阶段

  识别过程是对语音信号进行解码( decoding) 的过程,基于隐马尔科夫模型的解码过程可采用 Viterbi 算法。首先,在前端对输入语音信号进行特征提取,得到的特征向量与声学模型进行声学对比; 然后,从发音词典中选出概率分布最为接近的候选词,再利用语言模型进一步进行约束,得到最终的识别结果。

  4.3、应用系统搭建

  基于移动互联网和云计算平台,构建应用系统。利用手机平台作为移动终端,采集语音信息和实现人机交互,通过移动 GPRS/3G/4G 通信网络和 HTTP 协议,将采集到的语音信号发送到语音服务器进行识别,语音服务器依靠强大的云计算资源提供自动语音识别( ASR) 服务,可根据业务需求提供语音合成服务( TTS) 。Web 服务器为语音服务、业务服务、授权服务提供访问支持,通过 http 协议实现可靠的通信任务。业务服务器实现各种信息查询、决策支持、预警信息发布等具体业务。互联网用户通过 In-ternet 实现业务信息的访问,同时也可以完成语音识别的功能,但显然不适合在作业现场完成。

  5、实验及结果分析

  本实验按照上述方案,以农产品价格信息采集为例,采集农业部市场与信息司所规定的鲜活农产品名录中所列的142 种农产品价格。在北京市多处农贸市场录制语音语料库,其中 23 男、22 女,每人 192 句话,共计 8 640 句; 测试集另外录制 3 男 3 女,每人 100句,共计 600 句话。采用上下文相关的三音子为建模单元,声学模型采用自左至右无跳转隐马尔科夫模型,并区分男女分别进行训练。经实验发现: 男声和女声单独训练后,其识别性能要优于混合训练的结果。为了减少测试环境与训练环境的不匹配问题,本实验采用了倒谱均值归一化( Cepstral Mean Normaliza-tion,CMN ) 和 CVN ( Cepstral Variance Normalization,CVN) 方法,用归一化的特征分别训练男声和女声模型,并在此基础上进行了决策树聚类和增加高斯混合分量的数目,最终识别率男声模型为 95. 04% ,女声模型为 97. 40% 。

服务介绍
【论文写作介绍】凡是本站加盟写手老师,均为全国知名高校硕士、博士以及在校教授,您将要求发给我们,我们立即会安排相应专业老师对您的论文要求进行严格、认真的分析,并在48小时之内,为您定制出若干个题目,任您挑选,挑选符合,老师将对您的论文进行整体写作。
【论文发表介绍】在收到您的QQ、电话、邮箱后,将对您的论文进行严格的审核,如您未有决定发表期刊,则本站将根据您的论文质量,以及相关专业进行期刊推荐,您挑选好期刊后,我站将安排发表。
【为什么相信我们】我们视信誉为生命,我们的全职工作就是为论文需求者服务,我站成立论文行业数十年,服务客户上万名,每位客户的要求我们都尽力完成,不能写的论文我们绝对不接,能接的论文我们一定会努力完成,客户的满意是我们的目标。
联系我们
  • 代写QQ: 23721259
  • 发表QQ: 23726208
  • 咨询电话:18930620780
  • 固定电话:021-58510201
  • E-mail:lunwen021@163.com
热点论文
本站专注于提供各种论文代写、论文发表服务 联系QQ:23721259 23726208 咨询电话:18930620780 邮箱:lunwen021@163.com
【免责声明】:本网站所提供的信息资源如有侵权、违规,请及时告知