基于PID控制算法的热水器智能控制系统设计


    







    基PID控制算法热水器智控制系统设计——语音识系统设计




    基PID控制算法热水器智控制系统设计——语音识系统设计


    伴着物联网数工智发展语音识更高求时意味着生活中家居产品越越智走进生活中方方面面作消费者生活品质提高家电智化已成家电市场发展必趋势达更加性更加节约资源提供更便携服务等作全方位实现生活中信息交互功显十分必忽略电热水器智发面着巨发展前景满足定舒适度时希够做语音智市面已热水器储水式电热水器热式热水器中储水式电热水器广项优势更符合家庭安装求产品更新换代定群众基础储水式热水器作基础进行功改进增加结合语音识系统包括容
    针现语音识算法进行介绍做进步分析解算法原理种算法进行操作难度较结合设计体进行筛选选出合适算法设计体储水式电热水器参方案设计介绍结构设计语音识相关水温控制水位控制做相关调整
    基动态时间规整算法首先提取语音容计算机声卡收集收集语音进行数字化预处理时语音端点检测关重通处理语音进行特征提取获取需容进行训练识通实验验证该方法初步实现语音识达通语音控制电热水器基操作满足日常需提高舒适性
    关键词:储水式电热水器智控制语音识系统节保温动态时间规整算法


    Design of Intelligent Control System of Water Heater Based on PID Control Algorithm——Design of Speech Recognition System

    Abstract
    With the development of the Internet of Things big data and artificial intelligence there are higher requirements for voice recognition which also means that the household products in our lives are becoming more and more intelligent entering all aspects of our lives we as consumers The quality of life has been improved The intelligentization of home appliances has become a necessary trend in the development of the home appliance market In order to achieve more humanity save resources and provide more portable services it is very necessary to realize allround information interaction in life Electric water heaters which are often overlooked have huge development prospects in terms of intelligent development In addition to satisfying a certain degree of comfort at the same time it also hopes to achieve voice intelligence but the existing water heaters on the market are mainly storage type electric water heaters and instant water heaters Among them the storage type electric water heater is widely used because its advantages are more in line with the requirements of home installation so this has a certain mass base for the replacement of products Based on the storage water heater it has been improved and increased in function combined with a voice recognition system mainly including the following content
    According to the introduction of the main algorithms of speech recognition after further analysis after understanding the principles of different algorithms the operation difficulty of several algorithms is compared and combined with the main body of the design to select the appropriate algorithm For the main body of the design the storage type electric water heater participated in the scheme design introduced its structural design related to speech recognition water temperature control and water level control related adjustments
    The algorithm based on dynamic time warping first extracts the voice content uses the computer's sound card collection digitizes and preprocesses the collected voice and at the same time it is also crucial for the detection of voice endpoints Feature extraction of speech to obtain the required content and finally training and recognition through experimental verification this method can initially achieve speech recognition to achieve the basic operation of electric water heaters by voice control to meet daily needs Improved comfort
    Keywords Water storage electric water heater intelligent control voice recognition system energy saving and heat preservation dynamic time warping algorithm

    目 录

    1 前言 8
    11 设计目意义 8
    12 设计发展现状趋势 9
    121 设计现状 9
    122 设计发展趋势 10
    13 设计研究容目标 12
    2 语音识系统工作原理 13
    21 算法 13
    211 动态时间规整 13
    212 隐马尔夫 17
    213 工神网络 18
    214 深度神网络 19
    22 章结 21
    3 热水器总体方案设计 22
    31 总体方案介绍 22
    311 结构设计 22
    312 温度控制系统 22
    313 水位监测系统 23
    32 语音识系统方案设计 24
    33 章结 25
    4 基动态时间规整语音识算法实现 26
    41 语言学知识 26
    42 语音识系统软件流程图 26
    43 语音信号数字化预处理 27
    431 数字化 27
    432 预处理 28
    44 端点检测 31
    45 特征参数提取 31
    46 训练识 32
    47 语音识系统实验验证 32
    48 章结 33
    5 总结展 34
    51 总结 34
    52 展 34
    参考文献 35
    谢辞 36
    附录 37




    1 前言
    目前生活水提高加科研专家断研发商家营销生活中已式样智家居包围时作生活中必备品——热水器着捍卫坚固位家庭酒店热水器已装潢必备产品早期燃气热水器安全性欠缺燃气热水器引起爆炸中毒事件数量庞燃气热水器具定恐惧心理加燃气热水器安装条件限制水压较高求普遍家水压较难达求导致燃气热水器逐渐市场淘汰取代电热水器
    电热水器中国市场已发展十年历段意市场二十世纪90年代末部分国外品牌发现中国市场开始国引进国外品牌进入开始转关注电热水器相燃气热水器电热水器点显易见安装方式技术没高求更简洁方便重会产生量废气避免空气污染时避免中毒危险更安全更卫生仅适应天气变化
    目前市面销售部分电热水器已够基满足生活需求然学者断完善已产品力求更安全更智更稳定电热水器水温控制水位系统储水容量等设计方面目前国专家懈努力已取成直断完善开发新功

    11 设计目意义
    着物质生活水求逐渐断提高生活舒适性求越越高许智家居控制系统已进入生活热水器种类众控制方式统智家居控制系统少包含热水器控制模块现燃气式热水器出现问题越越明显水压受限较差安全性频繁出现废气中毒燃气爆炸等事导致燃气热水器渐渐退出市场天气原太阳热水器影响较逐渐市场淘汰目前市场两种电热水器
    代年轻较少知道连续水流式电热水器种生活中家庭装潢首选储水式电热水器连续水流式电热水器鲜知原缺点非常明显需功率相器家庭中非常路线求高优点十分显著水温加加热速度非常快实性高体积娇占方储水式电热水器吸取流水式电热水器验避开设计缺点采机械式设计方法鱼熊掌兼样设计带问题较温度控制简单时设计精度低加热时间偏长功单法做功两者进行相绝部分家庭更倾购买储水式电热水器毕竟作生活必须品具安全更符合家装求储水式电热水器流水式电热水器家装方面更具市场相应更广泛节智控制等方面提高时市面部分储水式热水器着重提高储水量忽略热水器智化性化需求
    满足高质量生活需求处环保节倡导理念必储水式电热水器进行改良温度控制系统求更高更加节更加方便程中热水器智控制热水器时候时关闭防止热量散发程中导致浪费热水器时候做性化提高舒适度

    12 设计发展现状趋势
    121 设计现状
    十年发展电热水器整技术取持续性进步例众较解防电墙防电门创新技术专业领域熟知3D快速加热变频功扩展等等类似样创新性产品逐渐行业蔓延开关注安全性节加热速率出水量等断改进
    目前电热水器市场进行查阅电热水器市场储水式电热水器水流式电热水器占半壁江山种广泛运家庭中储水式电热水器显著特征容量选择销量显示选择50L居户家庭空间受限更重储水式电热水器空间占倾选择较少储水量例40L家庭员较空间较充裕选择更出水容量例60L甚高达100L家般40L60L储水式热水器加热采低功率导致次前预热时间较长早期热水器加热需高达1时部分热水器加热时间缩短4060分钟加入预约加热等功然便时节节水方面然提高外程中部分热水器没考虑户体验需加改善
    水流式电热水器具巧热快优点弥补储水式电热水器缺点助加热高功率冷水快速加热水温升温快做立开关闭效果节约水 功率加热条件限必须专门线路安装出水量求出水量会影响效果
    储水式电热水器更广泛运家庭
    着技术断进步工智年发展迅速知觉中工智已进入生活方Apple手机中Siri机驾驶车辆 体现工智应 语音识技术作项含高科技技术实现程似简单实际操作十分复杂机器求需特定产品通语音进行识然分析理解机器语音信号进行转换相应文命令进执行计算机言语音识存耳朵脑嘴巴配合着工作样属工智中极重部分
    中国语音识研究世纪五十年代开始年需求猛增促发展迅猛国研究水已走出实验室逐渐走国际世纪八十年代国实施国家863计划开始国专家组特设立语音识技术研究项目解语音识研究项目两年进行次专家项研究中国语音识技术研究水基已赶国外水次中国语音识技术体现独特功优势例方言等等甚说已达国际先进水解国知名院校例清华学北京学哈尔滨工业学等语音识技术方面进行深入研究
    清华学电子工程系研究组断研究已开发出种非特定中文数字字符串连续语音识系统部分识精度高达987%目前国际识结果接实水

    122 设计发展趋势
    语音规模环境中语音识研究题 仅仅作语音信号处理重研究方模式识分支 做涉领域非常广泛包括类生理学心理学语言学计算机科学计算机信号处理甚类语言(例间交流时)技术帮助理解时方面部表情手势行着方终目标实现机器间然语言交流
    语音识技术正迅速普更户提供方便然交互体验语音识技术目前已移动互联网广泛应穿戴智家居智汽车等领域已开始应语音识技术越越智产品终端开始引入语音功伴着网络快速发展目前5G高速网络数服务台广泛应语音识技术发展听说初步应发展够理解思考工智
    果实现技术户体验效果幅度提升迎更发展机遇期
    新技术新产品新服务(例穿戴设备智家居驾驶汽车)语音作机交互设计开发手段智语音识技术影响新兴产业数万亿美元发展围绕智语音技术开发新产品服务程中产业链中环节会进行重新调整制造商开始例组件制造商终端制造商技术方面例软件技术提供商容服务提供商消费者通系列调整促进产业变革进建立新工业生态系统
    着语音识语音合成领域中深度神网络技术断深入语音识语音合成技术迅速发展断成熟断提高准确性精度机器翻译然语言理解技术作智语音两项核心技术学术界工业界关注焦点着工智技术广泛关注机器翻译然语言理解技术成未研究机构企业研发重点
    信息消费促进智语音识技术移动电话家电器汽车电子等传统终端设备中应扩展新兴穿戴设备例智眼镜智手表断改善户体验效果扩消费范畴消费类创建新信息消费市场
    济素房屋行业景气国消费电子行业增速放缓增长动力足 特产品类销售增长已放缓 然种现象电热水器行业例外
    电热水器产业新兴产业作项传统产业相新兴产业言竞争市场相言较激烈国家城市市场热水器普率较高时相应政策出台产业影响国热水器市场出现增长减缓情况挑战伴着机遇智需求局限电子产品开始转智家居相市面部分电热水器具更智更性化热水器慢慢进入视野中逐渐受年轻青睐远观未具机交互功技术含量高节环保新型电热水器国电热水器市场增长点 着国家农村力支持农村城市化家电乡节补贴等诸政策出台中国农村家电市场会巨发展空间
    目前市面电热水器品牌格局基已初步形成科学技术断发展需求断增热水器求逐渐趋高端化智化目前未十年甚年热水器行业会进入术语发展黄金时期解品牌智化电热水器加深究电热水器发展十分迅猛总体说行业缺乏统规划协调综合热水器未发展方然智化
    年消费群体热水器需求量然增长说明电热水器潜力旧巨时行业极成国电气行业阶段热点方面迄止诸家庭智需求类新概念尚未普智电热水器市场总体拥率较低更智电热水器会成行业优质产品果通现状握住升级机会加快机会推广新智电热水器概念未会更种类更功智化电热水器进入消费者家庭
    国家号召网络进步环保士力宣传节减排艺术逐渐提高相信智节储热式电热水器市场广阔需求稳定时着储热式电热水器等环保节产品普环境改善

    13 设计研究容目标
    次毕业设计旨针市面部分储水式热水器恒温系统语音识系统足进行改善市面数语音识系统流水式电热水器流水式电热水器足功率部分家庭法满足样硬性求针现象储水式电热水器进行改善完善语音识系统实现程中进行语音控制
    根需做出语音指令时电热水器做出相应反应例提高降低水温开关水等语音指令

    2 语音识系统工作原理
    21 算法
    目前具代表性语音识方法动态时间规整技术(DTW)隐马尔科夫模型(HMM)工神网络(ANN)深度神网络(DNN)等方法

    211 动态时间规整
    时间动态规整算法DTW初时候运识语音相似性例数字代表发出词语音调高低例某词语发音音调1324安排两学分说词语学a说时候前半部分发音意拖长发音表示113324学b说词语时候半部分发音拖长发音表示132244

    图21 AB发音序列图

    现两组序列分计算第位学113324序列距离第二位学132244序列距离已知距离越相似度越高两组序列代表词语期通计算出距离越越样两序列表示词语 视统词语概率越
    首先运传统计算方法计算两序列欧里距离步骤计算刚刚两序列应点间距离
    距离
    |A(1)B(1)| + |A(2)B(2)| + |A(3)B(3)| + |A(4)B(4)| + |A(5)B(5)| + |A(6)B(6)|
    |11| + |13| + |32| + |32| + |24| + |44|
    6

    图22 AB发音序列距离图

    假设允许第发音序列图中点第二发音序列图中点竖相连样做目延长点代表音调发音时间然间点距离进行计算求距离图:B发音中1A发音中1相连B发音中1A发音中2相连B发音中3A发音中3相连B发音中4A发音中4相连

    图23 AB应点相连图

    种序列某时刻点时刻连续时刻点相应做法时间规整(Time Warping)
    第序列称A第二序列称BA(113324)B(132244)两序列间总6点6*6矩阵M表示点间距离M(i j)代表A第i点(例A(2)1)B第j点(例B(2)3)间距离等322
    式21

    图24 矩阵M

    通传统欧里距离里应点:
    A(1)B(1)
    A(2)B(2)
    A(3)B(3)
    A(4)B(4)
    A(5)B(5)
    A(6)B(6)
    两两间正矩阵M角线条角线点进行综合计算难发现等6
    动态时间规整方法中应点示:
    A(1)A(2)B(1)
    A(3)A(4)B(2)
    A(5)B(3)B(4)
    A(6)B(5)B(6)
    难出左角右角路径中通时间规整方法应点中条路径路径元素总0
    DTW算法步骤:
    第步中计算两序列点间距离矩阵
    第二步中矩阵左角右角路径计算条路径元素
    路径元素总称路径长度找条路径呢?
    首先难出矩阵中左角右角路径长度具属性:
    前路径长度步路径长度+前元素
    路径元素(ij)前元素三元素:
    a)左侧元素(ij1)
    b)方元素(i1j)
    c)左方元素(i1j1)
    假设矩阵M矩阵中左角点(11)意点(ij)短路径长度Lmin(i j)然递算法找短路径长度:
    起始条件:
    式22
    递推规:
    式23
    前元素短路径必须前元素短路径长度加前元素长度前元素刚刚提三需取三中路径短

    212 隐马尔夫
    图示马尔科夫模型图结构

    图25 隐马尔夫模型

    通图25示结构初步解完成HMM模型满足3特征前提:
    (1)通已知变量未知变量进行猜测
    (2)序列满足马尔夫性质
    (3)观测序列变量X状态时间t隐藏状态确定时间t里
    时隐马尔夫模型概率图模型学务计算变量概率分布 通考虑联合概率P(YX)推断Y分布
    考虑马尔夫性质时间t处机变量Y状态仅y(t1)确定时间t处观测序列变量X状态仅yt确定:
    式24
    推出联合概率:
    式25
    通常马尔夫模型已知观察序列推断未知变量序列模型

    213 工神网络
    工神网络出现提高语音识准确率1980年代期出现英文缩写——ANN质非适应非线性动力学系统通解类神活动原理进行模仿类脑具适应性行性鲁棒性容错性学特征方面类具原理进行模仿学通模仿学具备样复杂特征然ANN仅仅着强分类功语音输入输出映射方面功相更吸引点具创新性种算法通俗说类脑进行模仿学复杂脑思维机制转换成工程模型隐马尔夫模型相工作原理相反具分类决策力确定信息描述两方面全世界学术界广泛认描述语音信号动态时间信号力然具足静态模式分类问题通常MLP分类器通解决足时间序列处理没涉
    界学者推出许具反馈结构表现力然意足表示出语音信号时间序列动态特性工神网络缺陷程中通常工神网络算法传统识方法结合劣势吸取优势进行语音识样算法够弥补工神网络传统算法间具足处较常神网络隐马尔夫模型识算法进行结合针种结合算法科研专家算法研究已走相长段路取较进展解种算法识正确率基接隐马尔夫模型识系统正确率效提高语音识鲁棒性准确性语音识做出较贡献


    图26工神网络图

    214 深度神网络
    Hinton全世界语音识技术做出重贡献提出深度置信网络(DBN)促进深度神网络(DNN)研究2010年左右HintonDNN应语音声学建模TIMIT取佳结果2011年底Microsoft ResearchYu DongDeng LiDNN技术应连续词汇连续语音识务中举措真正做降低语音识错误率时候开始语音识正式进入DNNHMM时代
    DNNHMM深层神网络模型代原始模型音频信号状态进行建模需语音数分布进行假设 DNN处 拼接语音帧时包括语音时序结构信息 方式状态分类概率显着提高 时深度神网络具强环境学力提高噪声口音鲁棒性

    图27 深度神网络图

    简言DNN出特征输入字符串相应状态概率 语音信号连续性单词中包含音素音节单词单词间没明显界限发音单元受文逻辑素影响拼帧添加文信息语音言仅仅通拼帧远远理想效果递神网络(RNN)出现作体现记住更历史信息获语音信号信号进行建模



    22 章结
    语音识算法种目前入门者说动态时间规整算法(DTW)隐马尔夫算法(HMM)较代表性实现孤立词识DTW算法适训练样较少时效果更理想针语音特征参数序列时间齐问题够较解决相关问题克服情况语音速度差异带识错误训练时样少算法相简单识程相复杂
    隐马尔夫算法(HMM)状态序列描述观测量时间逻辑观测量序列空间分布元高斯混合分布表示然识识率高保证识率前提种算法训练中需十分训练样疑增加存储负荷需量存储空间识程相简单规模词汇语音识系统中连续
    工神网络深度神网络然定程度降低识错误率更准确识出语音信号容考虑成算法难度优先考虑两种算法
    结合次设计求选择动态时间规整算法(DTW)

    3 热水器总体方案设计
    31 总体方案介绍
    311 结构设计
    电热水器结构关键零件胆加热棒镁棒
    中胆说重部分关系热水保温问题甚说评判热水器坏取决热水器胆性设计结构设计搪瓷胆提高电热水器耐腐蚀性外镁棒加热棒性关系热水器寿命
    加热棒作加热元件重性光名字显易见质量较电热水器加热棒选择着较高标准长时间处水里环境会产生结水垢现象时加热缘会加剧现象词设计电加热棒选择倾选择符合抗腐蚀标准产品
    镁棒似没体现出较作实际镁棒形中发挥着巨作吸收电热水器中产生离子保护水箱加热镁棒性质活泼采牺牲阳极方法减慢水碱腐蚀速度更效保回胆加热棒外镁棒会消耗殆未提高体验减少售维修成设计采高密度加厚镁棒延长寿命

    312 温度控制系统
    系统中选AT89C52单片机具高速低功耗超抗干扰超低价位等特点单片机
    传统8051微控制器做完全兼容时钟机器周期选择6时钟机器周期12时钟机器周期两种外采温度传感器DS18B20数字式测量温度范围较广低-55摄氏度高+125传感器精度精确05℃特点较明显线路简单体积娇广泛选择DS18B20数字式组成设计中需测温系统够避免线路繁杂导致实验失败起简化线路作
    通读取DS18B20数字传感器数线数通定运算实现前温度读取

    图31 温度控制电路图
    313 水位监测系统
    常水位指示器包括浮动光标指示器水连接指示器
    浮球光标指示器尼龙绳端绑住浮球然浮球放入水中绳子端绕滑轮绑住光标水位升时浮子水位起升表明光标落水位降时光标升水连接指示器水箱底部开孔垂直玻璃密封连接玻璃端直接通气连接水箱顶部样直接玻璃中水箱水位
    开放式储水式热水器中采产品1浮球浮球浮水面浮球式水位开关够准确判断出水箱中水位水箱中水位进行控制防止水箱中水量满导致水溢出情况浮球特殊属性浮水面着水位升降果浮球升指定高度时需关闭通连杆关闭水位开关进水停止水族箱中水位会升进达关水效果储水式电热水器需配水保护开关开关防止出水器没水电热水器然加热情况会导致电热水器损坏甚引发失火等危险 2指示灯绿色表示 3加热指示灯红色表示4温度控制器 5储水箱 6加热器保护器水压传感器保护器常保护器水压传感器保护器实质电路中电闸具高度灵敏特性水压传感器开关作加热器水位水压果水压高开关会开果水压低开关关闭电源保护电热水器样确保水完全浸没加热器时会工作电子水位保护器水位传感器保护器根原理水位相应水电导率进行工作测量水电导率进获水位信号进行放发出相应运行信号控制电源开关开者关闭

    32 语音识系统方案设计
    做完整语音识系统首先分析部分构成通资料查阅语音识系统初步解三部分展开:
    语音特征提取(前端处理部分):部分目通处理获语音进行分析获语音波形进提取想识容特征参数序列消干扰
    声学模型模式匹配(算法处理部分):部分中通训练语音信号孤立单词发音创建发音模板识程中输入语音特征模板中容进行较进匹配出结果
    训练识(处理部分):识结果进行分析根语语意做出知道命令发出命令时电热水器适做出相应响应
    完整语音识围绕方面进行设计:
    获取音频信号音频信号处理先决条件 麦克风声波转换电压信号通A D设备(例声卡)音频进行采样连续电压信号转换计算机处理数字信号


    图32 语音识流程

    作语音信号处理前提语音信号采集
    语音通常通话筒输入计算机目前媒体计算机已非常普台计算机基设备已包含声卡音箱话筒等等功计算机语音信进行加工重部件声卡实现ADDA转换信号滤波放等功声波转换连续电压信号继连续电压信号转换计算机够处理数字信号
    语音信号采集进行数字化预处理端点检测特征参数提取然进入训练识等实际应
    电热水器需孤立词特征参数特征参数集合作模版存入模版库中识程中通模版匹配法模版库中原先输入模版做较会出现种结果取相似度高作终结果输出

    33 章结
    语音识系统已伴着硬件计算力提高仅ai领域常提生活中开始引起注意做设计前解家居智化理方面国米企业研发应语音识家电产品广泛接纳智热水器总体设计方面仅提高热水器质量升级产品功














    4 基动态时间规整语音识算法实现
    41 语言学知识
    设计基动态时间规整算法实现电热水器语音识系统动态时间规整作种语音识模式匹配方法通动态规划思想解决孤立词语音识中问题基次设计语音识构思孤立词作语音识语音信号
    次设计实际算法中动态时间规整算法(DTW)会根点容进行算法实现充分解语言学知识作语音识系统前提条件构造流程图清晰算法思路首步骤语音信号进行数字化预处理通端点检测减少噪音干扰特征参数进行筛选提取提高语音识准确性语音信号做训练识降低识错误率
    进通步骤实现电热水器语音识完善语音识系统

    42 语音识系统软件流程图
    收集语音信号需计算机声卡设收集部分语音信号储存计算机中

    图41 语音识流程图

    通户图形界面菜单功钮计算机设备收集部分音频信号完成音频信号频率幅度信息提取获修改音频信号波形图

    图42 信号调整分析图

    采集语音信号进行fourier变换画出变换前频谱图变换倒谱图

    图43 信号滤波分析图

    43 语音信号数字化预处理
    431 数字化
    语言学基认识解语音识致程语音信号数字化说作语音识开始语音信号数字化需进行步骤呢示
    第步取样
    定期采样连续信号通奈奎斯特采样定理采样信号中包含高频率两倍采样频率需倍数采样中完全恢复原始信号少采集2点
    理定理 数情况现实生活中混叠波形获信号更接原始信号第二部步量化量化程序控量化精度简单理解量化精度越高够二进制数字表示音频数量越查阅通常8位12位16位间量化精度越高声音保真度越高续识错误率越低八位二进制例果计算机接收八位二进制数等效256十进制数字256级数字进行数字进行模拟信号电256种实际采样真实信号电定256种电中出现种情况时接数字代码指示采样信号电
    第三步编码
    音频信号量化二进制音频信号说已编码声音采样频率量化位记录需存储容量会发生改变单位时间相关采样频率量化位数通道数压缩编码方案数字速率波形声音参数压缩前波形声音特率计算公式:波形声音特率采样频率*量化位数*通道数8通常波形声音具较高编码率必压缩转换数转换二进制数字01连续模拟信号转换成更利识二进制通常说数模转换器够转换功电路通常a dadc表示示意图图示

    图44 语音处理程

    432 预处理
    般预处理流程图示

    图45 预处理流程图

    分析处理音频信号前预处理处理流程预加重加帧加窗 发音导致相关影响收集音频信号设备甚设备漏缺等等会影响语音音频信号质量例产品音频混叠失真高频等影响预处理目消非影响获取信号均匀滑进语音处理够高更高质量参数语音处理质量提高降低识错误率
    1预加重
    受声门激励口鼻辐射影响语音信号s(n)均功率谱高频端800Hz低6dB 八度(八度)状况需加改善分析前语音信号高频部分预先处理查阅果数字滤波器状况够改善帮助实现预加重处理
    预加重网络输出输入语音信号s(n)间关系:
    式41
    中a预加重系数
    单词 interesting数例

    图46 预加重处理
    单词 interesting数预加重

    2分帧
    语音信号具着时间改变时变特性予较短时间范围特性基做保持变者相稳定状态相稳定状态视整分析程中短期分析技术程通俗理解语音信号具短期稳定性部分视频24帧秒分成24帧稳定画面进视频进行剪辑处理语音信号鉴视频做法分析处理语音信号前提——短时间语音信号进行分段进分析段特征参数分段称帧短时间短呢?般说帧时间控制1030ms通分帧方式利整语音信号分析特征参数时间序列帧特征参数组成
    3加窗
    述信号进行帧化接进行窗口化目强调样n附语音波形削弱余波形处理语音信号短片段实际短片段执行某种转换执行某操作 三种广泛窗口功矩形窗口汉明窗汉宁窗定义分

    图48 三种窗口功定义

    矩形窗汉明窗较
    矩形窗口瓣较窄具较高频率分辨率旁瓣较高相邻谐波干扰更严重矩形窗口相通汉明窗口获光谱滑



    图49 点矩形点汉名窗区
    44 端点检测
    语音信号处理中端点检测作动检测需识语音开始结束避免需语音带工作量效端点检测减少续处理时间效消关声音片段需识语音干扰
    里双阈值较方法进行端点检测检测更加准确减少系统处理时间减少系统处理工作量减少存储量时消噪声干扰语音信号处理性提高提高识正确率

    45 特征参数提取
    完成语音信号预处理关键步语音信号特征提取语音信号实包含着非常丰富特征参数特征量间表示容样物理声学方面表示着含义量特征参数进行少选选择特征参数说话识系统成功失败具重意义选择特征参数语音识率疑利提高特征提取做提取语音信号中需识减少语音信号中识关信息进行步原始波形进行语音识然识效果意法取识效果识错误率提高步缺频域变换已提取特征参数识特征参数进行识已提取特征参数进行筛选必须满足点够语音识:
    1语音基特征特征参数详细描述
    2减少参数组件间耦合占存储空间情况压缩数
    3计算特征参数程中实现更加方便实施例算法更加高效降低识错误率
    音调周期振峰参数作表征语音特征参数
    通述初步筛选已定程度减轻提取特征参数量需进行处理识阶段数工作语音信号中生成携带说话者信息特征参数表根语音特征领域途特征参数提取保证识准确性
    前常语音功参数线性预测倒谱系数(LPCC)梅尔倒谱系数(MFCC)两者间区倒谱域中音频信号操作前者(LPCC)反映信道响应语音模型作起点LPC技术找倒频谱系数者(MFCC)类听觉模型作起点利类听觉界带效应mel音阶频域中提取倒谱特征参数
    音调周期声带振动频率(基频率)振动周期语音信号特性早期语音识研究中效表示出外重研究点音调周期检测语音信号量集中区域发音质量素声道物理特性语音识中非常重功参数
    46 训练识
    训练识阶段已达整语音识流程续部分想进行识声音通前面预处理特征提取进行集合进行步识特征参数代表词语训练识单单词识识语音信号中提取出特征参数识系统进行输入然应字母序列语音识训练识采方法致三种般模板匹配法机模型法概率语法分析法网查阅资料三方法中采般模型匹配法
    针训练阶段致分析出次设计需词汇构成新词汇表词汇表中词准确发音情况次说次通获取词特征量作模板存入模版库中便续配
    接进入识阶段输入语音进行处理特征参数参数前存入模版库中模版进行较较模版库中相似度高参数进行输出识结果
    47 语音识系统实验验证
    现低噪音环境录制开关闭升温降温等孤立词命令作模版

    图410 实验验证流程图

    48 章结
    鉴次设计行性选动态时间规整算法建立孤立词汇(单词)语音识系统识程中采模板匹配法整词语作识单元需逐字逐字识续训练部分先建立模版需先准确说出需词汇特征参数作模版识阶段需新语音词汇进行识先处理提取特征参数DTW算法匹配模板库中模板进计算距离找短距离相似度高结果作终结果进行输入作出相关命令

    5 总结展
    51 总结
    着时代发展热水器智性显越越重目前语音识系统产品已广泛运设计热水器语音识系统运效果良效提高舒适度
    设计体实现方案设计中提功力局限性仅针孤立词实现较优良语音整识系统提高余
    52 展
    语音识技术目前世界热门技术极具发展潜力技术某种意义说语音识技术计算机言实现计算机真正智化家居言智化升级具极挑战广阔市场未希语音识系统广泛运家居产品中止智手机等方面居家生活中运考虑家居类生活必性者舒适性需求性出发储水式热水器做更升级更智化令客户更体验


    参考文献
    [1]彭荣家庭电热水器安全[J]农村电工201927(08)61
    [2]张简蔡泽旭基户体验电热水器设计[J]设计201932(22)117119
    [3] 冯志远张连海基分段动态时间规整语音样例快速检索解放军信息工程学信息系统工程学院2014
    [4] 蒋志浩基改进动态时间规整算法断路器障诊断研究山东科技学2017
    [5] 冀振元数字信号处理基础MATLAB实现哈尔滨:哈尔滨工业学出版社20168
    [6] 张舸张鹏远刘建颜永红等基动态时间规整语音关键词检索算法[J]网络新媒体技术201901
    [7] Eihab BMBashierPractical Numerical and Scientific Computing with MATLAB and PythonCRC Press2020
    [8] 张志霞语音识中特征参数提取研究中国知网2009:3638
    [9] 张雪英数字语音处理MATLAB仿真北京:电子工业出版社2016
    [10] 刘敬东智家电户需求发展方中国电信战略创新研究院20191015
    [11] 徐智基改进型DTW语音识系统研究中国知网:201951
    [12] 刘杰等智控制MATLAB实技术北京科学出版社20173
    [13] 潘锋智语音控制系统设计研究四川信息职业技术学院2019
    [14] Lerato LeratoThomas NieslerFeature trajectory dynamic time warping for clustering of speech segmentsEURASIP Journal on AudioSpeechand Music Processing2019
    [15] 张红英WiFi语音模块智热水器中应北京宇音天科技限公司20151215
    [16] 海宁李慧艳王双维MATLAB声音信号处理中技术难点分析吉林省长春市东北师范学物理学院2013
    [17] Sulaymon EshkabilovIntroduction to MATLABApress2019













    附 录
    附录1
    程序源代码 1

    function distDTW2(xyfs)
    [x fs]audioread('myspeech_kwav')
    [y fs]audioread('myspeech_k1wav') 计算序列帧数
    tmfcc2(xfs)
    rmfcc2(yfs)
    subplot(211)
    plot(x)
    subplot(212)
    plot(y)
    n size(t1)
    m size(r1)
    帧匹配距离矩阵
    d zeros(nm)
    for i 1n
    for j 1m
    d(ij) sum((t(i)r(j))^2)
    end
    end
    累积距离矩阵
    D ones(nm) *realmax
    D(11) d(11)
    动态规划
    for i 2n
    for j 1m
    D1 D(i1j)
    if j>1
    D2 D(i1j1)
    else
    D2 realmax
    end
    if j>2
    D3 D(i1j2)
    else
    D3 realmax
    end
    D(ij) d(ij) + min([D1D2D3])
    end
    end
    dist D(nm)


    程序源代码 2

    MFCC implement with Matlab
    function mmfcc2(xfs)
    [x fs]audioread('myspeech1wav')
    bankmelbankm(24256fs004't') Mel滤波器阶数24FFT变换长度256采样频率8000Hz
    化Mel滤波器组系数
    bankfull(bank) full() convert sparse matrix to full matrix 坐标表示稀疏矩阵转换全稀疏矩阵
    bankbankmax(bank())
    for k112
    n023
    dctcoef(k)cos((2*n+1)*k*pi(2*24))
    end

    w1+6*sin(pi*[112]12)化倒谱提升窗口
    wwmax(w)

    xxdouble(x) 预加重滤波器
    xxfilter([109375]1xx) filter[bax]a输入信号系数b输出信号系数x输入信号
    xxenframe(xx25680)语音信号分帧xx 256点分帧 256*1000800032ms

    framenumbersize(xx1)中rsize(A1)该语句返回矩阵A行数 csize(A2) 该语句返回时矩阵A列数
    for i1framenumber
    E(i)0
    E(i)sum(xx(i)^2) 计算短时量
    end
    amax(E)
    EEa化幅度
    j0
    for i1framenumber
    if E(i)>0008
    jj+1
    yy(j)xx(i)
    end
    end

    计算帧MFCC参数
    for i1size(yy1)
    yyy(i)
    sy'*hamming(256)
    tabs(fft(s))FFT快速傅里叶变换
    tt^2
    c1dctcoef*log(bank*t(1129))
    c2c1*w'
    m(i)c2
    end

    求阶差分系数
    dtmzeros(size(m))
    for i3size(m1)2
    dtm(i)2*m(i2)m(i1)+m(i+1)+2*m(i+2)
    end
    dtmdtm3
    求取二阶差分系数
    dtmmzeros(size(dtm))

    for i3size(dtm1)2
    dtmm(i)2*dtm(i2)dtm(i1)+dtm(i+1)+2*dtm(i+2)
    end
    dtmmdtmm3
    合mfcc参数阶差分mfcc参数
    ccc[m dtm dtmm]
    首尾两帧两帧阶差分参数0
    cccccc(3size(m1)2)
    subplot(211)
    ccc_1ccc(112)
    ccc_2ccc(1324)
    ccc_3ccc(2536)
    plot(ccc_1)title('MFCC')ylabel('幅值')
    [hw]size(ccc)
    Asize(ccc)
    subplot(212)
    plot([1w]A)
    xlabel('维数')ylabel('幅值')
    title('维数幅值关系')



    附录2 英文文献
    Voice Recognition using Dynamic Time Warping and MelFrequency Cepstral Coefficients Algorithms
    Abdelmajid H Mansour
    Gafar Zen Alabdeen Salh
    Khalid A Mohammed
    ABSTRACT
    Voice recognition is an important and active research area of the recent years This research aims to build a system for voice recognition using dynamic time wrapping algorithm by comparing the voice signal of the speaker with prestored voice signals in the database and extracting the main features of the speaker voice signal using Melfrequency cepstral coefficients which is one of the most important factors in achieving high recognition accuracy
    General TermsDynamic time wrapping DTW algorithm Melfrequency Cepstral Coefficients MFCC algorithm vocal signal
    KeywordsVoice Recognition Feature Extraction Feature matching voice signal

    1 INTRODUCTION
    Voice recognition is one of the terms of biometric technology It uses to provide any authentication to any system on the basis of acoustic features of voice instead of images The behavioral aspect of human voice is used for identification by converting a spoken phrase from analog to digital format and extracting unique vocal characteristics such as pitch frequency tone and cadence to establish a speaker model or voice sample In voice recognition enrollment and verification processes are involved Enrollment process describes the registration of speaker by training his voice features [1]
    Voice is also physiological trait because every person has different pitch but voice recognition is mainly based on the study of the way a person speaks commonly classified as behavioral Speaker verification focuses on the vocal characteristics that produce speech and not on the sound or the pronunciation of speech itself The vocal characteristics depend on the dimensions of the vocal tract mouth nasal cavities and the other speech processing mechanism of the human body [2]

    Voicebiometrics systems can be categorized as belonging in two industries speech processing and biometric security This dual parentage has strongly influenced how voicebiometrics tools operate in the real world Speech processing Like other speechprocessing tools voice biometrics extract information from the stream of speech to accomplish their work They can be configured to operate on many of the same acoustic parameters as their closest speechprocessing relative speech recognition [3]
    Voice recognition has two categories text dependent and text independent Text dependent voice recognition identifies the speaker against the phrase that was given to him at the time of enrollment Text independent voice recognition identifies the speaker irrespective of what he is saying This method is very often use in voice recognition as it require very little computations but need more cooperation of speakers In this case the text in verification phase is different than in training or enrolment phase [1]
    Speech and Voice Recognition are the emerging scope of security and authentication for the future Nowadays text and image passwords are prone to attacks In case of the most commonly used text passwords users are required to handle different passwords for emails internet banking etc Hence they tend to choose passwords such that they are easy to remember But they are vulnerable in case of hackers In case of image passwords they are vulnerable to shoulder surfing and other hacking techniques Advances in speech technology have created a large interest in the practical application of speech recognition Therefore this system provides the users with the appropriate and efficient method of authentication system based on voice recognition [4]
    2 DYNAMIC TIME WARPING DTW

    DTW is an algorithm that focuses on matching two sequences of feature vectors by repetitively shrinking or expanding the time axis till an exact match is obtained between the two sequences It is generally used to calculate the distance between the two time series that vary in time A real time application of DTW in the voice recognition is that it should be able to recognize the user’s voice even when spoken at different speeds In order to check the similarity between two voice signals or the time series are warped nonlinearly In other words we can say DTW is an optimal algorithm that looks for the similarity between two signals ie similar patterns When the time series are wrapped the time series or the signals are either stretched to match with the template available in the database when the speaker speaks fast or shrunk when the user speaks slowly since even with a small shift of the signal points leads to incorrect identification [4]
    3 MEL FREQUENCY CEPSTRAL COEFFICIENTS MFCC

    MFCC is used to extract the unique features of human voice It represents the short term power spectrum of human voice It is used to calculate the coefficients that represent the frequency Cepstral these coefficients are based on the linear cosine transform of the log power spectrum on the nonlinear Mel scale of frequency In Mel scale the frequency bands are equally spaced that approximates the human voice more accurate [1] Equation (1) is used to convert the normal frequency to the Mel scale the formula is used as
    m 2595 log10(1 + f 700)(1)
    Mel scale and normal frequency scale is referenced by defining the pitch of 1000 Mel to a 1000 Hz tones 40 db above the listener’s threshold Mel frequency are equally spaced on the Mel scale and are applied to linear space filters below 1000 Hz to linearized the Mel scale values and logarithmically spaced filter above 1000 Hz to find the log power of Mel scaled signal Mel frequency wrapping is the better representation of voice Voice features are represented in MFCC by dividing the voice signal into frames and windowing them then taking the Fourier transform of a windowing signal Mel scale frequencies are obtained by applying the Mel filter or triangular band pass filter to the transformed signal [1]
    4 RELATED WORKS

    Voice Recognition is an emerging scope of security and authentication for the future there are numerous studies and researches on this area The concept of observing voice sample with MFCC for extracting acoustic features and then used to trained HMM parameters through forward backward algorithm which lies under HMM and finally the computed log likelihood from training is stored to database It will recognize the speaker by comparing the log value from the database against the PIN code were proposed by Shumaila Iqbal Tahira Mahboob and Malik Sikandar Hayat Khiyal [1] Presenting the viability of MFCC to extract features and DTW to compare the test patterns were proposed by Lindasalwa Muda Mumtaj Begam and I Elamvazuthi [5] Sahil Verma Tarun Gulati Rohit Lamba were proposed the focuses on recognising voice corresponding to English alphabets using Melfrequency cepstral coefficients (MFCCs) and Dynamic Time Warping (DTW) introduced by Sakoe Chiba [6] Nidhi Desai ProfKinnal Dhameliya Prof Vijayendra Desai were proposed an approach to recognize English words corresponding to control Robot in an isolated way by different male and female speakers The aim is to focuses on recognizing voice using Melfrequency cepstral coefficients (MFCCs) and Dynamic Time Warping (DTW) [7] Md Akkas Ali Manwar Hossain and Mohammad Nuruzzaman were presented some technique for recognizing spoken words in Bangla In this work we use MFCC LPC GMM and DTW
    MarutiLimkar RamaRao & VidyaSagvekar were proposed an approach to recognize spoken English words corresponding to digits zero to nine in an isolated way by different male and female speakers [9] The secure system that deploys the voice recognition for a natural language (Tamil) by combining the digital and mathematical knowledge using MFCC and DTW to extract and match the features to improve the accuracy for better performance were proposed by Dr Kavitha R Nachammai N Ranjani R Shifali J [11] Ms Savitha and S Upadhya were presented the two template matching techniques namely the Single and Average template matching techniques that were developed to recognize the English digits spoken in isolation The algorithm was implemented both for speaker dependent and speaker independent type of isolated digit recognition and a comparison of recognition accuracies for the two template matching techniques was made [12] An overview of major technological perspective and appreciation of the fundamental progress of speech recognition and gives overview technique developed in each stage of speech recognition and also summarize and compare different speech recognition systems and identify research topics and applications which are at the forefront of this exciting and challenging field were presented by Om Prakash Prabhakar Navneet Kumar Sahu [13]
    5 PROPOSED SCHEME
    [8]
    This paper build a system for voice recognition using dynamic time wrapping algorithm and comparing the entered voice signal of the speaker with prestored voice signals in the database for the purpose of verifying By using good statistical method for the process of comparing Then extracting the main features of the speaker voice signal by using MelFrequency Cepstral Coefficients which is one of the most important factors in achieving high recognition accuracy In order to solve the problem of extracting the components and features of the voice signals that entered into the computers and performing the comparison to getting the best results for maintaining the confidentiality security and integrity of the information The extraction of the feature done by creating source for each digital voice from a set of vocabulary that forming the sound database Which it is a voice signal for the voice called source signal Where each signal is divided into blocks of equal length samples from beginning to end Then each template converted to vector attributes that extract the signal features in that template These include vector in groups are called Features Vectors This processing repeated for each digital voice in the vocabulary set The Features matching is called recognition process in this process the coming signal that to be recognized is transformed into a series of features vectors by using the conversion (begin – end) for processing of features extraction These feature will be compared with all possible probability exist on the database by using pattern matching method To give the recognition decision from matching quality by using Euclidean Distance between two series of features vectors which one representing feature vectors of the source signal and the other feature vectors of the test signal The proposed system moves through two phases
    51 Training Phase
    At this stage the system will trained by creating training groups consists of different sounds samples from whic h the system can create its own sound database by selecting samples with more accuracy and purity as shown in the Fig 1

    Fig 1 Training Phase
    For the purpose of training was taken 5 voice samples from every person to be compared with all samples of the trainee person Then taking the sample that have highest match with more purity and store it on the system voice database They selected models for 3 person from the training groups The results of training process as shown in the following Tables
    Table 1 Training of word Khaled Ahmed

    Table 1 above the model number 4 achieved the highest rate of matching with 96 So have been selected within the system database to represent the word Khaled Ahmed
    Table 2 Training of the word Abdel Rahim

    Table 2 above the model number 1 achieved the highest rate of matching with 962 So have been selected within the system database to represent the word Abdel Rahim
    Table 3 Training of word Esraa

    Table 3 above the model number 5 achieved the highest rate of matching with 972 So have been selected within the system database to represent the word Esraa

    52 Testing Phase
    At this stage the system will tested for recognizing the voice of the speaker after the matching process with samples taken from training stage The system can take a decision whether the voice exist on theDatabase or not As shown in the Fig 2

    Fig 2 Testing Phase
    For the purpose of testing recognition in the proposed scheme they have been recorded 5 words sound for 20 different person and stored in 16 bit format with rate 11025 Hz and extension wav
    The model of recording the word Khaled Ahmed 5 times and selecting the best one to store it on the system voice database This process repeated to all required samples to be stored as shown in the following Figures



    Fig 3 1st Sample Model for Word Khaled Ahmed

    Fig 4 2nd Sample Model for Word Khaled Ahmed

    Fig 5 3rd Sample Model for Word Khaled Ahmed

    Fig 6 4th Sample Model for Word Khaled Ahmed

    Fig 7 5th Sample Model for Word Khaled Ahmed型

    Fig 8 Processing Feature Extraction of word Khaled

    Ahmed using MFCC
    The model of recorded voice for the word Khaled Ahmed after the process of performing feature extraction by using DTW technology as shown in the Fig 9

    Fig 9 After Processing Feature Extraction of word
    Khaled Ahmed using DTW
    6 VERFICATION USING DTW
    This method uses distance measure to find the nonlinear matching between test signal and all source signal Then selecting the source has less distance and the voice that represented by that source refers to the result of recognition The system has been tested 3 times on 20 samples which represent the system database and the verification result is in range from 0 to 1
    7 CONCLUSION
    The performance of recognition systems can be determined by voice sources including the speaker voice specification the rate of voice issuance delivery source and recording media The accuracy of recognition come from the behavior of speaker in issuing the voice From the tests and training above we found that the DTW is flexible mathematical method they gives high accuracy results The performance can be improved by selecting the sources carefully which have significant role in influencing the accuracy of recognition
    The signal analysis by using MFCC provide spectrum factors which represents the exact vocal system for stored words MFCC provide a high level of perception of the human voice where they work to remove all unimportant information then give a better representation of the signal which leads to a higher resolution in the performance of recognition
    The conclusion of this paper is the spectrum factors that have highspecification show their importance depending on the speaker himself and the method of producing the voice and vocal pronunciation style which can be used in many applications such as security systems where the voices of the people are different as fingerprints differ







    附录3 英文文献翻译

    动态时间规整Mel频率倒谱系数算法语音识

    阿卜杜勒·马吉德·曼苏尔
    Gafar Zen Alabdeen Salh
    哈立德·穆罕默德


    语音识年重活跃研究领域 研究旨通说话语音信号数库中预先存储语音信号进行较梅尔频率倒谱系数提取说话语音信号特征构建种动态时间包装算法语音识系统 实现高识精度重素
    般条款:动态时间环绕 DTW算法梅尔频率倒谱系数 MFCC算法声音信号
    关键词:语音识特征提取特征匹配语音信号

    1引言
    语音识生物识技术术语根语音图声学特征系统提供身份验证通口语短语模拟格式转换数字格式提取独特语音特征(例音高频率音调节奏)建立说话者模型语音样类语音行方面识语音识中涉注册验证程注册程通训练语音特征描述说话者注册[1]
    语音生理特征音调语音识基说话方式研究通常类行说话者验证重点产生语音语音特征语音身声音发音声音特征取决声道嘴巴鼻腔尺寸体语音处理机制[2]
    语音生物识系统两行业:语音处理生物识安全种双重父母关系极影响语音生物统计学工具现实世界中运作方式语音处理语音处理工具样语音生物识语音流中提取信息完成工作配置接语音处理相语音识[3]相许声学参数运行
    语音识具文赖文独立两类赖文语音识根说话者说话时短语识说话者注册文关语音识识说话者说什该方法需少计算需说话者更协作通常语音识种情况验证阶段文培训注册阶段文[1]
    语音语音识未安全性身份验证新兴范围文图密码容易受攻击常文密码求户处理电子邮件互联网银行等密码倾选择易记忆密码容易受黑客攻击果图片密码容易受肩膀浪黑客技术攻击语音技术进步引起语音识实际应极兴趣该系统户提供基语音识适效身份验证方法[4]

    2动态时间规整 DTW
    DTW种算法通重复缩扩展时间轴直两序列间获完全匹配专注匹配两特征量序列通常计算时间变化两时间序列间距离 DTW语音识中实时应速度说话应该够识户语音检查两语音信号间相似性时间序列进行非线性扭曲换句话说说DTW种寻找两信号间相似性(相似模式)佳算法时间序列包时间序列信号伸展数库中模板相匹配(说话者说话快速时)收缩(户说话缓慢时)信号偏移点导致识错误 [4]

    3 MEL倒谱系数 MFCC
    MFCC提取类语音独特功代表声短期功率谱计算代表频率倒频谱系数系数基数功率谱非线性梅尔频率刻度线性余弦变换梅尔音阶中频带等距分布更准确逼类声音[1]公式(1)正常频率转换梅尔标度公式作
    m 2595 log10(1 + f 700)(1)
    通1000 Mel音高定义1000 Hz音调(听众阈值高40 db)引Mel音阶正常频率音阶梅尔频率梅尔标度等距分布应1000 Hz线性空间滤波器线性化梅尔标度值1000 Hz数间隔滤波器找梅尔标度信号数功率梅尔频率环绕声音更表示语音特征MFCC中表示方法语音信号分帧加窗然窗信号进行傅立叶变换通梅尔滤波器三角带通滤波器应转换信号[1]梅尔标度频率
    4相关工作
    语音识未安全性身份验证新兴领域领域进行量研究MFCC观察语音样提取声学特征然通HMM前算法训练HMM参数计算出训练数似然性存储数库中 Shumaila IqbalTahira MahboobMalik Sikandar Hayat Khiyal提出[1]通较数库中日志值PIN码识发言 Lindasalwa MudaMumtaj BegamI Elamvazuthi提出提出MFCC提取特征力DTW较测试模式行性[5] Sahil VermaTarun GulatiRohit Lamba提出重点利Sakoe Chiba提出Mel频率倒谱系数(MFCC)动态时间规整(DTW)识英语字母相应语音[6] Nidhi DesaiKinnal Dhameliya教授Vijayendra Desai教授提出种方法男性女性说话者孤立方式识控制机器相应英语单词目专注Melfrequency倒谱系数(MFCC)动态时间规整(DTW)识语音[7]阿卡斯·阿里(Akkas Ali)曼华·侯赛(Manwar Hossain)穆罕默德·努鲁扎曼(Mohammad Nuruzzaman)介绍识孟加拉语口语技术项工作中MFCCLPCGMMDTW
    [8] MarutiLimkarRamaRaoVidyaSagvekar提出种方法男性女性讲话者孤立方式识数字09应英语口语[9] Kavitha博士提出种安全系统该系统通MFCCDTW结合数字数学知识提取匹配功提高准确性实现更性通结合数字数学知识然语言(泰米尔语)部署语音识 R纳卡玛NRanjani RShifali J [11] Savitha女士S Upadhya女士介绍两种模板匹配技术单模板均模板匹配技术技术识孤立英语数字该算法适说话赖性类型适说话关类型孤立数字识较两种模板匹配技术识精度[12]概述技术观点赞赏语音识基进展概述语音识阶段开发技术总结较语音识系统确定令振奋研究应前挑战领域Navneet Kumar SahuOm Prakash Prabhakar提出[13]

    5建议方案
    文建立种利动态时间包裹算法进行语音识系统说话输入语音信号数库中预先存储语音信号进行较进行验证通良统计方法进行较程然Mel频率倒谱系数提取说话语音信号特征获高识精度重素解决提取进入计算机语音信号成分特征进行较获保持信息机密性安全性完整性佳结果问题通形成声音数库组词汇中数字语音创建源完成功提取中语音信号语音信号称源信号中信号头尾分等长样块然模板转换矢量属性提取该模板中信号特征包括矢量组称特征矢量词汇集中数字语音重复处理特征匹配称识程程中识信号通转换(头尾)转换系列特征量处理特征提取通模式匹配方法特征数库中存概率进行较通两特征量间欧式距离匹配质量中做出识决定中特征量表示源信号特征量代表测试信号特征量拟议系统分两阶段:
    51培训阶段
    阶段系统通创建声音样组成训练组进行训练系统通选择更准确更纯净样中创建声音数库图1示

    图1:培训阶段

    培训目里获取5语音样受训员样进行较 然更高纯度获取匹配度高样存储系统语音数库中 培训组中选择3模型 培训程结果表示
    表1 Khaled Ahmed词培训

    型号4表1达高匹配率96% 已系统数库中选择代表 Khaled Ahmed单词

    表2 AbdelRahim词培训

    型号1表2达高匹配率962% 已系统数库中选择代表 Abdel Rahim单词
    表3 Esraa词培训


    型号5表3达高匹配率972% 已系统数库中选择代表 Esraa单词
    52测试阶段
    阶段系统测试训练阶段获取样匹配程否识说话者语音 系统决定语音否存数库中 图2示

    图2:测试阶段
    提出方案中测试识目已20录制5单词声音16位格式存储频率11025 Hz扩展名 wav
    该模型记录单词 Khaled Ahmed 5次然选择佳单词存储系统语音数库中 重复程存储必需样图示


    图3:单词 Khaled Ahmed第示例模型

    图4:单词 Khaled Ahmed第二示例模型

    图5:单词 Khaled Ahmed第三示例模型

    图6:单词 Khaled Ahmed第四示例模型

    图7:单词 Khaled Ahmed第五示例模型

    图8: Khaled词处理特征提取
    AhmedMFCC
    DTW Khaled AhmedDTW技术执行特征提取程单词 Khaled Ahmed录制语音模型图9示


    图9:词特征提取处理

    6DTW进行验证
    该方法距离测量找测试信号源信号间非线性匹配 然选择源距离更短该源代表声音识结果 已代表系统数库20样进行3次测试验证结果范围01

    7结
    识系统性语音源确定语音源包括扬声器语音规范语音发出速率传送源记录媒体识准确性说话者发出声音行通面测试培训发现DTW灵活数学方法出高精度结果通仔细选择源提高性源影响识准确性方面具重作
    通MFCC进行信号分析提供频谱子该频谱子表示存储单词准确声系统 MFCC提供高水类语音感知力消重信息然信号进行更表示识性获更高分辨率
    文结具高规格性频谱素显示出重性取决说话者产生声音声发音风格方法许场合中

    文档香网(httpswwwxiangdangnet)户传

    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 120 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    基于PID控制算法的热水器智能控制

    基于PID控制算法的热水器智能控制系统设计——温控系统设计基于PID控制算法的热水器智能控制系统设计——温控系统设计摘 要当今社会我们所使用的热水器有分为即热式与储水式,在其控制方面上也分了...

    2年前   
    692    0

    基于PID的温度控制系统设计论文

     (20XX届) 毕业设计 题  目:   基于PID的温度控制系统设计  学  院:             专  业:     电气工程及其自动...

    5年前   
    1964    0

    基于plc的智能交通灯控制系统设计毕业论文

    PLC可编程序控制器是以微处理器为基础,综合了计算机技术、自动控制技术和通讯技术发展而来的一种新型工业控制装置。它具有结构简单、编程方便、可靠性高等优点,已广泛用于工业过程和位置的自动控制中。

    4年前   
    3084    0

    基于物联网的智能家居控制系统设计与实现

    物联网是在信息社会发达的今所衍生的产品,他是基于互联网的模块上,利用射频识别技术、无线网等技术,打造一个联系世界不同物体,不同模块的“Internet of Things”。在这个模块网络中,...

    5年前   
    6114    0

    基于Zigbee的智能灯光控制系统设计

    在现代社会,自动化与智能程度得到很大提高的今天,家居智能管理很有可能是人们今后的主流选择。本文在研究的过程中,立足家庭照明展开了分析。在具体的论述上,通通过实现传统和智能照明模式比对,通过分析目...

    3年前   
    973    0

    基于单片机的红绿灯智能控制系统设计

    随着社会经济的快速发展以及人们生活水平的提高 ,机动车数量也在急剧增加 ,交通问题逐渐成为人们关注的重点对象,因城市发展所带来的交通拥堵等问题,利用智能交通来解决传统交通日渐出现的问题成为大势所趋。

    2年前   
    840    0

    基于语音识别技术的智能家居控制系统的设计

    21世纪经济快速发展,人们对物质文化的需求也越来越高。在信息科技的支持下,事物在朝着简单化、便捷化、智能化的方向发展。在此背景下应运而生而生的智能家居,正是信息时代的典型产物。

    3年前   
    1189    0

    基于语音控制的智能油烟机控制系统设计

    为了提高人们的生活质量,解决传统油烟机在使用过程中需要手动接触设置的问题,将会设计一款功能多样化的智能油烟机控制系统,使用语音指令实现对油烟机工作状态的选择,具备了通过语音控制选择风力大小,照明...

    3年前   
    806    0

    智能电风扇控制系统的设计

    智能电风扇控制系统的设计摘要:本文设计了一款智能电风扇控制系统,使用STC89C51作为主控制芯片,通过DS18B20检测环境温度并将温度信号发送给单片机。电机是否启动,以及电机的转速由系统设...

    1年前   
    738    0

    基于PLC的温室控制系统的设计

    基于PLC的温室控制系统的设计摘 要随着人们生活水平的提高,由温室大棚种植的反季节蔬菜成为人们越来越离不开的食物,所以温室大棚技术越来越重要,而温度控制是最为重要的一环。考虑到PLC具有灵活...

    3年前   
    805    0

    基于单片机的智能窗帘控制系统设计毕业论文

    基于单片机的智能窗帘控制系统设计 摘 要 在现代的社会中,人们对生活环境很重视,智能家居对人们的生活产生了极其重要的影响。本文将研究一种基于单片机的智能窗帘控制系统。在此设计系统中,以STC8...

    5年前   
    4306    0

    基于stm32智能家庭出入控制系统的设计与实现

     基于stm32智能家庭出入控制系统的设计与实现 ...

    2年前   
    576    0

    基于AT89C52智能吸尘器控制系统设计毕业论文

    摘要 本设计的智能吸尘器控制系统与智能小车的控制系统相似。是以AT89C52单片机为控制核心,加以步进电机、光电传感器、超声波传感器、压敏传感器和电源电路以及其他电路构成。

    4年前   
    1262    0

    基于51单片机的红外线遥控智能台灯设计-智能台灯的控制系统电路设计

    随着社会的发展,智能产品也随着变化,电子产品快速发展,我们家用电器智能化越来越多,常见的智能家居如电饭煲,电磁炉,台灯等主要系统都具有一个共同的特点,那就是利用单片机控制系统作为本次的核心系统,...

    3年前   
    949    0

    基于ZigBee的智能窗帘控制系统

    由于我国经济水平不断突飞猛进,人们的物质生活也得到了极大的提升,并且在科技告高速发达的今天,人们也越来越依赖于科技,并且将这种科技的便捷植入到家庭窗帘

    3年前   
    1523    0

    基于51单片机的智能窗帘控制系统

     毕业论文(设计) 学 院: 工学院 ...

    3年前   
    1096    0

    基于STM32的智能温室大棚控制系统

     基于STM32的智能温室大棚控制系统Intelligent greenhouse control system based on STM32 ...

    10个月前   
    811    0

    基于51单片机的教室智能照明控制系统

    目 录绪论1 教室灯光自动控制整体描述 1.1 灯光控制总体思想 ................................................................

    3年前   
    838    0

    多功能智能轮椅设计-运动控制系统的设计与实现

     多功能智能轮椅设计—运动控制系统的设计与实现多功能智能轮椅设计-运动控制系统的设计与实现摘 要在现如今智能化高速发展的时代,智能、科技已然成为时代的主题之一,智能产品也被越来越多运用到各行...

    3年前   
    575    0

    基于Multisim的声光控路灯控制系统设计与仿真课程设计

    信息工程学院课程设计报告书题目: 基于Multisim的声光控路灯控制系统设计与仿真 课 程:电子线路课程设计 专 业:电气工程及其自动化班 级: ...

    1年前   
    344    0

    文档贡献者

    平***苏

    贡献于2021-11-22

    下载需要 120 香币 [香币充值 ]
    亲,您也可以通过 分享原创文档 来获得香币奖励!
    下载文档

    该用户的其他文档