欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    感知音频质量的客观测量方法.docx

    • 资源ID:1584486       资源大小:128.08KB        全文页数:29页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    感知音频质量的客观测量方法.docx

    GY中华人民共和国广播电视和网络视听行业标准GY/T3492021感知音频质量的客观测量方法Me1.h(x1.forobjectivemeasurementOfperceivcdaudioqua1.ity(ITU-RBS.1387-1,MOD)2021-03-29发布2021-03-29实施国家广播电视总局前才引吉III1范用12规范性引用文件13术语、定义和缩略语13.1 术语和定义13.2 缩略语24概述35应用36版本17主观领域48分辨率和精准度9要求及限制10模型的描述10.1 顺10.2 耳朵周边模型710.3 激励模式的预处理2410.4 模型输出变染(M0丫)的计算2710.5 平均法3410.6 感知基本音频防盘的估竟3510.7 实现方案的一致性38冏录A资料性)本文件与ITC-RBS.1387-1相比的结构变化情况41冏录B(规范性学知音频麻瑾的客观测量方法的原则和特点42附录C规范性)应用47附录D规范性)输出变最51冏录E(规范性)模型补充说明53参考文献55本文件按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的现定起草.本文件使用里新起草法修改采用ITU-RBS.13871£感知音频质量的客观测量方法.本文件与ITVRBS.13871相比,在结构上有较多的调整.附录A中列出了本文件与ITVRBS.1387-1章条编号变化对照一览表。本文件与ITU-RBS.1387-1的技术性差界及其原因如下: 为符合GB/T1.1-2020的要求,增加了第1章“范阳”、第2章“规范性引用文件”、第3率“术语、定义和缩略谱”.本文件对以下内容进行了编辑性修改, 删除了附件1“概述”中过去招美研究情况的叙述内容; 删除了附件1主观领域中的对主观评价的叙述内容;删除了附件2第7章中的关于测试条日从数据库3中选择的描述性内容:一一删除了附件I的附录3中关于PAQY的部分论述性语句: 捌除了附件1的附录1中的侬权部分的描述;一一删除了附件1的附录4中的介绍与历史部分的描述; 捌除/附件2的附录1验证过程:删除了附件2的附录2参考数据库描述.请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的说任.本文件由全国广播电影电视标准化技术委员会(SAC/TC239)归口。本文件起草单位:国家广播电视总局广播电视规划院。本文件主要起草人:草毅力、邓向冬、书安明、JTi文辉.好涛、汪芮.王佰男.I1.考虑到:a)对采用低比特事编码算法,以及采用模拟或数字估号处埋的系统,传统的客观测成方法(如侑噪比和失真的测量)不适用于感知音频质量的测V:b)低比特率端码算法已得到迅速应用:c)并非所有符合某种规范或标准的系统/设备都可以保证达到规范或标准所规定的最高质fit:d)通常的主观评价方法不适用于音版质盘的连续监测,例如在系统运行的情况下:e)在整个测破领域中,第知音频顷n的客观测收方法将补充或替代传统的客观测依方法:f)感知音频殖求的客观测审方法可以有效地对主观评价方法进行补充:g)对一些应用,需要可实时测量的方法。建议对于本文件所列的应用,使用本文件规定的方法进行礴知音版质量的客观测fit感知音频质量的客观测量方法1黄国本文件规定了由知音领筋盘的客观测fit方法.本文件适用于在电视节目或广播节目的收录、分衽、传送和监测等环节,也适用于编解码器等音姣处理设符的研究、开发、测试和维护。2规葩性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款,其中,注II期的引用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件,GY/T298-2016音城系统小损伤主观评价方法(ITURBS.11163.MOD)ITU-RBS.1284-1:2003声音质置主观评价通用方法(Genern1.methodsforthesubjectiveassessmentofsoundqua1.ity)3术语、定义和缩略语3.1术语和定义下列术语和定义适用于本文件.3.1. 1绝对误差值abso1.uteerrorscore;AES反映SDG双信区间大小与SDG和ODG之差的关联平均他,其计算公式见公式(1).AES=2j三1.(1)式中:CI置信区间大小,若CI<0.25,则C1.=O.25:N-被评价音频素材的数1鼠3.1.2基本音频质量basicaudioquaIity一个通用主观M性,该屈性包含了任意及所有可检测到的参考信号及其处埋版本之间的差异.3.1.3编旧余量Codingmargin一个贷Ift参数,表示编码损伤从不可感知到可感知的阈值余度。3.1.4模型输出变量mode1.outputvariab1.es;MOV那知测玳方法的中间输出值.这些变此以她本心理声学研究为她础,用于进步描述编码损伤特性,3.1.5主观差异等级subjectivedifferencegrade;SDG根据WT2982016开展的甘城主观评价.采用5级损伤标度对Isit参考和被测信号的基本音频质疑诳行打分得到相应的评分等级,由被测信号评分等级减去的藏参考伯号评分等级所得的差值,见公式.,SDG=-(2)式中:G”被测信号评分等级:Gk-陷献参考信号评分等级。3.1.6客观差异等级objectivedifferencegrade;OOG感知测Jft方法的主要输出参数,相应于主观空异等级,为通用基本行版质限的冽Ift参数,,3.1.7周饯测量off-1inemeasurement一种测*程序,其测法过程不会影响正在进行节目传输的系统。3.1.8在线测Sio-1.iemeasurement一种测质程序,测试过程需依赖于正在进行传输的系统或是节目传输的一部分。32缩略语下列缩略语适用于本文件ADB平均失五块(AverageDistortedB1.ock)ASD听觉频谱差异(AudiIoIVSpectra1.Difference)BAQ基本音频版fit(BasicAudioQua1.ity)CI况信区间(ConfidenceInterva1.)DCI1.流(DirectCurrent)DFT离散傅里叶变换(DiSCrC1.eFourierTransform)DIX干扰指数(DisturbanceIndex)E1.iS谐波失真结构(ErrorHainonicStructure)ERB等效矩形带宽(Equiva1.entRectangu1.arBandwidth)FFT快速傅胆叶变换(Fas1.FourierTransform)F1.R有限MC冲响应(FiniteImpu1.seResponse)IIR无限脉冲响应(InfiniteIepu1.scResponse)ITU国际电信联盟(Internationa1.Te1.ecoamunicationUnion)ISO国际标准化力1.织(Internationa1.StandardsOrganization)JM.D临界可察觉电平差(JustNoticeab1.e1.eve1.Difference)MFPD最大过沌检测概率(MaximumFi1tcredProbabi1.ityofDetection)N1.喙音响痰(Noise1.oudness)NMR噪声枪蔽比(NOiSe-TO-MaSkRatio)PAQM感知音频J员JN测Jit(Perceptua1.AudioQua1.ityMeasure)PERCEVA1.感知评价(PerCePIUa1.Eva1.uation)1)理Iy情况卜,SW散值范围为07如果参考信号没有被IEe8识别则数俏为止Bu2)UDG数值范闱为。T.POM感知客观测Ift(Perceptua1.ObjectiveMeasure)Ref参考信号(ReferenceSigna1.)ROEXROEX函数(RoundedExponentia1.)ROV输出值比率(RateofOutputVa1.ues)SQ1.主观编码余Ift(SubjectiveCodingMargin)SP1.声压级<SoundPressure1.eve1.)Win窗口平均值(WindOWedAverage)4概述在数字广播电视系统中,音物烧收是一个非常关世的因素.判定音猱顺发的主要方法包括音就质状主观评价和客观测Iih由于音频主观评价既钳时又昂贵,而传统音频客观指标如信噪比或总谐波失其与感知音频质M没有可序的关联性,因此需提出一种客观测此方法用于音领质册测;匕本文件所规定的感知音频侦量客观测地方法是在对己有测方法如干扰指数DIX,啾声掩蔽比(WR)、感知音领麻明候(RVM)、感知怦价(PEREA1.)、呼知客观测量(TOM)以及工具箱法(Too1.boxApproach)进行研究的基础上形成的,输出可钻有用的信息,用于多种应用场景.通过时上述六种方法的性能进行研究,提取其中最有用的工具,并将这"工具融合形成一个新的测量方法,即本标准规定的测法方法,本文件规定的测收方法已经在许多测试场所羟过了仔细验证,且己证明能泌为许多应用生成既可痛又有用的信息,不过本文件中的客观测量方法无法取代正式听音测试。附录B规定了客观感知音领历信的测发方法的原则和特点.5应用懑知音频质奴客观测后的基本示意图见图1.图1客观测量的基本示意图本文件规定的测盘方法适用于大部分模拟或数字音姣信号处理设备,可著重用于音频嫔解码方面的应用,该测刷方法适用于实时在级测箍的应用场景,也适用于非实时离我测量的应用场竞。在实时在线测量时,被测设备适宜的最大延时宜小于等于200ms,最大不应大于Is.本文件规定的测敏方法可用于以下人类应用场景,应与表1相符合.表1应用范围字号应用名称简介版本1系统,假品的评价对白领处理设备(乡数情况指像解码潺的不同实现方案如行田价携咄/高级2感知质量的排序就对某个设位或戏路在投入运行的的快递刊R过程格础表1(续)序号应用名称的介版本3在我监测对工作中的齐柏传输进行连续也测MSH-1设苗或连接状态对某个诊备喊某个戏路进行详细分析福级5SWWffiiJ1.WI识别特定编解的卷的类型或实现方案Mfi6Si解闪潺开发对我超闪器性能将性进行尽可住地分析丛础ftts7网络规划对恃定招件下的传输M络在性傥他或木方Im进行优化恭础,洵极8主观评价辅助作为筛选听音测试中关健素材的工H基叱债级八类应用场景详细的说明见附录C.6版本考虑到不同的经济成本和性旎要求.本文件规定的客观测St方法提供了两个版本.基础板本适用于低成本实时实现方案,高级版本侧重于报高的准确度.出于高端版本增加了额外准确度,它的更杂度比基础版本增加了约四倍.过种应用所适用的版本应符合网录C的要求.7主观领域主观评价与齐观测年之间需要相互补充,示意图见图2。通常的音频主观评价,例如求于GY/T298一2016的评价,是羟过精心设计的.用以得出尽可能准确表征音频质量的可就评价结果.不过主观评价的结果也不一定能完全反映出真实的感觉.客观测*方法可通过音颇质量主观评价进行验证.图2嗡证示意图本文件中的测量方法主要关注那些在主观领域中可采用GYZT298-2016进行评价的应用.GY/T298一2016中测砧方法的基本原则可以简要描述为:所夸者在A、B、C三个音源中切换并评价,其中音源A为已知的参考信号,音源B和C为隐藏的参考信号和被测信号的随机排列.按照连续5级损伤等级,听音者通过对比B与A,C与R,对B和C的损伤进行评价.B和C中的其中一个为胞魔源,难以将其马A区分开,出一个则可能会反映出一些损伤,参考源和另一个音源之间的任何感知上的差异均应视为损伤,通常来说,只考虑“基本音频质量”这一M性.它是一个总体属性,涵盅了参考信号与被测信号之间可感知到的所有差异.损伤等级标度采用ITCRBS12841:2003中给定的连续且带第点的R5级损伤等级标度,应与图3相符合,损伤不可觉察报仿可察觉,但不令人不悦损伤和令人不悦报伤令人不悦报仿令人常不悦图3ITU五级根饬标度主观评价结果的分析通常以主观差异等级SDG)为基础。SDG值的理想范用应是01.。表示损伤不可察觉,-4表示榻伤令人非常不悦.8分辨率和精准度客观差异等级(ODG)是客观测瞰方法的獭出变殿,相当于主观额城中的SDG.OoG的精度精确到小数点后一位.当任意两个0«;之差超过10出,)则我明差异显著,在测试过程需要注意,避免出现这类精况.赛了缺少独立的参数时齐观测盘方法的准确度进行完整描述,因此在蕤证过程中尚要考察多个参数。性能参数一是SDG与OnG之间的美岷性.客观测录方法的性能可Ife1.a1.者引入损伤的类型和程度等参数变化而变化。性能卷数:是异行他的数;也异常值是指测最出来不符合预定容差的值。根据用户要求,评分等级衣靠上部分即高旗量音频,测依方法的准确性应最高,评分等级表中下部分即中等及较差质做音频,测M的掂确度可以稍降低,美联性可较好地评价客观测中方法的准确性,但还衢考察异常值;从升常俏的用度来若,即便测破方法具有相当的关联性,测成方法仍然有可能陷藏无法接受的特性.性能参数.三是绝对误差伯,它反映了SDG置信区间的大小与SDG和0IK;之基的关联平均值.9要求及限制整个测量期间,应将被测设符的信号和参考信号的时间准确度校正到24个采样值内。本文件中不涉及同步机制,不同测量方法的实现方案可有不同的同步机制.10模型的描述101概述10.1.1客观测量方法概述本文件规定的感知音频质量的客观泅眼方法包括一个耳朵周边模型、多个中间处理环节(即澈励模式的预处理)、旗于心理海学的MOV计鸵方法和将W)V集合映射到代去被测信号葩本质"的映射锻法,应与图4相符合.耳朵周边模型有两种模型,种以FFT为基础(简称FFT耳朵模型,一种以浓波潜组为基础(简称滤波器组耳朵模型)。除了计算说号信号时有所不同(仪使用FFT耳朵模鞭部分),其他情况下,两种耳朵周边模型的总体结构一样,给人信号(警考信号和械图怡号)激h模式.特定第吱佻式,谓制模式激E模式,特定峋度KJ式,WK!.说计0校FSft出IfiMM<II½M>失在后数客并等场图4测试方案的常用模坎结构图用干计算模型输出变量值(MOT)的静入包括:一一用于测试和参考伯号的激励模式:用于测试和参考伯号的频沿自适应的激励模式:一一用于测试和参考信号的指定响度模式;一一用于测试和参考信号的调制模式。误差信号,即测试信号和参考信号间差异的侦谱(仅适用于F1.W朵模型.如果没有其他说明,立体内信号左右声道的所有计算都独立执行,左右声道采用的方式一样.本文件给出了两种实现方式,即基础版本和诲级版木。在所有给出的公式中,”Re1.表示所有根据参考信号计算得到的模式,“Tcs1.”表示所有根据被测信号计算得到的模式,"k"表示离攸频率变W:(如频率频带),"n”表示离彼时间变址(如帧计数器或样木计数器)。如果k和n的假没有明确定义,计算时就会计匏所有可能的k和n值,其他缩写在其出现的地方会有说明.在MOY中.后假"A”表示潮波涔组耳朵模型计算出来的变量,“B”表示FFT耳朵模型计算出来的变i.各个MoV应符合附录D的要求,模型补充说明应符合附录E的要求。101.2私础版本基础版本只包含FFT耳朵模型计算得到的MWfI*i.不包括滤波潺组耳朵模型计算得到的MOV值.基础版本采用11个MW值,预测懑知音频基本质量.10.1.3高级的本高缎版本包含以淋波器祖耳朵模皇计尊得到的HOT值以及FFT耳朵模型计算得到的MW使,频谱适应激励模式和调制模式仅用于以浊波器组为然础的模型计算,高级版本采用5个YoV值来预测感知音频塔本ft.102耳朵周边模型10.2.1FFT耳朵模型102.1.1FFT耳朵模型概述耳朵周边模型和模型中基于FFT处理的激刷模式的预处理应符合图5的要求,FFr耳朵模型的输入为48k1.1.z采样、时间对齐的参考和泅试信号,输入信号被分割成长度为0012s的帧,帕间JR登率为50%,使用Hann阻口和短期FFT,将每个帧转换到领域,并对输入信号进行定标,调整到回放电平.为帙仿外耳和中耳的频率响应,褥对频谱系数进行加权,通过将加权频谱系数组合对应到临界领带,实现了信号到音商标度的转换,通过增加频率偏移,模拟听觉系统中的内部噪声。采用电平扩展函数,模拟粉率域中的频谱听觉沙波器,时域分布则负责前向掩蔽效应.所得的敌励模式用于计笄指定响度模式和掩新模式。最终的时域分布之前的模式(”未抹除的调制模式”)用于计算网制模式.为模仿误差信号,外耳和中耳避波器怆出的参考信号和测试信号模式将被组合起来,并分削对应到临界频帝,从而映射至音高标度.这屿输出与激励信号均用于计算MW值。输入信号(参考信号和被测信耳朵周边模型H-TJ调整.J1.输入信号的定标<回放电平:外耳和中耳的计权计犯悻VI谀信号1组合输入听觉谑波器级r11z3i内部噪声的摺加一,频率分布«时域分布激励模式激励模式忸误信号掩蔽指定响度模式激励模式调制模式频调图5耳朵周边模型和模型中基于FFT处理的激励模式的我处理102.12时间处理FFT耳朵模型的给入,冽试和参考信号划分成具有2048个取样点的帧.相邻的帧与帧之间具有1024个取样点的重质,见公式(3。tnkt,n=t1024n+kJ(3>式中:11一一时间帧数属,取值为0,1,2:k1.-帧内的时间计数潺,取值为0.2047.10.2.1.3FFT通过使用Hann窗口实现从时间域到频率域的映射,见公式(4)和公式(5)Q川-iJhes(2")IN=20484)tw%n=wkt×tjk,n<5>然后,采用短期僧里叶变换,见公式<6).F1.k1.n-以二Q出川丁隽杪(6)FFT的比例因于可根据一个满刻度正弦波的设定声压级1.p计算得到.见公式(7)和公式(8).fac=M(7)MrwFkn=fac×Fr1.,n<8>其中.白一化因数Nonn的计算过程为:把一个1019.5Hz、OdB的满刻度正弦波作为尬入信号,计算1嫩以上的领谐系数生大绝对伯。如果声压级未知,建议卬设而为92dB,。10.2. 1.4外耳和中耳外耳和中耳的烦率响应可由一个频率加权函数进行表示,见公式(9).Wk=-06X3.64×福)+65Xe0H售司-10-3(僵)”(9)其中:11k=23.4375k.-(10>表示在k行的频率表现。汗T输出见公式(11).Fjhn)=Fkfrn×KF-=1<11)Fekf为“外耳加权FEr输出”.10. 2.1.5分组到临界频带听觉音高标度可通过Sehroeder等人提出的近似法进行计算.见公式(12).z=7ars1.nh(三)(音高Z的单位是巴克(Bark).源披器的频率边界范围为80Hz1800CHz.对于荔础版本而言,沙波器领带的宽度和间距时应的分辨率为0.25Bark,对于高级板本而言,对应的分辨率为0.5Bark-可推断出基咄版本的旗带数量为109,应与表2相符合:1.级版本的物带数衣为55,应与表3相符合.表2用于基础版本的FFT耳朵模型的频带州别(k)低频(f1.(k)I1.z中心频率Gdk)IhKM<fu(W)Wz频率带宽<tv1.k>HzO«091.708103.小1523.4451103.445115.216127.02323.5772127,023138.87150,76223.7393150.762162.70211I.6<M23.932A174.68186.742时84924.1555198.849211.019223.25724.4086223.257255,566247.9524,6937247.96260.413272.95925.009g272.9592R5.593298.31725.35«9298.317311.136324.05525.7:»10324.0S5337.077350.20726.15111S50.207363.448376.80526.59812:H6.HO5390.2«2403.阚27.07913403.417.614431.47827.591H131.478445.479459.62228.14515459.622473.912488.35328.73116488.353502.95517.70729.35417517.707532629547.72130.01418547.721562.988578.43430.7131957«.I:M591.06531.45120609.8节625.899M2.IM32,22921W2.IM658.533675.16133.01822675.161692.006709.07133.90923709.07i726.362743.88424743.894761.W1.779.61735.76325779.617797.398816.UM36.75726H16.401835.17«81.20337.79927«54.203873.508893.0938.88828893.091912.959933.11940.02829933.119953.57684.33641.218-36995.4Oe1016.7»7X1.46131IOg7971038,511060.55543.758321060.5S51082.9381105.66645.I1.1.331105.t三1128.7461152.IS746.521311152.1871175.9951200.17847.991模型输出变量估计了当描板参考信号出现情况下所增加失真的部分响度.如果没有掩蔽信号出现.噪声响度的计算公式(见公式<69)用于计算噪声的指定响度:如果与掩蔽信号相比噪声非常小的情况下,噪声响度的计算公式用于计豫噪尚检蔽比,N1.k,n=(-1-×SttXBjft23×(1+K-IT了'”广3-IJ(69)其中Eo恒等于1,1.一指内部噪音函数EJk,定义见公式(36),S可通过公式(70)迸行计算.s=TAresFac0×Modk,n+SO<70)如果没有特殊说明,频诣自适应激励模式见10.3.2)作为输入,即Erat=Ep,TE出n1和Ere1.=Ep.M1.i.np系数B决定了枪敲的数法,可通过公式(71)计算得到,=e×p(o*7x)71)瞬时映出响度值需测试信号和参考信号的左右任一声道的1%声响度超过卜ThreS=OjSone,50BS后开始计算.见10.5.2.5.2.在诺平均中,瞬时值由每个临界频密注波器组的数Jit诳行归一化,而不是由逑波器组的总数进行归一化,也就是,if平均的结果柔以值为24的系数.如果瞬时噪声响度低于阈值XJ“设置其为0。估算整体噪声响度的MOV值应与表7相符合。表7估算整体噪声晌度的MoVMO,(XxxinvgRns>QThresFac0SN1.XxMissingCcxo*nentSik1.50.1510XxxNois1.<i1.50.150.50XxxMissinKCcf1.ponentsi1.50.1510Xxxise1.<xd.2.50.310.1Xxx1.inDist(1.50.151010.4.3.2RnsNoiSc1.oudtRmSNoiSe1.UUd,指沌波器组耳朵模型计算得到的噪声响度方均假。时间平均法见10.5.2.3,常数见表7.10.4.3.3RmSMiSSingComPOnentSARBSYiSSinKCOm1.x>nen1.s、指谑波器组耳朵模型得到的噪声响度方均值。为了生成在测试信号里丢失的部分(与参考信号相比).可互换刈试和参考信号与姣谱自适应激励模式一起进行计算.时间平均值见10.5.2.3,常数应与表?相符合.104.3.4RmsNoise1.oudAsynRmSNoiSe1.UUdASynb是丢失信号组成部份(见10.4.3.3)的一度和噪声(见10432)响度的方均色的加权总和,这两个响度那足根据避波器组耳朵模型进行计算,见公式(72).RmsNoise1.oudAsyni=RmsNoise1.oud÷0.SRmsMissingcomponents<72)10.7.2测试素材测试序列为16段,其MOV和DI值的范围较大.107.3一致性测试的设置测试序列由ITU-R提供,均为WAV文件(XiCroSOftR1.FF格式.采样格式均为18kHz、16bitPCM.ITU提供的泅试和参考信号均1.1.经进行时间时齐和电平调整,因此不需要增加额外的增益或延时。测IIt算法的听音电平应调整到92dBSP1.,1074可接受的容许空间为了符合本文件的规定,所有测试条目的DI值应与表18和表19的值一致.容差应小于10.02'.如果某个实现方案得到的泊超出该容差范围,则该方案不符合本文件.107.5测试项目测试序列的D1.值和ODG值应与表18和表19相符合,其中表18的D1.tfi为基础版本的DIft.表19为高级版本的DI值,其中,被测条目文件的文件名用“cod”表示,参考测试条目文件的文件名用“ref”衣示,例如bcodtri.WaV为被测序列,对应的参考序列名称为brefiri.wav.表18用于基础版本的测试素材以及其D1.值测谎序列DIC1.Macodsnawav.a00.678hcodtri.mv1.919-0.301c<rodsax.wav0.(MB7.829ecodsn.wav1.731-a-112fcodsb1.wav0.677-1.195fcodtr1.wav1.419-0.598fcodtr2.wy-o-i5-1.9Z7fcodtr3.*av-a75-Z601.geode1.a.WaV1.7810.388idsrw.wav-1029-1788kcodnc.vrnv3.0930.038)cdhrp.wavI.on-0.875Icudpip.wav1.973-amrc<x1.co.*bv-Q436-2.33!ncodxfc.mv3.1350.045xcodc1.v.Wny1.689-0.4355)为达到该精收.需采用IEEE浮点算法.b>内部裳征比较法图B1在感知音频质量的客观测量中用于不同方法的生理听觉概念B2心理声学及认知基础B2.1心理声学认知基础的概述本条对人类听觉系统的属性进行讨论。这些典性在对音频信号的第划质收进行评价的过程中具有突出的作用。本条希重阐述这些属性是如何进行建模的。B.2.2外耳及中耳传俄特性通常而言,声音信号必须经过外耳及中耳.到达内耳,在内耳进行声音检测和分析处理.外耳及中H的职能就如同一个浊波潺组对输入信号进行处理.所觉神经中出现的噪声与血液流动产生的噪声一起我加到输入信号上,唯那帕度在低频比较大,外耳及中耳传输功能与内部噪声限制了对较小书频信号的识别能力,对听力的绝而阈值产生了巨大的影响。B.2.3感知频率标度人类耳朵中的声压受体是毛细胞。它们位于内耳,具体来说是在耳蜗里。在耳蝌里,实现了频率到位武的传变.最大激励位置取决于输入伯号的翔率.在耳蜗指定位置上的每个毛细胞对频率标度上的重心范围负责.音高的感知与毛细胞的恒定距肉相关.采用心埋声学实验不同,频率到音高的转换函数也不同:ZWiCker和Fe1.dtke1.1.er在1967年将频率灯分为21个非正校带,也就是所谓的监界叙带,单位为赫兹(Ik).府与表B.1相符合.表B.1包含了城带的上限截止频率.该表还包括对附的Bark标度,具体为:IBark对应100Hz,24Bark时应15500Hz.表BIZWiCker定义的临界频带临界软带上限截止频率Hz临界知带上IM故止嫉率Hz临界柏帝上跟被止频率Hz1100910801737002200101270IHI1.Oo3300111.-t801953004100)21720206100表&1(续)临界嫉带上网截止顿本Hz临界频带上限截止顿率Hz他界频带上限截止频率Hz55101320002177(106630H23202295(J07770152700231200089201631502415500在Cohen和Fie1.der在1992年发表的论文中提到,来用巴克(Bark)标度得到的感知音颠客观测量结果最优.B.24激励每个毛细胞时一个范出的频率做出反应,类似于泄波器特性。波波涔的斜率最好用R.2.3定义的感划频率标度进行表示,采用该标度表示的波波器形状几乎与中心频率无关。激励的下行斜率(约27dBBark)与输入信号电平1.无关,上行斜率与输入信号电平有关,低电平的斜率比高电平的斜率大,上行斜率的范困为(-5-30)dB/Bark,应符合图B2。这个陡峭特性是由于两种不同£细胞的反馈机制造成的,且需要一定的时间来解决”因此,从伯号开始几至杪之后的静态信号中可能狭褥最佳听觉施率分辨率,含彳!多种组成的伯号的激洞模式需要I1.:税性相加.需时间取决于信号的电平及持续时间,可持续数百毫秒信号从毛细帼传输到大脏的时间,而电平信号比低电平信号快.因此,如果开始的信号声音较大,就能够撞板前之而来的柔和信号.另一个模拟激励的方法以Moorc在1986年提出的ERB标度为基础.这个方法使用了MUOre在1986年提出的ROEX湿波器.在超知音频质fit的客观测fit相关文献中,以ZWiCker和PeIdtkener在1967年提出的算法以及Terhardt在1979年提出的算法为基础的模型得出的结果较好.B.2.5检测不同音频信号的激励被传到人类大腑。大腑根据信息呈现的细节程度和持续时间进行划分,有3个不同的存储区:长期记忆,短期记忆和超短期记忆.在听音测试中,超短期记忆发挥若显著的作用.如果听众或评价员听到音领的持续时间小于5s8s,那么信号的绝大多数细节被保制了。在GY/T298««-2016规定的程序考虑到了这个因素.因此,GY/T298-2016规定的程序中.允许评价员选择讦颜中非常短的一部分进行仔细听。在检测的值处,检测概率是50%,在阈值周围检祗概率在0K)睇平滑分布,临界可察觉电平差(JN1.D)是电平号的检测阈值.JN1.D受输入电平的影响,时声音较小的信号,检测需要大差异<电平:20dBSPI.,1MB:0.75dB):对声音较大的信号,对较小差异的敏透度要高一些(电平:80dBSP1.JN1.D:0.2dB).数据是根据谢幅实验获得的.检测概率的原理掩蔽见图B.3.激W)苏拜图B.3检测概率的原理撤薮B. 2.6掩蔽总独播放时消隐可听的信号,在与其他信号同时播放时则可能完全听不见,该效应称之为掩部效应,施藏其他信号的信号称为掩蔽信号,被施蔽的信号称为被掩蔽信号.以下两种情况必须要区分开:同时掩蔽:这种情况下,掩蔽信号和被掩蔽信号同时出现H处于准稔态,如果掩蔽信号具有一个岗敞带宽,对于低于或高于掩般信号的频率,其听力网做都会提薪,掩蔽的数量取决于捶蔽信号和被捷收信号的结构,在类蟆声信号掩蔽音调信号的情况下,施破数玳几乎与频率无关。如果被掩蔽信号的声压电平比掩蔽信号的电平低约5<iB.那么被掩蔽信号就听不见了.如果情况对调.也就是音调信号掩蔽类噪声信号,掩蔽数量取决于掩蔽信号的颇率.这可以通过公式(153+高)dB进行估算,其中Z表示掩般信号的临界领带率。另外,在离信号电平处,非战性效应降低了施蔽信号的捶被阈俏。类似效应也出现在“音调掩蔽者调”的情况下.多信号的掩蔽网但是非税性登加的.总之,所得的掩蔽阀也比每个独立信号生成的撞板现值要高.时间性掩蔽:这种情况下,掩蔽信号和被枪械信号在不同的时间出现.在枪献信号衰减后不久的撞板网的更接近于该掩蔽信号的同时施械阔值,而不是绝对阈他,根据施贼信号的持续时间,俵值的衰减时间可以在5ms(掩板信号:持续0.0511>6的高斯脉冲)至J1.50ms之间(掩板信号:持续IS的粉红噪声)正好处干强信号之前的崩信号相会被掩蔽.这种后向施蔽效应的持续时间均为5三s.如果被撞板信号刚超过闺值,但在掩蔽信号出现之前它还未被礴知到,它可能会被看做是掩蔽信号的变化。对不同的视听者,后向掩蔽的效果差异很大。B2.7响度和部分掩蔽音频信号的序知响度取决于它们的频率、持续时间和声压级由于自动掩蔽,发杂信号的响度比其附录C(规范性)应用C1.概述本附录

    注意事项

    本文(感知音频质量的客观测量方法.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开