录音标注新手入门手册

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

LOGO录音标注新手入门手册培训流程项目概况说明1软件操作讲解2标注规范讲解3质检验收标准讲解43项目概况说明项目名称:录音数据标注项目项目结果应用领域:语音识别技术应用目的:提高语音识别引擎的识别率,即提高语音识别结果的准确率。技术应用:1、呼叫中心自动质检(可以对通话记录进行自动质检,以减少人工质检)2、语音自动转文字;如微信对用户的语音进行了标注,则实现了语音转文字的功能;类似的应用有:百度语音助手、苹果siri等;3、其他的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等标注软件操作讲解一、打开软件二、导入录音文件1、上传录音双击praat.exe只保留Praatobjects窗口,其他窗口关闭即可点击:Open点击:readfromfile选择录音文件标注软件操作讲解2、生成textgrid文件进行标注点击右手边的Annotate选项点击ToTextGrid选项在弹出的Sound;ToTextGrid界面输入标注层次名点击确定后按住Ctrl键,同时选中wav文件和textgrid文件,点击右侧的Edit出现标注界面,进行标注三、常用操作指令播放/暂停:Tab键放大/缩小:界面左下角:all全屏显示;in逐步放大;out逐步缩小;sel选中部分全屏显示选中音频:在语音波形上拖动鼠标拖动音频:拖动标注界面最下的滑动条生成切割线:在语音波形上用鼠标点击需切割处,即出现一条红色虚线,同时该红色虚线与每个标注层的相交处有一个空心圆圈。点击空心圆圈,即可生成切割线。(快捷键:Enter)移动切割线:鼠标点住要移动的切割线,左右拖动。标注软件操作讲解标注软件操作讲解删除切割线:1、快捷键Alt+Backspace2、点击界面左上顶部“Boundary”选项-选择Remove,即可删除。保存:Ctrl+S查看秒数:在标注层下面,滑动条上面,有三个显示依次为:每个切割片切割秒数、屏显秒数、整条音频秒数做完之后删除记录:选中文件之后,点击左下角的Remove标注规范讲解一、语音文件分类按语音质量,把语音文件分为两大类:一类为训练语音;另一类为非训练语音。(本项目只标注训练语音,非训练语音不标注)非训练语音识别条件①文件大小方面:文件大小为200KB以下的语音;(时长过短,未形成对话的语音)②噪音方面:整段语音伴有严重的持续背景噪音的语音;(背景音如严重电流声、风声和干扰声等)③文本方面:不能听懂的方言类语音,如某些南方方言等;经常性听不清,不能准确写出文本的语音;无贡献文本的语音(如:文本只有“喂,你好”这几个字的语音);整段语音中50%以上文本为脏话的语音。④其他方面:回声大的语音(听觉上出现双字的语音);过载严重的语音(音量过大导致截幅严重的语音,这里指全段语音的每字都严重截幅的语音;稍微截幅的要算作训练语音中标注)。标注规范讲解二、标注层级标注层级情绪层(emotion)1、标注语音对应的文本和噪音标识;2、中文文字要与语音一致1、标注主说话人的角色、性别和身份。2、客服用A表示,客户用B表示;3、用“M、F”+编号1或2,分别表示男(male)、女(female)性别;性别相同时,用数字按编号1、2来区别身份。如:AF1、BF2……(两女声),AM1、BM2……(两男声),AF1、BM1……(一男一女)中文层(chinese)说话人层(speaker)标注该段语音的语速、情绪图片案例标注规范讲解三、标注规范细则两个主说话人的语音片段(一般为两个主说话人:一个客服一个客户)背景无噪音或有轻微噪音时背景有严重噪音时(听感上达到说话声的30%以上,为严重噪音)1、切割此片段标记上所说文本(片段不要过长,一般控制在2~6秒,以语义完整的一句话为一个片段;特殊情况下,最长不超过10秒)2、数字和符号需转换成汉字,例70%写为百分之七十;3、切割的语音片段首尾要留有一定余量(首尾为静音段时可以多留余量,1秒都可以,首尾为噪音段时,要稍微紧贴语音)4、音译词用中文写出,如拜拜、英格兰、保时捷等将语音文本加上[]标记,其他同上。图片案例标注规范讲解特殊语音片段听不清的语音片段两个主说话人同时说话,音量相当且内容有意义时1、将这个词或句单独切段,标记为(())。2、说话人层也标记相应的信息。1、将这个语音段切出,chinese层标记两个人的说话内容,speaker层也对应标注两个角色信息,用|分隔,先后顺序,上下层要一致;2、两个人同时说话,而另一个人只说了”嗯”时:a)另一人“嗯”声音量很低时,作轻微噪音处理,直接标记主说话人的文本即可;b)另一人“嗯”声音量很大时,主说话人的文本首尾加上标记[]即可。图片案例标注规范讲解特殊语言句中出现英文句中出现外语1、出现字母,字母要大写,每个字母前边加上“~”,字母间、字母与文本间要以空格隔开。例如:~A~B~C2、出现单词或英文句,单词小写,每个字母前也加“~”,单词间、单词与文本间以空格隔开。例如:~g~o~o~d~m~o~r~n~i~n~g切割此片段,标记为对应标识符号:1)英文无法标记,切割片段并标记为E(English);2)日语,切割片段并标记为J(Japanese)3)韩语,切割片段并标记为K(korean)图片案例标注规范讲解静音段噪音标注超过1秒的安静无杂音的纯静音段静音段中的人声噪音片段静音段中的非人声噪音片段1、超过1秒的纯静音段标记为S(silence);2、1秒以下的纯静音段平分给前后语音。切割此片段,不标记;(此条规则的优先级高于其他)如:背景人说话声切割此片段,标记为N;(noise)如:敲键盘声、严重电流声等图片案例标注规范讲解静音段特殊声音标注静音段中的人声呼吸段静音段中的人的纯笑声非人声铃声、非人声彩铃、拨号音、传真声、等待音的语音片段切割此片段,标记为V(voice)如:咳嗽声、呼吸声、清嗓子声切割此片段,标记为L(laugh);1、切割此片段,标记为R(rubbish);2、必须是非人声铃声,若有人声,则按人声噪音处理,不标记。图片案例标注规范讲解说话人层标注中文层为文本、(())的,标注说话人层信息中文层为文本、(())的,多个片段都是同一个说话人时,合并为一段标记中文层为两人同时说话的,说话人层用|分隔,先后顺序,上下层要一致上下层切割线要严格对齐图片案例标注规范讲解情绪层标注情绪为正常时情绪变化导致语速变快时情绪为激动或着急时情绪为愉快时情绪为悲伤时不用标记标记为Q(quickly)标记为A(anxious)标记为H(happy)标记为S(sad)图片案例标注规范讲解1标注规范中出现的所有符号为英文半角符号,标识必须为大写字母。3标注结束后,保存标注信息文件时,请确保标注的textgrid文件与当前的wav语音文件所在路径保持一致。2不能出现标点符号,切割时以语义完整的一句话为一个片段,句末不加标点。规则中要求标注的符号除外。四、注意事项质检验收标准讲解1、正确率96%2、质检验收标准细则验收标准文本有误(多字少字错字)主说话人的大段文本未标注(漏标、大段标成听不清)听不清的未单独切段;说话人角色、性别、身份有误噪音标识有误(错标、漏标)切割线位置不准;同一人说话时长10S以上的未分段符号未半角,标识未大写两人同时说话情况未用|分隔,或上下层顺序不一致LOGO

1 / 27
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功