语音识别自学习工具
优化识别效果的利器
阿里云提供的语音识别服务,提供了通用的模型,或者模型领域的通用模型如8k客服质检模型、电商等。如果您在自己的领域积累了丰富的历史数据,那么就可以使用这些历史数据来对自己的模型做定制的优化。
通过使用阿里云语音自学习工具,您可以通过可操作的界面上传训练语料文本,通过对您训练语料做模型训练,可以有效提高您的场景的语音识别识别率,尤其是专有名词和文本中的高频词汇,有较好的优化效果。
具体在管理控制台训练定制模型的操作说明,请查看 管理自学习模型文档。
训练语料说明
自学习平台训练模型的语料格式为小于20M的 UTF-8格式TXT文本 文件。训练语料应基于您历史生产出的标注文本,或者应用场景的专业术语的文本集合构成。
- 识别语料应该一句一行。
- 针对要识别的重点内容,如专有名词、人名地名等,需要在语料中反复出现,才可以提高识别的权重。
应用举例
某地即将召开一场红学研究会,为了记录会场嘉宾的讲话,主办方选择接入阿里云智能语音服务来进行会议转写。首先开发人员注册并开通阿里云智能语音服务,为了提高会议发言的识别率,考虑采用自学习平台进行模型训练优化:
- 选择基础模型:采用通用模型。
- 训练语料采集:由于会议核心是讨论红楼梦相关的议题,开发人员将红楼梦小说的原文进行处理,根据标点做裁剪,将原文每句话保存为训练文本中的一行。
- 操作训练模型:通过自学习平台提交语料和训练之后,采用训练出的模型,可以有效识别出『贾宝玉』等红楼梦中的词汇,获得理想的识别效果。