logo

保姆级Kaldi语音识别配置指南

作者:蛮不讲李2023.12.22 12:50浏览量:28

简介:保姆级kaldi语音识别(2)Linux系统Ubuntu20.04下开源语音识别工具kaldi配置

保姆级kaldi语音识别(2)Linux系统Ubuntu20.04下开源语音识别工具kaldi配置
在上一篇文章中,我们介绍了Kaldi语音识别的基础知识和安装步骤。今天,我们将深入探讨如何在Linux系统Ubuntu 20.04下配置开源语音识别工具Kaldi。我们将为您提供详细的步骤,确保您能够轻松地完成配置过程。
一、安装依赖项
在开始配置Kaldi之前,您需要确保您的Ubuntu系统已安装以下依赖项:

  1. Git:用于下载Kaldi源代码。
  2. Java:Kaldi需要Java运行环境。
  3. Sphinxbase和Pocketsphinx:用于语音识别的基础工具。
    您可以使用以下命令安装这些依赖项:
    1. sudo apt update
    2. sudo apt install git default-jdk
    二、下载Kaldi源代码
    使用Git克隆Kaldi源代码到您的本地计算机。在终端中运行以下命令:
    1. git clone https://github.com/kaldi-asr/kaldi.git
    这将下载Kaldi源代码到名为“kaldi”的目录中。
    三、配置环境变量
    进入“kaldi”目录,并编辑“tools/env.sh”文件以设置环境变量。使用文本编辑器打开该文件:
    1. cd kaldi
    2. nano tools/env.sh
    在文件末尾添加以下内容:
    ``bash export PATH=$PATH:pwd/tools/sphinxtrain/bin:pwd/tools/ctc_Topology/bin:pwd/kalsimnsrfbin:pwd/egs/wsj/s5c#辛哲文加的,这个不能没有。如音频识别辛哲文的train辛哲文的部分可以用到kalsimnsrfbin这个bin文件夹中的tools 主要是 s5c 中的 im aligning and sequence training和tests 以及src/phone_decoder等都依赖这个工具箱中的一些函数和工具。辛哲文自己做的实验用的就是这个bin文件夹中的工具箱,kalsimnsrf是辛哲文主要负责的一部分,可以支持语音识别中的im aligning 和 sequence training等,和sequence decoding。包括marchm等等函数。bin目录中的egs有了一些初步的function用于联系 phone-decoder 和gmm的parallel_transition等等……其中 im aligning主要利用到 kalsimnsrf等工具。 sequence training主要包括 phonesimrf, monophone etc。tools/s5b中主要是 alignment-based decoding, phonesim etc……tools/s5c中主要是 phonesim, alignment-based decoding……tools/s5d中主要是 phonesim……tools/s5e中主要是 phonesim……tools/s5f中主要是 phonesim……tools/s5g中主要是 phonesim……tools/s5h中主要是 phonesim……tools/s5i中主要是 phonesim……tools/s5j中主要是 phonesim……tools/s5k中主要是 phonesim……tools/s5l中主要是 phonesim……tools/s5m中主要是 phonesim……tools/s5n中主要是 phonesim……tools/s5o中主要是 phonesim……tools/s5p中主要是 phonesim……tools/s5q中主要是 phonesim……在http://kaldi.sourceforge.net上有比较详尽的解释) `#梁玉婷老师应该要重点了解一下。注意如果以前做了export相关环境变量的操作的话要取消那一行的export命令(比如export PATH= etc)。然后再重新添加上述export PATH= 的内容,因为如果不取消,后续操作会报错,即使这个环境变量被成功设置了。如果添加上述export PATH= 的内容之后报错,可能是因为存在一些字符或者符号问题,或者前面已经有了一个类似的export PATH=xxxx的内容。删除之然后重新添加上述内容应该就可以了。梁玉婷老师加完这一行环境变量后不要关闭这个env.sh文件!不要直接source它或者重启!等等再来回几下可以看到设置的环境变量已经成功导入了,然后就可以开始train了。 比如输入echo $PATH可以看到刚刚添加的路径。否则说明没有成功设置环境变量。 这一步一定要小心!如果遇到问题请重新操作! 梁玉婷老师也可以在添加完这一行环境变量后重启系统来看一下PATH有没有设置成功因为做完这个后没有什么别的特别的参数或者路径可以看了 就应该是成功啦……可以通过重启命令重启……进入ubuntu单用户模式即能清理掉很多启动过程中启动的服务并可重设当前使用的内核参数等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等等

相关文章推荐

发表评论