ROAD2018

Results 1 issues of ROAD2018

注意,本教程是完全基于FunASR进行标点模型微调与onnx模型导出,不涉及modelscope。 ### 1. 标点模型训练 标点模型训练与微调借鉴 FunASR/egs/aishell2这个例子进行,具体如下: **1) 下载标点预训练模型文件夹 punc_ct-transformer_zh-cn-common-vocab272727-pytorch 到本地 FunASR/egs/aishell2 目录下。** **2)FunASR/egs/aishell2 目录下新建 tokenize_text.py 文件用于进行文本和标点处理,主要是根据预训练模型punc_ct-transformer_zh-cn-common-vocab272727-pytorch 文件夹中的 punc.yaml 配置文件对输入文本进行文字和标点提取。可以应用 WeTextProcessing 工具包进行文本正则化,也可以利用FunASR自带的正则化脚本进行处理。** tokenize_text.py 脚本如下: ``` #!/usr/bin/env python3 import argparse from collections...