Logohaoai 产品使用指南
haoone

模型下载与管理教程

中文/英文/日文/地方方言转录优先使用中英专用模型,中文识别准确率在92%-94%,字幕与音频对齐精度高。

haoone 针对中文转录场景做了特别的优化,自研了字幕与音频的对齐算法,不会像其他工具一样出现中文漂移、标点错误等问题。

转录中充分利用了 GPU 的加速能力,你无需配置,默认开启。


模型对比

  • 识别准确率:中英专用模型 > 多语种-最好 > 多语种-均衡
  • 字幕与音频对齐精度:中英专用模型 > 多语种-最好 > 多语种-均衡
  • 转录速度:多语种-均衡 > 中英专用模型 > 多语种-最好
  • 低语音质量识别准确率:多语种-最好 > 中英专用模型 > 多语种-均衡
  • 方言识别:中英专用模型
  • 歌曲识别:中英专用模型 > 多语种-最好 > 多语种-均衡

下载模型

字幕与音频对齐模型说明

必须下载字幕与音频对齐模型,才能使用,是为了实现词语级的高精度对齐。

转录模型说明

优先使用 均衡模型 ,转录速度比较快。

模型大小用途推荐硬盘空间
中英专用~725MB中文/英文/日文/地方方言转录优先使用此模型1 GB
多语种-均衡~1.5 GB支持大多数语言,中文/方言识别不如中英专用模型2 GB
多语种-最好~3 GB支持大多数语言,对电脑性能要求高,转录速度慢4 GB
base~150 MB仅用于测试1 GB

第一次下载转录模型下载,会自动下载字幕与音频对齐模型。

选择模型点击下载按钮即可

下载中,请勿关闭弹层。

使用网盘下载

如果你下载模型失败,或遇到下载很慢的问题,可以到网盘下载模型,目前支持百度网盘与夸克网盘

点击“网盘下载”:

下载中英专用,需要下载二个文件:

  • funasr-nano-2026.zip(下载完成后需要解压缩)
  • wav2vec2.onnx

下载多语种-均衡,需要下载二个文件:

  • ggml-large-v3-turbo.bin
  • wav2vec2.onnx

点击“打开模型所在目录”,将文件复制到模型目录下即可。

打开模型存储目录