Logohaoai 产品使用指南
haoone

模型下载与管理教程

haoone 的本地转录使用 whisper,市面上的whisper 工具,如果你没翻墙的话,会遇到模型下载问题,软件集成了模型下载与管理,简化你的使用。

经过验证,中文转录首推 平衡(large-v3-turbo) 模型,其次是 最好(large-v3)。

haoone 针对中文转录场景做了特别的优化,字幕与音频的对齐也是专门调教过的,不会像其他工具一样出现中文明显漂移的问题。

转录中充分利用了 GPU 的加速能力,你无需配置,默认开启,转录速度上我已经优化到顶了。


下载模型

模型说明

优先使用 large-v3-turbo ,转录速度比较快。

模型大小用途推荐硬盘空间
large-v3-turbo~1.5 GB优先使用此模型,均衡效果和速度2 GB
large-v3~3 GB最佳准确度4 GB
base~150 MB仅用于测试1 GB

苹果电脑会额外下载 encoder.mlmodelc 加速。

选择模型点击下载按钮即可

下载中,请勿关闭弹层。

使用网盘下载

如果你下载模型失败,或遇到下载很慢的问题,可以到网盘下载模型,目前支持百度网盘与夸克网盘

点击“网盘下载”:

以下载 large-v3-turbo为例。

苹果电脑需要下载三个内容:

  • ggml-large-v3-turbo.bin
  • ggml-large-v3-turbo-encoder.mlmodelc 文件夹
  • wav2vec2.onnx

windows 电脑需要下载二个内容:

  • ggml-large-v3-turbo.bin
  • wav2vec2.onnx

点击“打开模型所在目录”,将文件复制到模型目录下即可。

打开模型存储目录