haoone
4 模型下载与管理教程
与其他很多字幕软件软件不同,haoone 并没有使用 whisper,whisper 的中文识别准确率是很一般的,还容易出现幻觉。
2026 年 haoone 的本地模型已经升级成 qwen3-asr(感谢阿里开源如此优秀的 asr 模型) ,对齐算法是自研的,可以实现中英识别准确率在 95% ,可以识别歌曲与地方方言,且字幕与音频可以实现词语级的高精度对齐。
windows 与 mac 都已经自动开启 GPU 加速,无需你复杂设置,开箱即用。windows 要求电脑需要有显卡,特别是英伟达显卡。
haoone 本地转录速度很快。3 分钟的音频,mac m4 max 30 秒内可转录完成,windows i5 5060 显卡 2 分钟可完成转录。
下载模型
字幕与音频对齐模型说明
必须下载字幕与音频对齐模型,才能使用,是为了实现词语级的高精度对齐。
转录模型说明
优先使用 均衡模型 ,转录速度比较快。
| 模型 | 大小 | 用途 | 推荐硬盘空间 |
|---|---|---|---|
| 中英-2026(qwen3-asr-0.6B) | ~1.5G | 中文/英文/地方方言转录 | 3 GB |
第一次下载转录模型下载,会自动下载字幕与音频对齐模型。
选择模型点击下载按钮即可

下载中,请勿关闭弹层。
使用网盘下载
如果你下载模型失败,或遇到下载很慢的问题,可以到网盘下载模型,目前支持百度网盘与夸克网盘
点击“网盘下载”:

下载模型,需要下载二个文件:
- windows 下载 qwen3-asr-0.6B-win.zip(下载完成后需要解压缩),mac下载 qwen3-asr-0.6B-mac.zip
- wav2vec2.onnx
解压缩的文件夹名称确保是 qwen3-asr-0.6B。
点击“打开模型所在目录”,将文件复制到模型目录下即可。
打开模型存储目录
