Logohaoai 产品使用指南
haoone

17 批量转录

批量转录用于一次性处理项目中的多个媒体文件,系统会按顺序逐个转录,并把结果自动写回当前项目。

只能使用本地模型。翻译必须使用自定义的模型 API。

批量转录不会影响字幕编辑操作,整个过程是异步的,但不要关闭haoone 程序。

一、功能入口

批量转录入口位于项目页面左侧或底部的媒体导入区。

使用方式:

  1. 先把需要处理的音频或视频导入到当前项目
  2. 在媒体列表中选中 2 个及以上文件,可以使用 cmd+a 全选,快捷键跟达芬奇保持一致
  3. 点击底部 批量转录
  4. 在弹出的设置窗口中确认参数后,点击 开始转录

说明:

  • 只有当你选中了多个媒体文件时,批量转录 按钮才会作为批量操作使用

二、使用前准备

开始前请先确认以下条件:

1. 已创建并进入项目

批量转录依赖当前项目名和项目目录来保存结果,因此必须在项目内操作。

2. 已导入待处理媒体

支持对项目中的已导入媒体进行批量处理:

  • 视频文件:会使用对应的音频轨进行转录
  • 音频文件:直接使用原始音频进行转录

3. 已下载本地转录模型

批量转录使用本地离线模型执行。若弹窗中选择的模型尚未下载,系统会提示你先下载模型。

4. 如需批量翻译,需先配置自定义大模型 API

当你希望使用以下能力时,需要先在软件中完成自定义大模型 API 配置:

  • 双语模式
  • 翻译模式

如果未配置,自定义翻译相关选项会被禁用,并显示提示。

三、详细操作步骤

步骤 1:导入媒体文件

把需要处理的音频或视频导入当前项目。导入完成后,这些文件会出现在媒体列表中。

步骤 2:选择要批量转录的文件

在媒体列表中选中多个文件。

可参考以下方式:

  • 逐个点击选择目标文件
  • 使用 Cmd + ACtrl + A 全选当前列表中的全部媒体

选中后,底部会显示已选择的文件数量。

步骤 3:打开批量转录窗口

点击底部的 批量转录 按钮,打开设置弹窗。

步骤 4:设置转录参数

弹窗中可设置以下参数。

1. 本地模型

用于控制批量转录所用的离线识别模型。

注意:

  • 只能选择本机已经下载的模型
  • 若默认模型未下载,系统会自动允许你切换到其他已下载模型

2. 语言

目前只支持中文、英文。

3. 翻译模式

可选项如下:

  • 不翻译:仅生成原文字幕
  • 双语模式:生成双语字幕
  • 翻译模式:将字幕翻译为目标语言

说明:

  • 批量翻译依赖自定义大模型 API
  • 未配置 API 时,只能使用 不翻译

4. 双语语言

当翻译模式选择 双语模式 时,需要指定:

  • 上行语言
  • 下行语言

常见用法:

  • 上行中文,下行英文
  • 上行英文,下行中文

最终会生成一份双语主字幕,同时额外导出上下行各自的独立文件。

5. 目标语言

当翻译模式选择 翻译模式 时,需要指定目标语言,例如:

  • 英语
  • 日语
  • 韩语
  • 法语

6. 单行字幕最大长度

用于控制单条字幕的拆分长度,当前可设置范围为 1430

建议:

  • 口播、短句较多:可适当调小
  • 演讲、课程、长句较多:可适当调大

7. AI 智能拆行

该开关用于控制批量转录时的智能拆行偏好。

建议:

  • 希望保留更细致的拆行控制时可以开启尝试
  • 如结果与预期差异不明显,可结合 单行字幕最大长度 一起调整

步骤 5:开始转录

点击 开始转录 后,系统会按顺序逐个处理所选文件。

处理期间:

  • 底部状态栏会显示当前整体进度,例如“第 2/5 个文件”
  • 当前文件卡片上会显示阶段和百分比
  • 已完成文件会自动把字幕结果回写到项目中

步骤 6:查看结果

批量任务结束后,每个成功处理的文件都会在项目内获得对应字幕数据,可直接继续:

  • 检查识别结果
  • 载入时间线继续编辑
  • 进行后续批量合成

四、输出结果说明

批量转录的输出目录与单文件转录保持一致,统一写入当前项目下的 transcriptions 目录。

目录示意:

你的项目目录/
  项目名/
    transcriptions/

1. 不翻译

每个成功文件会生成:

  • 文件名.srt
  • 文件名.json

其中:

  • srt 为字幕文件
  • json 为结构化分段结果,包含时间段和文本内容

2. 双语模式

每个成功文件通常会生成:

  • 文件名.srt
  • 文件名.json
  • 文件名_1.srt
  • 文件名_1.json
  • 文件名_2.srt
  • 文件名_2.json

含义如下:

  • 文件名.srt / json:双语合并后的主结果
  • 文件名_1.*:上行语言结果
  • 文件名_2.*:下行语言结果

3. 翻译模式

每个成功文件会生成:

  • 文件名.srt
  • 文件名.json

此时主文件保存的是翻译后的字幕结果。

五、批量转录中的状态说明

任务运行时,常见状态包括:

  • 准备中:任务刚启动,正在初始化
  • 转录中:正在处理当前文件
  • 完成:当前文件已完成
  • 失败:当前文件处理失败
  • 全部完成:整批任务处理结束

说明:

  • 即使某个文件失败,后续文件也会继续处理
  • 批量任务结束后,你可以根据失败提示单独重试有问题的文件

六、中止机制说明

批量转录运行时,底部按钮会变为 中止转录

点击后,系统会停止当前批量任务,不再继续后续文件。

请注意:

  • 已经完成的文件结果会保留
  • 正在执行中的当前文件可能中止在处理中间
  • 未开始的文件不会继续执行

如果你希望继续处理剩余文件,建议重新选择未完成文件,再次发起批量转录。

七、非购买用户限制

当前版本中,未购买用户存在以下限制:

1. 文件数量限制

一次批量转录最多只能处理 5 个文件。

如果超过,系统会提示:

批量导入文件个数超过 5 个,请先购买软件

2. 单文件时长限制

未购买用户在批量转录时,超过 20 分钟 的文件会被自动跳过,并标记为失败。

典型提示:

非购买用户跳过超过 20 分钟文件的转录,请先购买软件

购买后:

  • 不限制批量文件数量
  • 不限制文件时长
  • 可使用自定义大模型 API