Question 1

支持哪些文件格式？

Accepted Answer

支持常见音频（mp3、wav、m4a、aac 等）与视频（mp4、mov、mkv 等）。视频会在你的浏览器本地抽取音频后再上传。

Question 2

我的文件会被上传到服务器吗？

Accepted Answer

视频在你的浏览器本地抽取为音频，原视频不会上传；仅上传抽取后的音频用于识别，识别完成后服务端即删除。

Question 3

支持哪些语言？

Accepted Answer

默认自动检测语种，并可手动指定中文、英文、日语、韩语等。中文会自动启用普通话与简体优化。

Question 4

三种识别模式有什么区别？

Accepted Answer

快速（small）最快、适合长音频先出稿；标准（medium）平衡，推荐日常使用；高精度（large-v3）最准、适合正式字幕，但耗时更长。

语音转文字

常见问题