2026 年中文区缺少的那个字幕格式转换器
把 SRT 喂给浏览器 HTML5 播放器报错?把 ASS 给老 PotPlayer 显示一片乱码?把 YouTube 下载下来的 SBV 想拿去 B 站重新上字幕?字幕格式互转是中文创作者每天都会撞到的痛点。但 2026 年你能找到的中文字幕转换工具有限,常见的两类:需要上传到第三方服务器(隐私敏感)或者 UI 像 2010 年。
MeTool 字幕格式转换器把 5 个最常用格式做成一个干净的纯前端工具:SRT、VTT、ASS、SBV、LRC 任意两种之间互转。整套流程在浏览器里完成,字幕文件从不上传。一次拖入一整批文件,选目标格式,几秒钟下载 ZIP。
关键场景:把 Bilibili / Aegisub 的 ASS 转 SRT 给老电视播放器、把 SRT 转 VTT 给 HTML5 video 元素、把 .lrc 歌词转 SRT 给视频剪辑软件、把 YouTube 旧版 SBV 字幕转成现代格式。
5 种字幕格式各自的取舍
SRT (SubRip) — 最通用
互联网最早期的字幕格式,几乎所有播放器都识别。结构最简:序号 + 时间 + 文本。毫秒级精度。如果不知道选什么,选 SRT。
VTT (WebVTT) — HTML5 标配
HTML5 <track> 元素的官方字幕格式,被所有现代浏览器原生支持。语法接近 SRT 但用 . 而不是 , 分隔毫秒,并且支持简单的样式 / 行内标签。Web 视频用 VTT。
ASS (Advanced SubStation Alpha) — 动漫字幕组的最爱
支持自定义字体、颜色、动画、卡拉 OK 特效、定位标签。Aegisub 编辑器原生格式,B 站 / Bilibili 上的高级字幕大多是 ASS。MeTool 转换会保留文本和时间,但样式信息在转 SRT/VTT/SBV/LRC 时会被剥离(目标格式根本不支持)。
SBV (SubViewer) — YouTube 旧版字幕
YouTube 早期的字幕导出格式,没有序号、没有头,时间字段间用「逗号」分隔(容易被误解析)。厘秒精度。从 YouTube CC 下载下来的字幕通常是 SBV 或 SRT。
LRC (Lyric) — 音乐播放器歌词
为音乐设计的同步歌词格式,只有起始时间没有结束时间。同一行可以有多个时间标签(同句歌词出现多次)。转出 LRC 时一定会丢失结束时间信息 — 这不是 bug 是格式所限。
为什么字幕格式转换不应该在云服务器跑
字幕文件本质是文本,体积小(多数 < 100KB),但内容敏感度可能很高:未发布的视频脚本、内部培训内容、客户访谈逐字稿、医疗 / 法律录音转写。把这些文本传到第三方服务器,本身就是隐私风险。
很多在线字幕工具的商业模式就是「免费转换 + 收集字幕语料训练 NLP 模型」。文件传上去你就没办法证明对方有没有保留副本。
MeTool 用纯 JavaScript 在浏览器解析、再序列化字幕,压根没有上传环节:DevTools Network 面板里看不到任何字幕相关请求。这意味着哪怕断网(页面已加载完成),转换功能依然可用。
这种「不上传」的能力是天生的,不是营销话术。底层只用了 JavaScript 字符串处理 + Blob 下载 — 没有任何技术理由需要服务器参与字幕格式转换。
常见使用场景与对应技巧
场景 1:B 站投稿要求 SRT,本地是 ASS
把 ASS 拖入工具,选 SRT,下载。如果 ASS 含特效,会被剥离,但文本和时间完整保留 — 重新在剪辑软件里给 SRT 加样式即可。
场景 2:HTML5 网页视频要喂 VTT,手头是 SRT
选目标 VTT,工具自动加 WEBVTT 头并把 , 替换为 .。
场景 3:YouTube 下载下来的 SBV 想给国内剪辑软件
剪映、必剪、Pr 等都首选 SRT。直接 SBV → SRT 即可。
场景 4:网易云音乐 .lrc 歌词想加到视频里
LRC 转 SRT 后,每行的结束时间用下一行的开始时间补上,最后一行用 5 秒兜底。可视情况手工微调。
场景 5:批量整理一整个剧集的字幕
把 24 集的 .ass 一次全拖进来,目标 SRT,点「全部下载(.zip)」拿到一个 zip 包,原文件名保留只换扩展名。
