X-Cut 2.1.0 发布说明,以及未来开发计划

萝卜2026-05-30

X-Cut 用字幕,剪视频

本文包括以下主要内容:

  1. X-Cut 2.1.0 更新
  2. X-Cut 现存的问题
  3. 未来开发计划

X-Cut 2.1.0 更新

  1. 提升对低分辨率屏幕的适应性,避免占满窗口。
  2. 导出字幕默认格式从 VTT 改为 SRT。
    以前下载视频,默认 VTT,便以为这是最普遍的了。但有用户使用会声会影时,发现不支持 VTT,只支持 SRT,了解之后,才知道,SRT 才是最普遍的字幕格式,VTT 是其改进版,支持网页标签,丰富样式。感谢反馈。

X-Cut 现存的问题

安装 whisper 慢,易出错的问题

whisper 安装过程要下载几百兆的程序和数据,网络也经常不稳定,有时候要很长时间才能安装好。

即便安装好了,有些系统可能还会遇到缺少类库的问题。

语音转字幕慢的问题

whisper 默认使用高效的 small 模型,已经算是优化了速度。但对于大多数电脑来说,仍是很慢。

我的电脑是 17 年的 i5-7500 CPU,转录时间大概是视频时间的三倍,去掉时间戳,可以快一点,那字幕生成质量就不够好了。

X-Cut 号称轻量级视频剪辑软件,目标是让所有的电脑都能剪辑视频。从技术栈上讲,用 Electron,只要能运行浏览器,就能剪辑。

但转字幕,是个重体力活。高端的电脑,才能快速转码,据说新的 M 芯片,可以一分钟完成一小时的视频转录。

苹果 M 芯片慢的问题

刚还说 M 系列性能强,怎么又慢呢?

最近至少三位朋友反馈这个问题。这个问题,主要是没有针对 M 芯片打包,软件是在我 17 年的 iMac 上打的包,虽然 macOS 可以自动处理芯片问题,但性能损耗还是挺大的。

未来开发计划

对于上面的问题,我做了一些探索。

我试着接入语音转文字 API,如火山,但感觉其网站太乱了,新版旧版空闲版标准版极速版,让人头大,还死贵。罢了。以后研究一下如何融入 AI 代理之类的,据说有些可以直接转录的。敬请期待。

我尝试了 whisper.cpp,这个体积小,可以包含到软件中,性能也好,初步测试比 whisper 快三到五倍。但生成字幕的质量,不如 whisper,特别是对静音片段的处理。

未来我打算研究一下这个项目的源码,改善一下静音处理,针对 X-Cut 的需求进行优化。

X-Cut 用字幕剪视频,字幕越精确,效率越高,特别是中间的静音片段,这一点,目前的软件做得并不是很好,每次剪视频,都需要手动切分一些字幕来去掉静音部分。如果生成字幕时,能清晰地分离静音部分,将能很好地提高剪辑效率。

针对大部分电脑不胜任视频转字幕这件事儿,我打算开发一个转录服务器,部署改善后的 whisper.cpp 或其他转录软件进行转录,一个是提升字幕质量,一个是提高转录速度,应该能做到一小时视频几分钟转完的速度。

未来,部署网上,提供转录服务,以及卖给企业,为企业内部提供转录服务。

软件是免费的,转录服务器,估计能让我赚点钱。我也是要吃饭的,现在穷的真是快吃不起饭了。

M 芯片慢的问题,似乎是最容易解决的,搞个电脑,打个包就解决了。但,还是上面的问题,解决不了。

解决问题的方案

我需要三五台 M 芯片主机,可以是 MacBook Neon Air Pro,也可以是 Mac mini,用来打包软件,和验证转码服务的可行性。

如果您手头有闲置的机器,可以捐赠给我。我将在软件主页上,展示您为赞助商,以示感谢,以及赠送一定价值的转录服务(如果能实现的话)。

感谢支持,欢迎成为赞助商,您的支持很重要!

最后修改于 2026-05-30 10:17:57