X-Cut 2.1.0 发布说明,以及未来开发计划
X-Cut 用字幕,剪视频
本文包括以下主要内容:
- X-Cut 2.1.0 更新
- X-Cut 现存的问题
- 未来开发计划
X-Cut 2.1.0 更新
- 提升对低分辨率屏幕的适应性,避免占满窗口。
- 导出字幕默认格式从 VTT 改为 SRT。
以前下载视频,默认 VTT,便以为这是最普遍的了。但有用户使用会声会影时,发现不支持 VTT,只支持 SRT,了解之后,才知道,SRT 才是最普遍的字幕格式,VTT 是其改进版,支持网页标签,丰富样式。感谢反馈。
X-Cut 现存的问题
安装 whisper 慢,易出错的问题
whisper 安装过程要下载几百兆的程序和数据,网络也经常不稳定,有时候要很长时间才能安装好。
即便安装好了,有些系统可能还会遇到缺少类库的问题。
语音转字幕慢的问题
whisper 默认使用高效的 small 模型,已经算是优化了速度。但对于大多数电脑来说,仍是很慢。
我的电脑是 17 年的 i5-7500 CPU,转录时间大概是视频时间的三倍,去掉时间戳,可以快一点,那字幕生成质量就不够好了。
X-Cut 号称轻量级视频剪辑软件,目标是让所有的电脑都能剪辑视频。从技术栈上讲,用 Electron,只要能运行浏览器,就能剪辑。
但转字幕,是个重体力活。高端的电脑,才能快速转码,据说新的 M 芯片,可以一分钟完成一小时的视频转录。
苹果 M 芯片慢的问题
刚还说 M 系列性能强,怎么又慢呢?
最近至少三位朋友反馈这个问题。这个问题,主要是没有针对 M 芯片打包,软件是在我 17 年的 iMac 上打的包,虽然 macOS 可以自动处理芯片问题,但性能损耗还是挺大的。
未来开发计划
对于上面的问题,我做了一些探索。
我试着接入语音转文字 API,如火山,但感觉其网站太乱了,新版旧版空闲版标准版极速版,让人头大,还死贵。罢了。以后研究一下如何融入 AI 代理之类的,据说有些可以直接转录的。敬请期待。
我尝试了 whisper.cpp,这个体积小,可以包含到软件中,性能也好,初步测试比 whisper 快三到五倍。但生成字幕的质量,不如 whisper,特别是对静音片段的处理。
未来我打算研究一下这个项目的源码,改善一下静音处理,针对 X-Cut 的需求进行优化。
X-Cut 用字幕剪视频,字幕越精确,效率越高,特别是中间的静音片段,这一点,目前的软件做得并不是很好,每次剪视频,都需要手动切分一些字幕来去掉静音部分。如果生成字幕时,能清晰地分离静音部分,将能很好地提高剪辑效率。
针对大部分电脑不胜任视频转字幕这件事儿,我打算开发一个转录服务器,部署改善后的 whisper.cpp 或其他转录软件进行转录,一个是提升字幕质量,一个是提高转录速度,应该能做到一小时视频几分钟转完的速度。
未来,部署网上,提供转录服务,以及卖给企业,为企业内部提供转录服务。
软件是免费的,转录服务器,估计能让我赚点钱。我也是要吃饭的,现在穷的真是快吃不起饭了。
M 芯片慢的问题,似乎是最容易解决的,搞个电脑,打个包就解决了。但,还是上面的问题,解决不了。
解决问题的方案
我需要三五台 M 芯片主机,可以是 MacBook Neon Air Pro,也可以是 Mac mini,用来打包软件,和验证转码服务的可行性。
如果您手头有闲置的机器,可以捐赠给我。我将在软件主页上,展示您为赞助商,以示感谢,以及赠送一定价值的转录服务(如果能实现的话)。
感谢支持,欢迎成为赞助商,您的支持很重要!
