找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 3|回复: 0

SmartSub v2.7.0:智能音视频字幕生成工具

[复制链接]

升级   21.33%

26

主题

1

回帖

82

积分

注册会员

积分
82
QQ
发表于 2025-12-7 05:38:28 | 显示全部楼层 |阅读模式
SmartSub(妙幕)v2.7.0 是一款跨平台智能工具,支持批量为 MP4、AVI 等多种音视频格式生成字幕,还能对字幕进行多语言翻译,本地化处理保护隐私且处理速度更快,轻松满足日常学习、办公的字幕制作需求。


核心特性
作为升级自 VideoSubtitleGenerator 的工具,SmartSub 在保留原有优势的基础上,新增多项实用功能,体验更出色:
  • 多格式兼容:支持 MP4、AVI、MKV、MOV 等视频格式,以及 MP3、WAV 音频格式,覆盖主流媒体文件类型。
  • 字幕全能处理:可实现 “生成 + 翻译”“仅生成”“仅翻译” 三种任务模式,无论是从零制作字幕,还是翻译已有字幕文件都能胜任。
  • 本地化隐私保护:无需上传音视频文件,本地完成处理,既保护隐私安全,又大幅提升处理速度。
  • 多翻译服务集成:支持百度翻译、火山引擎翻译、DeepLX、Ollama 本地模型、DeepSeek、OpenAI 风格 API 等多种服务,满足不同翻译需求(注:DeepLX 批量翻译可能限流)。
  • 硬件加速支持:适配 NVIDIA CUDA(Windows/Linux)和 Apple Core ML(macOS M 系列芯片),提升处理效率。
  • 灵活自定义:可自定义字幕文件名、翻译结果格式(纯翻译 / 原字幕 + 翻译),支持自定义并发任务数量,兼容不同播放器。

使用指南普通用户使用步骤
  • 下载安装:根据自身系统、芯片及显卡情况,选择对应安装包(通用版或优化版),安装后启动程序。
  • 模型配置:通过应用内 “模型管理” 下载所需模型,若下载困难可手动从国内镜像源或 Hugging Face 官方源获取,再导入应用。
  • 任务设置:配置翻译服务(需对应 API 密钥),选择任务类型、源语言、目标语言及模型,上传音视频或字幕文件。
  • 启动处理:确认参数设置后开始任务,等待完成即可获取生成或翻译后的字幕文件。
开发用户使用步骤
  • 克隆项目:执行git clone https://github.com/buxuku/SmartSub.git将项目克隆到本地。
  • 安装依赖:进入项目目录,执行yarn install或npm install安装依赖包;Windows 或 Mac Intel 平台需手动下载对应 node 文件并覆盖指定目录。
  • 启动项目:依赖安装完成后,执行yarn dev或npm run dev启动项目。
  • 模型导入:参考普通用户模型导入方式,完成所需模型的配置。

关键配置说明模型选择建议
  • 低端设备 / 显卡:推荐tiny或base系列模型,兼顾速度与基础精度,占用显存小。
  • 普通电脑:建议选择small或base系列,平衡精度与资源消耗。
  • 高性能显卡 / 工作站:优先large系列模型,字幕生成准确性更高。
  • 英文音视频:推荐带en的模型,专为英语优化,减少多语言干扰。
  • 关注模型体积:可选择q5或q8量化系列模型,牺牲少量精度换取更小体积。
翻译服务配置
使用百度翻译、火山引擎翻译等服务需提前申请 API 密钥,申请方法可参考相关第三方软件提供的指引;AI 翻译结果受模型和提示词影响,推荐尝试 DeerAPI 聚合平台,支持近 500 种模型,适配性更强。
硬件加速要求
  • CUDA 支持:需电脑支持 CUDA 且安装对应版本 toolkit(11.8.0/12.2.0/12.4.1),优化版安装包兼容性更优。
  • Core ML 支持:macOS M 系列芯片用户需下载 mac-arm64 版本,将自动启用 Core ML 加速语音识别。

下载链接:
游客,如果您要查看本帖隐藏内容请回复

[发帖际遇]: 小羽哦 发帖时在路边捡到 4 金钱,偷偷放进了口袋. 幸运榜 / 衰神榜
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|安忆论坛

GMT+8, 2026-1-24 09:37 , Processed in 0.070452 second(s), 13 queries , Redis On.

交流论坛 安忆论坛

© 2021-2023 安忆

快速回复 返回顶部 返回列表