Lada|JavPlayer 中文交流论坛

 找回密码
 立即注册
查看: 79|回复: 1

[软件下载] Docker 安装包 Video Pipeline – 视频去码·字幕翻译·合成 1.0

[复制链接]

8

主题

92

帖子

1029

积分

中级会员

Rank: 3Rank: 3

积分
1029
发表于 昨天 19:06 | 显示全部楼层 |阅读模式
Video Pipeline – 视频去码·字幕翻译·合成
基于 Docker 的全自动视频处理流水线,提供 Web 管理界面,一键完成 马赛克移除 → 日语语音识别/翻译 → 中文字幕合成。

核心功能
视频去码:使用 Lada 移除马赛克,支持 GPU 推理与硬件编码加速(NVENC)。

语音转字幕:集成 Faster-Whisper 海南鸡版,将日语语音翻译为中文并生成字幕。

视频合成:通过 FFmpeg 将字幕烧录(硬字幕)或封装(软字幕)到成品视频中,支持 GPU 硬件编码(h264_nvenc)。

Web 管理界面:暗色主题仪表盘,可视化控制全部流程。

视频列表自动刷新,递归扫描子文件夹

文件状态实时显示(待处理/排队中/去码中/字幕中/合成中/已完成)

步骤开关(去码、字幕、合成)滑块控制

批量处理、隐藏已处理视频、一键显示全部

全局设置:Lada 模型选择、编码预设、Whisper 参数、FFmpeg 字幕模式等

硬件监控侧边栏(GPU/CPU/内存)

处理后直接在线播放成品,或从输出目录获取文件

软件版本
最新版本:v1.0(2026-05-22)

Docker 镜像:基于 nvidia/cuda:12.8.0-cudnn-runtime-ubuntu22.04,内置 Python 3.12、FFmpeg(带 NVENC 支持)、Lada、Faster-Whisper 等。


运行要求
硬件
支持 NVIDIA GPU(推荐 Pascal 及以上架构,如 GTX 10 系列、RTX 20/30/40 系列)

显存:≥ 6 GB(建议 8 GB 以上,用于处理 1080p 视频)

磁盘空间:镜像约 10 GB,模型文件约 3–5 GB(独立挂载)

软件
操作系统:Windows 10/11(需 WSL 2)或 Linux 发行版(推荐 Ubuntu 22.04)

Docker:Docker Desktop(Windows)或 Docker Engine + NVIDIA Container Toolkit(Linux)

NVIDIA 驱动:≥ 570.0(如需 NVENC GPU 硬件编码,否则仅影响编码速度)

安装说明
1. 准备项目文件
下载或克隆本仓库到本地,例如Ubuntu fnOS 或者 Windows 下使用 WSL:

FFMPEG 依赖 单独下载 推荐迅雷 放到根目录 在构建
https://github.com/BtbN/FFmpeg-B ... -linux64-gpl.tar.xz

bash
wsl
cd ~
cd video-pipeline
(若无法联网,可将备份压缩包解压至此)

2. 配置模型路径
项目需要两个模型目录(需提前下载模型文件并放置在宿主机):

Lada 模型:默认路径 D:\soft\lada-v0.11.0\_internal\model_weights(WSL 中对应 /mnt/d/soft/lada-v0.11.0/_internal/model_weights)

Whisper 模型:默认路径 D:\whisper-large-v2-translate-zh-v0.2-st

如果模型放在其他位置,请编辑 docker-compose.yml 中的卷挂载路径:

yaml
volumes:
  - /你的实际路径/lada_models:/app/lada_models:ro
  - /你的实际路径/whisper_model:/app/whisper_model:ro
3. 创建输入/输出目录
默认使用 E:\input(待处理视频)和 E:\output(成品输出),也可在 docker-compose.yml 中修改。

4. 构建并启动容器
bash
docker-compose build
docker-compose up -d
首次构建会下载基础镜像和 Python 依赖,国内用户可在 Dockerfile 中看到已配置阿里云镜像源和清华 pip 源,速度较快。
构建完成后打开浏览器访问 http://localhost:8000。

5. 处理视频
将需要处理的视频放入输入目录(支持子文件夹)。

点击“刷新列表”,视频将显示在左侧。

通过全局设置调整参数(可选,默认已优化)。

点击单个视频的“开始”按钮,或勾选多个后点击“批量处理”。

等待进度条完成,状态变为“已完成”后,文件名会变为可点击的链接,直接播放成品。

参数调整
Lada 去码:可切换 CPU/GPU、选择编码预设(HEVC/H.264 GPU 加速等)、修复模型、检测模型、片段长度等。

Whisper 字幕:可指定模型路径、语言、设备、任务(转录或翻译)、解码参数。

FFmpeg 合成:可选择硬字幕(烧录)或软字幕(封装),支持 GPU 硬件编码器(h264_nvenc)。

文件命名规则
输入文件 video.mp4 将产生:

去码后视频:video-U.mp4

字幕文件:video-U.srt

最终成品:video-UC.mp4(存放在输出目录的同名子文件夹中)

常见问题
Q:页面一直“加载中”怎么办?
A:检查浏览器控制台(F12)是否有报错,同时确认输入目录是否存在且包含视频文件。

Q:任务失败显示“Lada 去码失败”或“字幕文件为空”?
A:通常是因为模型文件未正确挂载或 VAD 离线环境未配置。可尝试:

确认模型路径正确且文件完整。

进入容器手动运行 lada-cli --help 或 python infer.py --help 检查环境。

暂时关闭 VAD(修改 app/tasks.py 中配置文件 vad_filter: false)以保证离线稳定性。

Q:GPU 编码失败(Cannot load libnvidia-encode.so.1)?
A:驱动版本需 ≥ 570,并在 docker-compose.yml 中设置 NVIDIA_DRIVER_CAPABILITIES=all。若仍无法解决,可暂时使用 CPU 编码(libx264)。

Q:如何完全离线使用?
A:所有 Python 包已在构建时安装,模型通过挂载本地目录加载,无需联网。若需避免构建时下载依赖,可提前下载基础镜像和 pip 包,但默认配置已使用国内镜像加速。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0

主题

9

帖子

40

积分

注册会员

Rank: 1

积分
40
发表于 昨天 20:54 | 显示全部楼层
好,完整版来了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Lada|Jasna|JavPlayer 中文交流论坛 |网站地图

GMT+8, 2026-5-23 05:54 , Processed in 0.028767 second(s), 24 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表