Docker 安装包 Video Pipeline – 视频去码·字幕翻译·合成 1.0

xiguan99 · 发表于 2026-5-22 19:06:15

本帖最后由 xiguan99 于 2026-5-26 23:16 编辑

Video Pipeline – 视频去码·字幕翻译·合成
基于 Docker 的全自动视频处理流水线，提供 Web 管理界面，一键完成马赛克移除 → 日语语音识别/翻译 → 中文字幕合成。

核心功能
视频去码：使用 Lada 移除马赛克，支持 GPU 推理与硬件编码加速（NVENC）。

语音转字幕：集成 Faster-Whisper 海南鸡版，将日语语音翻译为中文并生成字幕。

视频合成：通过 FFmpeg 将字幕烧录（硬字幕）或封装（软字幕）到成品视频中，支持 GPU 硬件编码（h264_nvenc）。

Web 管理界面：暗色主题仪表盘，可视化控制全部流程。

视频列表自动刷新，递归扫描子文件夹

文件状态实时显示（待处理/排队中/去码中/字幕中/合成中/已完成）

步骤开关（去码、字幕、合成）滑块控制

批量处理、隐藏已处理视频、一键显示全部

全局设置：Lada 模型选择、编码预设、Whisper 参数、FFmpeg 字幕模式等

硬件监控侧边栏（GPU/CPU/内存）

处理后直接在线播放成品，或从输出目录获取文件

软件版本
最新版本：v1.0（2026-05-22）

Docker 镜像：基于 nvidia/cuda:12.8.0-cudnn-runtime-ubuntu22.04，内置 Python 3.12、FFmpeg（带 NVENC 支持）、Lada、Faster-Whisper 等。

运行要求
硬件
支持 NVIDIA GPU（推荐 Pascal 及以上架构，如 GTX 10 系列、RTX 20/30/40 系列）

显存：≥ 6 GB（建议 8 GB 以上，用于处理 1080p 视频）

磁盘空间：镜像约 10 GB，模型文件约 3–5 GB（独立挂载）

软件
操作系统：Windows 10/11（需 WSL 2）或 Linux 发行版（推荐 Ubuntu 22.04）

Docker：Docker Desktop（Windows）或 Docker Engine + NVIDIA Container Toolkit（Linux）

NVIDIA 驱动：≥ 570.0（如需 NVENC GPU 硬件编码，否则仅影响编码速度）

安装说明
1. 准备项目文件
下载或克隆本仓库到本地，例如Ubuntu fnOS 或者 Windows 下使用 WSL：

FFMPEG 依赖单独下载推荐迅雷放到根目录在构建
https://github.com/BtbN/FFmpeg-B ... -linux64-gpl.tar.xz

bash
wsl
cd ~
cd video-pipeline
（若无法联网，可将备份压缩包解压至此）

2. 配置模型路径
项目需要两个模型目录（需提前下载模型文件并放置在宿主机）：

Lada 模型：默认路径 D:\soft\lada-v0.11.0\_internal\model_weights（WSL 中对应 /mnt/d/soft/lada-v0.11.0/_internal/model_weights）

Whisper 模型：默认路径 D:\whisper-large-v2-translate-zh-v0.2-st

如果模型放在其他位置，请编辑 docker-compose.yml 中的卷挂载路径：

yaml
volumes:
- /你的实际路径/lada_models:/app/lada_models:ro
- /你的实际路径/whisper_model:/app/whisper_model:ro
3. 创建输入/输出目录
默认使用 E:\input（待处理视频）和 E:\output（成品输出），也可在 docker-compose.yml 中修改。

4. 构建并启动容器
bash
docker-compose build
docker-compose up -d
首次构建会下载基础镜像和 Python 依赖，国内用户可在 Dockerfile 中看到已配置阿里云镜像源和清华 pip 源，速度较快。
构建完成后打开浏览器访问 http://localhost:8000。

5. 处理视频
将需要处理的视频放入输入目录（支持子文件夹）。

点击“刷新列表”，视频将显示在左侧。

通过全局设置调整参数（可选，默认已优化）。

点击单个视频的“开始”按钮，或勾选多个后点击“批量处理”。

等待进度条完成，状态变为“已完成”后，文件名会变为可点击的链接，直接播放成品。

参数调整
Lada 去码：可切换 CPU/GPU、选择编码预设（HEVC/H.264 GPU 加速等）、修复模型、检测模型、片段长度等。

Whisper 字幕：可指定模型路径、语言、设备、任务（转录或翻译）、解码参数。

FFmpeg 合成：可选择硬字幕（烧录）或软字幕（封装），支持 GPU 硬件编码器（h264_nvenc）。

文件命名规则
输入文件 video.mp4 将产生：

去码后视频：video-U.mp4

字幕文件：video-U.srt

最终成品：video-UC.mp4（存放在输出目录的同名子文件夹中）

常见问题
Q：页面一直“加载中”怎么办？
A：检查浏览器控制台（F12）是否有报错，同时确认输入目录是否存在且包含视频文件。

Q：任务失败显示“Lada 去码失败”或“字幕文件为空”？
A：通常是因为模型文件未正确挂载或 VAD 离线环境未配置。可尝试：

确认模型路径正确且文件完整。

进入容器手动运行 lada-cli --help 或 python infer.py --help 检查环境。

暂时关闭 VAD（修改 app/tasks.py 中配置文件 vad_filter: false）以保证离线稳定性。

Q：GPU 编码失败（Cannot load libnvidia-encode.so.1）？
A：驱动版本需 ≥ 570，并在 docker-compose.yml 中设置 NVIDIA_DRIVER_CAPABILITIES=all。若仍无法解决，可暂时使用 CPU 编码（libx264）。

Q：如何完全离线使用？
A：所有 Python 包已在构建时安装，模型通过挂载本地目录加载，无需联网。若需避免构建时下载依赖，可提前下载基础镜像和 pip 包，但默认配置已使用国内镜像加速。

实测：2080TI 22G 单卡开2个lada 流畅 3个lada极限双卡同时可以跑6个lada实例

o4andv1 · 发表于 2026-5-22 20:54:10

好，完整版来了

touch999 · 发表于 2026-5-23 19:05:33

没有地址啊

akiralok · 发表于 2026-5-24 12:54:39

地址....???

lisamdt · 发表于 2026-5-26 15:46:11

真牛人！感谢分享

xiguan99 · 发表于 2026-5-26 16:18:07

有一些BUG 还在优化然后打包docker镜像24G 我现在Emo了在想办法怎么缩小或者做成dockerfile

现在已经优化到1张2080TI 同时跑2个Lada不卡极限3个 2张2080TI 同时跑6个

lisamdt · 发表于 2026-5-26 16:39:06

akiralok 发表于 2026-5-24 12:54
地址....???

啥情况，有地址能下载吗？同问

qinsese · 发表于 2026-5-26 16:55:35

期待发布

897992747 · 发表于 2026-5-27 03:56:45

66666
66666

djaafer · 发表于 2026-5-27 09:40:32

我买了金币都扣了怎么还显示购买

		自动登录	找回密码
密码			立即注册

[软件下载] Docker 安装包 Video Pipeline – 视频去码·字幕翻译·合成 1.0

本帖子中包含更多资源

本帖子中包含更多资源