|
|
本帖最后由 hodalahiruma 于 2026-6-9 14:23 编辑
06/09 更新
视频信息:
FPRE-149-clip.mp4
分辨率:1920x1080
编码格式: H.264
位元率: 6233kbps
影格: 29.97fps
片长: 04:59
PC配置:
AMD Ryzen 5 5600x 3.7Ghz up to 4.6Ghz
内存: 32GB(8Gx4) 3200Mhz
显卡: RTX 4060 8G
OS:Windows 11
导出视频目录与暂存目录皆SSD硬盘上
测试模型: 三者皆 v4-fast,参数皆以软件系统默认值,lada-ex 另开 torchcodec 与 fast-pipeline 加速
Lada(0.11.0)
lada-cli.exe --input FPRE-149-clip.mp4 --output "c:\ctemp" --temporary-directory "e:\etemp" --output-file-pattern "{orig_file_name}-U.mp4" --mosaic-detection-model "v4-fast" --encoding-preset "hevc-nvidia-gpu-hq" --max-clip-length 180 --no-detect-face-mosaics --fp16 --device cuda:0
lada-ex(v0.12.1-dev torchcodec 0.14.0+cu130)
lada-cli.exe --input FPRE-149-clip.mp4 --output c:\ctemp --temporary-directory e:\etemp --output-file-pattern "{orig_file_name}.ladaEx-U.mp4" --mosaic-detection-model v4-fast --encoding-preset hevc-nvidia-gpu-hq --max-clip-length 90 --clip-overlap 8 --fp16 --device cuda:0 --tensorrt --fast-pipeline --torchcodec-encoder --hw-decode nvidia --hw-decode-detector nvidia
jasna(v0.6.2)
.\jasna-cli.exe --input FPRE-149-clip.mp4 --output c:\ctemp\FPRE-149-clip-jasna-U.mp4 --max-clip-size 90 --detection-model lada-yolo-v4 --working-directory e:\etemp --fp16 --device cuda:0 --detection-score-threshold 0.25 --temporal-overlap 8 --encoder-settings cq=26
心得: Jasna 更新至 0.6.2 后,lada-ex 再被反超
Lada 需时 279 秒,Lada-ex 需时 129 秒,Jasna 需时 96 秒
Jasna 快 lada 65.59%
Jasna 快 lada-ex 25.58%
============================================分隔線================================================
05/09 更新
视频信息:
FPRE-149-clip.mp4(切片)
1920x1080
格式: H.264
位元率: 6233kbps
影格: 29.97fps
片长: 04:59
PC配置:
AMD Ryzen 5 5600x 3.7Ghz up to 4.6Ghz
内存: 32GB(8Gx4) 3200Mhz
显卡: RTX 4060 8G
Windows 11
Lada(v0.11.0) ※使用 v4-fast 模型
"lada-cli.exe" --input FPRE-149-clip.mp4 --output "g:\gtemp" --temporary-directory "d:\dtemp" --output-file-pattern "{orig_file_name}-U.mp4" ^
More? --mosaic-detection-model "v4-fast" --encoding-preset "hevc-nvidia-gpu-hq" --max-clip-length 180 --fp16 --device cuda:0
处理中影片: 100%|████████████████████████████████████████████|已处理: 04:40 (8973f) | 剩余的: 0:00 (1f) | 速度: 34.7fps
lada-ex(0.12.1-dev+a2e8368) ※使用 v4-fast 模型
(lada-ex) E:\lada-ex>lada-cli.exe --input FPRE-149-clip.mp4 --output "g:\gtemp" --temporary-directory "d:\dtemp" --output-file-pattern "{orig_file_name}-ex-U.mp4" ^
More? --mosaic-detection-model v4-fast --encoding-preset hevc-nvidia-gpu-hq --max-clip-length 180 --fp16 --device cuda:0
Processing video: 100%|██████████████████████████████|Processed: 05:20 (8973f) | Remaining: 0:00 (0f) | Speed: 32.09fps
Processing audio
Restoration completed: g:\gtemp\FPRE-149-clip-ex-U.mp4
lada-ex(0.12.1-dev+a2e8368) ※开启 torchcodec(0.11.1) 编码、使用 v4-fast 模型
(lada-ex) E:\lada-ex>lada-cli.exe --input FPRE-149-clip.mp4 --output "g:\gtemp" --temporary-directory "d:\dtemp" --output-file-pattern "{orig_file_name}-ex-tc-U.mp4" ^
More? --mosaic-detection-model v4-fast --encoding-preset hevc-nvidia-gpu-hq --max-clip-length 180 --fp16 --device cuda:0 --fast-pipeline --torchcodec-encoder
2026-05-09 09:47:40,953 [WARNING] [lada] CUDA encode pipeline: Switching from TorchCodec to PyAV encoder.
Processing video: 100%|██████████████████████████████|Processed: 04:02 (8973f) | Remaining: 0:00 (0f) | Speed: 42.86fps
Processing audio
Restoration completed: g:\gtemp\FPRE-149-clip-ex-tc-U.mp4
lada-ex(0.12.1-dev+a2e8368) ※开启 torchcodec(0.11.1) 编码及 TensortRT 加速、使用 v4-fast 模型
(lada-ex) E:\lada-ex>lada-cli.exe --input FPRE-149-clip.mp4 --output "g:\gtemp" --temporary-directory "d:\dtemp" --output-file-pattern "{orig_file_name}-ex-tc-RT-U.mp4" ^
More? --mosaic-detection-model v4-fast --encoding-preset hevc-nvidia-gpu-hq --max-clip-length 180 --fp16 --device cuda:0 --fast-pipeline --torchcodec-encoder --tensorrt
2026-05-09 09:55:28,854 [WARNING] [lada] CUDA encode pipeline: Switching from TorchCodec to PyAV encoder.
Processing video: 0%| |Processed: 00:00 (0f) | Remaining: ? | Speed: ?[05/09/2026-09:55:31] [TRT] [W] Functionality provided through tensorrt.plugin module is experimental.
W0509 09:55:31.754000 6136 Lib\site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.
Processing video: 100%|██████████████████████████████|Processed: 03:35 (8973f) | Remaining: 0:00 (0f) | Speed: 51.99fps
Processing audio
Restoration completed: g:\gtemp\FPRE-149-clip-ex-tc-RT-U.mp4
Jasna (v0.6.0a5),官方默认值,使用 rfdetr-v5 模型、TensortRT 加速
E:\Jasna-0.6.0a5>jasna-cli.exe --input FPRE-149-clip.mp4 --output g:\gtemp\FPRE-149-clip-rfdetr-RT-U.mp4 --max-clip-size 90 --detection-model rfdetr-v5 --encoder-settings cq=22 --working-directory d:\dtemp --fp16 --device cuda:0
Processing video: 100%|███████████████████████████████|Processed: 04:10 (8973f) | Remaining: 0:00 (1f) | Speed: 38.9fps
Jasna (v0.6.0a5),使用 lada-yolo-v4(v4-fast) 模型、TensortRT 加速
E:\Jasna-0.6.0a5>jasna-cli.exe --input FPRE-149-clip.mp4 --output g:\gtemp\FPRE-149-clip-yolov4-RT-U.mp4 --max-clip-size 90 --detection-model lada-yolo-v4 --encoder-settings cq=22 --working-directory d:\dtemp --fp16 --device cuda:0
Processing video: 100%|███████████████████████████████|Processed: 02:15 (8973f) | Remaining: 0:00 (1f) | Speed: 78.1fps
心得: 和之前比较,CPU 升级有助于减少处理时间;jasna 使用 lada-yolo-v4(02:15) 比 lada(04:40) 快約 51.8%、比lada-ex(torchcodec & TensorRT)(03:35) 快約 37.2%
而 lada-ex 使用 torchcodec 及 TensorRT 加速(03:35),比不开 TensorRT(04:02) 快約 12.5% 、比 lada(04:40) 快約 23%
jasna 使用 rfdetr-v5 速度虽不是最快,但较不容易掉码,而 lada-ex 有 torchcodec 有机会反超 jasna
若使用 Linux 系统更可以让 torchcodec 使用 cuda 编码,有条件的朋友可以试下
国外论坛有人说速度是可以超过 jasna
============================================分隔線================================================
05/22 更新
torchcodec 终于支持在 windows 下使用 cuda 编码
以下是测试结果:
Lada-ex(0.12.1-dev+febcb3b) ※开启 torchcodec(0.13.0)使用 CUDA 加速、TensortRT 加速、使用 v4-fast 模型
lada-cli.exe --input FPRE-149-clip.mp4 --output "g:\gtemp" --temporary-directory "d:\dtemp" --output-file-pattern "{orig_file_name}-ex-tcCUDA-RT-U.mp4" ^
More? --mosaic-detection-model v4-fast --encoding-preset hevc-nvidia-gpu-hq --max-clip-length 180 --fp16 --device cuda:0 --fast-pipeline --torchcodec-encoder --tensorrt --hw-decode nvidia
2026-05-22 17:08:46,984 [WARNING] [lada.restorationpipeline.frame_restorer] MosaicDetector: Switching from NVIDIA to CPU decode (Intel QSV not available)
Processing video: 0%| |Processed: 00:00 (0f) | Remaining: ? | Speed: ?[05/22/2026-17:08:51] [TRT] [W] Functionality provided through tensorrt.plugin module is experimental.
W0522 17:08:51.467000 7312 Lib\site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.
Processing video: 100%|██████████████████████████████|Processed: 01:59 (8983f) | Remaining: 0:00 (1f) | Speed: 84.32fps
Processing audio
Restoration completed: g:\gtemp\output-ex-tcCUDA-RT-U.mp4
使用 torchcodec cuda 花费时间 01:59,比 05/09 使用 torchcode cpu 花费时间 03:35,快了 44.65%
比 Jasna 花费时间 02:15 被 lada-ex 反超
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|