Lada|JavPlayer 中文交流论坛

 找回密码
 立即注册
查看: 1352|回复: 21

lada模型训练要求太高了,显存需要24G+

[复制链接]

10

主题

61

帖子

162

积分

初级会员

Rank: 2

积分
162
发表于 2026-1-8 18:10:04 | 显示全部楼层 |阅读模式
云端GPU训练mosaic-restoration-basicvsrpp模型,显存直接占用20G+,
数据集还只是一个5分钟的视频,速度也很慢,先练练手,希望没炼错

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

10

主题

61

帖子

162

积分

初级会员

Rank: 2

积分
162
 楼主| 发表于 2026-1-8 18:43:18 | 显示全部楼层
本帖最后由 androw01 于 2026-1-14 21:20 编辑

看来要芭比q了,第二步转换trained weights into the GAN-compatible model报错


========================================
看了mmengine训练文档,开启AMP、bfloat16,BS设置为1,
显存训练显存可以控制在10G+左右,速度也会增加
回复

使用道具 举报

10

主题

61

帖子

162

积分

初级会员

Rank: 2

积分
162
 楼主| 发表于 2026-1-8 19:25:12 | 显示全部楼层
转换完成,到了训练第三步,显存直接占用24G+,恐怖如斯


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

10

主题

61

帖子

162

积分

初级会员

Rank: 2

积分
162
 楼主| 发表于 2026-1-8 21:25:00 | 显示全部楼层
已放弃,步骤太繁琐,坑太多,,还是更喜欢炼超分Real-Esrgan模型
回复

使用道具 举报

2

主题

81

帖子

555

积分

中级会员

Rank: 3Rank: 3

积分
555
发表于 2026-1-8 21:57:15 | 显示全部楼层
本帖最后由 wangsh 于 2026-1-8 21:58 编辑

楼主牛,有没有练好的Real-Esrgan 2x 或 3x模型分享?
回复

使用道具 举报

7

主题

103

帖子

1188

积分

中级会员

Rank: 3Rank: 3

积分
1188
发表于 2026-1-9 08:45:42 | 显示全部楼层
前排围观,感谢分享
回复

使用道具 举报

0

主题

73

帖子

403

积分

初级会员

Rank: 2

积分
403
发表于 2026-1-9 12:33:11 | 显示全部楼层
看起來好高端 這是把模組拿到雲端去操作的意思嗎?
回复

使用道具 举报

0

主题

5

帖子

13

积分

注册会员

Rank: 1

积分
13
发表于 2026-1-9 20:56:28 | 显示全部楼层
新人,虽然看不懂,不明觉厉
回复

使用道具 举报

0

主题

8

帖子

11

积分

注册会员

Rank: 1

积分
11
发表于 2026-1-10 03:39:03 | 显示全部楼层
不然呢。。。你以为呢。。。训练模型又不是部署模型进行推理,即便是可以部署在嵌入式设备的模型,训练的时候都会吃掉几十G显存,理论上几乎是没有上限的,有多少显存都可以通过训练时候的参数给你吃满。
回复

使用道具 举报

17

主题

169

帖子

1061

积分

中级会员

Rank: 3Rank: 3

积分
1061
发表于 2026-1-10 09:25:12 | 显示全部楼层
24g的显存,用5090的8卡机基本差不多吧。还是要H200?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Lada|JavPlayer 中文交流论坛 |网站地图

GMT+8, 2026-2-24 05:20 , Processed in 0.029592 second(s), 24 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表