Lada|JavPlayer 中文交流论坛

 找回密码
 立即注册
查看: 1608|回复: 21

lada模型训练要求太高了,显存需要24G+

[复制链接]

10

主题

64

帖子

184

积分

初级会员

Rank: 2

积分
184
发表于 2026-1-8 18:10:04 | 显示全部楼层 |阅读模式
云端GPU训练mosaic-restoration-basicvsrpp模型,显存直接占用20G+,
数据集还只是一个5分钟的视频,速度也很慢,先练练手,希望没炼错

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

10

主题

64

帖子

184

积分

初级会员

Rank: 2

积分
184
 楼主| 发表于 2026-1-8 18:43:18 | 显示全部楼层
本帖最后由 androw01 于 2026-1-14 21:20 编辑

看来要芭比q了,第二步转换trained weights into the GAN-compatible model报错


========================================
看了mmengine训练文档,开启AMP、bfloat16,BS设置为1,
显存训练显存可以控制在10G+左右,速度也会增加
回复

使用道具 举报

10

主题

64

帖子

184

积分

初级会员

Rank: 2

积分
184
 楼主| 发表于 2026-1-8 19:25:12 | 显示全部楼层
转换完成,到了训练第三步,显存直接占用24G+,恐怖如斯


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

10

主题

64

帖子

184

积分

初级会员

Rank: 2

积分
184
 楼主| 发表于 2026-1-8 21:25:00 | 显示全部楼层
已放弃,步骤太繁琐,坑太多,,还是更喜欢炼超分Real-Esrgan模型
回复

使用道具 举报

2

主题

94

帖子

625

积分

中级会员

Rank: 3Rank: 3

积分
625
发表于 2026-1-8 21:57:15 | 显示全部楼层
本帖最后由 wangsh 于 2026-1-8 21:58 编辑

楼主牛,有没有练好的Real-Esrgan 2x 或 3x模型分享?
回复

使用道具 举报

7

主题

106

帖子

1208

积分

中级会员

Rank: 3Rank: 3

积分
1208
发表于 2026-1-9 08:45:42 | 显示全部楼层
前排围观,感谢分享
回复

使用道具 举报

0

主题

88

帖子

459

积分

初级会员

Rank: 2

积分
459
发表于 2026-1-9 12:33:11 | 显示全部楼层
看起來好高端 這是把模組拿到雲端去操作的意思嗎?
回复

使用道具 举报

0

主题

5

帖子

18

积分

注册会员

Rank: 1

积分
18
发表于 2026-1-9 20:56:28 | 显示全部楼层
新人,虽然看不懂,不明觉厉
回复

使用道具 举报

0

主题

8

帖子

11

积分

注册会员

Rank: 1

积分
11
发表于 2026-1-10 03:39:03 | 显示全部楼层
不然呢。。。你以为呢。。。训练模型又不是部署模型进行推理,即便是可以部署在嵌入式设备的模型,训练的时候都会吃掉几十G显存,理论上几乎是没有上限的,有多少显存都可以通过训练时候的参数给你吃满。
回复

使用道具 举报

17

主题

176

帖子

1098

积分

中级会员

Rank: 3Rank: 3

积分
1098
发表于 2026-1-10 09:25:12 | 显示全部楼层
24g的显存,用5090的8卡机基本差不多吧。还是要H200?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Lada|Jasna|JavPlayer 中文交流论坛 |网站地图

GMT+8, 2026-4-10 07:20 , Processed in 0.031715 second(s), 25 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表