魔搭 xGPU 创空间部署较大参数模型问题
沐雪Roleplay Qwen3-8B 微调模型 - 此为创空间链接
是这样的,我尝试在魔搭 xGPU 提供的免费 Ada 系列 / 48G 显存 / 8 vCPU / 64G 内存的免费创空间上部署一个 Qwen3-14B 的微调模型,推理框架使用 lmdeploy,float16 精度,采用先合并再部署的方式,但总是遇到 OOM,按说这个显存应该足够了
我开始以为是 lmdeploy kv 缓存的问题,调低点之后还是一样,又换 pytorch 原生试一下,照旧,但是这次的日志上说有 2 个进程分别占据了 20 多 GB 的显存
我也没办法了,只能换个参数小点的,用 Qwen3-8B,这次一次成功
之前我使用 llama-cpp-python 部署过 float16 精度的 Qwen3-14B 已转换为 gguf 的微调模型,一次成功
感觉很奇怪,但也不知道是哪里出了问题,只能看看各位佬有无这方面经验了
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: ACGURL)
沐雪Roleplay Qwen3-8B 微调模型 - 此为创空间链接
是这样的,我尝试在魔搭 xGPU 提供的免费 Ada 系列 / 48G 显存 / 8 vCPU / 64G 内存的免费创空间上部署一个 Qwen3-14B 的微调模型,推理框架使用 lmdeploy,float16 精度,采用先合并再部署的方式,但总是遇到 OOM,按说这个显存应该足够了
我开始以为是 lmdeploy kv 缓存的问题,调低点之后还是一样,又换 pytorch 原生试一下,照旧,但是这次的日志上说有 2 个进程分别占据了 20 多 GB 的显存
我也没办法了,只能换个参数小点的,用 Qwen3-8B,这次一次成功
之前我使用 llama-cpp-python 部署过 float16 精度的 Qwen3-14B 已转换为 gguf 的微调模型,一次成功
感觉很奇怪,但也不知道是哪里出了问题,只能看看各位佬有无这方面经验了
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: ACGURL)
不敢发布自己的第一个脚本(及趣事一则)
太紧张了,在犹豫要不要把自己的脚本发上greasy fork。
由于习惯新标签页打开论坛,但是现有的脚本多多少少都不适应自己的需求。正好L站的大家天天在说 vibe coding,我也想试一试,就趁着国庆节薅了站内某位富可敌国送的套餐,借助AI自己弄了个脚本,自动识别Discourse论坛并且对符合规则的链接用新标签页打开,在具体规则上和目前已有的脚本不太一样,更贴合自己的使用习惯。
本人一直是小白一枚,就连VS Code 和 git 都是一边问AI一边现场安装的,配置也配了一整天才终于把cc和codex的key什么的弄上去,javascript更是一点不会。经过三天三夜和AI的搏斗,最终搞出来一个感觉像样的脚本,用着顺手极了。
但是这脚本自己用着怎么样都无所谓,一考虑要不要发布到网上,立马压力倍增。总是担心会不会我一把它发出去,下一秒它就自己爆炸了,或者是发了才看到介绍里有个错别字,又或者有人来反馈有什么bug,但是我和AI没一个能改……
但是吧,脚本写都写了,万一能帮到同样操作习惯的人呢……
现在好纠结,有没有佬友来安慰一下或者提点建议 🥲。
顺带分享一则开发中的趣事。
AI给写的第一版代码里,基本功能都实现了,但是有严重的性能问题,导致我打开L站的每个帖子都要等10秒。
让AI修复这个问题,第二版代码的性能问题虽然有了改善,但是脚本原本应该实现的全部功能都莫名其妙不起作用了 😂
Vibe Coding,很神奇吧……准备好好学习一下了。
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 双色辉光)
太紧张了,在犹豫要不要把自己的脚本发上greasy fork。
由于习惯新标签页打开论坛,但是现有的脚本多多少少都不适应自己的需求。正好L站的大家天天在说 vibe coding,我也想试一试,就趁着国庆节薅了站内某位富可敌国送的套餐,借助AI自己弄了个脚本,自动识别Discourse论坛并且对符合规则的链接用新标签页打开,在具体规则上和目前已有的脚本不太一样,更贴合自己的使用习惯。
本人一直是小白一枚,就连VS Code 和 git 都是一边问AI一边现场安装的,配置也配了一整天才终于把cc和codex的key什么的弄上去,javascript更是一点不会。经过三天三夜和AI的搏斗,最终搞出来一个感觉像样的脚本,用着顺手极了。
但是这脚本自己用着怎么样都无所谓,一考虑要不要发布到网上,立马压力倍增。总是担心会不会我一把它发出去,下一秒它就自己爆炸了,或者是发了才看到介绍里有个错别字,又或者有人来反馈有什么bug,但是我和AI没一个能改……
但是吧,脚本写都写了,万一能帮到同样操作习惯的人呢……
现在好纠结,有没有佬友来安慰一下或者提点建议 🥲。
顺带分享一则开发中的趣事。
AI给写的第一版代码里,基本功能都实现了,但是有严重的性能问题,导致我打开L站的每个帖子都要等10秒。
让AI修复这个问题,第二版代码的性能问题虽然有了改善,但是脚本原本应该实现的全部功能都莫名其妙不起作用了 😂
Vibe Coding,很神奇吧……准备好好学习一下了。
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 双色辉光)
不是,L站的性压抑指数测试这么火了,给我干到B站首页通知书来了 😲
9 posts - 9 participants
Read full topic
via LINUX DO - 最新话题 (author: Megasoft)
Invalid media: image
9 posts - 9 participants
Read full topic
via LINUX DO - 最新话题 (author: Megasoft)
Invalid media: image
著名表演艺术家、导演、演员赵克明因病去世,享年93岁『轉』 | 老顽童爷爷
https://mp.weixin.qq.com/s/jt44i0DRkKMtc2OecOmOUw
guancha.cn
著名表演艺术家、导演、演员赵克明因病去世,享年93岁
Read full topic
via LINUX DO - 最新话题 (author: stevessr)
Invalid media:
image
image
https://mp.weixin.qq.com/s/jt44i0DRkKMtc2OecOmOUw
guancha.cn
著名表演艺术家、导演、演员赵克明因病去世,享年93岁
8 posts - 5 participants
[!info]+
据西安话剧院10月5日凌晨消息,著名表演艺术家、导演、一级演员赵克明因病于2025年10月4日15时55分逝世,享年93岁。
他扮演的儿童科幻电视系列剧《快乐星球》中的“老顽童爷爷”,深受广大观众喜爱,是许多80后、90后的“童年回忆”。此外,他还参演了《晚秋的旋律》《杨家将》《罄声悠扬》等多部电视剧。
Read full topic
via LINUX DO - 最新话题 (author: stevessr)
Invalid media:
image
image
身为房东,应该买什么家用消防物品
在京东看了153元的一套,评论说防火毯外露玻璃纤维,扎人。。
还有别的推荐吗
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 可爱滴捏~)
在京东看了153元的一套,评论说防火毯外露玻璃纤维,扎人。。
还有别的推荐吗
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 可爱滴捏~)
今天,我遇到了一件无语的事
今天真是遇到件无语的事,气死我了
我逛QQ时,点进一个很久没看的群,发现有个人连续几天都在发
结果,这人直接攻击我的网站,回复我一样的话。我寻思我也没得罪他啊
然后我就找到了他的名字,问这是不是他,结果他不回复了。我以为这事就这么过去了,他总该收敛点。没想到一个小时后,他又回来了
我问他这么久去哪了,他上来就对我一顿问候
主要我没说错啊,他这么发是毫无价值啊,然后他就给我拉黑了
我气不过,就把他之前的聊天记录发到群里,想让大家看看他是什么样的人。可没想到,其他人竟然也反过来指责我
难道我真的做错了吗?感觉这个群里已经没几个正常人了。唉,可惜我现在不像以前那么冲动了,要是搁以前,我早就把站打了,不过我也知道,那样做其实毫无意义的
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: MingYued)
Invalid media:
image
image
image
image
image
image
image
今天真是遇到件无语的事,气死我了
我逛QQ时,点进一个很久没看的群,发现有个人连续几天都在发
求打。下面有人评论说毫无价值,我觉得说得没错,因为他这几天都这么发,于是也跟了一句毫无价值结果,这人直接攻击我的网站,回复我一样的话。我寻思我也没得罪他啊
然后我就找到了他的名字,问这是不是他,结果他不回复了。我以为这事就这么过去了,他总该收敛点。没想到一个小时后,他又回来了
我问他这么久去哪了,他上来就对我一顿问候
主要我没说错啊,他这么发是毫无价值啊,然后他就给我拉黑了
我气不过,就把他之前的聊天记录发到群里,想让大家看看他是什么样的人。可没想到,其他人竟然也反过来指责我
难道我真的做错了吗?感觉这个群里已经没几个正常人了。唉,可惜我现在不像以前那么冲动了,要是搁以前,我早就把站打了,不过我也知道,那样做其实毫无意义的
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: MingYued)
Invalid media:
image
image
image
image
image
image
image
有没有可以看SVIP和超前点映的iOS的免费的影视软件推荐
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Zhou Mingkang)
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Zhou Mingkang)
Introducting RiCA: 为生成式人工智能带来并行思考能力(大饼)(开发中)
详情请参见鄙人拙作(???): GitHub - rica-team/rica-server
暂时用不了, 学业原因, 维护比较费劲. 要是有人愿意帮忙那就更好了🙇
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Alexander Green)
详情请参见鄙人拙作(???): GitHub - rica-team/rica-server
暂时用不了, 学业原因, 维护比较费劲. 要是有人愿意帮忙那就更好了🙇
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Alexander Green)
仅限国庆期间(5折-8折)
evanmi.top
Evan's Domain Name
咪表标价或折扣的基础上,再打5折-8折。具体折扣请联系咪表~
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Evan)
evanmi.top
Evan's Domain Name
咪表标价或折扣的基础上,再打5折-8折。具体折扣请联系咪表~
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Evan)
重磅更新!中国地震局:推进地震预警信息接入苹果iOS系统功能
对于使用iPhone的用户来说,很快也能享受到地震预警信息提示了。
近日有公众向中国地震局询问:地震局能否在地震系统上制作iOS预警应用呢?以及小区广播功能?另外能否推进在地震预警上的0级短信覆盖呢?
对此,地震局监测司回复:中国地震局高度重视地震预警服务工作,正在积极对接相关市场主体,推进地震预警信息接入iOS系统功能。现阶段,您可通过“中国地震台网”及各地地震预警微信小程序在iOS系统上获取权威地震预警信息。
小区广播和0级短信由工业和信息化部门主管,各地通信管理局具体监管。
目前,我局正在积极推进与相关部门在地震预警信息服务方面的沟通合作,争取尽快实现更多渠道更大范围服务覆盖。后续进展敬请留意相关部门公告。
finance.sina.com.cn – 5 Oct 25
果粉终于等到!中国地震局:推进地震预警信息接入苹果iOS系统功能
果粉终于等到!中国地震局:推进地震预警信息接入苹果iOS系统功能
7 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
Invalid media:
image
image
对于使用iPhone的用户来说,很快也能享受到地震预警信息提示了。
近日有公众向中国地震局询问:地震局能否在地震系统上制作iOS预警应用呢?以及小区广播功能?另外能否推进在地震预警上的0级短信覆盖呢?
对此,地震局监测司回复:中国地震局高度重视地震预警服务工作,正在积极对接相关市场主体,推进地震预警信息接入iOS系统功能。现阶段,您可通过“中国地震台网”及各地地震预警微信小程序在iOS系统上获取权威地震预警信息。
小区广播和0级短信由工业和信息化部门主管,各地通信管理局具体监管。
目前,我局正在积极推进与相关部门在地震预警信息服务方面的沟通合作,争取尽快实现更多渠道更大范围服务覆盖。后续进展敬请留意相关部门公告。
finance.sina.com.cn – 5 Oct 25
果粉终于等到!中国地震局:推进地震预警信息接入苹果iOS系统功能
果粉终于等到!中国地震局:推进地震预警信息接入苹果iOS系统功能
7 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
Invalid media:
image
image
国庆总结:又忘了哥
国庆这几天一直在刷开心元元切片,从七擒孟获入坑,再到都钊老师七次连麦,有点停不下来了,这能对吗?都是哥们!
4 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: ZHE228)
国庆这几天一直在刷开心元元切片,从七擒孟获入坑,再到都钊老师七次连麦,有点停不下来了,这能对吗?都是哥们!
4 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: ZHE228)
佬来认一下在哪
39 posts - 19 participants
Read full topic
via LINUX DO - 最新话题 (author: 42)
Invalid media: image
39 posts - 19 participants
Read full topic
via LINUX DO - 最新话题 (author: 42)
Invalid media: image
502的Z,商机来了
😆 这不得去卖个高防 😆
12 posts - 8 participants
Read full topic
via LINUX DO - 最新话题 (author: YougLin)
Invalid media: image
😆 这不得去卖个高防 😆
12 posts - 8 participants
Read full topic
via LINUX DO - 最新话题 (author: YougLin)
Invalid media: image
在没有稳定cc的日子里安然过渡
众所周知cc渠道最近又被A社搞了,这里是我的过渡方案
项目地址: GitHub - BenedictKing/claude-proxy: only one claude code proxy
1. 用魔搭的glm每日免费次数。
2. 用gemini替代。
首选是 【Undying API永不跑路】vertex-ai满血gemini api恢复供应,抽奖送最高$1000额度 因为有抽中他家的$100额度,vertex-ai分组表现挺好。
其次是用 GitHub - justlovemaki/AIClient-2-API: AIClient2API:模拟Gemini CLI,Qwen Code和Kiro 客户端请求,兼容OpenAI API。可每日千次Gemini模型请求, 免费使用Kiro内置Claude模型。通过API轻松接入任何客户端,让AI开发更高效! 自己搭建geminicli转发的cc接口,但是似乎智商上差一点。
3. 用其他公益站的gpt-5等
4. 等其他cc渠道恢复了一键切换,什么都不影响。
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Forward)
Invalid media:
image
image
image
image
众所周知cc渠道最近又被A社搞了,这里是我的过渡方案
项目地址: GitHub - BenedictKing/claude-proxy: only one claude code proxy
1. 用魔搭的glm每日免费次数。
2. 用gemini替代。
首选是 【Undying API永不跑路】vertex-ai满血gemini api恢复供应,抽奖送最高$1000额度 因为有抽中他家的$100额度,vertex-ai分组表现挺好。
其次是用 GitHub - justlovemaki/AIClient-2-API: AIClient2API:模拟Gemini CLI,Qwen Code和Kiro 客户端请求,兼容OpenAI API。可每日千次Gemini模型请求, 免费使用Kiro内置Claude模型。通过API轻松接入任何客户端,让AI开发更高效! 自己搭建geminicli转发的cc接口,但是似乎智商上差一点。
3. 用其他公益站的gpt-5等
4. 等其他cc渠道恢复了一键切换,什么都不影响。
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Forward)
Invalid media:
image
image
image
image
有没有用过 乌鸫,给iPad2018也就是6代降级的?
ipad 2018 乌鸫降级,有用过的吗?
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Linux.Do.Zz)
ipad 2018 乌鸫降级,有用过的吗?
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Linux.Do.Zz)
请问各位佬有没有比较轻量的 api 网关的开源项目?
就是管理自己的api接口,为api 接口提供代理转发服务,网关同时提供负载均衡,鉴权,限流,熔断这些服务的项目.
我搜了一下有一个叫 kong 和 APISIX,好像都很臃肿啊.请问佬们有没有那种轻量一点的.
我问的是通用api网关,用于部署私人api服务.
不是特指大模型的 api 网关.
5 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 墨菲)
就是管理自己的api接口,为api 接口提供代理转发服务,网关同时提供负载均衡,鉴权,限流,熔断这些服务的项目.
我搜了一下有一个叫 kong 和 APISIX,好像都很臃肿啊.请问佬们有没有那种轻量一点的.
我问的是通用api网关,用于部署私人api服务.
不是特指大模型的 api 网关.
5 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 墨菲)
【小白求助】gcli2api反代的环境变量设置
我之前部署了站内佬的反代项目gcli2api,在使用的过程当中需要手动开启,修改完一些配置后还需要一直挂着,所以我添加了一个vbs让它开机自启,也没有烦人的黑框一直挂着,但依然在每次重启电脑后要去控制面板改改其他配置,所以我想按照项目作者的提示改一下环境变量。
我将.env.example文件修改好并重命名为.env并保存(rt),重启项目发现环境变量没有生效,我去问AI也没解决,想求助一下站内的佬。
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: PATMON)
Invalid media: image
我之前部署了站内佬的反代项目gcli2api,在使用的过程当中需要手动开启,修改完一些配置后还需要一直挂着,所以我添加了一个vbs让它开机自启,也没有烦人的黑框一直挂着,但依然在每次重启电脑后要去控制面板改改其他配置,所以我想按照项目作者的提示改一下环境变量。
我将.env.example文件修改好并重命名为.env并保存(rt),重启项目发现环境变量没有生效,我去问AI也没解决,想求助一下站内的佬。
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: PATMON)
Invalid media: image
蜂巢的激活邮件多久收到啊
今天下午刚注册的蜂巢,用的谷歌邮箱,从发送激活邮件开始,已经过去三个小时了,还没收到,垃圾箱也都看了没有,邮箱也没错啊。这是咋回事啊,一般多久能收到啊 😂
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: zlinux)
今天下午刚注册的蜂巢,用的谷歌邮箱,从发送激活邮件开始,已经过去三个小时了,还没收到,垃圾箱也都看了没有,邮箱也没错啊。这是咋回事啊,一般多久能收到啊 😂
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: zlinux)