LinuxDo 新帖推送
183 subscribers
252K photos
315K links
Download Telegram
标题: Z-Image-Turbo 本地部署折腾
作者: #合本丶
板块: #开发调优
编号: 1234434
帖子: https://linux.do/t/topic/1234434
时间: 2025-11-29 06:54:47
摘要:
起初也就是想尝尝鲜,直接拉取了 Z-Image-Turbo 的原始版本。结果本体就有 30G 左右,官方推荐 BF16 精度 ,至少得 16G 显存 才能顺畅跑起来
我手里只有这台 RTX 4060 Laptop (8G),跑了一下结果:

跑图实测:仅仅生成一张 768p 的图片。
耗时:居然用了 6 分半钟!
这速度基本没法玩,完全是在用系统内存硬磨。

实在受不了这个速度,我去咨询了一下 AI,才发现原来 Civitai(C站)上早就有人发了 FP8 精度版本 和 Q版量化模型。

果断换路:直接下载了 FP8 版本,体积瞬间从 30G 瘦身到 6G 左右。
部署门槛:这个版本不能直接裸跑,得丢进 ComfyUI 或者 SD (Stable Diffusion) 环境里才行。

为了省事,也是为了稳定,我用了 B 站 秋叶 (aaaki) 大佬的 ComfyUI 整合包。经过一番折腾,终于凑齐了运行 Z-Image-Turbo FP8 所需的“三件套”:

主模型:Z-Image-Turbo (FP8)
文本理解:Qwen-4b (用于处理Prompt)
辅助模型:配套的 Flux VAE

搭建好工作流 (Workflow) 后,8g显存实际上机测试:




测试项目
分辨率
耗时
显存/状态
评价




BF16 原版
768p
6分30秒
显存溢出,借用内存
没法用


FP8 优化版
768p
15秒
8G 显存稳吃
起飞!


FP8 优化版
2K
1分30秒
爆显存 (Shared Memory)
勉强能跑



体验总结:
出图效果非常不错,NSFW 内容解锁丝滑,且肉眼看画质和 BF16 原版 几乎无差别,但速度提升了整整 26倍!
既然跑通了,就在本地搞点更有意思的。
搓了一个 FastAPI 服务,把这个 ComfyUI 的工作流封装了起来,并且适配了 OpenAI API 格式。
这样一来,配合写的一个简易测试页面(UI),现在可以直接像调用 ChatGPT 一样调用这个画图模型了,体验拉满
FastAPI
标题: 佬们,有没有什么当代推荐的手机型号...!纠结中...
作者: #吱吱zzZ
板块: #搞七捻三
编号: 1234436
帖子: https://linux.do/t/topic/1234436
时间: 2025-11-29 07:00:58
摘要:
“当代”,哈哈哈哈哈主要是、想从一点考虑各种搭便捷性(比如我现在用的刚出那会儿入的荣耀70 Pro,前几年记得想装个谷歌框架结果显示机型系统完全不兼容什么的(也可能其实还有什么黑科技but我也没研究?),移动端几乎已经与墙外的世界隔绝好几年了)、玩AI友好性(比如SillyTavern安卓能本地部署,就只能云端?多年使用习惯和设备原因我还是比起倾向安卓一点…)等这些特征来考虑。
拍摄需求倒都没有那么高了,反正用荣耀太久已经被调教好了哈哈哈(都是泪)然后最近觉得它信号还越来越不好,按理说手机除了电池性能降了点其实爱护得挺好,但日常和同学同时启动网页转到最后一个才出来了,抢课永远只能抢剩下的。。。
游戏需求也不是很高,今年玩得少 也主要转电脑端游了,其他性价比什么的也不用太纠结,主要想了解了解大家对自己的手机型号(/or了解的机型?)有没有一些推荐/吐槽…
荣耀我真得要控制你了
标题: 发现一个网页版的.py转.exe
作者: #doing1024
板块: #开发调优
编号: 1234495
帖子: https://linux.do/t/topic/1234495
时间: 2025-11-29 08:13:30
摘要:
py2exe.com





Convert py to exe online

py2exe.com - the first online Python to EXE compiler












我平时电脑上装的是arch linux,但是要把写好的脚本发给朋友的时候需要转为exe,然后就找到了这个网站。
很方便,支持第三方包、多文件、自定义图标,具体见网站的介绍。
标题: Canva居然能发到933333这样的验证码
作者: #nullptr
板块: #搞七捻三
编号: 1234542
帖子: https://linux.do/t/topic/1234542
时间: 2025-11-29 08:45:36
摘要:
百年一遇的5连验证码,我都怀疑到底是不是真正随机出来的
标题: aws是不是各种隐藏收费的坑呀?
作者: #undefined
板块: #搞七捻三
编号: 1234549
帖子: https://linux.do/t/topic/1234549
时间: 2025-11-29 08:48:59
摘要:
第一次碰aws。
昨天新注册了个aws账号,主要是想着用ses发邮件的。
然后发现送了半年免费+100刀赠金。

想着反正白送,就打算开个ec2看看,结果立马迷糊了。。
边问gemini边倒腾,然后gemini一个劲的提示这有坑,那有坑。。。
关键aws界面上也没写。。
话说大伙有在啥地方被aws坑过么?我好避避坑。
标题: 《哆啦A梦小课堂:后Scaling时代的AI进化论》
作者: #kenmick
板块: #开发调优
编号: 1234559
帖子: https://linux.do/t/topic/1234559
时间: 2025-11-29 08:55:15
摘要:
取材:Ilya 最新访谈 We’re moving from the age of scaling to the age of research
分镜:Gemini 3 Pro
作画:Nano Banana Pro
标题: 不懂就问,求助!!!关于甲骨文服务器线路问题。
作者: #Devo
板块: #搞七捻三
编号: 1234560
帖子: https://linux.do/t/topic/1234560
时间: 2025-11-29 08:55:25
摘要:
佬友们,前一阵刚过了甲骨文账号,我又升级了账号

现在我绑了3个区:
主区:阿什本
一个首尔,一个东京。
我家用和公司都是电信。
去阿什本稳定200ms的延时,去首尔要300ms,去东京直接稳定丢包。
我有个疑问就是我假设买个香港出口去这3个区会有改善嘛?还是买国内的呢?还是其他区域呢?求推荐

谢谢佬
标题: 各位佬们,不懂为什么不能激活GCP,不激活3个月到期还是付费用户吗
作者: #wang yongjie
板块: #搞七捻三
编号: 1234674
帖子: https://linux.do/t/topic/1234674
时间: 2025-11-29 09:13:43
摘要:
我的马上就要到期了,要不要激活
标题: MLNLP 2025 live
作者: #stevessr
板块: #前沿快讯
编号: 1234675
帖子: https://linux.do/t/topic/1234675
时间: 2025-11-29 09:13:53
摘要:
event.baai.ac.cn





智源社区活动

听AI讲座来智源社区,面向AI研究者、开发者的最新AI讲座活动、学术会议、直播回放













“第四届机器学习算法与自然语言处理大会”(MLNLP2025 )将于2025年11月29日-11月30日 线上召开,大会由中国中文信息学会青工委、中国中文信息学会大模型与生成专委、MLNLP社区 联合主办,智源社区提供社区支持。
标题: 突发⚠️ App store 土区内购GPT被限制
作者: #tyri
板块: #搞七捻三
编号: 1234717
帖子: https://linux.do/t/topic/1234717
时间: 2025-11-29 09:25:31
摘要:
前言:chatgpt即将全球“统一定价”
解决方案:联系Apple support,得到的回复是48小时后重试
有经历过的兄弟两天后成功恢复的吗?
土区云居民大面积限购
标题: Ikuncode缓存命中测试
作者: #lizzzc
板块: #开发调优
编号: 1234720
帖子: https://linux.do/t/topic/1234720
时间: 2025-11-29 09:27:10
摘要:
突发奇想测试缓存命中,因为有的时候缓存命中算法的好坏也会决定用户的性价比,同时也会识别是否为官方API。
基于中转可用性网站2025.11.26排行,选择用Ikuncode进行测试。
非常感谢Ikuncode站长提供的key @zyoung
下面是详细报告
1. 摘要
本次测试基于 Titan-DB 基准技术文档(虚拟构建)及 6 个标准化测试场景,对大模型中转系统的 Prompt Caching 命中率进行了系统性测评。实验涵盖冷启动、完全命中、前缀命中、短请求过滤、内容变更、模型隔离等典型场景,旨在客观评估缓存机制的有效性、稳定性与可复现性。
通过对 6 种典型情况仿真测试,结论如下:


功能性验证: 网关成功实现了基于 Anthropic 协议的缓存机制,精确匹配场景下的请求级命中率达 100%。


效能指标: 在混合压力测试下,综合 Token 命中率为 19.92%,直接成本节省率为 13.50%。


架构特征: 测试揭示该网关后端采用无状态轮询负载均衡策略,导致前缀复用场景在跨节点分发时存在缓存漂移现象。


安全性: 跨模型及内容变更场景均通过了隔离性验证,未发现数据串扰风险。


2. 审计方法论
本次测试采用黑盒探测法,通过构建确定性的基准语料(Titan-DB Technical Docs, Length: 2529 Tokens),文档内容包含:架构描述、配置参数、API 接口定义和错误码,模拟真实的开发者文档。
评价指标体系如下:


CHR (综合命中率): 缓存读取 Token 总数与总输入 Token 数的比值

定义:衡量全局流量中通过缓存直接服务的比例,反映算力节省程度。



CWR (缓存写入占比): 缓存写入 Token 总数与总输入 Token 数的比值

定义:衡量流量中用于建立缓存(写入)的比例,反映系统的“冷启动”成本。



3. 实验数据详解
3.1 总体流量统计


总请求数: 6


总吞吐量: 12,694


总输出量: 2,012


3.2核心绩效指标



综合 Token
标题: 订单被L53取消
作者: #F-Droid
板块: #搞七捻三
编号: 1234731
帖子: https://linux.do/t/topic/1234731
时间: 2025-11-29 09:28:57
摘要: