LinuxDo 新帖推送

标题: Z-Image-Turbo 本地部署折腾
作者: #合本丶
板块: #开发调优
编号: 1234434
帖子: https://linux.do/t/topic/1234434
时间: 2025-11-29 06:54:47
摘要:

起初也就是想尝尝鲜，直接拉取了 Z-Image-Turbo 的原始版本。结果本体就有 30G 左右，官方推荐 BF16 精度 ，至少得 16G 显存 才能顺畅跑起来
我手里只有这台 RTX 4060 Laptop (8G)，跑了一下结果：

跑图实测：仅仅生成一张 768p 的图片。
耗时：居然用了 6 分半钟！
这速度基本没法玩，完全是在用系统内存硬磨。

实在受不了这个速度，我去咨询了一下 AI，才发现原来 Civitai（C站）上早就有人发了 FP8 精度版本 和 Q版量化模型。

果断换路：直接下载了 FP8 版本，体积瞬间从 30G 瘦身到 6G 左右。
部署门槛：这个版本不能直接裸跑，得丢进 ComfyUI 或者 SD (Stable Diffusion) 环境里才行。

为了省事，也是为了稳定，我用了 B 站 秋叶 (aaaki) 大佬的 ComfyUI 整合包。经过一番折腾，终于凑齐了运行 Z-Image-Turbo FP8 所需的“三件套”：

主模型：Z-Image-Turbo (FP8)
文本理解：Qwen-4b (用于处理Prompt)
辅助模型：配套的 Flux VAE

搭建好工作流 (Workflow) 后，8g显存实际上机测试：




测试项目
分辨率
耗时
显存/状态
评价




BF16 原版
768p
6分30秒
 显存溢出，借用内存
没法用


FP8 优化版
768p
15秒
 8G 显存稳吃
起飞！


FP8 优化版
2K
1分30秒
 爆显存 (Shared Memory)
勉强能跑



 体验总结：
出图效果非常不错，NSFW 内容解锁丝滑，且肉眼看画质和 BF16 原版 几乎无差别，但速度提升了整整 26倍！
既然跑通了，就在本地搞点更有意思的。
搓了一个 FastAPI 服务，把这个 ComfyUI 的工作流封装了起来，并且适配了 OpenAI API 格式。
这样一来，配合写的一个简易测试页面（UI），现在可以直接像调用 ChatGPT 一样调用这个画图模型了，体验拉满
FastAPI

2 views22:56

LinuxDo 新帖推送

标题: 佬们，有没有什么当代推荐的手机型号...！纠结中...
作者: #吱吱zzZ
板块: #搞七捻三
编号: 1234436
帖子: https://linux.do/t/topic/1234436
时间: 2025-11-29 07:00:58
摘要:

“当代”，哈哈哈哈哈主要是、想从一点考虑各种搭便捷性（比如我现在用的刚出那会儿入的荣耀70 Pro，前几年记得想装个谷歌框架结果显示机型系统完全不兼容什么的（也可能其实还有什么黑科技but我也没研究?），移动端几乎已经与墙外的世界隔绝好几年了）、玩AI友好性（比如SillyTavern安卓能本地部署，就只能云端？多年使用习惯和设备原因我还是比起倾向安卓一点…）等这些特征来考虑。
拍摄需求倒都没有那么高了，反正用荣耀太久已经被调教好了哈哈哈（都是泪）然后最近觉得它信号还越来越不好，按理说手机除了电池性能降了点其实爱护得挺好，但日常和同学同时启动网页转到最后一个才出来了，抢课永远只能抢剩下的。。。
游戏需求也不是很高，今年玩得少 也主要转电脑端游了，其他性价比什么的也不用太纠结，主要想了解了解大家对自己的手机型号（/or了解的机型?）有没有一些推荐/吐槽…
荣耀我真得要控制你了

2 views23:01

LinuxDo 新帖推送

标题: 发现一个网页版的.py转.exe
作者: #doing1024
板块: #开发调优
编号: 1234495
帖子: https://linux.do/t/topic/1234495
时间: 2025-11-29 08:13:30
摘要:

py2exe.com
  

  
    

Convert py to exe online

  py2exe.com - the first online Python to EXE compiler


  

  
    
    
  

  


我平时电脑上装的是arch linux，但是要把写好的脚本发给朋友的时候需要转为exe，然后就找到了这个网站。
很方便，支持第三方包、多文件、自定义图标，具体见网站的介绍。

2 views00:15

LinuxDo 新帖推送

标题: Canva居然能发到933333这样的验证码
作者: #nullptr
板块: #搞七捻三
编号: 1234542
帖子: https://linux.do/t/topic/1234542
时间: 2025-11-29 08:45:36
摘要:

百年一遇的5连验证码，我都怀疑到底是不是真正随机出来的

2 views00:46

LinuxDo 新帖推送

标题: aws是不是各种隐藏收费的坑呀？
作者: #undefined
板块: #搞七捻三
编号: 1234549
帖子: https://linux.do/t/topic/1234549
时间: 2025-11-29 08:48:59
摘要:

第一次碰aws。
昨天新注册了个aws账号，主要是想着用ses发邮件的。
然后发现送了半年免费+100刀赠金。

想着反正白送，就打算开个ec2看看，结果立马迷糊了。。
边问gemini边倒腾，然后gemini一个劲的提示这有坑，那有坑。。。
关键aws界面上也没写。。
话说大伙有在啥地方被aws坑过么？我好避避坑。

2 views00:49

LinuxDo 新帖推送

标题: 《哆啦A梦小课堂：后Scaling时代的AI进化论》
作者: #kenmick
板块: #开发调优
编号: 1234559
帖子: https://linux.do/t/topic/1234559
时间: 2025-11-29 08:55:15
摘要:

取材：Ilya 最新访谈 We’re moving from the age of scaling to the age of research
分镜：Gemini 3 Pro
作画：Nano Banana Pro

2 views00:57

LinuxDo 新帖推送

标题: 不懂就问，求助！！！关于甲骨文服务器线路问题。
作者: #Devo
板块: #搞七捻三
编号: 1234560
帖子: https://linux.do/t/topic/1234560
时间: 2025-11-29 08:55:25
摘要:

佬友们，前一阵刚过了甲骨文账号，我又升级了账号

现在我绑了3个区：
主区：阿什本
一个首尔，一个东京。
我家用和公司都是电信。
去阿什本稳定200ms的延时，去首尔要300ms,去东京直接稳定丢包。 
我有个疑问就是我假设买个香港出口去这3个区会有改善嘛？还是买国内的呢？还是其他区域呢？求推荐

谢谢佬

3 views00:57

LinuxDo 新帖推送

标题: 各位佬们，不懂为什么不能激活GCP，不激活3个月到期还是付费用户吗
作者: #wang yongjie
板块: #搞七捻三
编号: 1234674
帖子: https://linux.do/t/topic/1234674
时间: 2025-11-29 09:13:43
摘要:

我的马上就要到期了，要不要激活

3 views01:14

LinuxDo 新帖推送

标题: MLNLP 2025 live
作者: #stevessr
板块: #前沿快讯
编号: 1234675
帖子: https://linux.do/t/topic/1234675
时间: 2025-11-29 09:13:53
摘要:

event.baai.ac.cn
  

  
    

智源社区活动

  听AI讲座来智源社区，面向AI研究者、开发者的最新AI讲座活动、学术会议、直播回放


  

  
    
    
  

  



“第四届机器学习算法与自然语言处理大会”（MLNLP2025 ）将于2025年11月29日-11月30日 线上召开，大会由中国中文信息学会青工委、中国中文信息学会大模型与生成专委、MLNLP社区 联合主办，智源社区提供社区支持。

3 views01:14

LinuxDo 新帖推送

标题: 突发⚠️ App store 土区内购GPT被限制
作者: #tyri
板块: #搞七捻三
编号: 1234717
帖子: https://linux.do/t/topic/1234717
时间: 2025-11-29 09:25:31
摘要:

前言：chatgpt即将全球“统一定价”
解决方案：联系Apple support,得到的回复是48小时后重试
有经历过的兄弟两天后成功恢复的吗？
土区云居民大面积限购

3 views01:27

LinuxDo 新帖推送

标题: Ikuncode缓存命中测试
作者: #lizzzc
板块: #开发调优
编号: 1234720
帖子: https://linux.do/t/topic/1234720
时间: 2025-11-29 09:27:10
摘要:

突发奇想测试缓存命中，因为有的时候缓存命中算法的好坏也会决定用户的性价比，同时也会识别是否为官方API。
基于中转可用性网站2025.11.26排行，选择用Ikuncode进行测试。
非常感谢Ikuncode站长提供的key @zyoung
下面是详细报告
1. 摘要
本次测试基于 Titan-DB 基准技术文档（虚拟构建）及 6 个标准化测试场景，对大模型中转系统的 Prompt Caching 命中率进行了系统性测评。实验涵盖冷启动、完全命中、前缀命中、短请求过滤、内容变更、模型隔离等典型场景，旨在客观评估缓存机制的有效性、稳定性与可复现性。
通过对 6 种典型情况仿真测试，结论如下：


功能性验证： 网关成功实现了基于 Anthropic 协议的缓存机制，精确匹配场景下的请求级命中率达 100%。


效能指标： 在混合压力测试下，综合 Token 命中率为 19.92%，直接成本节省率为 13.50%。


架构特征： 测试揭示该网关后端采用无状态轮询负载均衡策略，导致前缀复用场景在跨节点分发时存在缓存漂移现象。


安全性： 跨模型及内容变更场景均通过了隔离性验证，未发现数据串扰风险。


2. 审计方法论
本次测试采用黑盒探测法，通过构建确定性的基准语料（Titan-DB Technical Docs, Length: 2529 Tokens），文档内容包含：架构描述、配置参数、API 接口定义和错误码，模拟真实的开发者文档。
评价指标体系如下：


CHR (综合命中率): 缓存读取 Token 总数与总输入 Token 数的比值

定义：衡量全局流量中通过缓存直接服务的比例，反映算力节省程度。



CWR (缓存写入占比): 缓存写入 Token 总数与总输入 Token 数的比值

定义：衡量流量中用于建立缓存（写入）的比例，反映系统的“冷启动”成本。



3. 实验数据详解
3.1 总体流量统计


总请求数: 6


总吞吐量: 12,694


总输出量: 2,012


3.2核心绩效指标



综合 Token

2 views01:27

LinuxDo 新帖推送

标题: 订单被L53取消
作者: #F-Droid
板块: #搞七捻三
编号: 1234731
帖子: https://linux.do/t/topic/1234731
时间: 2025-11-29 09:28:57
摘要:

3 views01:29

About

Blog

Apps

Platform