linux.do
21K subscribers
114K photos
195 videos
114 files
245K links
linux.do最新话题和热议话题
Download Telegram
请教一下能用 ktransformers 框架做推理的国产硬件推理服务器配置

请教一下各位关于国产信创硬件的方案。我的目标是可以用少量(单卡或双卡)国产GPU搭配大体积内存,达到使用 ktransformers 框架进行大语言模型推理大参数量的大语言模型如 MiniMaxAI/MiniMax-M2.1 的效果,即激活参数放显卡,其它卸载到内存的。无高并发要求,最多3个并发就可以了,单并发的 TPS 最好能达到 10 tokens/s 以上。
主要是我们客户只能用信创方案,我对硬件实在是不太熟悉,不知道目前哪些硬件方案可以实现以及价格一般是多少的。先谢过各位了!
另外补一嘴,之所以希望用 ktransformers 架构就是希望尽可能压低硬件成本的,像华为 8卡 910B 这种方案就不考虑了。

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Maker毕)
codex要单独收费了吗?

奥特曼在x上面发布codex收费方案投票,是要单独收费了吗?

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: mrbook)

Invalid media: image
谷歌邮箱注册成功案例分享

前提准备,必要要素

苹果手机(安卓未测试)
代理需要干净的ip
手机已有gmail软件

苹果手机

本人在注册的时候使用的是国行13pm,应该是苹果的系统才可以,或者有谷歌手机,安卓没测试过

干净的ip

我就是用了一个便宜的机场ip,节点选择的是新加坡,佬们可以自己去测试节点,当然一定要是全剧代理模式,下面有两个网站可以自行打开浏览器进行测试(safari):

1. https://ip.sb
2. https://whatismyip.com

大家可以自行去测试,要绿色的才可以,显示真实的节点位置,例如这种:

利用手机下载好的gmail进行注册

1. 创建个人账户
2. 信息随便填
3. 年龄2005年的
4. 86手机号验证 一个手机号可以注册多个(这是我注册的第二个)

验证码验证的时候如果是自己节点国家的手机号成功率应该会高点
,我在注册时就是节点的国家手机号,后面换了中国手机号可以接码
后面我进行了直接登录,设置了信息,目前还算正常,住址没设置。今天晚上12点左右注册的成功案例,希望能帮助到大家,欢迎大家积极评论,如果没有成功纯属本人运气,只是分享一下自己的成功案例,

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Song)

Invalid media: image
vibe coding:法律 AI 助手 - 让判决书人人都能看懂

github.com

GitHub - hacker4257/legal-ai-assistant: 一个基于 Claude AI 的智能法律案例分析系统,提供双视角解读(专业版 +...

一个基于 Claude AI 的智能法律案例分析系统,提供双视角解读(专业版 + 普通人版),让法律判决书人人都能看懂。

感觉这方面还得专业人士来,目前感觉AI还是差点意思,
现实就是魔法

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Morale)

Invalid media:
image
image
image
image
image
讯飞的20路并发属实有点假

我给个15个线程用websocket调用,过一会就
11203 授权错误:并发流控超限。并发路数超过授权路数限制。(联系我们提高限制)
然后我就调成5个,依旧不行,最后只用1个 🤣

讯飞的glm-4.7,当然既然是免费的,也无所谓了。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: vmjcv666)

Invalid media: image
vs code中 kilo code插件 使用claude code 现在需要登录,居然需要接收验证码,各位佬有没有碰到

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: black Jack)

Invalid media:
image
image
自用的一套Spec+Obsidian编程工作流v1.4 --引入claude code 的最新特性

自用的一套Spec+Obsidian编程 --更新继续讨论:
分享一下自研的 Spec 驱动式 AI 开发框架的又一次重大更新。这次 v1.4 的核心主题是拥抱 Claude Code 原生能力和Skill 模块化瘦身,在实际项目中持续迭代了不少东西。
双层互补记忆架构:之前的经验系统是独立运作的,这次引入了 Claude Code 原生的 Auto Memory 作为自动层,负责日常编码经验的零摩擦捕获(覆盖约 80% 的轻量经验)。原有的 exp-* 系统重新定位为显式层,只处理需要 Obsidian
双链关联的重大困境-策略对。两层各管各的存储,互补不冲突。exp-reflect 新增了经验权重分流机制,自动判断一条经验该走结构化记录还是交给 Auto Memory 处理。

Agent Teams 双轨工作流:这是这次最大的功能新增。spec-writer 在规划阶段会评估任务是否适合拆分给多个 Agent 并行执行(从可分解性、独立性、复杂度、测试独立性四个维度判断),在 plan.md 中写入 execution_mode。spec-executor
和 spec-updater 都支持了双轨工作流——路径 A 是原有的单 Agent 逐步实现,路径 B 是 Agent Teams 模式:自动创建团队、拆分任务、生成队友并行实现、监控汇总、关闭团队。对于可拆分的复杂任务,效率提升明显。

Skill 模块化重构:按照 skill-creator 的渐进式披露原则,对四个核心 Spec Skill 做了大幅瘦身。spec-writer 从 592 行压缩到 116 行(-80%),spec-executor 从 1224 行到 238 行(-80%),spec-updater 从 1257 行到 104
行(-92%),spec-reviewer 从 690 行到 94 行(-86%)。详细的模板和参考资料提取到 references/ 子目录按需加载,删除了所有 README.md、EXAMPLES.md 等辅助文件。Frontmatter 统一只保留 name + description,去掉了
allowed-tools、model 等冗余字段。整体净减少 6700+ 行,上下文窗口的利用效率大幅提升。

信息分层架构:重新梳理了项目的信息层次——CLAUDE.md 只做项目身份和路由,.claude/rules/ 存放永久性编码规范(每文件不超过 20 行),MEMORY.md 由 Claude 自主管理跨会话记忆,exp/ 存项目级结构化经验,skills/
按需加载工作流定义。每一层各司其职,避免信息膨胀。

skill-creator 增强:创建新 Skill 时会自动评估是否需要配套的 .claude/rules/ 摘要文件,确保关键规范能常驻上下文。

这次更新的核心思路是:让框架本身也遵循「最小必要信息」原则。Skill 文件不再是大而全的文档,而是精简的核心流程 + 按需加载的参考资料。实际使用下来,Claude 对精简后的 Skill 理解更准确,执行偏差也更少。

GitHub 地址如下,欢迎交流!GitHub: GitHub - HHU3637kr/skills: 自用的一些 skills

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Rking)

Invalid media: image
不是说腾讯的edgeone是免费的吗,我这里没免费套餐啊

我这里看怎么不是免费的呢

11 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: binghe)

Invalid media: image
一点关于 vibe coding 的疑问

我是一名在读的博士生,想问问大家平时进行 vibe coding (使用 claude code) 的场景?我个人一般是辅助进行代码实现,最近也尝试了写论文,发现在给足够多的信息后,效果还可以;大家有别的场景应用吗?比如为 github 的 repo 提 PR,这个事情也是可以完全AI 自我驱动完成的吗,想听听大家的故事~

4 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: Melon)
api中转站用法

接了佬友很多中转站,但是不管openclaw还是手动推curl都是报403或者404,之前没接触过中转站类项目,有没有教程类帖子,求佬分享~

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Loli_Wolf)
夜深了,看看那些夜猫子佬还没睡

佬友们还有没睡的吗?这会了不睡都在干嘛呢?

9 posts - 9 participants

Read full topic

via LINUX DO - 最新话题 (author: 天南第一剑修)
【真·喂饭 教程】无需千问ai答复,可直接使用千问25元免单卡的方法

直接使用千问25元免单卡的方法继续讨论:

使用方法:
先在千问 使用手机号登录中获得25元优惠券
打开淘宝
然后点击上方闪购
确认是否有25元优惠券(如果知道有优惠券请跳过此步) (click for more details)
闪购中的搜索框旁有个扫描二维码选项,扫描二维码
会跳转到可以使用25面单的购买页面
选择你想买的东西

确认用上券了!!!

再结账

可以将此链接 (不含aff!!!是根据原贴进一步去除参数的链接):
https://h5.ele.me/minisite/pages/index-xsd/index?channelInfo=%7B%22subSubChannel%22%3A%22mobile.qwen.default%22%2C%22channel%22%3A%22mobile%22%2C%22subChannel%22%3A%22mobile.qwen%22%7D

转换成二维码使用:
(该二维码是上面的链接转换而来,如不放心可自行解码查看)

二维码是上面的不含aff的链接转换而来,如不放心可自行解码查看
特别感谢 @Zane11
https://linux.do/t/topic/1577832
虽然帖子不见了,但私信问这位大佬仍然给我耐心解答,十分感谢

10 posts - 8 participants

Read full topic

via LINUX DO - 最新话题 (author: lmoonl)

Invalid media: image
可灵AI发布 Kling AI Video 3.0:大有赶超Veo3的趋势?20+ Prompt 实测深度解析

Kling 3.0 的升级标志着 AI 视频领域的一次重要跃迁。其三大核心能力——AI 导演系统(AI Director System)、原生视听同步(Native Audio-Visual Synchronization)以及视觉思维链(Visual Chain of Thought,vCoT)——使 AI 视频生成从碎片化的动态画面,进化为可直接进入剪辑流程的结构化叙事短视频。我们通过内部测试账号完成了 20+ 次 Prompt 实测,对其技术突破与核心优势进行了深入分析。

----------------------

一、Kling 3.0 核心技术架构:混合模型融合 + 专属 Omni One 架构

Kling 3.0 基于 Diffusion Model 与 Transformer 的深度融合构建,模型参数规模达到数百亿级别。其训练数据覆盖物理仿真、多镜头电影剪辑等多样场景。与 Sora 纯 Transformer 架构不同,Kling 3.0 更强调生成效率与画面一致性的双重优化,并通过自研 Omni One 架构形成差异化技术优势。

----------------------

3D 时空联合注意力机制:消除视觉漂移,提升运动一致性

作为 Omni One 架构的核心,该机制由 Spatiotemporal Transformer 进化而来,在时间、高度、宽度三维空间中计算注意力权重,从而精准还原物体真实运动轨迹,基本解决早期 AI 视频生成中长期存在的“视觉漂移”问题。用户测试显示,生成视频的视觉一致性提升约 30%–50%,物理运动还原达到行业领先水平。

----------------------

AI Director System:解锁导演级镜头控制与专业叙事

系统内置专业剧本解析器,可将 Prompt 自动拆解为 场景-镜头-动作-转场 的标准序列,实现反打镜头、淡入淡出等专业转场,并通过 RLHF 优化叙事节奏。同时支持自定义镜头库,用户可轻松生成如希区柯克式悬疑镜头等个性化专业镜头,让普通创作者也能实现专业级镜头创作。

----------------------

原生视听同步:端到端生成,减少 80% 后期工作

Kling 3.0 集成先进 TTS 与 Lip Sync 技术,基于优化的 Wav2Lip 类模块实现实时视听匹配,中文口型同步准确率超过 95%,并支持多语言。用户上传 3–8 秒参考视频 即可通过 Face ID 锁定角色特征,实现个性化生成;单次生成即可同步完成配音、音效和背景音乐,大幅降低后期制作成本。

----------------------

Visual Chain of Thought(vCoT):模拟专业创作流程,呈现电影级画质

结合 Chain-of-Thought 推理机制,AI 在渲染前会对 Prompt 中的透视、光影、物理约束等视觉要素进行精准分析,从而显著降低画面失真率。系统原生支持 1080p 高清输出,并可解锁 4K 与 16-bit HDR 专业画质,视觉效果接近专业摄影水平。

----------------------

Kling 3.0 具备轻量高效的运行能力:在低成本硬件环境下生成 15 秒高质量视频仅需 2–8 分钟,即将推出的 Draft Mode 预计可将生成速度提升 20 倍。相比对算力依赖更高的 Sora,Kling 3.0 在实用性方面更具优势。此外,平台生成的视频均附带完整商业版权,可直接用于广告、影视、电商等商业场景。

----------------------

Kling 3.0 还提供全面优化的操作系统,内置 7-in-1 多模态编辑器,支持一站式视频编辑功能,如对象添加、背景替换和风格重塑等。在多镜头叙事与角色动作生成方面表现尤为突出,并提供面向个人创作者、团队及专业工作室的灵活订阅方案。

----------------------

(小广误cue​😂)访问:
立即体验 Kling 3.0 AI 视频生成器,将你的创意快速转化为电影级视频作品

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 小羊)

Invalid media:
image
image
image
image
image
image
image
image
nijiv6v7 同p值测试

7终于支持p值了? 不太清楚,豆包搜索没有找到新闻。但之前会报参数错误,这次没有了
v6:

v7

依然非常喜欢v7 可萌,可御,可梦幻

旧版本还是太朦胧艺术了

5 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 欣欣|林可欣)

Invalid media:
image
image
image
淘宝上的永久iCloud扩容靠谱吗?

想知道淘宝上的永久iCloud扩容是咋回事啊?

靠谱吗,会不会很容易掉?

有买过的佬友说一下吗?还是自己也有办法扩容?

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: eric)

Invalid media: image
【薄荷公益站】惊喜!gemini-3-pro模型全面恢复!!!

gemini-3-pro-high、gemini-3-pro-preview,都已经恢复了,并且都是高可用状态!!!

gemini-3-pro-preview是每天只有2w次,多了就报错了;gemini-3-pro-high应该可以很多,因为有两个渠道进行负载均衡,加上很多佬友的捐赠

目前gemini3pro模型有:

gemini-3-pro-high
gemini-3-pro-low
gemini-3-pro-preview(每天限量2w次)
gemini-3-pro-preview-gcp(每天限量1w次,来源于gcp的官转渠道)
gemini-3-pro-preview-bs(不限额,来源于一位佬友的business渠道)

10 posts - 10 participants

Read full topic

via LINUX DO - 最新话题 (author: bohe)
刚精心写的话题被吃了,不知道为啥?

题目大概是:编译kiro.rs纯静态二进制文件,部署迷你小鸡,搭建sonnet号池
是触发什么关键词被删了还是被推到审核了? :bili_001: 辛苦写的分享贴呀

13 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: 算符Sir)

Invalid media:
image
image
震惊!Claude opus 4.6 数学能力飞速提升!在数学专业题目上拳打GPT5.2,脚踢Gemini 3!无思考模式持平GPT 5 Pro!

A\畜
你告诉我claude数学能力持平GPT 5.2 xhigh???????
你告诉我不同推理强度差距这么小??无推理快赶上64k推理???
你告诉我无推理的opus 4.6 在Tier4超难题上持平GPT 5 pro????

:distorted_face:
9 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: lueluelue)

Invalid media:
image
image
image
吐槽:兵马俑门票预约时间

想着春节去逛逛兵马俑,今天一看票全放完了,之前在网上查的是平常提前7天放票,节假日会提前10天放票,我翻遍了官方公众号、购票网站 没有看到任何关于提前15天放票的通知。

刚刚在闲鱼上看到百分百出票的,不知道要不要买,敢不敢买。。

还有携程、去哪这些购票网站,但看到官方公众号又一再的提醒没有授权过任何第三方买票。

还看到有人说在去哪买了票,到门口进不去,又不敢买了。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 迷糊虫)
终于要三级啦~

5 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: Monika)

Invalid media: image
anyroute站500报错API Error: 500 {"error":{"message":"invalid claude code request (request id: 20260208022117854845401Wrea0u0K)","type":"new_api_error"},"type":"error"}

各位大佬,实在没办法了,求招!

23 posts - 11 participants

Read full topic

via LINUX DO - 最新话题 (author: qzw)