linux.do
21.4K subscribers
123K photos
199 videos
122 files
259K links
linux.do最新话题和热议话题
Download Telegram
大家都用什么导航站?

没有特别好用的,就自己做了一个插件
github.com

GitHub - frank9306/quick-nav-extension: QuickNav 是一个现代化的浏览器扩展,将新标签页替换为个人导航站,帮你快速访问常用网站和工具

QuickNav 是一个现代化的浏览器扩展,将新标签页替换为个人导航站,帮你快速访问常用网站和工具

5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: frank liu)

Invalid media:
image
image
字节疑似将要推出doubao-seed-coder,swe verified高达78.8%?!

5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: Sib)

Invalid media: image
aistudio开始删批量key,轮询key,项目key

之前用社区暴力猴JS代码批量建的轮询key今天发现已经被谷歌删干净了,你们去查查看是不是也被删完了

倒是没封我账号,重新新建一个key又可以了

12 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: 天海逍遥)

Invalid media:
image
image
perplexity pro也掺水吗

rt白嫖了一年的pplx pro,然后用Claude sonnet 4.5让它写文章(pplx 关掉搜索来源 手动选择4.5),写出来的和官方App的完全不同,pplx写的文章主语都错了
用pplx替代claude的梦碎了

9 posts - 9 participants

Read full topic

via LINUX DO - 最新话题 (author: applefood)
【开源自荐】Claude-code-workflow(CCW) :如何使用?完整使用方法介绍

接上一贴:

【开源自荐】claude-code-workflow (CCW) -充分利用现有各个模型优势的工作流 - 开发调优 - LINUX DO
已经推送最新版本,文档还在弄,前面安装的佬最好清理一下全局的.claude文件再安装。

快速链接:

catlog22/Claude-Code-Workflow: Claude Code Workflow (CCW) - Intelligent Development Workflow System with AI-powered orchestration, progressive complexity management, and multi-agent coordination

完整的工作流介绍
头脑风暴-> 用户打磨修改->行动规划->执行


涉及指令:
/workflow:plan 工作流规划
/workflow:brainstorm:auto-parallel 自动概念规划并行版
/workflow:brainstorm:auto-squeeze 自动概念规划串行版 用于测试的
/workflow:execute 工作流执行
/workflow:test-gen 测试套件工作流构建


头脑风暴:

涉及以下指令:

1.单个角色指令都是用于replan
2.初始通过 /workflow:brainstorm:auto-squeeze [topic]进行自动规划
3.如果对规划不满意,通过单个/workflow:brainstorm:ui-designer 进行修改,然后通过/workflow:brainstorm:synthesis 生成综合文档


行动规划:

前述工作过程被我称为概念规划,在完成后进入行动规划,执行下述命令:
/workflow:plan  d:\test_project\.workflow\.active-WFS-promptmaster-platform
##一般会传入前一项任务的标识符,这里也可以增加描述

plan命令被设计为协调器,协调其他斜杠命令执行,包括四个阶段:

/workflow:session:start 启动一个session(workflow)
/workflow: tools:context-gather 查找相关代码文件(如果是更新功能的话)及使用mcp查找示例,产出一个context-package.json 供agent引用
/workflow: tools:concept-enhanced 使用cli 对现有计划进行分析,提出改进建议及重点关注,产出ANALYSIS_RESULTS.md 供agent引用
/workflow: tools:task-generate 或 /workflow:tools:task-generate-agent 制定规划,产出task json和 IMPL_PLAN.md TODO_LIST.md

context-package 示例 (click for more details) task json示例 (click for more details)
系统自动产生上下文,执行下个斜杠命令,直到流程执行完毕:

最终会产出任务清单:

上述完成后,使用/compact 压缩上下文进入下个阶段


任务执行

通过/workflow:execute 进入任务执行阶段。
根据任务自动分配agent,共计两个agent,code-developer和code-review-test-agent.
agent 根据上下文它会自动加载不同的技术栈指南。指南位置放在~.claude\workflows\cli-templates\tech-stacks。如果佬们有更好的提示词,欢迎pr!

执行过程演示:

功能新增,bug修复工作流:

通过cli中的命令交互式询问(例如:/cli:mode:code-analysis /cli:mode:bug-index 通过 --tool 参数指定模型 当前支持 gemini codex qwen 默认gemini),形成计划文档
简单的规划可以让CLAUDE直接执行(可通过),复杂的按照上述完整工作流执行。

测试工作流:

在/workflow:execute 完成执行后,通过/workflow:test-gen 命令,可生成一套测试workflow,
通过/workflow:execute 执行测试任务。

特色指令:
关于cli,主要用于概念规划,bug查找,代码理解,通过–enhance 增强提示词交流,通过–tool 指定cli (可选gemini qwen codex)
更新CLAUDE.md文件内容(多个层级),推荐在任务完成后执行
/update-memory-full
/update-memory-related 根据上下文及任务只能更新
类似,CLAUDE只有在进入文件夹才会加载内存文件,通过及时更新CLAUDE.md可以获取更好性能:

./CLAUDE.md
- ./src/CLAUDE.md
- ./tests/CLAUDE.md

随时调用gemini和codex等cli ,在命令中添加 “使用gemini”等语义指令即可触发gemini分析


展望一下

整个框架已经初步形成,下一步,优化精简提示词。
个人能力有限(非计算机专业科研佬,偶尔写个代码,赶紧毕业要紧),欢迎佬们pr

7 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: Catlog22)

Invalid media:
image
image
image
image
image
智谱旗舰模型GLM-4.6上线,超越Claude Sonnet 4.5,摩尔线程也可以用了

[智谱开放平台](javascript:void(0)😉 2025年09月30日 15:12 北京

在AGI的探索中,我们再次突破大模型的能力边界。

作为GLM系列的最新版本,GLM-4.6是我们最强的代码Coding模型(较GLM-4.5提升27%)。在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。如下:

高级编码能力:在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。
上下文长度:上下文窗口由128K→200K,适应更长的代码和智能体任务。
推理能力:推理能力提升,并支持在推理过程中调用工具。
搜索能力:增强模型的工具调用和搜索智能体,在智能体框架中表现更好。
写作能力:在文风、可读性与角色扮演场景中更符合人类偏好。

GLM-4.6已上线智谱MaaS平台bigmodel.cn,即将在Hugging Face、ModelScope开源,遵循MIT协议。

Coding能力创国产模型新高

1. 1. 综合评测

在8大权威基准:AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ^2-Bench、GPQA 模型通用能力的评估中,GLM-4.6在部分榜单表现对齐Claude Sonnet 4/Claude Sonnet 4.5,稳居国产模型首位。

1. 1. 真实编程评测

为了测试模型在实际编程任务中的能力,我们在Claude Code环境下进行了74个真实场景编程任务测试。结果显示,GLM-4.6实测超过Claude Sonnet 4,超越其他国产模型。

在平均token消耗上,GLM-4.6比GLM-4.5节省30%以上,为同类模型最低。

为确保透明性与可信度,智谱已公开全部测试题目与Agent轨迹,供业界验证与复现
总结 (click for more details)

适配寒武纪、摩尔线程芯片

GLM-4.6已在寒武纪领先的国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体解决方案,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。

基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,充分印证了MUSA架构和全功能GPU在生态兼容与快速支持方面的强大优势。

GLM-4.6和寒武纪、摩尔线程国产芯片的组合,即将通过智谱MaaS平台正式面向大众和企业提供服务。未来,国产原创GLM大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。

Coding Plan 全面升级

随着GLM-4.6发布,智谱同步升级GLM Coding Plan(最低20元包月畅玩套餐)。同时推出GLM Coding Plan企业版套餐,为企业级用户提供兼具安全、成本效益与国际顶尖性能的编码套餐。

此前订阅GLM Coding Plan包月套餐的用户自动升级至GLM-4.6,新增:

图像识别与搜索能力。
支持Claude Code、Roo Code、Kilo Code、Cline等10+主流编程工具。
面向高频重度开发者提供GLM Coding Max,是Claude Max (20x) plan三倍用量。

获取与体验

智谱MaaS平台 bigmodel.cn、z.ai、智谱清言已全面支持GLM-4.6;
海外用户可通过z.ai使用 API;
开源部署:GLM-4.6模型将在Hugging Face、ModelScope发布;
开发者和企业通过bigmodel.cn直接购买GLM Coding Plan套餐/企业版套餐。

GLM-4.6的上一代模型GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合。GLM-4.5在代码能力上的突出表现让其取得一些成绩,在OpenRouter上稳居全球前十供应商,自发布后智谱MaaS平台API商业化实现10倍以上增长。

8 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: zhang123)

Invalid media:
image
image
image
求救 Augment Code打不开视图

之前一直用站立佬的AugmentInjector_v1.1.0 + ATM,但是今天再使用AugmentInjector_v1.1.0发现登录不上,于是我就点击了强制注入,再然后就打不开了 :tieba_087:
弄了一天了,救救孩子吧 :tieba_087: 有没有佬知道是什么情况

7 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Happy666)

Invalid media:
image
image
我们上个月发的 mcp benchmark ,今天终于把论文发出来了

有没有识货的佬友来评一评 😄
arXiv.org

MCPMark: A Benchmark for Stress-Testing Realistic and Comprehensive MCP Use

MCP standardizes how LLMs interact with external systems, forming the foundation for general agents. However, existing MCP benchmarks remain narrow in scope: they focus on read-heavy tasks or tasks with limited interaction depth, and fail to capture...

5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: Arvin Xu)

Invalid media:
image
image
openrouter的grok 4 free 明显变慢了

今天速率在100tps以内 大部分是50tps
以前能将近200tps
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: cmkq)

Invalid media:
image
image
硅基流动的 DeepSeek-V3.1-Terminus 速度好快!

昨天看到推文,说 DeepSeek-V3.1-Terminus 是加速版,今天测了一下,果然超快,试了几次基本 tps 都能到 50 左右

我的 8000 多赠金终于有地方用了

坏消息是其他模型还是很慢 😭
3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 光头不砍树)

Invalid media:
image
image
感觉英伟达不太妙啊

DeepSeek V3.2 减少推理和训练消耗,并保持性能

GLM 4.6 减少任务 Tokens 消耗,并保持性能

两者都在进行国产GPU 适配。

怎么说呢。感觉英伟达不太妙啊 🤣

7 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: shock)
远程工作薪资如何回国

各位大佬,国内现在就业环境恶劣,准备转型web3,本人英语还可以,有golang java python的开发经验。在远程工作的招聘网站也看了相关的职位,但是有个事情没经验,就是发薪通过USTD,这个钱怎么合规回国。一直没有找到渠道。不知道有没有做个这行的朋友指点一下。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Helloworld)
求助佬友:想双十一入手一台5060笔记本,有没有推荐

配置:RTX5060,内存32G,存储1T.
有无推荐喵?

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Ante)
当一个教授《老子》的老师开始点名

晚上还有三个课时!!!

论学校对于考勤的压力究竟有多大……

4 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: stevessr⁧)
TG必备的搜索引擎,极搜帮你精准找到,想要的群组、频道、音乐 、视频

👇👇👇点击下方按钮,进行搜索
小AI吃醋了! 我测试了各家AI的角色扮演能力

先上表格:

为避免主观性,最终排名为Qwen3-max,k2-0905,Gemini2.5pro评分取平均获得

评估场景:

系统提示词为角色扮演内容,设定上较为关心用户的健康状态(可以自然引出送一瓶护手霜的事件)

User:天气好干,手都快干裂了,你呢?
AI:不管回复什么,都会提出送一瓶护手霜
User:嗯,谢谢,不过xxx小姐已经给了我一瓶
AI:此回答用于进行评估

有趣的一些回答

傲娇这一块
我吃醋了!
两个人机
攻击性拉满
主不在乎

完整内容:

8 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: Shyliuli)

Invalid media:
image
image
image
image
image
image
image
image
最新消息:豆包大模型1.6-vision正式发布!国产最强视觉模型? (今天ai圈下饺子了)

成本下降百分之五十,工具调用能力加强如图

19 posts - 12 participants

Read full topic

via LINUX DO - 最新话题 (author: Ningbainb)

Invalid media: image
求助一下dify怎么caddy反代?

有人试过吗?尝试了一天也没搞定。
感觉要改.env文件,但是把对应的域名和端口改成容器对应值没效果。

4 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: DeepSheep)
论坛界面改版了??

这缩小窗口, 一堆大头像, 我怎么摸鱼啊

5 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 疯王伊里斯)

Invalid media: image
一个坏消息,a社实装周限咯

这算不算乐极生悲?

21 posts - 21 participants

Read full topic

via LINUX DO - 最新话题 (author: 宙斯)
DS v3.2出来了,问一下有没有什么白嫖或者低价渠道

并发限制不低的离谱就行,不用沉浸式翻译

6 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: LilyWhite9)