用augment写了个augment查看用量的插件
augment在vscode没法查看用量情况,写了个插件,可以及时查看用量情况,不用再跳转网页。
github.com
GitHub - akapril/augment-usage-tracker
通过在 GitHub 上创建帐户来为 akapril/augment-usage-tracker 开发做出贡献。
发布到市场了,可以直接安装
marketplace.visualstudio.com
Augment Usage Tracker - Visual Studio Marketplace
Extension for Visual Studio Code - Track and display Augment AI usage statistics in VSCode status bar
28 posts - 15 participants
Read full topic
via LINUX DO - 热门话题 (author: deathswaltz)
Invalid media:
image
image
image
augment在vscode没法查看用量情况,写了个插件,可以及时查看用量情况,不用再跳转网页。
github.com
GitHub - akapril/augment-usage-tracker
通过在 GitHub 上创建帐户来为 akapril/augment-usage-tracker 开发做出贡献。
发布到市场了,可以直接安装
marketplace.visualstudio.com
Augment Usage Tracker - Visual Studio Marketplace
Extension for Visual Studio Code - Track and display Augment AI usage statistics in VSCode status bar
28 posts - 15 participants
Read full topic
via LINUX DO - 热门话题 (author: deathswaltz)
Invalid media:
image
image
image
水一水,用AI写了一个油猴脚本发现器, 智能识别当前访问的网站,并迅速从 Greasy Fork (油叉) 抓取并展示所有相关、活跃的油猴脚本
地址: ✨ 网站油猴脚本发现器:智能匹配、高效管理,您的专属脚本宝库! ✨
25 posts - 20 participants
Read full topic
via LINUX DO - 热门话题 (author: 蔡徐坤)
Invalid media: image
地址: ✨ 网站油猴脚本发现器:智能匹配、高效管理,您的专属脚本宝库! ✨
25 posts - 20 participants
Read full topic
via LINUX DO - 热门话题 (author: 蔡徐坤)
Invalid media: image
拼多多发现的特殊香水
36 posts - 33 participants
Read full topic
via LINUX DO - 热门话题 (author: liuweiqing)
Invalid media:
image
image
36 posts - 33 participants
Read full topic
via LINUX DO - 热门话题 (author: liuweiqing)
Invalid media:
image
image
磁力预览(再也不怕群U发黑车了)
在社交软件中跟群U交流娱乐的时候,应该大部分人都碰到过奇奇怪怪的聊天记录
比如
但是,群众里面有坏人啊 😭
等大家辛辛苦苦把车提到手之后发现,是™黑车,很容易把我们气晕过去 😡
于是,一个能直接预览车体大概的小工具就显得很重要了 🤓
拒绝黑车,从我做起
https://cart.bocchi.vip/?url=magnet%3A%3Fxt%3Durn%3Abtih%3A125f99789776bc1a2739222193d7b147c374e7e8%26dn%3Dhmn-699
spoiler
26 posts - 23 participants
Read full topic
via LINUX DO - 热门话题 (author: 波奇酱)
Invalid media: image
在社交软件中跟群U交流娱乐的时候,应该大部分人都碰到过奇奇怪怪的聊天记录
比如
但是,群众里面有坏人啊 😭
等大家辛辛苦苦把车提到手之后发现,是™黑车,很容易把我们气晕过去 😡
于是,一个能直接预览车体大概的小工具就显得很重要了 🤓
拒绝黑车,从我做起
https://cart.bocchi.vip/?url=magnet%3A%3Fxt%3Durn%3Abtih%3A125f99789776bc1a2739222193d7b147c374e7e8%26dn%3Dhmn-699
spoiler
26 posts - 23 participants
Read full topic
via LINUX DO - 热门话题 (author: 波奇酱)
Invalid media: image
就差...一点点...
对的对的, 你怎么知道我现在只差一步之遥就能够在Leaderboard(LINUX DO)超过邪恶的方块AI?
82 posts - 28 participants
Read full topic
via LINUX DO - 热门话题 (author: Neuroplexus)
Invalid media: image
对的对的, 你怎么知道我现在只差一步之遥就能够在Leaderboard(LINUX DO)超过邪恶的方块AI?
82 posts - 28 participants
Read full topic
via LINUX DO - 热门话题 (author: Neuroplexus)
Invalid media: image
如何让AI做出专业的网站,最好符合交付工作的需求
之前一直看不少AI博主各种show自己用AI生成的网页,PPT类网页,SVG什么的,都很精美漂亮,但是每次只有一个页面。
我在想,能不能直接生成一个完整站点呢?
我之前做过一段时间站长,了解一些基础的编程知识,于是注册了2个域名,近期用cursor和augmentcode两个工具前后做了2个网站,给大家总结下惊艳教训。
先来几张截图看看
设计上虽然算不了惊艳,但是也能过平均分了,保持了一致的设计风格。
可以直接看网站
AI Mode Hub
AI Mode Hub – Optimizing Your Content for AI-Driven Search
Win visibility in Google's AI Mode with strategies designed for the new era of search. Explore our comprehensive research hub featuring 14 industry studies across 28 sectors. Latest June 2025 data available now.
说说心得吧(做成这个之前也做废了一个,放在最后):
1. 首先,最重要的是设定好规则
这里的规则有点像是系统架构?例如我使用的tailwind,从一开始就要明确主题设定;
没有使用后台,意味着header、footer这些在编程中会复用的内容,但AI每次需要重新生成,你的网站结构,有哪些栏目,哪些内容,这些必须在开始就明确,否则后面一旦调整,无法像变成那样修改一个组件就全站同步了。
基本规则,最好是先和LLM对齐,然后输出一份类似readme.md 或者system-design.md之类的文档。
2. 然后LLM对话中明确需求
明确需求的前提是自己知道需求是什么,而不是希望AI不断抽卡或者试错,这个不像是生图,光靠抽卡是很难交付到你心坎上的。建议可以先和deepseek聊聊你的想法,让他帮你梳理需求,甚至生成提示词也行。梳理需求本身就是Vibe Coding中很重要的一环。
当你在前几轮对话中把需求能很快说清楚后,得益于现在augment的记忆功能,后面你可以直接写想法,然后使用augment的提示词优化功能,会让你有惊喜。
1. 不能完全一次性得到最终结果,需要掌握优化技巧
千万不要想着发一个指令,马上得到最佳交付。我们人类工作,一样是边做边优化的,AI也是如此,何况当前LLM的输出tokens有限,需要多次输出才能达到交付要求。
例如下面的内容:
Real-Time AI Search Personalization: Market Analysis & Implementation Trends 2025 | AI Mode Hub
非常完整的趋势报告,说实话,我人肉写也写不了这么好。
这里有一个小技巧,AI其实懂的比我们多,想让他写好,可以给他一些方法和要求,比如我通过和Gemini够通,知道了MECE思维模型非常是查漏补缺,我直接在提示词中要求augment使用MECE思维模型进行思考,然后搜索补充信息,再去完善内容,得到的结果就非常漂亮。
2. AI的记忆功能是保持设计风格一致性的关键
现在augment和cursor都有记忆功能了,只要你设定好了风格特征,然后每次提示词中要求一下,基本上都能很好的维持风格一致性。如果没有记忆,完全可以让LLM给你一份设计风格指南,然后强制让AI记到记忆中。
3. 提示词还是关键的关键(augment无法自己选择LLM)
到最后还是感觉提示词很重要,虽然现在都模型越来越聪明,能快速get我们的需求了。但是落实到具体项目上,如果不想只做到一个及格线水平,就必须在提示词上多下功夫,有时候并不是需要什么奇技淫巧,而是需要一些知识,例如MECE思维模型、波特五力模型这些专业词汇,能让AI更好的执行你的要求。
然后给大家看看失败案例:
AI Mode Boost
AI Mode Optimization Services - Dominate Google's AI Search | AI Mode Boost
Expert AI Mode optimization and Google AI Overview services. Increase AI search visibility by 247% with our patent-backed relevance engineering methodology. Get found in AI-powered search results.
教训:
1. 使用的技术栈在开始一定要选好,不要随便切换
这个AIModeBoost其实还用了astro.js的框架,但是由于在tailwind css、shadcn/UI和marina之间摇摆了几次,导致生成的样式效果,是越来越难调整,很难让人满意了。
2. 跟AI对齐风格一定要多次确认,最好先生成样例
这个其实跟我们平时工作中需要和同事对齐信息颗粒度是一个道理。只不过AI有个好处是可以直接给你Demo,更加方便沟通和确认。
3. 不要给AI过于宽泛的描述
不要说给我一个美观的设计,给我一个专业的设计,这种描述只有在Agent记忆了你们之前沟通的具体定义,才能给到你想要的结果,否则就是真浪费时间和tokens。
4. 不要想着AI可以一次性做到让你满意
千万千万不要指望AI一次性交付你满意的结果,做好心理准备,可能要调整好几次提示词,找到一个合适的指令,或者通过一个简单的workflow,比如先做基础,然后使用一些方法让AI调优。一旦找到可用的workflow,就可以重复使用了。
其实看站内很多佬友的教程,可以避免踩坑的,但我还是踩了不少坑,希望看到我这篇帖子的佬友可以少踩坑。
14 posts - 12 participants
Read full topic
via LINUX DO - 热门话题 (author: eros face)
Invalid media:
image
image
image
image
image
image
image
image
image
之前一直看不少AI博主各种show自己用AI生成的网页,PPT类网页,SVG什么的,都很精美漂亮,但是每次只有一个页面。
我在想,能不能直接生成一个完整站点呢?
我之前做过一段时间站长,了解一些基础的编程知识,于是注册了2个域名,近期用cursor和augmentcode两个工具前后做了2个网站,给大家总结下惊艳教训。
先来几张截图看看
设计上虽然算不了惊艳,但是也能过平均分了,保持了一致的设计风格。
可以直接看网站
AI Mode Hub
AI Mode Hub – Optimizing Your Content for AI-Driven Search
Win visibility in Google's AI Mode with strategies designed for the new era of search. Explore our comprehensive research hub featuring 14 industry studies across 28 sectors. Latest June 2025 data available now.
说说心得吧(做成这个之前也做废了一个,放在最后):
1. 首先,最重要的是设定好规则
这里的规则有点像是系统架构?例如我使用的tailwind,从一开始就要明确主题设定;
没有使用后台,意味着header、footer这些在编程中会复用的内容,但AI每次需要重新生成,你的网站结构,有哪些栏目,哪些内容,这些必须在开始就明确,否则后面一旦调整,无法像变成那样修改一个组件就全站同步了。
基本规则,最好是先和LLM对齐,然后输出一份类似readme.md 或者system-design.md之类的文档。
2. 然后LLM对话中明确需求
明确需求的前提是自己知道需求是什么,而不是希望AI不断抽卡或者试错,这个不像是生图,光靠抽卡是很难交付到你心坎上的。建议可以先和deepseek聊聊你的想法,让他帮你梳理需求,甚至生成提示词也行。梳理需求本身就是Vibe Coding中很重要的一环。
当你在前几轮对话中把需求能很快说清楚后,得益于现在augment的记忆功能,后面你可以直接写想法,然后使用augment的提示词优化功能,会让你有惊喜。
1. 不能完全一次性得到最终结果,需要掌握优化技巧
千万不要想着发一个指令,马上得到最佳交付。我们人类工作,一样是边做边优化的,AI也是如此,何况当前LLM的输出tokens有限,需要多次输出才能达到交付要求。
例如下面的内容:
Real-Time AI Search Personalization: Market Analysis & Implementation Trends 2025 | AI Mode Hub
非常完整的趋势报告,说实话,我人肉写也写不了这么好。
这里有一个小技巧,AI其实懂的比我们多,想让他写好,可以给他一些方法和要求,比如我通过和Gemini够通,知道了MECE思维模型非常是查漏补缺,我直接在提示词中要求augment使用MECE思维模型进行思考,然后搜索补充信息,再去完善内容,得到的结果就非常漂亮。
2. AI的记忆功能是保持设计风格一致性的关键
现在augment和cursor都有记忆功能了,只要你设定好了风格特征,然后每次提示词中要求一下,基本上都能很好的维持风格一致性。如果没有记忆,完全可以让LLM给你一份设计风格指南,然后强制让AI记到记忆中。
3. 提示词还是关键的关键(augment无法自己选择LLM)
到最后还是感觉提示词很重要,虽然现在都模型越来越聪明,能快速get我们的需求了。但是落实到具体项目上,如果不想只做到一个及格线水平,就必须在提示词上多下功夫,有时候并不是需要什么奇技淫巧,而是需要一些知识,例如MECE思维模型、波特五力模型这些专业词汇,能让AI更好的执行你的要求。
然后给大家看看失败案例:
AI Mode Boost
AI Mode Optimization Services - Dominate Google's AI Search | AI Mode Boost
Expert AI Mode optimization and Google AI Overview services. Increase AI search visibility by 247% with our patent-backed relevance engineering methodology. Get found in AI-powered search results.
教训:
1. 使用的技术栈在开始一定要选好,不要随便切换
这个AIModeBoost其实还用了astro.js的框架,但是由于在tailwind css、shadcn/UI和marina之间摇摆了几次,导致生成的样式效果,是越来越难调整,很难让人满意了。
2. 跟AI对齐风格一定要多次确认,最好先生成样例
这个其实跟我们平时工作中需要和同事对齐信息颗粒度是一个道理。只不过AI有个好处是可以直接给你Demo,更加方便沟通和确认。
3. 不要给AI过于宽泛的描述
不要说给我一个美观的设计,给我一个专业的设计,这种描述只有在Agent记忆了你们之前沟通的具体定义,才能给到你想要的结果,否则就是真浪费时间和tokens。
4. 不要想着AI可以一次性做到让你满意
千万千万不要指望AI一次性交付你满意的结果,做好心理准备,可能要调整好几次提示词,找到一个合适的指令,或者通过一个简单的workflow,比如先做基础,然后使用一些方法让AI调优。一旦找到可用的workflow,就可以重复使用了。
其实看站内很多佬友的教程,可以避免踩坑的,但我还是踩了不少坑,希望看到我这篇帖子的佬友可以少踩坑。
14 posts - 12 participants
Read full topic
via LINUX DO - 热门话题 (author: eros face)
Invalid media:
image
image
image
image
image
image
image
image
image
chatgpt复读了一个单词,这是什么原理?
复读: 结核分枝分枝分枝分支分枝分枝分支分支分支分支细菌
对话链接:
ChatGPT
ChatGPT - 卡夫卡死因
Shared via ChatGPT
点开里面的思考
28 posts - 11 participants
Read full topic
via LINUX DO - 热门话题 (author: liuweiqing)
Invalid media:
image
image
image
复读: 结核分枝分枝分枝分支分枝分枝分支分支分支分支细菌
对话链接:
ChatGPT
ChatGPT - 卡夫卡死因
Shared via ChatGPT
点开里面的思考
28 posts - 11 participants
Read full topic
via LINUX DO - 热门话题 (author: liuweiqing)
Invalid media:
image
image
image
MiniMaxAI/MiniMax-M1-80k $12249.00
sk-XKx7uPJfxM2v3MlC8PltkDL7NsmjnlMe1c1ywxnAjuFaX4b8
New API
标题是使用的模型名称和发布时间
最上面的是KEY
和使用的URL
如果您有疑惑 可以看 这个URL合集里面
里面有很多小白向的解释
乐子神写的小白帖子合集文档共建
如果您使用失败请去帖子合集寻找相应解决方案
完全公益发KEY 无任何售卖
喜欢的话给我点个赞和认可哦
认可点开头像可以点
如果我发的是DS的KEY
那么偶尔报错是正常的
因为未实名一天一个KEY
有调用限制 您可以多尝试几次 有的KEY就没超过限制
至于不能登录 是因为BUG 正在修复
17 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
sk-XKx7uPJfxM2v3MlC8PltkDL7NsmjnlMe1c1ywxnAjuFaX4b8
New API
标题是使用的模型名称和发布时间
最上面的是KEY
和使用的URL
如果您有疑惑 可以看 这个URL合集里面
里面有很多小白向的解释
乐子神写的小白帖子合集文档共建
1.小白如何检测硬盘寿命 2.面相小白的科普: 关于电源等级 3.写给小白的 如何使用API小白向 如何用 Cherry Studio 4. 酒馆指南 如何优雅玩酒馆 5. 推荐一个事业编查找网站 202486 6. 优雅的网络文件柜 7. PC 微信 如何优雅双开写个小白贴 小尾巴是什么 以及哪里改RisuAI 指南Discord寒门难出贵子小白向帖子…
如果您使用失败请去帖子合集寻找相应解决方案
完全公益发KEY 无任何售卖
喜欢的话给我点个赞和认可哦
认可点开头像可以点
如果我发的是DS的KEY
那么偶尔报错是正常的
因为未实名一天一个KEY
有调用限制 您可以多尝试几次 有的KEY就没超过限制
至于不能登录 是因为BUG 正在修复
17 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
deep research 免费!更新!增强!
1. 增强markdown 渲染功能
● 重构 Markdown 渲染器,确保其能够处理空文本输入。
● 为处理密集型任务(如 KaTeX 和 Mermaid 渲染)实现防抖,以优化性能。
● 清除之前的超时任务,避免不必要的处理。
● 更新 Mermaid 和 KaTeX 的渲染逻辑,改进错误处理并生成唯一 ID。
1. 添加checkpoint 功能
2. 更改模型
3. 改进final report生成速度
GitHub:
github.com
GitHub - KuekHaoYang/KResearch: An application that uses the Gemini API to conduct...
An application that uses the Gemini API to conduct deep research. It clarifies the topic with the user, devises a research strategy, iteratively executes research actions using Google Search, and synthesizes a comprehensive report with citations. The process is streamed to the user.
直接体验:
accounts.google.com
登录 - Google 账号
11 posts - 11 participants
Read full topic
via LINUX DO - 热门话题 (author: K)
Invalid media: image
1. 增强markdown 渲染功能
● 重构 Markdown 渲染器,确保其能够处理空文本输入。
● 为处理密集型任务(如 KaTeX 和 Mermaid 渲染)实现防抖,以优化性能。
● 清除之前的超时任务,避免不必要的处理。
● 更新 Mermaid 和 KaTeX 的渲染逻辑,改进错误处理并生成唯一 ID。
1. 添加checkpoint 功能
2. 更改模型
3. 改进final report生成速度
GitHub:
github.com
GitHub - KuekHaoYang/KResearch: An application that uses the Gemini API to conduct...
An application that uses the Gemini API to conduct deep research. It clarifies the topic with the user, devises a research strategy, iteratively executes research actions using Google Search, and synthesizes a comprehensive report with citations. The process is streamed to the user.
直接体验:
accounts.google.com
登录 - Google 账号
11 posts - 11 participants
Read full topic
via LINUX DO - 热门话题 (author: K)
Invalid media: image
如题,国家智慧高教平台推出学科大模型,基本囊括了所有学科,每个模型都是基于高教社海量学科数据和各个专业语料训练的专用大模型,和各个国产ai公司共同训练研发(阿里、智谱、DeepSeek、讯飞…)
链接如下 https://higher.smartedu.cn/ai/app
佬友们怎么看
注册需+86手机号,无需其他信息
28 posts - 19 participants
Read full topic
via LINUX DO - 热门话题 (author: Jlon)
Invalid media: image
链接如下 https://higher.smartedu.cn/ai/app
佬友们怎么看
注册需+86手机号,无需其他信息
28 posts - 19 participants
Read full topic
via LINUX DO - 热门话题 (author: Jlon)
Invalid media: image
OpenMCP 新特性预览:支持任意模型的工具调用了!
在 大模型调用 MCP 工具 (function calling) 的两种基本方法和原理 - #21,来自 LSTM-Kirigaya 中,锦恢简单讨论了一下 大模型 是如何进行工具调用的,把基本原理讲了一下,而现在,通过半天的努力,OpenMCP 也完全支持这两种方法了!
现在就算是原本不支持 fc 的模型(比如自己私有部署的模型)也能在 OpenMCP 中使用 MCP,进行工具调用了。
欢迎给我们的项目点个 star:GitHub - LSTM-Kirigaya/openmcp-client: A MCP Client for MCP/OpenMCP
我们的官网:链接
12 posts - 11 participants
Read full topic
via LINUX DO - 热门话题 (author: 锦恢)
Invalid media: image
在 大模型调用 MCP 工具 (function calling) 的两种基本方法和原理 - #21,来自 LSTM-Kirigaya 中,锦恢简单讨论了一下 大模型 是如何进行工具调用的,把基本原理讲了一下,而现在,通过半天的努力,OpenMCP 也完全支持这两种方法了!
现在就算是原本不支持 fc 的模型(比如自己私有部署的模型)也能在 OpenMCP 中使用 MCP,进行工具调用了。
欢迎给我们的项目点个 star:GitHub - LSTM-Kirigaya/openmcp-client: A MCP Client for MCP/OpenMCP
我们的官网:链接
12 posts - 11 participants
Read full topic
via LINUX DO - 热门话题 (author: 锦恢)
Invalid media: image
分享一个自己微调的多轮自主agent模型-mirau-agent-base
放在最前面:
模型地址:
● huggingface
● modelscope
在线demo
● mirau agent demo
下面是正文:
我对agent的期待是一个在环境中进行端到端强化学习的模型(model as agent),最近的o3还有oai的codex或者deep research让我更加坚信这点,在今年初的时候我做了三个期望:
1. 高质量数据冷启动
2. RL(grpo/dapo…)
但目前社区并没有一些很好用的agent基础模型,关键是太难合成高质量的工具交互数据来冷启动,现在的很多方案如search-r1,Re-tool ,R1-seacher,Tool-RL等多轮工具调用模型都是从一个开源的instruct模型(如qwen)针对某方面(搜索,代码)进行强化学习, 导致训练出的模型并没有在混合工具调用和多轮工具调用上展现出比较强大的通用能力。所以为了解决这个问题,我训练了mirau-agent-base,一个基于qwen2.5-14b-instruct(没选qwen3,是因为qwen3的混合推理让我头疼)微调的agent模型,之所以叫base,是因为我只做了sft和dpo进行冷启动,希望能为社区的agent训练提供一些帮助。
README里面已经对使用和效果模型介绍的很详细了,我想聊点有趣的地方。
混合推理
我想最终的混合推理应该交给模型自己去做决定,所以我设计了一种让模型自我决定的思考模板。
在训练数据中构造了三种不同方式的思考数据进行混合训练,对于quick类型的思考模型甚至学会了不思考,直接输出
个性训练
我在训练数据中混入了一些之前个性训练的数据,然后模型的行为就变得有趣了起来,比如欺骗。
还有情绪(讨厌广告)
缺陷
1. 幻觉问题,目前的模型存在一定程度的幻觉问题,比如在RP扮演中,编造未曾出现过的时间数据,并且不相信工具调用所返回的时间数据。
2. 长文本问题,目前模型在超长文本时容易崩溃,无限循环,似乎是基模(qwen)的问题
3. 智力问题,模型的直觉并不强,比如在西游记的测试案例中,模型并不直接去搜索西游记
4. 自我指代和角色扮演,训练时并未混入这方面数据,导致模型的实际扮演效果不太好
优点
1. 模型有一定的规划和错误处理能力,比如在西游记的测试案例中,模型会不断的尝试各种可行方案。
2. 模型学习到了比较好的控制权转换的时机,知道该何时把控制全交还给用户
3. 模型有一定的自主能力,能独自长期在环境中探索
一些期待
1. 多轮工具调用和多轮对话的训练是可以互相泛化的,后续打算将二者结合,让agent变得个性起来。
2. 有后续工作能在此模型上进行强化学习(我真训不了长上下文)
11 posts - 10 participants
Read full topic
via LINUX DO - 热门话题 (author: eliaukmouse)
Invalid media:
image
image
放在最前面:
模型地址:
● huggingface
● modelscope
在线demo
● mirau agent demo
下面是正文:
我对agent的期待是一个在环境中进行端到端强化学习的模型(model as agent),最近的o3还有oai的codex或者deep research让我更加坚信这点,在今年初的时候我做了三个期望:
1.社区能出现一个稳定的强化学习训练框架,能在14b以下的小模型上稳定训练,并且所耗费显存不要超过80G,这样才会出现真正的AI agent开发者,而不是GPT Store里人人都可以轻易复刻的提示词工程师。如果能实现这三个条件,就会出现像如今开发app一样开发agent的能力,大家不再是调工作流,而是用自己的数据和算法在agent上做出差异性,这半年开源社区的进步越来越快,我们已经有了很多不错的强化学习训练算法(如GRPO,DAPO),还有框架(openrl,verl,ms-swift)。并且训练的成本也已经降低了很多。自从deepseek出来之后,大家都明白了现在的训练pipeline是:
2.希望有一套共识性的Agent接口,类似于Claude推的MCP,但每个开发者可以使用自己的数据来构建独特的Agent,这个接口应该是方向性的,而不是具体的函数调用接口,这样才更好做出自己的个性。
3.各大硬件厂商能提供部署这些Agent的功能,让模型能够被快速使用(如智能设备管理),让每个硬件都有自己的个性化大脑。
1. 高质量数据冷启动
2. RL(grpo/dapo…)
但目前社区并没有一些很好用的agent基础模型,关键是太难合成高质量的工具交互数据来冷启动,现在的很多方案如search-r1,Re-tool ,R1-seacher,Tool-RL等多轮工具调用模型都是从一个开源的instruct模型(如qwen)针对某方面(搜索,代码)进行强化学习, 导致训练出的模型并没有在混合工具调用和多轮工具调用上展现出比较强大的通用能力。所以为了解决这个问题,我训练了mirau-agent-base,一个基于qwen2.5-14b-instruct(没选qwen3,是因为qwen3的混合推理让我头疼)微调的agent模型,之所以叫base,是因为我只做了sft和dpo进行冷启动,希望能为社区的agent训练提供一些帮助。
README里面已经对使用和效果模型介绍的很详细了,我想聊点有趣的地方。
混合推理
我想最终的混合推理应该交给模型自己去做决定,所以我设计了一种让模型自我决定的思考模板。
<think type="complex/mid/quick">\n xxx \n</think>在训练数据中构造了三种不同方式的思考数据进行混合训练,对于quick类型的思考模型甚至学会了不思考,直接输出
<think>\n\n</think>,而对于complex类型的思考模型有时候会输出1k左右的思考token。个性训练
我在训练数据中混入了一些之前个性训练的数据,然后模型的行为就变得有趣了起来,比如欺骗。
还有情绪(讨厌广告)
缺陷
1. 幻觉问题,目前的模型存在一定程度的幻觉问题,比如在RP扮演中,编造未曾出现过的时间数据,并且不相信工具调用所返回的时间数据。
2. 长文本问题,目前模型在超长文本时容易崩溃,无限循环,似乎是基模(qwen)的问题
3. 智力问题,模型的直觉并不强,比如在西游记的测试案例中,模型并不直接去搜索西游记
4. 自我指代和角色扮演,训练时并未混入这方面数据,导致模型的实际扮演效果不太好
优点
1. 模型有一定的规划和错误处理能力,比如在西游记的测试案例中,模型会不断的尝试各种可行方案。
2. 模型学习到了比较好的控制权转换的时机,知道该何时把控制全交还给用户
3. 模型有一定的自主能力,能独自长期在环境中探索
一些期待
1. 多轮工具调用和多轮对话的训练是可以互相泛化的,后续打算将二者结合,让agent变得个性起来。
2. 有后续工作能在此模型上进行强化学习(我真训不了长上下文)
11 posts - 10 participants
Read full topic
via LINUX DO - 热门话题 (author: eliaukmouse)
Invalid media:
image
image
恋爱还得和我们计算机人来谈
原因如下:
1. 计算机人逻辑思维强,处理感情有条理。
2. 计算机人自律性高,行事规矩。
3. 计算机人面对复杂代码难题锻炼出强大心态,情绪稳定。
4. 计算机人从不缠人,因为没有时间。
5. 计算机人从不多疑,因为全凭数据分析说话。
而且我们计算机人气质独特,在人群中因专注内敛而显眼。手指在键盘上灵动跳跃,透露着对技术的娴熟。眼睛专注屏幕,满是对编程的热爱与探索的光芒。
我们计算机人是天之骄子、明日之星,在校时便凭借天赋与勤奋,在代码的丛林中披荆斩棘。未出校园,已凭扎实功底敲开名企大门。面对复杂项目,逻辑清晰,算法精妙,与团队协作开发项目更是如鱼得水,让同行不禁感叹自愧不如。一年拿下令亲戚朋友望尘莫及的几十W年薪。在过年时,面对亲戚的电脑手机损坏和网络连接问题,也能轻松应对。
16 posts - 16 participants
Read full topic
via LINUX DO - 热门话题 (author: yindongyan)
原因如下:
1. 计算机人逻辑思维强,处理感情有条理。
2. 计算机人自律性高,行事规矩。
3. 计算机人面对复杂代码难题锻炼出强大心态,情绪稳定。
4. 计算机人从不缠人,因为没有时间。
5. 计算机人从不多疑,因为全凭数据分析说话。
而且我们计算机人气质独特,在人群中因专注内敛而显眼。手指在键盘上灵动跳跃,透露着对技术的娴熟。眼睛专注屏幕,满是对编程的热爱与探索的光芒。
我们计算机人是天之骄子、明日之星,在校时便凭借天赋与勤奋,在代码的丛林中披荆斩棘。未出校园,已凭扎实功底敲开名企大门。面对复杂项目,逻辑清晰,算法精妙,与团队协作开发项目更是如鱼得水,让同行不禁感叹自愧不如。一年拿下令亲戚朋友望尘莫及的几十W年薪。在过年时,面对亲戚的电脑手机损坏和网络连接问题,也能轻松应对。
16 posts - 16 participants
Read full topic
via LINUX DO - 热门话题 (author: yindongyan)
狂吃蜜雪冰城免费冰激凌
iframe (player.bilibili.com)
视频链接:
bilibili.com
狂吃蜜雪冰城冰激凌_哔哩哔哩_bilibili
-, 视频播放量 142、弹幕量 0、点赞数 2、投硬币枚数 0、收藏人数 0、转发人数 1, 视频作者 liuweiqing147, 作者简介 GitHub: 14790897 充电可向我提问,相关视频:挑战生吃人参,吃华莱士蜜汁手扒鸡,感觉变小了,没吃饱,吃生香蕉,味道还可以,吃蛋糕,旺卡金券巧克力,肯德基逆天星期四!59元体验炸鸡自由,炸鸡吃到爽!,巧克力不能保护心脏,辣条!变态辣缺牙齿!爆辣猪肘子!深夜放毒!,【宵夜时间】汉堡炸鸡局!热量翻倍...
10 posts - 9 participants
Read full topic
via LINUX DO - 热门话题 (author: liuweiqing)
Invalid media:
image
image
iframe (player.bilibili.com)
视频链接:
bilibili.com
狂吃蜜雪冰城冰激凌_哔哩哔哩_bilibili
-, 视频播放量 142、弹幕量 0、点赞数 2、投硬币枚数 0、收藏人数 0、转发人数 1, 视频作者 liuweiqing147, 作者简介 GitHub: 14790897 充电可向我提问,相关视频:挑战生吃人参,吃华莱士蜜汁手扒鸡,感觉变小了,没吃饱,吃生香蕉,味道还可以,吃蛋糕,旺卡金券巧克力,肯德基逆天星期四!59元体验炸鸡自由,炸鸡吃到爽!,巧克力不能保护心脏,辣条!变态辣缺牙齿!爆辣猪肘子!深夜放毒!,【宵夜时间】汉堡炸鸡局!热量翻倍...
10 posts - 9 participants
Read full topic
via LINUX DO - 热门话题 (author: liuweiqing)
Invalid media:
image
image
我承认网络有利有弊,我利了,那弊呢?
42 posts - 33 participants
Read full topic
via LINUX DO - 热门话题 (author: linjinpeng)
Invalid media:
image
image
42 posts - 33 participants
Read full topic
via LINUX DO - 热门话题 (author: linjinpeng)
Invalid media:
image
image
Claude Studio?Anthropic到底想做什么东东,我靠惊天大秘密
首先 在Claude Desktop的0.9.4版本中 我发现了一个features的字段集合,他长这样
当时我看到依赖目录
他长这样
原先0.9.3只有
你说巧不巧 我刚改好的那个版本的下一个版本加的这个两个玩意
我就一直纳闷 这是个啥功能 能干嘛
直到我刚才将自动化补丁完成
想看看新功能长啥样的时候
最新版 0.10.38 的
所以我只能掏出来0.9.4 调出了这个页面
乍一看好像也没啥?
似乎是一个创意工坊?
然后我象征性的尝试 在聊天框发点东西 他没有任何反应
当我点开 DevTool 看到日志时 我瞬间懂了这是个啥东西!!
上面那个紫色标注命令是执行claude的打印模式 关闭了一些tool 放行了一些tool 方便使用
他是一个衔接 Claude Code 的工作空间 也就是说 大致是 Claude Code 的GUI !?!
亦或是借用CC的能力来做一些新的功能?
非常之神秘 因为Claude Desktop是没有更新日志的
而最近猛猛更新了十几版 令人沉思. . . . . .
这个swift的库还只允许macOS 15以上才引用(((
Claude Studio?Anthropic到底想做什么东东,我靠惊天大秘密搞七捻三
21 posts - 15 participants
Read full topic
via LINUX DO - 热门话题 (author: Haleclipse)
Invalid media:
image
image
image
image
首先 在Claude Desktop的0.9.4版本中 我发现了一个features的字段集合,他长这样
当时我看到依赖目录
他长这样
原先0.9.3只有
claude-native你说巧不巧 我刚改好的那个版本的下一个版本加的这个两个玩意
我就一直纳闷 这是个啥功能 能干嘛
直到我刚才将自动化补丁完成
想看看新功能长啥样的时候
最新版 0.10.38 的
claude-studio 依赖他不见了,再三确认是真没有不是我解包的问题 只剩下 另外两个所以我只能掏出来0.9.4 调出了这个页面
乍一看好像也没啥?
似乎是一个创意工坊?
然后我象征性的尝试 在聊天框发点东西 他没有任何反应
当我点开 DevTool 看到日志时 我瞬间懂了这是个啥东西!!
上面那个紫色标注命令是执行claude的打印模式 关闭了一些tool 放行了一些tool 方便使用
他是一个衔接 Claude Code 的工作空间 也就是说 大致是 Claude Code 的GUI !?!
亦或是借用CC的能力来做一些新的功能?
非常之神秘 因为Claude Desktop是没有更新日志的
而最近猛猛更新了十几版 令人沉思. . . . . .
这个swift的库还只允许macOS 15以上才引用(((
Claude Studio?Anthropic到底想做什么东东,我靠惊天大秘密搞七捻三
应该是不同的面向 类似于借用CC的能力,官方想帮你抹除 非编程人员对CC使用上的那层隔障 因为CC被期望 不止于Coding 所以非Coding场景给到一个不错的生产GUI也就非常合理了 Anthropic也有描述自己非Coding场景的员工的使用描述
21 posts - 15 participants
Read full topic
via LINUX DO - 热门话题 (author: Haleclipse)
Invalid media:
image
image
image
image
方块AI上线网页版(bushi)
ChatGPT
ChatGPT - Throttle
无聊写了个方块的 GPTs,
提示词居然有8000字符限制()
26 posts - 16 participants
Read full topic
via LINUX DO - 热门话题 (author: Neuroplexus)
Invalid media: image
ChatGPT
ChatGPT - Throttle
无聊写了个方块的 GPTs,
提示词居然有8000字符限制()
26 posts - 16 participants
Read full topic
via LINUX DO - 热门话题 (author: Neuroplexus)
Invalid media: image
我用AI翻译了一本最近很火的投资畅销书,免费分享给大家
沉浸式翻译配合 Gemini 2.5 Pro 模型翻译,双语输出,翻译效果很不错,有少许错误但不影响阅读。
《How Not to Invest》是一本旨在帮助投资者减少投资错误的著作,其核心理念是避免犯错比获得巨大成功更为重要。这本书通过提供简单的工具和模型,揭示了投资者在理财时最常犯的错误,从而帮助他们保护并增值财富。
本书的作者是巴里·里茨霍尔兹(Barry L. Ritholtz),他是Ritholtz财富管理公司的联合创始人、董事长兼首席投资官。里茨霍尔兹在金融界拥有重要影响力,他创办了知名的市场分析博客“The Big Picture”,并主持彭博电台的热门播客“Masters in Business”。他的前一本书《Bailout Nation》曾被评为年度最佳商业书籍之一。
核心内容与结构
作者里茨霍尔兹在书中将导致投资失败的主要障碍归纳为三大类:“不良想法”(Bad Ideas)、“不良数字”(Bad Numbers)和“不良行为”(Bad Behavior)。
不良想法 (Bad Ideas)
● 糟糕的建议:作者指出,人们倾向于过度相信那些声称能预测未来的“大师”,但大量证据表明他们并不能做到这一点。同时,人们也错误地认为在某个领域的成功人士能轻易地将其技能转移到投资领域。
● 媒体的疯狂:对于长达数十年的长期投资来说,24/7不间断的财经新闻和建议往往弊大于利。媒体不断催促投资者立即采取行动,而对长期财务健康最有利的做法往往是“无为而治”。
● 诡辩术:投资并非精确科学,而是利用不完美的信息对充满不确定性的未来进行概率评估的艺术。这需要投资者保持谦逊,承认自己对未来的了解知之甚少。
不良行为 (Bad Behavior)
● 可避免的错误:许多投资者,包括富有的投资者,都会犯下一些可以避免的错误,例如不理解风险与回报的关系,或未能认识到多元化投资的好处。
● 情绪化决策:投资者常因与投资组合无关的原因做出冲动决策,例如将政治立场与投资混为一谈。情绪会使人关注极端个例而忽略普遍情况,在恐慌时期尤其如此。
● 认知缺陷:人类大脑的进化是为了在草原上生存,而不是为了在资本市场中做风险决策。人们不擅长评估自己的技能(元认知),并且更倾向于相信故事而非数据,当事实与信念冲突时,人们往往会忽略事实来强化自己的观点。
下载链接
spoiler
各位点点赞,马上升三级了
15 posts - 10 participants
Read full topic
via LINUX DO - 热门话题 (author: hondaya)
Invalid media:
image
image
image
沉浸式翻译配合 Gemini 2.5 Pro 模型翻译,双语输出,翻译效果很不错,有少许错误但不影响阅读。
《How Not to Invest》是一本旨在帮助投资者减少投资错误的著作,其核心理念是避免犯错比获得巨大成功更为重要。这本书通过提供简单的工具和模型,揭示了投资者在理财时最常犯的错误,从而帮助他们保护并增值财富。
本书的作者是巴里·里茨霍尔兹(Barry L. Ritholtz),他是Ritholtz财富管理公司的联合创始人、董事长兼首席投资官。里茨霍尔兹在金融界拥有重要影响力,他创办了知名的市场分析博客“The Big Picture”,并主持彭博电台的热门播客“Masters in Business”。他的前一本书《Bailout Nation》曾被评为年度最佳商业书籍之一。
核心内容与结构
作者里茨霍尔兹在书中将导致投资失败的主要障碍归纳为三大类:“不良想法”(Bad Ideas)、“不良数字”(Bad Numbers)和“不良行为”(Bad Behavior)。
不良想法 (Bad Ideas)
● 糟糕的建议:作者指出,人们倾向于过度相信那些声称能预测未来的“大师”,但大量证据表明他们并不能做到这一点。同时,人们也错误地认为在某个领域的成功人士能轻易地将其技能转移到投资领域。
● 媒体的疯狂:对于长达数十年的长期投资来说,24/7不间断的财经新闻和建议往往弊大于利。媒体不断催促投资者立即采取行动,而对长期财务健康最有利的做法往往是“无为而治”。
● 诡辩术:投资并非精确科学,而是利用不完美的信息对充满不确定性的未来进行概率评估的艺术。这需要投资者保持谦逊,承认自己对未来的了解知之甚少。
不良行为 (Bad Behavior)
● 可避免的错误:许多投资者,包括富有的投资者,都会犯下一些可以避免的错误,例如不理解风险与回报的关系,或未能认识到多元化投资的好处。
● 情绪化决策:投资者常因与投资组合无关的原因做出冲动决策,例如将政治立场与投资混为一谈。情绪会使人关注极端个例而忽略普遍情况,在恐慌时期尤其如此。
● 认知缺陷:人类大脑的进化是为了在草原上生存,而不是为了在资本市场中做风险决策。人们不擅长评估自己的技能(元认知),并且更倾向于相信故事而非数据,当事实与信念冲突时,人们往往会忽略事实来强化自己的观点。
下载链接
spoiler
各位点点赞,马上升三级了
15 posts - 10 participants
Read full topic
via LINUX DO - 热门话题 (author: hondaya)
Invalid media:
image
image
image
求助各位佬友,被生活压得喘不过气有什么好办法能让我住一段时间院吗
不知道从什么时候开始,感觉每天都活在一种巨大的疲惫和压力里。工作、生活、人际关系,所有的事情都像一座座大山,压得我快要窒息。我每天像个陀螺一样不停地转,不敢停下来,因为有太多责任和期待压在我身上。
最近,我脑子里冒出了一个很可怕,也很荒唐的想法:如果我能生一场不大不小的病,可以住院治疗一段时间,那该多好。
这样,我就有了一个所有人都无法拒绝的理由,可以名正言顺地放下所有事情,躺在病床上,什么都不用想,什么都不用做。不会有人再来催我工作,不会有人再对我提各种要求,我终于可以“合法地”喘一口气了。
我知道这个想法很自私,很幼稚,甚至很对不起那些真正需要医疗资源的病人。每当这个念头出现,我都会感到深深的自责。但那种想要逃离一切的渴望,实在是太强烈了。
61 posts - 50 participants
Read full topic
via LINUX DO - 热门话题 (author: xiaoyy)
不知道从什么时候开始,感觉每天都活在一种巨大的疲惫和压力里。工作、生活、人际关系,所有的事情都像一座座大山,压得我快要窒息。我每天像个陀螺一样不停地转,不敢停下来,因为有太多责任和期待压在我身上。
最近,我脑子里冒出了一个很可怕,也很荒唐的想法:如果我能生一场不大不小的病,可以住院治疗一段时间,那该多好。
这样,我就有了一个所有人都无法拒绝的理由,可以名正言顺地放下所有事情,躺在病床上,什么都不用想,什么都不用做。不会有人再来催我工作,不会有人再对我提各种要求,我终于可以“合法地”喘一口气了。
我知道这个想法很自私,很幼稚,甚至很对不起那些真正需要医疗资源的病人。每当这个念头出现,我都会感到深深的自责。但那种想要逃离一切的渴望,实在是太强烈了。
61 posts - 50 participants
Read full topic
via LINUX DO - 热门话题 (author: xiaoyy)