linux.do
21.3K subscribers
121K photos
196 videos
117 files
256K links
linux.do最新话题和热议话题
Download Telegram
ChatGPT给我试用机会了,可能是因为刚才我把免费额度用光了

但是我信用卡在车里,懒的去取,关了不知道明天会不会有了,哈哈.还有就是我怕开了到时候一个月到期了,扣我20刀.哈哈
2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Z0R0)

Invalid media: image
佬们怎么预防鼠标手的?有啥好法子不

最近手腕疼得越来越厉害了,换了垂直鼠标虽然好一点但用久了还是一样的痛 🥲
又买了个那种带夹板的手腕固定器,感觉待久了还是有点勒,所以佬友有什么好方法吗

5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: specter)
我之前好像参加过抽奖,然后领到了一个节点,但是不知道去哪里找了,有地方能找出来吗?

10 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 宝可梦自走棋(52kx.net))
ccr模型配置优化

各位大佬,目前的ccr我是这么配置的,是否合适呢?有啥调优建议吗?第一次配置ccr不太清楚具体细节呢。
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: qianyixing)

Invalid media: image
百元内 低功耗小主机求推荐!

好不容易薅到一个公网IP,想弄个便宜小破烂,放在老家运行一些简单服务
百元内,能docker,debian或者ubuntu,功耗5w左右
目前就看到oect,不知道佬们有没有更好的推荐 🥹

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 202502)
CDK站是挂掉 了吗?

3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 宝可梦自走棋(52kx.net))

Invalid media: image
基于TraeCN定制的自定义智能体 - 提示词

很有趣的提示词,原版也是论坛佬友的,在其上面定制了Trae的工具,居然会调用。

----------------------

首先是v1版本:
v1版本 (click for more details)
然后是v2版本 (推荐)
v2版本 (click for more details)
其次是v3版本:
v3版本 (click for more details)

版本说明

v1:是初始优化版本,对原佬友的进行了精简,并且去除了大部分冗余描述,效果中规中矩。

v2:是精简工具版,嗯哼,在v1的基础上,继续去除大部分冗余描述,感觉不需要很长的提示词也能遵守,并且会调用trae自带的工具了,很不错

v3:是最新技术工具版,就是在v2的基础上,增加了对memory、context7的强制调用,确保技术栈最新,但是实测下来不如v2,目前推荐使用v2?

碎碎念

嘛,也希望各位多多分享,因为发现论坛里面的提示词貌似并不多?还是期待各位佬友大佬的神奇操作!

原博文地址:

https://blog.warhut.cn/dmbj/1256.html

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 土豆教主)
为什么IPad上一大堆一百年都不会用的按钮和选项?

完全不习惯,是我一个人的问题吗?
你们感觉呢?

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: svwi01)
有佬用gpt-codex修改论文的latex代码吗

它很方便,但我总感觉gpt-codex写的文章干巴巴的。

4 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: Chen9865)
Cursor的composer-1效果怎么样

最近想要进行使用AI工具,有没有佬来对比一下各个工具之前的区别,CC、CodeX以及cursor。另外Cursor刚出了新的模型,测试怎么样呢

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: cruxtau)
泪失禁该怎么克服

有时候好讨厌自己的泪失禁体质,眼泪总是比话先出来,每次都控制不住,说出来的话都感觉气势差很多,也很容易让别人觉得自己好商量,到底要怎么才能克服 😭 😭

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: klmr)
wushifashen

(话题已被作者删除)

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Leo Lam)
这内存是金子做的吗,年初2根16G320快,现在一根卖429块

朋友最近想配电脑,然后搞配置单的时候看了下内存。真就比金子还贵

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Alex Ju)

Invalid media:
image
image
【GPTs】5-Thinking:去掉系统提示词和Tools,抛弃Auto路由,更易长时间思考

ChatGPT

ChatGPT - 5-Thinking

对话式 AI 系统:陪您倾听、高效学习以及应对挑战

8 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: Mozi)

Invalid media:
image
image
image
一直被L站重定向到这边是咋回事?

咱也不知道自己梯子是否干净啊,用规则也是这样

15 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: user0000)

Invalid media: image
关于GeminiCli?

一直搞不清楚的是它是如何计费的呢?我搜索了一下2.5pro每天可以用5次,但我发现用了100多次也没问题啊?什么情况 🥲

4 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 约瑟夫傅里叶)
华为Versatile工作流遇到的问题

如图所示,用户输入一个观点,由一个独立的Agent提炼提示词,再用不同的Agent分别扮演正方、反方,进行五轮辩论,再给予总结
但是循环体内出现了问题(应该是参数配置问题),不管运行多少次,都只输出ROUND 1
不知道应该配什么参数好了
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Eric)

Invalid media: image
为什么我需要设计回流系统?openmcp reflux 用量化指标帮你让你更加了解你的 Agent 系统与 MCP

为什么我需要设计回流系统?

如果不考虑架构特性和拓展性,需求和设计边界明确的情况下 agent 的开发本身难度并不是很高,难就难在验证上。而保持对线上 agent 数据的采集,我想,是一个很好的习惯。在和 coze 和 蚂蚁 的工程师交流下后,我发现他们也有和我一样的想法,我们把这样一套采集 agent 部署后 trace 的模块称为 agent 的数据回流模块。
trace 这个概念取自编程语言的编译原理中的 traceback,编程器中,将抛出错误的函数的调用所在的函数栈打印出来的 debug 做法叫做 traceback,而打印出的函数栈可以看成系统执行到当前动作的“轨迹”,称为 trace。在 agent 开发中,也是类似,在一次 Agent Loop 中,哪些工具被调用,它们顺着时间串起来的序列数据,就是独属 agent 的 trace。


OpenMCP Reflux Preview

下面是功能预览,这套 reflux 系统可同时运行在 openmcp 的插件端和 sdk 端,这意味着无论是开发时的测试验证,还是上线的 agent 服务,你都可以利用 openmcp reflux 来自动完成数据的回流,以便后续的全自动 PE 并为模型后训练构建 RLVR 训练集。

在 openmcp 中查看数据回流模块的方法:新建空白页面 → 选择「查看回流数据」,此处就会打开一个查看器,你能在此查看当前 MCP 服务器回流的数据。

性能预览

后续工作的重点在于两部分:Agent 指标与 Evaluator 系统。

Agent 指标

我将我比较关心的指标罗列如下,如何设计出可让 reflux 自动或者半自动记录这些指标会是我后续的工作:

Success Rate: 任务执行成功率。
LLM Sensitivity:不同大模型下的执行结果如何。
Prompt Sensitivity:同义词替换后,系统的调用结果会如何。
Hallucination:告知系统某些信息你不知道后,执行结果中是否会无视上下文对执行器的参数瞎猜。
Scalability:随着工具数量的增长,相同任务的执行结果会如何。
Autonomy :大模型对于流程会不会自己去主动调用工具。

Evaluator 系统

在系统迭代的后期,并非所有数据都需要回流,且我们希望获取某个版本的具体指标,这个时候,一套成熟的验证器系统就至关重要了。如何设计一套可拓展的验证器设置框架,也是后续的重点工作。

很多人可能会质疑,这个 Evaluator 不就是传统软件测试的 test suite 吗?非也非也,因为 LaaJ 的存在,目前最前沿的 Agent 的 Evaluator 的设计也是 agentic 的,换句话说,Agent 的 Evaluator 本身也是一个 Agent。这是和传统软件测试的 test suite 最大的区别。

----------------------

目前基础的组件都做完了,显然数据不断积累起来吧!第一个阶段的工作完成后(不包括 Agent 指标和 Evaluator 系统),我就要继续更新 AI Agent 系统博客了。

如果你觉得我的工作有意思的话,请不要忘记帮 openmcp 点一个免费的 star,谢谢!
github.com

GitHub - LSTM-Kirigaya/openmcp-client: All in one vscode plugin for mcp developer

All in one vscode plugin for mcp developer

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 锦恢)

Invalid media:
image
image
image
image
image
image
华为什么能永葆青春

自鸿蒙之时,盘古开天劈地,怎么健康地刷牙?牙膏我只用中华为的就是这个响亮的名字。日常饮食食用小米等粗粮。现在日子好过了,年年有余大嘴也不用挨饿。膳食均衡,水果也要吃,饭后吃个苹果是非常好的佳品,让人直呼无敌。听力健康也很重要,避免长时间处于吵闹环境,比如打雷军号同时响起,那声音分贝受不了。短途出行可以考虑步行,这比亚迪电动车更健康又环保。保重好我们的身体,享平安卓越人生,跟垃圾生活告别,坚持真我,才有荣耀,不然连一加一等于二都不记得。

5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: 木瓜蛋白酶Tea🎋)
能一键部署到网站的海外top级的ai搜索吗?

主要是想给网站增加点流量
增加点黏性

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: gogoo)
想在vps上自建个rss信息获取生态系统,求推荐不错的源和工具(订阅和阅读)

源希望有好玩和实用的,看国外新闻比如纽约时报比较多,平时对各种科普知识啥的也很感兴趣。
工具希望是网页端和安卓能够同步的

3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: LilyWhite9)