为什么IPad上一大堆一百年都不会用的按钮和选项?
完全不习惯,是我一个人的问题吗?
你们感觉呢?
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: svwi01)
完全不习惯,是我一个人的问题吗?
你们感觉呢?
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: svwi01)
有佬用gpt-codex修改论文的latex代码吗
它很方便,但我总感觉gpt-codex写的文章干巴巴的。
4 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: Chen9865)
它很方便,但我总感觉gpt-codex写的文章干巴巴的。
4 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: Chen9865)
Cursor的composer-1效果怎么样
最近想要进行使用AI工具,有没有佬来对比一下各个工具之前的区别,CC、CodeX以及cursor。另外Cursor刚出了新的模型,测试怎么样呢
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: cruxtau)
最近想要进行使用AI工具,有没有佬来对比一下各个工具之前的区别,CC、CodeX以及cursor。另外Cursor刚出了新的模型,测试怎么样呢
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: cruxtau)
泪失禁该怎么克服
有时候好讨厌自己的泪失禁体质,眼泪总是比话先出来,每次都控制不住,说出来的话都感觉气势差很多,也很容易让别人觉得自己好商量,到底要怎么才能克服 😭 😭
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: klmr)
有时候好讨厌自己的泪失禁体质,眼泪总是比话先出来,每次都控制不住,说出来的话都感觉气势差很多,也很容易让别人觉得自己好商量,到底要怎么才能克服 😭 😭
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: klmr)
这内存是金子做的吗,年初2根16G320快,现在一根卖429块
朋友最近想配电脑,然后搞配置单的时候看了下内存。真就比金子还贵
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Alex Ju)
Invalid media:
image
image
朋友最近想配电脑,然后搞配置单的时候看了下内存。真就比金子还贵
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Alex Ju)
Invalid media:
image
image
【GPTs】5-Thinking:去掉系统提示词和Tools,抛弃Auto路由,更易长时间思考
ChatGPT
ChatGPT - 5-Thinking
对话式 AI 系统:陪您倾听、高效学习以及应对挑战
8 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Mozi)
Invalid media:
image
image
image
ChatGPT
ChatGPT - 5-Thinking
对话式 AI 系统:陪您倾听、高效学习以及应对挑战
8 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Mozi)
Invalid media:
image
image
image
一直被L站重定向到这边是咋回事?
咱也不知道自己梯子是否干净啊,用规则也是这样
15 posts - 6 participants
Read full topic
via LINUX DO - 最新话题 (author: user0000)
Invalid media: image
咱也不知道自己梯子是否干净啊,用规则也是这样
15 posts - 6 participants
Read full topic
via LINUX DO - 最新话题 (author: user0000)
Invalid media: image
关于GeminiCli?
一直搞不清楚的是它是如何计费的呢?我搜索了一下2.5pro每天可以用5次,但我发现用了100多次也没问题啊?什么情况 🥲
4 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 约瑟夫傅里叶)
一直搞不清楚的是它是如何计费的呢?我搜索了一下2.5pro每天可以用5次,但我发现用了100多次也没问题啊?什么情况 🥲
4 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 约瑟夫傅里叶)
华为Versatile工作流遇到的问题
如图所示,用户输入一个观点,由一个独立的Agent提炼提示词,再用不同的Agent分别扮演正方、反方,进行五轮辩论,再给予总结
但是循环体内出现了问题(应该是参数配置问题),不管运行多少次,都只输出ROUND 1
不知道应该配什么参数好了
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Eric)
Invalid media: image
如图所示,用户输入一个观点,由一个独立的Agent提炼提示词,再用不同的Agent分别扮演正方、反方,进行五轮辩论,再给予总结
但是循环体内出现了问题(应该是参数配置问题),不管运行多少次,都只输出ROUND 1
不知道应该配什么参数好了
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Eric)
Invalid media: image
为什么我需要设计回流系统?openmcp reflux 用量化指标帮你让你更加了解你的 Agent 系统与 MCP
为什么我需要设计回流系统?
如果不考虑架构特性和拓展性,需求和设计边界明确的情况下 agent 的开发本身难度并不是很高,难就难在验证上。而保持对线上 agent 数据的采集,我想,是一个很好的习惯。在和 coze 和 蚂蚁 的工程师交流下后,我发现他们也有和我一样的想法,我们把这样一套采集 agent 部署后 trace 的模块称为 agent 的数据回流模块。
OpenMCP Reflux Preview
下面是功能预览,这套 reflux 系统可同时运行在 openmcp 的插件端和 sdk 端,这意味着无论是开发时的测试验证,还是上线的 agent 服务,你都可以利用 openmcp reflux 来自动完成数据的回流,以便后续的全自动 PE 并为模型后训练构建 RLVR 训练集。
在 openmcp 中查看数据回流模块的方法:新建空白页面 → 选择「查看回流数据」,此处就会打开一个查看器,你能在此查看当前 MCP 服务器回流的数据。
性能预览
后续工作的重点在于两部分:Agent 指标与 Evaluator 系统。
Agent 指标
我将我比较关心的指标罗列如下,如何设计出可让 reflux 自动或者半自动记录这些指标会是我后续的工作:
● Success Rate: 任务执行成功率。
● LLM Sensitivity:不同大模型下的执行结果如何。
● Prompt Sensitivity:同义词替换后,系统的调用结果会如何。
● Hallucination:告知系统某些信息你不知道后,执行结果中是否会无视上下文对执行器的参数瞎猜。
● Scalability:随着工具数量的增长,相同任务的执行结果会如何。
● Autonomy :大模型对于流程会不会自己去主动调用工具。
Evaluator 系统
在系统迭代的后期,并非所有数据都需要回流,且我们希望获取某个版本的具体指标,这个时候,一套成熟的验证器系统就至关重要了。如何设计一套可拓展的验证器设置框架,也是后续的重点工作。
很多人可能会质疑,这个 Evaluator 不就是传统软件测试的 test suite 吗?非也非也,因为 LaaJ 的存在,目前最前沿的 Agent 的 Evaluator 的设计也是 agentic 的,换句话说,Agent 的 Evaluator 本身也是一个 Agent。这是和传统软件测试的 test suite 最大的区别。
----------------------
目前基础的组件都做完了,显然数据不断积累起来吧!第一个阶段的工作完成后(不包括 Agent 指标和 Evaluator 系统),我就要继续更新 AI Agent 系统博客了。
如果你觉得我的工作有意思的话,请不要忘记帮 openmcp 点一个免费的 star,谢谢!
github.com
GitHub - LSTM-Kirigaya/openmcp-client: All in one vscode plugin for mcp developer
All in one vscode plugin for mcp developer
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 锦恢)
Invalid media:
image
image
image
image
image
image
为什么我需要设计回流系统?
如果不考虑架构特性和拓展性,需求和设计边界明确的情况下 agent 的开发本身难度并不是很高,难就难在验证上。而保持对线上 agent 数据的采集,我想,是一个很好的习惯。在和 coze 和 蚂蚁 的工程师交流下后,我发现他们也有和我一样的想法,我们把这样一套采集 agent 部署后 trace 的模块称为 agent 的数据回流模块。
trace 这个概念取自编程语言的编译原理中的 traceback,编程器中,将抛出错误的函数的调用所在的函数栈打印出来的 debug 做法叫做 traceback,而打印出的函数栈可以看成系统执行到当前动作的“轨迹”,称为 trace。在 agent 开发中,也是类似,在一次 Agent Loop 中,哪些工具被调用,它们顺着时间串起来的序列数据,就是独属 agent 的 trace。
OpenMCP Reflux Preview
下面是功能预览,这套 reflux 系统可同时运行在 openmcp 的插件端和 sdk 端,这意味着无论是开发时的测试验证,还是上线的 agent 服务,你都可以利用 openmcp reflux 来自动完成数据的回流,以便后续的全自动 PE 并为模型后训练构建 RLVR 训练集。
在 openmcp 中查看数据回流模块的方法:新建空白页面 → 选择「查看回流数据」,此处就会打开一个查看器,你能在此查看当前 MCP 服务器回流的数据。
性能预览
后续工作的重点在于两部分:Agent 指标与 Evaluator 系统。
Agent 指标
我将我比较关心的指标罗列如下,如何设计出可让 reflux 自动或者半自动记录这些指标会是我后续的工作:
● Success Rate: 任务执行成功率。
● LLM Sensitivity:不同大模型下的执行结果如何。
● Prompt Sensitivity:同义词替换后,系统的调用结果会如何。
● Hallucination:告知系统某些信息你不知道后,执行结果中是否会无视上下文对执行器的参数瞎猜。
● Scalability:随着工具数量的增长,相同任务的执行结果会如何。
● Autonomy :大模型对于流程会不会自己去主动调用工具。
Evaluator 系统
在系统迭代的后期,并非所有数据都需要回流,且我们希望获取某个版本的具体指标,这个时候,一套成熟的验证器系统就至关重要了。如何设计一套可拓展的验证器设置框架,也是后续的重点工作。
很多人可能会质疑,这个 Evaluator 不就是传统软件测试的 test suite 吗?非也非也,因为 LaaJ 的存在,目前最前沿的 Agent 的 Evaluator 的设计也是 agentic 的,换句话说,Agent 的 Evaluator 本身也是一个 Agent。这是和传统软件测试的 test suite 最大的区别。
----------------------
目前基础的组件都做完了,显然数据不断积累起来吧!第一个阶段的工作完成后(不包括 Agent 指标和 Evaluator 系统),我就要继续更新 AI Agent 系统博客了。
如果你觉得我的工作有意思的话,请不要忘记帮 openmcp 点一个免费的 star,谢谢!
github.com
GitHub - LSTM-Kirigaya/openmcp-client: All in one vscode plugin for mcp developer
All in one vscode plugin for mcp developer
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 锦恢)
Invalid media:
image
image
image
image
image
image
华为什么能永葆青春
自鸿蒙之时,盘古开天劈地,怎么健康地刷牙?牙膏我只用中华为的就是这个响亮的名字。日常饮食食用小米等粗粮。现在日子好过了,年年有余大嘴也不用挨饿。膳食均衡,水果也要吃,饭后吃个苹果是非常好的佳品,让人直呼无敌。听力健康也很重要,避免长时间处于吵闹环境,比如打雷军号同时响起,那声音分贝受不了。短途出行可以考虑步行,这比亚迪电动车更健康又环保。保重好我们的身体,享平安卓越人生,跟垃圾生活告别,坚持真我,才有荣耀,不然连一加一等于二都不记得。
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: 木瓜蛋白酶Tea🎋)
自鸿蒙之时,盘古开天劈地,怎么健康地刷牙?牙膏我只用中华为的就是这个响亮的名字。日常饮食食用小米等粗粮。现在日子好过了,年年有余大嘴也不用挨饿。膳食均衡,水果也要吃,饭后吃个苹果是非常好的佳品,让人直呼无敌。听力健康也很重要,避免长时间处于吵闹环境,比如打雷军号同时响起,那声音分贝受不了。短途出行可以考虑步行,这比亚迪电动车更健康又环保。保重好我们的身体,享平安卓越人生,跟垃圾生活告别,坚持真我,才有荣耀,不然连一加一等于二都不记得。
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: 木瓜蛋白酶Tea🎋)
能一键部署到网站的海外top级的ai搜索吗?
主要是想给网站增加点流量
增加点黏性
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: gogoo)
主要是想给网站增加点流量
增加点黏性
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: gogoo)
想在vps上自建个rss信息获取生态系统,求推荐不错的源和工具(订阅和阅读)
源希望有好玩和实用的,看国外新闻比如纽约时报比较多,平时对各种科普知识啥的也很感兴趣。
工具希望是网页端和安卓能够同步的
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: LilyWhite9)
源希望有好玩和实用的,看国外新闻比如纽约时报比较多,平时对各种科普知识啥的也很感兴趣。
工具希望是网页端和安卓能够同步的
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: LilyWhite9)
MiniMax M2惊现天大BUG
是不是有点精神分裂症?
10 posts - 9 participants
Read full topic
via LINUX DO - 最新话题 (author: F-Droid)
Invalid media: image
是不是有点精神分裂症?
10 posts - 9 participants
Read full topic
via LINUX DO - 最新话题 (author: F-Droid)
Invalid media: image
原来cf也可以查ip
搓了一个小玩具
https://ip.696988.xyz
16 posts - 10 participants
Read full topic
via LINUX DO - 最新话题 (author: 小白)
搓了一个小玩具
https://ip.696988.xyz
16 posts - 10 participants
Read full topic
via LINUX DO - 最新话题 (author: 小白)
tailscare + rustdesk是否可以部署一个稳定快速的远程方案
有大佬试过吗 想弄一个家里和公司电脑的免费稳定快速的远程方案
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: raco)
有大佬试过吗 想弄一个家里和公司电脑的免费稳定快速的远程方案
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: raco)
找 软件工程 职场佬友 周六下午 救一下大学生作业
因为
具体来说,我们有一节水课必须要采访在本领域工作的人并填写采访表,成绩计入绩点,所以必须要真的采访一下
人数特意说了不要少于两位,感兴趣的佬友可以直接私聊我
这个是采访的提纲 (click for more details)
:tieba_087: 救救苦逼大学生吧!
15 posts - 8 participants
Read full topic
via LINUX DO - 最新话题 (author: WhaleInColdSky)
从 怎么大学生作业还有采访的(绝望 继续讨论(绝望
因为
大学生职业规划课有这个要命的作业所以来求助一下佬友!具体来说,我们有一节水课必须要采访在本领域工作的人并填写采访表,成绩计入绩点,所以必须要真的采访一下
人数特意说了不要少于两位,感兴趣的佬友可以直接私聊我
这个是采访的提纲 (click for more details)
:tieba_087: 救救苦逼大学生吧!
15 posts - 8 participants
Read full topic
via LINUX DO - 最新话题 (author: WhaleInColdSky)
送qq音乐会员三天,共五份
需要自取哦,各位佬们~~
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: wuxinchuxiu)
Invalid media: image
需要自取哦,各位佬们~~
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: wuxinchuxiu)
Invalid media: image
【海王判别】我有一个绝妙的想法
Read full topic
via LINUX DO - 最新话题 (author: 蹲神)
Invalid media: image
[!note]我有一个绝妙的想法。5 posts - 4 participants
:tieba_022:
一个男人/女人有极限,说明他/她是专一的。
但是一个男人/女人有极限点……那只能说明他/她是一个海王!
Read full topic
via LINUX DO - 最新话题 (author: 蹲神)
Invalid media: image