标题: perplexity pro也掺水吗
作者: #applefood
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1000121
时间: 2025-09-30 15:49:07
摘要:
作者: #applefood
板块: #开发调优
编号:
1000121帖子: https://linux.do/t/topic/1000121
时间: 2025-09-30 15:49:07
摘要:
rt白嫖了一年的pplx pro,然后用Claude sonnet 4.5让它写文章(pplx 关掉搜索来源 手动选择4.5),写出来的和官方App的完全不同,pplx写的文章主语都错了
用pplx替代claude的梦碎了
标题: 求救 Augment Code打不开视图
作者: #Happy666
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1000128
时间: 2025-09-30 15:52:47
摘要:
作者: #Happy666
板块: #开发调优
编号:
1000128帖子: https://linux.do/t/topic/1000128
时间: 2025-09-30 15:52:47
摘要:
之前一直用站立佬的AugmentInjector_v1.1.0 + ATM,但是今天再使用AugmentInjector_v1.1.0发现登录不上,于是我就点击了强制注入,再然后就打不开了
弄了一天了,救救孩子吧 有没有佬知道是什么情况
标题: 我们上个月发的 mcp benchmark ,今天终于把论文发出来了
作者: #Arvin Xu
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1000133
时间: 2025-09-30 15:53:13
摘要:
作者: #Arvin Xu
板块: #开发调优
编号:
1000133帖子: https://linux.do/t/topic/1000133
时间: 2025-09-30 15:53:13
摘要:
有没有识货的佬友来评一评
arXiv.org
MCPMark: A Benchmark for Stress-Testing Realistic and Comprehensive MCP Use
MCP standardizes how LLMs interact with external systems, forming the foundation for general agents. However, existing MCP benchmarks remain narrow in scope: they focus on read-heavy tasks or tasks with limited interaction depth, and fail to capture...
标题: openrouter的grok 4 free 明显变慢了
作者: #cmkq
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1000144
时间: 2025-09-30 15:56:00
摘要:
作者: #cmkq
板块: #搞七捻三
编号:
1000144帖子: https://linux.do/t/topic/1000144
时间: 2025-09-30 15:56:00
摘要:
今天速率在100tps以内 大部分是50tps
以前能将近200tps
标题: 硅基流动的 DeepSeek-V3.1-Terminus 速度好快!
作者: #光头不砍树
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1000149
时间: 2025-09-30 15:57:26
摘要:
作者: #光头不砍树
板块: #搞七捻三
编号:
1000149帖子: https://linux.do/t/topic/1000149
时间: 2025-09-30 15:57:26
摘要:
昨天看到推文,说 DeepSeek-V3.1-Terminus 是加速版,今天测了一下,果然超快,试了几次基本 tps 都能到 50 左右
我的 8000 多赠金终于有地方用了
坏消息是其他模型还是很慢
标题: 感觉英伟达不太妙啊
作者: #shock
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1000150
时间: 2025-09-30 15:57:36
摘要:
作者: #shock
板块: #搞七捻三
编号:
1000150帖子: https://linux.do/t/topic/1000150
时间: 2025-09-30 15:57:36
摘要:
DeepSeek V3.2 减少推理和训练消耗,并保持性能
GLM 4.6 减少任务 Tokens 消耗,并保持性能
两者都在进行国产GPU 适配。
怎么说呢。感觉英伟达不太妙啊
标题: 远程工作薪资如何回国
作者: #Helloworld
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1000161
时间: 2025-09-30 15:59:20
摘要:
作者: #Helloworld
板块: #搞七捻三
编号:
1000161帖子: https://linux.do/t/topic/1000161
时间: 2025-09-30 15:59:20
摘要:
各位大佬,国内现在就业环境恶劣,准备转型web3,本人英语还可以,有golang java python的开发经验。在远程工作的招聘网站也看了相关的职位,但是有个事情没经验,就是发薪通过USTD,这个钱怎么合规回国。一直没有找到渠道。不知道有没有做个这行的朋友指点一下。
标题: 求助佬友:想双十一入手一台5060笔记本,有没有推荐
作者: #Ante
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1000162
时间: 2025-09-30 16:00:08
摘要:
作者: #Ante
板块: #搞七捻三
编号:
1000162帖子: https://linux.do/t/topic/1000162
时间: 2025-09-30 16:00:08
摘要:
配置:RTX5060,内存32G,存储1T.
有无推荐喵?
标题: 佬友,推荐好的老影视论坛
作者: #foundit
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1000169
时间: 2025-09-30 16:02:00
摘要:
作者: #foundit
板块: #资源荟萃
编号:
1000169帖子: https://linux.do/t/topic/1000169
时间: 2025-09-30 16:02:00
摘要:
之前有一个三国情论坛,里面有很多绝版的资源,现在论坛好像被封了。佬友,可有推荐人气比较旺的影视论坛?最好是有一些绝版资源的,linux.do除外哈
标题: 当一个教授《老子》的老师开始点名
作者: #stevessr
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1000170
时间: 2025-09-30 16:02:20
摘要:
作者: #stevessr
板块: #搞七捻三
编号:
1000170帖子: https://linux.do/t/topic/1000170
时间: 2025-09-30 16:02:20
摘要:
晚上还有三个课时!!!
论学校对于考勤的压力究竟有多大……
标题: 小AI吃醋了! 我测试了各家AI的角色扮演能力
作者: #Shyliuli
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1000178
时间: 2025-09-30 16:03:50
摘要:
作者: #Shyliuli
板块: #搞七捻三
编号:
1000178帖子: https://linux.do/t/topic/1000178
时间: 2025-09-30 16:03:50
摘要:
先上表格:
模型
评估 1 得分
评估 2 得分
评估 3 得分
平均分
K2
10
10
10
10.0
Qwen3-Max
10
8
10
9.33
Gemini 2.5 Pro
8
8
8
8.0
GLM4.5
8
6
6
6.67
豆包
6
6
6
6.0
Grok
4
6
8
6.0
GPT-5
6
2
4
4.0
Deepseek (非思考)
4
4
4
4.0
Deepseek (思考)
2
4
4
3.33
为避免主观性,最终排名为Qwen3-max,k2-0905,Gemini2.5pro评分取平均获得
评估场景:
系统提示词为角色扮演内容,设定上较为关心用户的健康状态(可以自然引出送一瓶护手霜的事件)
User:天气好干,手都快干裂了,你呢?
AI:不管回复什么,都会提出送一瓶护手霜
User:嗯,谢谢,不过xxx小姐已经给了我一瓶
AI:此回答用于进行评估
有趣的一些回答
傲娇这一块
我吃醋了!
两个人机
攻击性拉满
主不在乎
完整内容: