LinuxDo 新帖推送
176 subscribers
248K photos
308K links
Download Telegram
标题: 开发了一个AI 编码能力评测框架,需要一些帮助
作者: #QingJ
板块: #开发调优
编号: 1630376
帖子: https://linux.do/t/topic/1630376
时间: 2026-02-20 18:51:15
摘要:
首先介绍下我的项目
Req-2-Rank
一个开源 AI 编码能力评测框架 — 动态需求生成 · 多模型陪审团评审 · 社区驱动排行榜
它解决什么问题?
现有 LLM 编码评测普遍依赖固定题库,面临训练集泄漏、难度分布不均和维度单一等问题。
Req-2-Rank 的策略:




特性
实现方案




杜绝数据泄漏
每次运行由 LLM 动态生成全新需求,无固定题库


去评审偏见
多模型陪审团(LLM-as-a-Judge)交叉评审,附带一致性分析与 95% 置信区间


开源自部署
用户用自己的 API Key 在本地运行,零外部服务依赖(仅需 LLM API)


社区排行榜
评测结果可提交至中心 Hub,含 Nonce 防伪 + 抽样复验机制



这是项目的GitHub,感兴趣的佬友可以看看


github.com






GitHub - QingJ01/Req-2-Rank: 一个开源的 AI 编码能力评测框架

一个开源的 AI 编码能力评测框架












项目目前还在开发中,开发进度90%左右
跟佬友们讲讲我需要的帮助
因为本人目前还是高三学生(还有几天开学),所以需要一些有技术的佬友和我共同开发维护这个项目(当然你对这个项目有一定兴趣)
还需要社区的维护(实际就是防作弊审核)本人高三学生经历有限,so很需要这个帮助~
另外还需要一些各类模型的token,因为是新项目,需要有第一批测试结果上传上去供参考
标题: 韩国全体公民获诺贝尔和平奖提名
作者: #慕鸢
板块: #前沿快讯
编号: 1630377
帖子: https://linux.do/t/topic/1630377
时间: 2026-02-20 18:52:40
摘要:
韩国全体市民获诺贝尔和平奖提名:因非暴力阻止12·3紧急戒严
国际政治协会前任及现任会长等学者已向挪威诺贝尔委员会提交申请,推荐韩国全体市民为诺贝尔和平奖候选人。推荐理由称韩国民众在未引发内战或镇压的情况下,通过非暴力参与克服了12·3紧急戒严引发的宪法危机。该努力被相关学者定性为光之革命,并被视为全球民主典范。
韩国总统李在明在社交平台表示,国民和平克服民主危机的行为足以成为人类历史典范。他认为若最终获奖,将成为全球因冲突与分裂而动摇国家的重大转折点。目前该提名已由相关政治学者于上月正式递交。
韩联社
标题: Logan:Gemini 3.1 Pro预览版,很快会有更稳定的修订版。更多新模型在路上!
作者: #PSP
板块: #前沿快讯
编号: 1630387
帖子: https://linux.do/t/topic/1630387
时间: 2026-02-20 18:56:15
摘要:
标题: 安卓可用llm-based翻译app有哪些?
作者: #SHENZHEN I/O 挂机玩家
板块: #搞七捻三
编号: 1630388
帖子: https://linux.do/t/topic/1630388
时间: 2026-02-20 18:56:26
摘要:
L友知不知道什么翻译app。最好是非chatbot形式的,简化交互的。不然每次都要给prompt,还要等llm输出一些无用token,在需要即时翻译的场景不太方便
标题: 今天大年初四
作者: #005672.d
板块: #搞七捻三
编号: 1630405
帖子: https://linux.do/t/topic/1630405
时间: 2026-02-20 19:05:15
摘要:
我發現AI有新模型
大家有初四看到甚麼慶祝
我們這邊會迎財神
标题: capsolver有佬友用过吗?
作者: #ceshi01Adx
板块: #搞七捻三
编号: 1630409
帖子: https://linux.do/t/topic/1630409
时间: 2026-02-20 19:06:14
摘要:
现在不提供个人试用了,而且貌似不支持退款,不知道是不是真的有用,万一充值完成后发现根本过不了验证码的话不就亏了?
标题: 我跟gemini说数学是假的,根基不牢固,他居然夸我
作者: #relax
板块: #搞七捻三
编号: 1630414
帖子: https://linux.do/t/topic/1630414
时间: 2026-02-20 19:07:45
摘要:
然后说了一堆话证明为什么我说的是对的,然后又说了历史一堆名人看法跟我一样,感觉gemini好喜欢夸人或者讨好人类
标题: vibe code了一个浏览器扩展,送给喜欢anki的佬友
作者: #John
板块: #开发调优
编号: 1630426
帖子: https://linux.do/t/topic/1630426
时间: 2026-02-20 19:16:17
摘要:
名字叫ReadCopilot,两个功能:

侧边栏直接对当前页面内容聊——不用复制粘贴,AI 已经读完整个页面,直接问就行
一键生成 Anki 闪卡——对话里觉得重要的知识点,点一下生成 Front/Back 格式的卡片,导出直接导进 Anki

API Key 自己填,支持 OpenAI / Claude / Deepseek / Ollama 任意兼容接口,数据不过我的服务器。
chrome-mv3.zip (459.6 KB)
使用前安装anki connect,创建一个名叫basic的模版,正面改成front,背面改成back。然后创建一个ReadCopilot牌组就可以了。
标题: 晒年味,吃火锅
作者: #geewonii
板块: #活动
编号: 1630429
帖子: https://linux.do/t/topic/1630429
时间: 2026-02-20 19:17:27
摘要:
走了两三天亲戚,难得一天闲下来决定家里烫火锅,牛肉毛肚管够,就是切的太大块了哈哈
标题: 目前有啥免费的或者可以自己部署的中文tts
作者: #cd
板块: #开发调优
编号: 1630432
帖子: https://linux.do/t/topic/1630432
时间: 2026-02-20 19:19:15
摘要:
之前一直用edge tts 。效果太差了。
标题: 自制插件工具(vscode cursor et.al):多终端同步发送消息 适用于Codex与Claude code的多终端开发
作者: #TQmyLady
板块: #搞七捻三
编号: 1630440
帖子: https://linux.do/t/topic/1630440
时间: 2026-02-20 19:20:51
摘要:
github.com/TangQi001/terminal-multi-send
使用示例:一次打开20个终端


基础功能


多选终端,发送相同内容,比如打开codex





多选终端,发送相同消息,但是通过终端名称切换占位符内容






实现任务轮训,定时发送消息





实现链式任务
标题: 有个手机号要注销了,有啥羊毛能在注销前薅一下吗
作者: #zcmi
板块: #福利羊毛
编号: 1630458
帖子: https://linux.do/t/topic/1630458
时间: 2026-02-20 19:26:11
摘要:
基本什么都没有注册过,抖音快手小红书啥的好像没啥大额点的福利。
想注册个谷歌,又怕风险二验的话号就废了。目前是想先搞个tg,但好像现在验证码要收费了。
标题: 【抽奖】美国纯净家宽一个月使用权
作者: #长期家宽自用拼车alice.vg
板块: #福利羊毛
编号: 1630460
帖子: https://linux.do/t/topic/1630460
时间: 2026-02-20 19:26:43
摘要:
如有违规请管理删除

交付方式 alice.vg(本人自用拼车面板) 注册,然后私我邮箱给您分配套餐
订阅链接方式:ss+vless(无大陆优化)
若等不及也可上车,神秘折扣7折代码 马年大吉


还请中奖的佬友不要滥用以及分享


奖品详情:
[奖品1]:[美国纯净家宽]
[中奖人数]:[1]
活动时间:
开始时间:[发帖时间]
截止时间:[2026-02-23-22:00]·开奖后保留24H(过时视为自动放弃
参与方式:
在本帖下回复任意内容
抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后12小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
标题: 求codex的集成管理器,可以让同事生成属于自己key调用
作者: #yhh
板块: #开发调优
编号: 1630464
帖子: https://linux.do/t/topic/1630464
时间: 2026-02-20 19:28:03
摘要:
求codex的集成管理器,可以让同事生成属于自己key调用。。。想给同事用,前两天用注册机注册了两百个号 又不想一直换key 想直接弄一个管理器 生成属于自己的key 去轮转使用 有没有佬可以给给开源项目
标题: gemini怎么还虚报模型呢?
作者: #Kral
板块: #开发调优
编号: 1630465
帖子: https://linux.do/t/topic/1630465
时间: 2026-02-20 19:28:14
摘要:
本来以为是他口误,(毕竟他经常会错一些上下文关键点)没想到问他之后,他还说真的有。
最终:

另外,使用了3.1pro ,感觉gemini仍然是过分关注一些上下文和AI记忆内容,在和”记忆”完全不相关的话题也会强行关联