标题: 哈维律师事务所 发布 长期法律Agent基准测试
作者: #🐟
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2124390
时间: 2026-05-07 09:55:48
摘要:
作者: #🐟
板块: #前沿快讯
编号:
2124390帖子: https://linux.do/t/topic/2124390
时间: 2026-05-07 09:55:48
摘要:
Harvey
Introducing Harvey’s Legal Agent Benchmark
Harvey’s Legal Agent Benchmark is an open-source benchmark built to evaluate and improve agent capabilities for supporting legal work.
我们推出 Harvey 的法律代理基准测试 (LAB),这是一个面向法律代理的开源基准测试。LAB 旨在评估和提升代理支持律师实际工作的能力。每个任务都包含一条指令、一个包含相关材料的客户案例,以及一项要求代理提交工作成果以供审核的条件。这种结构旨在模拟大型律师事务所的工作分配、执行和审核流程。
LAB 的目标是清晰地展现如何部署智能体来支持现实世界中的法律工作。通过阐明智能体可以完成全部、部分或完全不完成哪些任务,LAB 帮助律师事务所衡量人工智能投资的回报率,以及这些投资可以在哪些方面增强团队的工作效率。
LAB 的首个版本涵盖 24 个法律实践领域的 1200 多个代理任务,并采用超过 75000 条专家编写的评估标准进行评估。我们开源 LAB,旨在为模型提供商、代理构建者、研究人员和律师事务所提供一种共享的方式来衡量长期法律代理的进展。
我们特意在LAB发布时不设排行榜,因为我们预计数据集会随着时间推移而不断更新,并且我们希望与社区合作,确保结果能够清晰直观地反映代理的表现。在接下来的几周里,我们将与研究伙伴合作,获取LAB的基准结果,并发布排行榜,以便更好地展现法律代理的现状。此外,我们还将发布提交规范化的标准,以便大家能够识别改进之处,并跟踪基准测试的进展,因为基准测试本身也会随着新任务、实践领域和知识工作学科的出现而不断发展。
github.com
GitHub - harveyai/harvey-labs: A benc
标题: feishu cli + codex 好爽有没有懂得
作者: #chenggou
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124396
时间: 2026-05-07 09:56:36
摘要:
作者: #chenggou
板块: #开发调优
编号:
2124396帖子: https://linux.do/t/topic/2124396
时间: 2026-05-07 09:56:36
摘要:
rt, 写完代码,让codex 调用 lark cli 填写流程和日报爽的一批
标题: deepseek-tui这玩意在我电脑拉了一坨大的!
作者: #topsage
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2124398
时间: 2026-05-07 09:57:38
摘要:
作者: #topsage
板块: #搞七捻三
编号:
2124398帖子: https://linux.do/t/topic/2124398
时间: 2026-05-07 09:57:38
摘要:
装上去一直都没办法用,一直working无回复
早上备份硬盘数据,发现好像少了一两百G,然后扫描了下,wocao 这货在我电脑拉了一坨大的,超大!
100G!snapshot
标题: 极连快传 用不了了 发不了图片 求平替方案
作者: #qingteng2025
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2124409
时间: 2026-05-07 09:58:52
摘要:
作者: #qingteng2025
板块: #搞七捻三
编号:
2124409帖子: https://linux.do/t/topic/2124409
时间: 2026-05-07 09:58:52
摘要:
电脑要给多个手机传图片 不是一个网络 之前还能传 现在传不了了 不知道怎么回事 有没有什么办法解决 或者有平替方案吗 感谢佬
标题: 五一高速车现状
作者: #dengdeng3
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2124413
时间: 2026-05-07 09:59:20
摘要:
作者: #dengdeng3
板块: #前沿快讯
编号:
2124413帖子: https://linux.do/t/topic/2124413
时间: 2026-05-07 09:59:20
摘要:
现在最左侧车道不是最快车道了,有些人一直再左车道占着乌龟行;他们是不知道还是就无所谓。反而右车道变成快速车道,超速形态了
标题: 猜猜这究竟是 codex free 还是 plus
作者: #monia
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124415
时间: 2026-05-07 09:59:21
摘要:
作者: #monia
板块: #开发调优
编号:
2124415帖子: https://linux.do/t/topic/2124415
时间: 2026-05-07 09:59:21
摘要:
(话题已被作者删除)
标题: 【开源推广】音乐API,带Demo免费给大家用
作者: #川意
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124416
时间: 2026-05-07 09:59:22
摘要:
作者: #川意
板块: #开发调优
编号:
2124416帖子: https://linux.do/t/topic/2124416
时间: 2026-05-07 09:59:22
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
github.com
GitHub - MiChongs/karpov-gateway: Karpov Gateway — REST API gateway + Next.js...
Karpov Gateway — REST API gateway + Next.js console. Go (Gin+gRPC) + PostgreSQL + Redis + OAuth2 (Linux.do) + TOTP 2FA + encrypted credential pool
demo https://gateway.karpov.cn
目前仅支持QQ音乐和网易云音乐,后续会支持更多,默认注册为free套餐,注册后可在帖子下方留下uid,我会给佬友们改套餐
标题: grok 还卖上萌了
作者: #穆罕默德.哆啦A梦
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2124428
时间: 2026-05-07 10:01:06
摘要:
作者: #穆罕默德.哆啦A梦
板块: #搞七捻三
编号:
2124428帖子: https://linux.do/t/topic/2124428
时间: 2026-05-07 10:01:06
摘要:
这该不会是中国人再运营吧。话说各位有订阅grok吗?现在试用都只有fast模式
标题: 小米的mimo token plan凭啥这么贵?
作者: #火星文专家
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124429
时间: 2026-05-07 10:01:09
摘要:
作者: #火星文专家
板块: #开发调优
编号:
2124429帖子: https://linux.do/t/topic/2124429
时间: 2026-05-07 10:01:09
摘要:
太离谱了,最低档每月40元套餐,每个月6000万token,用pro还*2系数,也就是3000万token,而且还不区分缓存,半天就能把一个月额度蹬完,这玩意比a÷的还贵。是不是因为面向用户群体不一样?赚信息差,专割非it行业的小白粉丝。
标题: 猜猜这是 codex free 还是 plus
作者: #monia
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124431
时间: 2026-05-07 10:01:38
摘要:
作者: #monia
板块: #开发调优
编号:
2124431帖子: https://linux.do/t/topic/2124431
时间: 2026-05-07 10:01:38
摘要:
(话题已被作者删除)
标题: claudecode opencode kimicode
作者: #krismile
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124446
时间: 2026-05-07 10:02:40
摘要:
作者: #krismile
板块: #开发调优
编号:
2124446帖子: https://linux.do/t/topic/2124446
时间: 2026-05-07 10:02:40
摘要:
家人们,有深度使用这几款工具的吗,哪个更好用一些,我发现不同工具同样的模型和指令最终实现出来的效果差异还是挺大的
标题: 猜猜这究竟是 codex free 还是 plus 呢
作者: #monia
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124453
时间: 2026-05-07 10:03:23
摘要:
作者: #monia
板块: #开发调优
编号:
2124453帖子: https://linux.do/t/topic/2124453
时间: 2026-05-07 10:03:23
摘要:
标题: 请问NewApi这些公益站的API如何接入ClaudeCode使用
作者: #ezios
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124467
时间: 2026-05-07 10:04:10
摘要:
作者: #ezios
板块: #开发调优
编号:
2124467帖子: https://linux.do/t/topic/2124467
时间: 2026-05-07 10:04:10
摘要:
公益站注册拿到key后,使用cc switch配置,测试连通性通过。
cc使用的时候会报错:
API Error: 400 external billing pre-consume: insufficient balance (401002), balance=11576 required=149302 (request id: 20260507020140251160151QQfgmzma) (request id: 2026050702014063155188268d9d6fvN5ucVd)
或者是:
<tool_use_error>Error: No such tool available: Glob</tool_use_error>
反正导致根本没法正常用,但是接入到Hermes似乎没什么问题。
我问了gpt,他说是兼容性的问题,没办法。我想问一下佬们是如何解决的呢?
标题: 腾讯云的coding plan 还有吗?
作者: #fengchuan
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2124474
时间: 2026-05-07 10:04:47
摘要:
作者: #fengchuan
板块: #搞七捻三
编号:
2124474帖子: https://linux.do/t/topic/2124474
时间: 2026-05-07 10:04:47
摘要:
腾讯云的coding plan这个还能抢吗?一直都是补货中
标题: 明朝这点儿事儿
作者: #sun
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2124482
时间: 2026-05-07 10:05:36
摘要:
作者: #sun
板块: #搞七捻三
编号:
2124482帖子: https://linux.do/t/topic/2124482
时间: 2026-05-07 10:05:36
摘要:
感觉这几天老刷到这些
标题: 感觉new-api+cc-switch+claude code这种搭配格外好用
作者: #初墨
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2124503
时间: 2026-05-07 10:07:42
摘要:
作者: #初墨
板块: #搞七捻三
编号:
2124503帖子: https://linux.do/t/topic/2124503
时间: 2026-05-07 10:07:42
摘要:
我日常使用的有三个模型:
公司给开的Claude
自己开的GPT Plus
自己买的DeepSeek Key
然后我自建了一个new-api中转站放到我的服务器上,把上面GPT和DS模型作为渠道配置好。
只安装claude code,再配合cc-switch,就可以随时切换这三个模型但是不丢失上下文
佬们有其它的奇淫技巧吗?一起分享一下
标题: claude code小众错误,没招了
作者: #LucentSnow
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124522
时间: 2026-05-07 10:09:45
摘要:
作者: #LucentSnow
板块: #开发调优
编号:
2124522帖子: https://linux.do/t/topic/2124522
时间: 2026-05-07 10:09:45
摘要:
⎿ API Error: 500
{“type”:“internal_server_error”,“request_id”:“”,“error”:{“type”:“internal_server_error”,“message”:“database or disk
is full (13)”}} · check status.claude.com
这是啥啊,磁盘满了是什么意思,但是我用的是deepseek、minimax写代码一直报错,网上找了一圈怎么都没有一样的。
现在干啥都没用了,只能用codex了吗?
标题: 前端开发使用gpt还是claude更好?
作者: #wanna
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2124523
时间: 2026-05-07 10:09:51
摘要:
作者: #wanna
板块: #开发调优
编号:
2124523帖子: https://linux.do/t/topic/2124523
时间: 2026-05-07 10:09:51
摘要:
最近一直使用中gpt5.5来写前端,感觉效果一般啊,总会出现一些基础的bug
使用中还发现gpt5.4开始变笨了,总是遗忘之前的问题和回复。有使用claude来做前端的吗,效果如何,还是选择ds?
标题: 1 刀虚拟信用卡
作者: #su
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/2124533
时间: 2026-05-07 10:10:19
摘要:
作者: #su
板块: #福利羊毛
编号:
2124533帖子: https://linux.do/t/topic/2124533
时间: 2026-05-07 10:10:19
摘要:
有佬给个1刀虚拟信用卡的渠道吗,想去薅一下 羊毛
标题: 五一 38th萤火虫漫展返图
作者: #Ereshkigal
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2124536
时间: 2026-05-07 10:10:32
摘要:
作者: #Ereshkigal
板块: #搞七捻三
编号:
2124536帖子: https://linux.do/t/topic/2124536
时间: 2026-05-07 10:10:32
摘要:
五一还得给老板当牛马打工,但是不能耽误个人爱好,这漫展得看啊。趁着五一去了两次萤火虫,不得不感慨碧蓝还是太超模了。