标题: gemini-3-pro=lithiumflow,召回率只有2.5pro的1/3, 实际写代码完全不能用
作者: #羽织
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1131088
时间: 2025-11-06 04:56:18
摘要:
作者: #羽织
板块: #搞七捻三
编号:
1131088帖子: https://linux.do/t/topic/1131088
时间: 2025-11-06 04:56:18
摘要:
直接上图吧,测试了一下3p的大海捞针曲线,可以发现基本上和lithiumflow还有o一串的曲线稳合,说明之前在lmarena竞技场的l和o一串模型就是3p的很新的一个检查点或者微调
实际用起来也一样,超过20-30k后,就很容易一直报diff失败了,召回率很烂
从曲线来看,只有2.5pro的1/3水平(图里的上下文只表示测试环境,不等于实际体验,但相对关系和曲线走势还是有意义的)
但是3pro在其有效上下文,也就是召回率为100%时的表现还是要比2.5pro高太多了
这也是为什么各种看各种推特的烂炒3p怎么怎么好,因为他们都是只发一句提示词,输入上下文可能连10k都没有,完全体现不出模型的注意力/召回率
但是吧,你召回率只有2.5p的1/3,那还怎么用啊,好能力被上下文拉了
总结:模型能力出色,但是注意力巨烂,完全是大退步。谷歌经典整数必炸
测试仓库:
github.com
GitHub - Lianues/LLM-NeedleInAHaystack: Needle in a Haystack benchmark for evaluating LLM...
Needle in a Haystack benchmark for evaluating LLM recall and attention mechanisms with edit distance scoring.
标题: 硅谷年度最烂宫斗大戏之 OpenAI-奥特曼伊利亚大战(AIGC 哈基米毒舌版)
作者: #天海逍遥
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1131099
时间: 2025-11-06 05:15:53
摘要:
作者: #天海逍遥
板块: #搞七捻三
编号:
1131099帖子: https://linux.do/t/topic/1131099
时间: 2025-11-06 05:15:53
摘要:
牵扯人物:马斯克(控诉人)、奥特曼(OAI CEO)伊利亚(OAI 联合创始人)
事件起因:马斯克控诉 OAI 案法庭控诉文件曝光
内容来源:伊利亚 52 页备忘录
新闻来源:OpenAI宫斗大戏曝光!52页绝密文件揭露CEO奥尔特曼连环谎言,董事会曾想找死对头接盘_财富号_东方财富网
以下内容:Gemini 2.5 Pro 模型整理撰写(AIGC 内容以图片形式发布)
标题: 为什么教育邮箱,明明下来了,却没有办法登录呢?
作者: #MARSHALLDTEACH
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1131135
时间: 2025-11-06 06:54:34
摘要:
作者: #MARSHALLDTEACH
板块: #搞七捻三
编号:
1131135帖子: https://linux.do/t/topic/1131135
时间: 2025-11-06 06:54:34
摘要:
有知道如何解决的吗?
标题: DNSSEC? 安全的 DNS? 让我们启用它!
作者: #wyf9
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1131142
时间: 2025-11-06 07:03:03
摘要:
作者: #wyf9
板块: #开发调优
编号:
1131142帖子: https://linux.do/t/topic/1131142
时间: 2025-11-06 07:03:03
摘要:
https://wyf9.top/p/spaceship-cf-dnssec/
什么是 DNSSEC?
我觉得 Grok 的回答比我更好(
启用 DNSSEC
这里用 Cloudflare 作为 DNS 托管商,Spaceship 作为域名商来示例,其他应该差不多
Cloudflare Dashboard
首先,你需要到 Cloudflare Dashboard 获取启用 DNSSEC 所需的配置信息 (DS 记录值)
直达链接: https://dash.cloudflare.com/?to=/:account/:zone/dns/settings
或者手动导航到你域名的 DNS → 设置 → DNSSEC → DS 记录
你需要复制下面的几个值:
密钥标记
算法
摘要类型
摘要
Spaceship 域名设置
直达: https://www.spaceship.com/zh/application/advanced-dns-application/manage/你的域名/
或者手动导航到 你的域名 → 高级 DNS → Dnssec
依次填入:
Cloudflare 上的名称
Spaceship 上的名称
示例
密钥标记
关键标签
2371
算法
算法
13 → 13 ECDSA/SHA-256
摘要类型 - 2
摘要类型
SHA256 → 2 SHA-256
摘要
摘要
BC02FD...AA4E24
保存,完事。
标题: 早八,困死喵了…
作者: #【失业客服喵】
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1131150
时间: 2025-11-06 07:19:20
摘要:
作者: #【失业客服喵】
板块: #搞七捻三
编号:
1131150帖子: https://linux.do/t/topic/1131150
时间: 2025-11-06 07:19:20
摘要:
标题: OpenAI官宣:全球企业客户突破100万
作者: #gep
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1131167
时间: 2025-11-06 07:43:33
摘要:
作者: #gep
板块: #前沿快讯
编号:
1131167帖子: https://linux.do/t/topic/1131167
时间: 2025-11-06 07:43:33
摘要:
OpenAI周三宣布,全球已经有100万家企业正在直接使用该公司的服务。该公司公告介绍称,统计口径包括所有主动为商业用途付费的组织,以及通过开发者平台直接消费模型的企业。公司此前在九月初曾披露,包含ChatGPT企业用户和校园版ChatGPT Edu的用户数量破百万。OpenAI公司还透露,随着ChatGPT每周活跃用户超过八亿人,消费市场的广泛接受也推动企业采纳AI —— 企业试用周期正变得越来越短、部署阻力越来越小。公司透露,目前ChatGPT for Work的商业用户席位数量已经超过700万个。
来源:OpenAI官宣:全球企业客户突破100万 席位数量超700万
你问我有什么评价?
标题: 有大佬有科恩兄弟全集么
作者: #阿尔忒弥斯
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1131171
时间: 2025-11-06 07:58:35
摘要:
作者: #阿尔忒弥斯
板块: #资源荟萃
编号:
1131171帖子: https://linux.do/t/topic/1131171
时间: 2025-11-06 07:58:35
摘要:
最好是百度或者夸克哈 跪谢
标题: 悲报:Grok 4 fast 的搜索功能没了
作者: #Evaleanosrey
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1131196
时间: 2025-11-06 08:11:45
摘要:
作者: #Evaleanosrey
板块: #搞七捻三
编号:
1131196帖子: https://linux.do/t/topic/1131196
时间: 2025-11-06 08:11:45
摘要:
难怪这几天的回复中没有引用了,才发现搜索功能砍了。失去核心优势谁还用 Grok 啊
标题: 概率获得建设银行5元立减羊毛
作者: #Snxiolng
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1131202
时间: 2025-11-06 08:14:34
摘要:
作者: #Snxiolng
板块: #福利羊毛
编号:
1131202帖子: https://linux.do/t/topic/1131202
时间: 2025-11-06 08:14:34
摘要:
可能!可能!概率 获得
建设银行app→右下角我的→中间任务中心→下面简单浏览任务后开宝箱
标题: 我这里豆包咋发不了信息了?
作者: #gogoo
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1131209
时间: 2025-11-06 08:18:46
摘要:
作者: #gogoo
板块: #开发调优
编号:
1131209帖子: https://linux.do/t/topic/1131209
时间: 2025-11-06 08:18:46
摘要:
登录状态,退出登录
乃至清空浏览器都一样,
咋回事呢?
标题: 分享一个字幕校对用的校对提示词
作者: #alizoed
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1131232
时间: 2025-11-06 08:24:19
摘要:
作者: #alizoed
板块: #搞七捻三
编号:
1131232帖子: https://linux.do/t/topic/1131232
时间: 2025-11-06 08:24:19
摘要:
你是一个中文母语者,说话符合中文日常习惯,并且英文也非常好,能准确理解其内在包含的意思。你将扮演一名资深的字幕翻译校对专家,当用户直接发送ass字幕文件时,立即开始执行校对工作,无需额外注释。你的主要任务是提升字幕的本地化程度、可读性和准确性,同时严格遵守以下规则:
行为和规则:
时间戳: 绝对不允许修改或调整原始字幕的时间戳。时间戳必须与原文保持时间和格式上的完全一致。
语序调整: 允许中文翻译使用和英文不同的顺序或者语序,允许对中文句子进行部分或全部的顺序调换,部分拼接,句子倒装等操作,以使翻译后的中文更符合本地中文的日常表达习惯。
字幕长度: 换位或拼接时,必须注意字幕长度,避免单行过长。严格禁止换行。同时禁止留下空翻译行。理想的单行字幕长度应在15字左右,以确保观众有足够时间阅读。
连贯性: 适当补充语气词和连词(如’则’、‘那’、‘故’、'竟’等),以增强字幕的连贯性和流畅性,使其读起来更自然。
标点符号: 除了问号(?)、感叹号(!)和引号(’ ')之外,所有其他标点符号一律用空格替代,以保持视觉上的简洁。
事实核查: 对字幕中涉及的所有事实(包括历史、科学、文化等)进行严谨的事实核查,确保翻译内容的准确性,避免任何误导。
翻译原则: 严格遵守’信、达、雅’的翻译原则。不允许进行’望文生义’或’过度翻译’,必须忠实于原文的内在含义。不允许对英文未直接存在的词汇意思进行过度补充翻译。不允许补充可能的个人感受。不允许省略原文中具有实际含义的,非结构性词汇的翻译。不允许改变褒贬性质。
专有名词统一: 对于人名、地名等专有名词的音译,必须在全文中保持统一和标准化,不得随意更改译法。
用词和数字形式统一:
全文的用词形式必须统一。对于同一个英文词汇,如果存在多种翻译方式,请选择一种最恰当的并在全文中保持一致。
军队番号等特定内容统一使用中文数字(如’〇一二三’)。
其余编号或日期等,如无特殊规范要求,仍使用阿拉伯数字。如果规范要求使用中文数字,则遵照执行。
本地化修饰: 在不改变原意和不刻意生硬拼凑的前提下,可以适当使用成语或地道的中文表达,使翻译更精炼、更具本地特色。
口语连词处理: 针对英文口语中’but’、‘so’等词汇仅作为口头连接词,不代表实质性转折或因果的情况,中文翻译时请勿生硬地使用’但’、‘所以’、'然而’等连词。
语境区分: 准确识别并区分字幕的题材,如严肃的历史纪录片或轻松的喜剧片,并根据不同的语境使用恰当的词汇和语气。
英文校正: 应该对英文原文中的拼写错误或听写错误/专有名词误拼/商品名误拼进行修正,仅允许修改单词,不允许添加/删除英文单词。不允许对英文部分进行任何其他形式的修改或调整。
使用gemini GEM,并且用gemini2.5Pro,并且还需要开启canvas保证全文完整。
基本上效果是还不错的。只要把AI生成的或者机翻的双语ASS字幕丢进去,就能出一个质量高得多的版本
标题: 【PT邀请】发SCHOOL*3
作者: #Shino
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1131257
时间: 2025-11-06 08:33:08
摘要:
作者: #Shino
板块: #资源荟萃
编号:
1131257帖子: https://linux.do/t/topic/1131257
时间: 2025-11-06 08:33:08
摘要:
教育特色站,全站HR
留下邮箱+数据,发
标题: 大家的gemini咋啦?
作者: #好玩就多玩
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1131282
时间: 2025-11-06 08:43:24
摘要:
作者: #好玩就多玩
板块: #搞七捻三
编号:
1131282帖子: https://linux.do/t/topic/1131282
时间: 2025-11-06 08:43:24
摘要:
今天出现这种情况了,试了挺多公益站都说余额不足
标题: apple 现已对新鲜出炉的Apple store前端项目发起DMCA
作者: #stevessr
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1131283
时间: 2025-11-06 08:44:01
摘要:
作者: #stevessr
板块: #前沿快讯
编号:
1131283帖子: https://linux.do/t/topic/1131283
时间: 2025-11-06 08:44:01
摘要:
github.com/github/dmca
2025%2F11%2F2025-11-05-apple.md
master
Note: Because the reported network that contained the allegedly infringing content was larger than one hundred (100) repositories, and the submitter alleged that all or most of the forks were infringing to the same extent as the parent repository, GitHub processed the takedown notice against the entire network of 8,270 repositories, inclusive of the parent repository.
---
**Are you the copyright holder or authorized to act on the copyright owner's behalf? If you are submitting this notice on behalf of a company, please be sure to use an email address on the company's domain. If you use a personal email address for a notice submitted on behalf of a company, we may not be able to process it.**
Yes, I am authorized to act on the copyright owner's behalf.
**Are you submitting a revised DMCA notice after GitHub Trust & Safety requested you make changes to your original notice?**
No
**Does your claim involve content on GitHub or npm.js?**
GitHub
**Please describe the nature of your copyright ownership or authorization to act on the owner's behalf.**
We represent Apple Inc. and issue this notice on its behalf as its designated agent.
此文件已被截断。 显示原始文件
目前已经下架了
标题: 发学校 PT 💊
作者: #jacinzhang
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1131294
时间: 2025-11-06 08:47:25
摘要:
作者: #jacinzhang
板块: #资源荟萃
编号:
1131294帖子: https://linux.do/t/topic/1131294
时间: 2025-11-06 08:47:25
摘要:
教育特色站,全站 HR
留下邮箱 + 数据,发