codex如何使用,idea里有插件吗
如题,最近想试试codex,不知道最佳实践是怎样的,只能登录openai账号使用吗,可以使用三方的api key调用吗,求指教
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: libaimu)
如题,最近想试试codex,不知道最佳实践是怎样的,只能登录openai账号使用吗,可以使用三方的api key调用吗,求指教
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: libaimu)
【Cubence】低至0.2x一刀,双十一福利第二弹,抽6000刀,巨多福利和优惠!!!
Cubence一个秉承「小而美」理念的中转站,一切以稳定优先,并保证有性价比的价格!
🚀 极速稳定
我们站已经 非常稳定的运行了一段时间了,得益于调度算法以及严格控制售卖(虽然可能会被说饥饿营销,但确实是为了保证稳定),几乎达到了99%的可用性,也是得到了群友们的一致好评。
📊 官网同源计费
按Token实时计费,计费方式与A社和openai官网完全同步。每一刀都非常耐蹬,codex 扣费0.35倍,cc0.8倍率。无隐藏费用,用量明细一目了然!
虽然我们已经进行过一轮的双十一活动了,但是群友似乎还觉得活动还不够,我们经过内部商讨,决定回应大家的热情,开始双十一活动第二弹:
⏰️至11.11日之前,订阅套餐及按量套餐均打0.75折(为了保证稳定,随时可能停售),使用优惠码【11CUBENCE11】
👉️ 立即抢购: https://cubence.com/
🎁福利抽奖,截止11.8日晚8点,200个30刀,评论区抽奖。
群里可能会抽更大折扣的优惠哦,售前售后群:QQ群
再介绍下Cubence:一个秉承「小而美」理念的中转站,一切以稳定优先,并保证有性价比的价格。
缓存命中率非常奈斯,非常耐蹬,主打稳定。
最后非常感谢各位大家的支持!
41 posts - 41 participants
Read full topic
via LINUX DO - 最新话题 (author: Lynn)
Invalid media:
image
image
Cubence一个秉承「小而美」理念的中转站,一切以稳定优先,并保证有性价比的价格!
🚀 极速稳定
我们站已经 非常稳定的运行了一段时间了,得益于调度算法以及严格控制售卖(虽然可能会被说饥饿营销,但确实是为了保证稳定),几乎达到了99%的可用性,也是得到了群友们的一致好评。
📊 官网同源计费
按Token实时计费,计费方式与A社和openai官网完全同步。每一刀都非常耐蹬,codex 扣费0.35倍,cc0.8倍率。无隐藏费用,用量明细一目了然!
虽然我们已经进行过一轮的双十一活动了,但是群友似乎还觉得活动还不够,我们经过内部商讨,决定回应大家的热情,开始双十一活动第二弹:
⏰️至11.11日之前,订阅套餐及按量套餐均打0.75折(为了保证稳定,随时可能停售),使用优惠码【11CUBENCE11】
👉️ 立即抢购: https://cubence.com/
🎁福利抽奖,截止11.8日晚8点,200个30刀,评论区抽奖。
群里可能会抽更大折扣的优惠哦,售前售后群:QQ群
再介绍下Cubence:一个秉承「小而美」理念的中转站,一切以稳定优先,并保证有性价比的价格。
缓存命中率非常奈斯,非常耐蹬,主打稳定。
最后非常感谢各位大家的支持!
41 posts - 41 participants
Read full topic
via LINUX DO - 最新话题 (author: Lynn)
Invalid media:
image
image
到底该怎么升级,不是都满足条件了吗?
为什么我还没升级 🥲
8 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: zcrane)
Invalid media: image
为什么我还没升级 🥲
8 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: zcrane)
Invalid media: image
离不开linux.do此网站了,怎么办?已经被硬控一上午了
我的时间去哪了? 😭
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 吃喝不愁)
我的时间去哪了? 😭
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 吃喝不愁)
何小鹏发布一镜到底无剪辑视频,回应 IRON 机器人里“藏真人”质疑 - IT之家
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
Invalid media:
image
image
image
image
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
Invalid media:
image
image
image
image
【RoxyBrowser】 好久不见,请大家一起看 Netflix!
如何参与?
客户端左下角即可找到 Roxy 资源入口(版本需更新至 3.6.0),对于还没下载的佬友,可以通过 L站专属链接 下载客户端。
欢迎佬友们体验,有任何问题或建议都可以随时回帖交流 :bili_031: 也可以通过客户端右下方蓝色客服按钮加入官方群组~
未来我们会根据大家的需求和反馈不断优化,提供更多不同类型、有价值的共享资源。
Read full topic
via LINUX DO - 最新话题 (author: RoxyBrowser)
Invalid media: image
时隔数月,RoxyBrowser 流媒体认证终于得到了解决 💰️ :distorted_face:我们搭建了一个 Netflix 共享空间并购置了一批 Premium 账号,现已配置好环境请佬友体验 :lark_085:
如何参与?
客户端左下角即可找到 Roxy 资源入口(版本需更新至 3.6.0),对于还没下载的佬友,可以通过 L站专属链接 下载客户端。
欢迎佬友们体验,有任何问题或建议都可以随时回帖交流 :bili_031: 也可以通过客户端右下方蓝色客服按钮加入官方群组~
未来我们会根据大家的需求和反馈不断优化,提供更多不同类型、有价值的共享资源。
PS:紧急删除了一个用“Ctrl+Enter”换行而发直接出去的帖…:distorted_face:7 posts - 7 participants
Read full topic
via LINUX DO - 最新话题 (author: RoxyBrowser)
Invalid media: image
今天能不能吃上KFC ,就看下午与老庄的博弈了
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 青云)
Invalid media: image
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 青云)
Invalid media: image
Switch硬改成功了
之前试着自己硬破我的老Switch,结果不太成功,还差点把机器焊坏了:
https://linux.do/t/topic/1119831
这两天冷静下来去看了很多油管视频,发现别人焊EMMC的时候,都是按一下就好了
但我就不行,感觉焊锡被烙铁吸回去了!
所以强烈怀疑是烙铁温度偏低,我平时焊东西是用375度的,这下给他来到445度,再把尖头换成平头,终于找到视频上的感觉了,挂满锡怼上去,几秒钟看到冒烟了再拿起来,这下热透“纸”背了
再连上Picofly就成功破解了!已经开始下大气层整合包了~
下一步打算改机换壳之类的,有没有佬一起玩的
39 posts - 32 participants
Read full topic
via LINUX DO - 热门话题 (author: xiedidan)
之前试着自己硬破我的老Switch,结果不太成功,还差点把机器焊坏了:
https://linux.do/t/topic/1119831
这两天冷静下来去看了很多油管视频,发现别人焊EMMC的时候,都是按一下就好了
但我就不行,感觉焊锡被烙铁吸回去了!
所以强烈怀疑是烙铁温度偏低,我平时焊东西是用375度的,这下给他来到445度,再把尖头换成平头,终于找到视频上的感觉了,挂满锡怼上去,几秒钟看到冒烟了再拿起来,这下热透“纸”背了
再连上Picofly就成功破解了!已经开始下大气层整合包了~
下一步打算改机换壳之类的,有没有佬一起玩的
39 posts - 32 participants
Read full topic
via LINUX DO - 热门话题 (author: xiedidan)
飘云、吾爱、品技论坛帮忙下载,不忙有币的时候看到就会帮
混迹了一阵子也算有点币子但不多,有需要的佬友可以留言帮下,看到就会回复
❤️❤️❤️❤️❤️顺便求个赞,助我重回巅峰 ❤️❤️❤️❤️❤️
21 posts - 18 participants
Read full topic
via LINUX DO - 热门话题 (author: vae)
Invalid media:
image
image
image
混迹了一阵子也算有点币子但不多,有需要的佬友可以留言帮下,看到就会回复
❤️❤️❤️❤️❤️顺便求个赞,助我重回巅峰 ❤️❤️❤️❤️❤️
21 posts - 18 participants
Read full topic
via LINUX DO - 热门话题 (author: vae)
Invalid media:
image
image
image
在Github上给开源项目贡献PR全流程
本文主要提供给那些想要给开源仓库做贡献,但不熟悉完整工作流程的小伙伴~
(假定已装好 git、配好 SSH,且已完成过一次 fork)
1. 一次性准备
2. 日常开工 → 同步最新官方代码
3. 写新功能
4. 提 PR
GitHub 页面 → Compare & pull request
base 选
5. 后续迭代(官方仓库有更新)
(PR 会自动更新)
总结:
完整工作流:先同步 main → 新分支开发 → push → PR → rebase 保新鲜。
其他
查看当前本地仓库所关联的远程仓库(remote)信息。通过这个命令,你可以快速确认当前仓库连接的远程服务器地址,避免推送到错误的仓库,或检查远程地址是否正确配置。
8 posts - 8 participants
Read full topic
via LINUX DO - 热门话题 (author: Jacky)
本文主要提供给那些想要给开源仓库做贡献,但不熟悉完整工作流程的小伙伴~
(假定已装好 git、配好 SSH,且已完成过一次 fork)
1. 一次性准备
git clone git@github.com:你的用户名/repository_name.git # clone自己 fork 下来的仓库
cd repository_name # 进入项目文件夹
git remote add upstream git@github.com原仓库拥有者的用户名/repository_name.git # 要做贡献的原始仓库
2. 日常开工 → 同步最新官方代码
git fetch upstream # 拉取最新的代码
git checkout main # 切换到主分支
git reset --hard upstream/main # 让本地 main 变成“跟上游完全一致”的状态,通常只在“同步官方代码”时使用。 --hard :未提交改动全部丢弃
git push origin main --force-with-lease # 把 fork 的 main 也更新
3. 写新功能
git checkout -b feature/短描述 # 在新的分支上进行开发
# 写代码、commit
git push origin feature/短描述
4. 提 PR
GitHub 页面 → Compare & pull request
base 选
chen-zeong/DTV:main,compare 选你的 feature/短描述 → 填标题/描述 → Create PR5. 后续迭代(官方仓库有更新)
git fetch upstream
git checkout feature/短描述
git rebase upstream/main
git push origin feature/短描述 --force-with-lease
(PR 会自动更新)
总结:
完整工作流:先同步 main → 新分支开发 → push → PR → rebase 保新鲜。
其他
查看当前本地仓库所关联的远程仓库(remote)信息。通过这个命令,你可以快速确认当前仓库连接的远程服务器地址,避免推送到错误的仓库,或检查远程地址是否正确配置。
git remote -v
8 posts - 8 participants
Read full topic
via LINUX DO - 热门话题 (author: Jacky)
谷歌Gemini平台即将推出Nano Banana 2,图像生成技术再升级
据最新消息,谷歌正加紧准备发布其备受关注的AI图像生成模型Nano Banana2,内部代号GEMPIX2。这一动态源于Gemini官方网站近日新增的一则公告,业内人士预计,该模型将在未来几周内正式亮相。这标志着谷歌在生成式AI领域的创新步伐进一步加速,旨在为用户带来更高效、更精准的图像创作体验。
此次Nano Banana2的曝光,源于Gemini UI界面中出现的预告卡片和技术指标。这些线索显示,新版模型将延续前作的创意焦点,针对专业创作者和开发者优化视觉生成速度与艺术风格多样性。同时,它可能与Gemini3.0系列深度整合,进一步提升多模态处理能力,如视频概述的自定义视觉风格生成。
谷歌方面尚未公布具体细节,但公告的出现通常预示着发布窗口已近在咫尺,或将伴随NotebookLM和Google Photos等产品的更新一同登场。分析人士指出,Nano Banana的成功不仅源于其技术领先——如内置SynthID数字水印以标识AI生成内容,还得益于与Gemini应用的 seamless 融合,让普通用户也能像专业设计师一样操作。
Source: 谷歌Gemini平台即将推出Nano Banana2,图像生成技术再升级
17 posts - 16 participants
Read full topic
via LINUX DO - 热门话题 (author: Bunn)
Invalid media: image
据最新消息,谷歌正加紧准备发布其备受关注的AI图像生成模型Nano Banana2,内部代号GEMPIX2。这一动态源于Gemini官方网站近日新增的一则公告,业内人士预计,该模型将在未来几周内正式亮相。这标志着谷歌在生成式AI领域的创新步伐进一步加速,旨在为用户带来更高效、更精准的图像创作体验。
此次Nano Banana2的曝光,源于Gemini UI界面中出现的预告卡片和技术指标。这些线索显示,新版模型将延续前作的创意焦点,针对专业创作者和开发者优化视觉生成速度与艺术风格多样性。同时,它可能与Gemini3.0系列深度整合,进一步提升多模态处理能力,如视频概述的自定义视觉风格生成。
谷歌方面尚未公布具体细节,但公告的出现通常预示着发布窗口已近在咫尺,或将伴随NotebookLM和Google Photos等产品的更新一同登场。分析人士指出,Nano Banana的成功不仅源于其技术领先——如内置SynthID数字水印以标识AI生成内容,还得益于与Gemini应用的 seamless 融合,让普通用户也能像专业设计师一样操作。
Source: 谷歌Gemini平台即将推出Nano Banana2,图像生成技术再升级
17 posts - 16 participants
Read full topic
via LINUX DO - 热门话题 (author: Bunn)
Invalid media: image
465块 线上配眼镜
佬友们准备线上配个眼镜
依视路膜岩1.60:248
纯钛眼镜框:132
宝岛验光:85
总价:465
值得吗?佬们有别的建议吗?
95 posts - 44 participants
Read full topic
via LINUX DO - 热门话题 (author: BigDream)
佬友们准备线上配个眼镜
依视路膜岩1.60:248
纯钛眼镜框:132
宝岛验光:85
总价:465
值得吗?佬们有别的建议吗?
95 posts - 44 participants
Read full topic
via LINUX DO - 热门话题 (author: BigDream)
【第19弹】微信读书 | 自选书籍 66元!
----------------------
🎁 奖品详情
中奖者一位。
⏰️ 活动时间
即刻 🔜 Fri, Nov 7, 2025 3:30 PM CST
🎯 参与方式
在本帖下回复即可。
📢 抽奖规则
● 每位用户可多次参与,但中奖只取一次。
● 语义不明的回复视为无效(被我拉黑导致消息隐藏了的也为无效),中奖者将顺移至下一层,直到符合要求。
● 中奖者未按照私信信息24小时内回复视为放弃。
● 使用 官方抽奖程序 随机抽取中奖者。
----------------------
点赞不能提高中奖率,但可以让大鹅开心一整天 ————鲁鹅
58 posts - 58 participants
Read full topic
via LINUX DO - 热门话题 (author: Clarke.L)
[!danger] 参与须知
非实体书籍。不可折现。按需参与。
----------------------
🎁 奖品详情
中奖者一位。
微信读书 中 可赠送 书籍,总价值在 66币 以内。⏰️ 活动时间
即刻 🔜 Fri, Nov 7, 2025 3:30 PM CST
🎯 参与方式
在本帖下回复即可。
📢 抽奖规则
● 每位用户可多次参与,但中奖只取一次。
● 语义不明的回复视为无效(被我拉黑导致消息隐藏了的也为无效),中奖者将顺移至下一层,直到符合要求。
● 中奖者未按照私信信息24小时内回复视为放弃。
● 使用 官方抽奖程序 随机抽取中奖者。
----------------------
点赞不能提高中奖率,但可以让大鹅开心一整天 ————鲁鹅
58 posts - 58 participants
Read full topic
via LINUX DO - 热门话题 (author: Clarke.L)
大家谨防这种引流的公益站
一周前在论坛看到一个公益站 里面提供的gemini还挺好用的 每天签到给的也足够低频使用
前两天突然发现签到按钮没了api站公告里更是要求加Q群签到
加了Q群快2000人了 也没看到签到方式在哪,群里有人问也没人回应 公告里直接要求拉人头
感觉不对劲就赶紧退了 想着额度用完就算了 结果到今天所有模型都不给用了
49 posts - 36 participants
Read full topic
via LINUX DO - 热门话题 (author: 水电柔火电暖核电硬)
Invalid media: image
一周前在论坛看到一个公益站 里面提供的gemini还挺好用的 每天签到给的也足够低频使用
前两天突然发现签到按钮没了api站公告里更是要求加Q群签到
加了Q群快2000人了 也没看到签到方式在哪,群里有人问也没人回应 公告里直接要求拉人头
感觉不对劲就赶紧退了 想着额度用完就算了 结果到今天所有模型都不给用了
49 posts - 36 participants
Read full topic
via LINUX DO - 热门话题 (author: 水电柔火电暖核电硬)
Invalid media: image
【day4】augment code 34000积分 * 5 连抽五天,冲冲冲 【day3已发】!!!!
【奖品】:augment 34000积分 账号 * 5
:three_o_clock: 活动时间:
开始时间:2025 年 11 月 06日 09:00
截止时间:2025 年 11 月 07日 09:00
📝 参与方式:
谈谈你对Zaugment的意见?没有也没事
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用论坛官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
发奖格式为session
貌似发到L站中横线解析有问题 后面发租户url+token的json:
安装防封插件后 账号管理点击相应编辑器即可上号
希望大家多多反馈,以便我进行后续优化更新
Zaugment下载:
github.com
GitHub - Zheng-up/zAugment: zaugment
zaugment
99 posts - 99 participants
Read full topic
via LINUX DO - 热门话题 (author: zheng)
Invalid media:
image
image
【奖品】:augment 34000积分 账号 * 5
:three_o_clock: 活动时间:
开始时间:2025 年 11 月 06日 09:00
截止时间:2025 年 11 月 07日 09:00
📝 参与方式:
谈谈你对Zaugment的意见?没有也没事
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用论坛官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
发奖格式为session
貌似发到L站中横线解析有问题 后面发租户url+token的json:
{打开Zaugment 首页选择账号管理 新增 手动输入 将值填入保存即可
“tenant_url”: “xxxx”,
“access_token”: “xxxx”
}
安装防封插件后 账号管理点击相应编辑器即可上号
希望大家多多反馈,以便我进行后续优化更新
Zaugment下载:
github.com
GitHub - Zheng-up/zAugment: zaugment
zaugment
99 posts - 99 participants
Read full topic
via LINUX DO - 热门话题 (author: zheng)
Invalid media:
image
image
送几个cursor试用和aug积分 token
送5个cursor pro trial和2个aug积分 token。
cdk.linux.do
LINUX DO CDK
Linux Do 社区 CDK 快速分享平台 - 让分享变得更简单
佬友们助我升三级!!领到后随机是aug和cursor。
15 posts - 14 participants
Read full topic
via LINUX DO - 热门话题 (author: 7xia)
Invalid media: image
送5个cursor pro trial和2个aug积分 token。
cdk.linux.do
LINUX DO CDK
Linux Do 社区 CDK 快速分享平台 - 让分享变得更简单
佬友们助我升三级!!领到后随机是aug和cursor。
15 posts - 14 participants
Read full topic
via LINUX DO - 热门话题 (author: 7xia)
Invalid media: image
吾爱破解新规
一下子少了两百多积分 头像都没有了
92 posts - 67 participants
Read full topic
via LINUX DO - 热门话题 (author: 叶泯希)
Invalid media: image
一下子少了两百多积分 头像都没有了
92 posts - 67 participants
Read full topic
via LINUX DO - 热门话题 (author: 叶泯希)
Invalid media: image
【L站连帽卫衣来啦!】
不少佬友反馈喜欢连帽卫衣,戴上帅气的帽子,不仅能防风保暖,还能酷酷地沉浸在自己的空间里……
没问题,衫外有山来安排!
经过反复多次地调整版形,L站专属连帽卫衣来啦!面料安全舒适,帽子版型独特,采用双层整片式无缝版,让帽子更立体,更有形!
品质感拉满!性价比拉满!
如图片:
听说双十一天花乱坠的优惠券让大家手忙脚乱,先上调价格再叠加并隐藏各种券和好评返现,要算清楚到手价可是不容易啊!
佬友们莫烦躁,衫外有山以最低价真诚相待,链接如下:
灰色卫衣链接:【淘宝】7天无理由退货 https://e.tb.cn/h.SpPiUn3VjWaWOoP?tk=2SlEf6FWRhu
黑色卫衣链接:【淘宝】7天无理由退货 https://e.tb.cn/h.SpP7PkY9xARCegT?tk=rnQ1f6F2Uu6
42 posts - 31 participants
Read full topic
via LINUX DO - 热门话题 (author: 衫外有山)
Invalid media:
image
image
image
image
image
image
不少佬友反馈喜欢连帽卫衣,戴上帅气的帽子,不仅能防风保暖,还能酷酷地沉浸在自己的空间里……
没问题,衫外有山来安排!
经过反复多次地调整版形,L站专属连帽卫衣来啦!面料安全舒适,帽子版型独特,采用双层整片式无缝版,让帽子更立体,更有形!
品质感拉满!性价比拉满!
如图片:
听说双十一天花乱坠的优惠券让大家手忙脚乱,先上调价格再叠加并隐藏各种券和好评返现,要算清楚到手价可是不容易啊!
佬友们莫烦躁,衫外有山以最低价真诚相待,链接如下:
灰色卫衣链接:【淘宝】7天无理由退货 https://e.tb.cn/h.SpPiUn3VjWaWOoP?tk=2SlEf6FWRhu
黑色卫衣链接:【淘宝】7天无理由退货 https://e.tb.cn/h.SpP7PkY9xARCegT?tk=rnQ1f6F2Uu6
42 posts - 31 participants
Read full topic
via LINUX DO - 热门话题 (author: 衫外有山)
Invalid media:
image
image
image
image
image
image
Gemini 3 Pro召回率测评,召回率只有2.5Pro的1/3, 上下文注意力大退步,实际写代码完全不能用
话说在前:
我发帖的时候就标注过了,这里的30k只是在我测试环境里的30k,不能直接照搬。只能说,同样的环境下,同样的准确率,2.5p能支持到大概70-100k。3p大概30-40k,差不多是2-3倍的关系。
不知道怎么传着传着成了上下文只有30k了,我发帖就说过这里的上下文只表示测试时用的。
实际上应该这么理解,处理同一段文本,召回率(这里用的就是字面意思,从文本里提取出数字的能力)上2.5p的效果是3p的2-3倍
----------------------
直接上图吧,测试了一下3p的大海捞针曲线,可以发现基本上和lithiumflow还有o一串的曲线稳合,说明之前在lmarena竞技场的l和o一串模型就是3p的很新的一个检查点或者微调
实际用起来也一样,超过20-30k后,就很容易一直报diff失败了,召回率很烂
从曲线来看,只有2.5pro的1/3水平(图里的上下文只表示测试环境,不等于实际体验,但相对关系和曲线走势还是有意义的)
但是3pro在其有效上下文,也就是召回率为100%时的表现还是要比2.5pro高太多了
这也是为什么各种看各种推特的烂炒3p怎么怎么好,因为他们都是只发一句提示词,输入上下文可能连10k都没有,完全体现不出模型的注意力/召回率
但是吧,你召回率只有2.5p的1/3,那还怎么用啊,好能力被上下文拉了
总结:模型能力出色,但是注意力巨烂,完全是大退步。谷歌经典整数必炸
Gemini系列全家桶测试曲线
下面是3p具体的:
测试仓库:
github.com
GitHub - Lianues/LLM-NeedleInAHaystack: Needle in a Haystack benchmark for evaluating LLM...
Needle in a Haystack benchmark for evaluating LLM recall and attention mechanisms with edit distance scoring.
26 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: 羽织)
Invalid media:
image
image
image
image
image
image
image
image
话说在前:
我发帖的时候就标注过了,这里的30k只是在我测试环境里的30k,不能直接照搬。只能说,同样的环境下,同样的准确率,2.5p能支持到大概70-100k。3p大概30-40k,差不多是2-3倍的关系。
不知道怎么传着传着成了上下文只有30k了,我发帖就说过这里的上下文只表示测试时用的。
实际上应该这么理解,处理同一段文本,召回率(这里用的就是字面意思,从文本里提取出数字的能力)上2.5p的效果是3p的2-3倍
----------------------
直接上图吧,测试了一下3p的大海捞针曲线,可以发现基本上和lithiumflow还有o一串的曲线稳合,说明之前在lmarena竞技场的l和o一串模型就是3p的很新的一个检查点或者微调
实际用起来也一样,超过20-30k后,就很容易一直报diff失败了,召回率很烂
从曲线来看,只有2.5pro的1/3水平(图里的上下文只表示测试环境,不等于实际体验,但相对关系和曲线走势还是有意义的)
但是3pro在其有效上下文,也就是召回率为100%时的表现还是要比2.5pro高太多了
这也是为什么各种看各种推特的烂炒3p怎么怎么好,因为他们都是只发一句提示词,输入上下文可能连10k都没有,完全体现不出模型的注意力/召回率
但是吧,你召回率只有2.5p的1/3,那还怎么用啊,好能力被上下文拉了
总结:模型能力出色,但是注意力巨烂,完全是大退步。谷歌经典整数必炸
Gemini系列全家桶测试曲线
下面是3p具体的:
测试仓库:
github.com
GitHub - Lianues/LLM-NeedleInAHaystack: Needle in a Haystack benchmark for evaluating LLM...
Needle in a Haystack benchmark for evaluating LLM recall and attention mechanisms with edit distance scoring.
26 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: 羽织)
Invalid media:
image
image
image
image
image
image
image
image
可能是用过最好的MCP server - mcp-sequentialthinking-tools
github.com
GitHub - spences10/mcp-sequentialthinking-tools: 🧠 An adaptation of the MCP Sequential Thinking...
🧠 An adaptation of the MCP Sequential Thinking Server to guide tool usage. This server provides recommendations for which MCP tools would be most effective at each stage.
无意间在github发现的一个基于初代sequential-thinking的升级版思考mcp
sequential-thinking 是一个给大模型使用的工具,结构化思考,增强推理.
此项面在原本的基础上增加了 branch, revise, rational 等诸多实用特性, 项目目前仍在维护中.
35 posts - 21 participants
Read full topic
via LINUX DO - 热门话题 (author: cedric chen)
Invalid media: image
github.com
GitHub - spences10/mcp-sequentialthinking-tools: 🧠 An adaptation of the MCP Sequential Thinking...
🧠 An adaptation of the MCP Sequential Thinking Server to guide tool usage. This server provides recommendations for which MCP tools would be most effective at each stage.
无意间在github发现的一个基于初代sequential-thinking的升级版思考mcp
sequential-thinking 是一个给大模型使用的工具,结构化思考,增强推理.
此项面在原本的基础上增加了 branch, revise, rational 等诸多实用特性, 项目目前仍在维护中.
{
"mcpServers": {
"mcp-sequentialthinking-tools": {
"command": "npx",
"args": ["-y", "mcp-sequentialthinking-tools"],
"env": {
"MAX_HISTORY_SIZE": "1000"
}
}
}
}35 posts - 21 participants
Read full topic
via LINUX DO - 热门话题 (author: cedric chen)
Invalid media: image
悲报!用了三年的OpenAI账号于2025.11.05 14:32被封禁
今天无意间看到需要认证组织才能使用o3这类的高级模型,遂来L站看看佬们都是怎么认证的,在看到这篇我去,拿中国大陆身份证过了OpenAI组织认证后决定也去试试,完成认证后回到控制台,发现账号在一瞬间就被封了,访问大部分页面都会报账号已被封禁和无法加载订阅信息
应该不是ip的问题,我经常都在用各种节点上号。这是发现我是用中国的信息认证直接封了?
并且同邮箱的ChatGPT也被封了,现在访问已经看不到历史对话记录,头像也没有加载。移动端APP也无法发送消息了 😭
同时邮箱也收到了封号通知
这个号是2022年底注册的,当时还在上高中,在新闻上看到有个叫ChatGPT的人工智能推出,就兴致勃勃地拿班上的电脑,随便找了免费个开梯子的Edge插件。当时才刚发布不久,没有什么复杂的风控,随便拿QQ邮箱的foxmail别名后缀就注册上直接开用了,当时接收激活链接的邮件现在都还在我收件箱里
从那时起就用得越来越频繁了,还用它给班上好几个同学写了一些烦人的报告。在此后的三年间,这个号任凭我切ip换节点,几个设备同时登录,都没有被风控卡过。因此我还经常和朋友吹我这是早期注册的种子账号,是很难被封的。
而今天,在2025年11月5日下午两点半,在我的自投罗网下,Oai发现了我是来自中国大陆的公民,遂封禁了它…… 😥 😥
28 posts - 25 participants
Read full topic
via LINUX DO - 热门话题 (author: mvec)
Invalid media:
image
image
image
image
今天无意间看到需要认证组织才能使用o3这类的高级模型,遂来L站看看佬们都是怎么认证的,在看到这篇我去,拿中国大陆身份证过了OpenAI组织认证后决定也去试试,完成认证后回到控制台,发现账号在一瞬间就被封了,访问大部分页面都会报账号已被封禁和无法加载订阅信息
应该不是ip的问题,我经常都在用各种节点上号。这是发现我是用中国的信息认证直接封了?
并且同邮箱的ChatGPT也被封了,现在访问已经看不到历史对话记录,头像也没有加载。移动端APP也无法发送消息了 😭
同时邮箱也收到了封号通知
这个号是2022年底注册的,当时还在上高中,在新闻上看到有个叫ChatGPT的人工智能推出,就兴致勃勃地拿班上的电脑,随便找了免费个开梯子的Edge插件。当时才刚发布不久,没有什么复杂的风控,随便拿QQ邮箱的foxmail别名后缀就注册上直接开用了,当时接收激活链接的邮件现在都还在我收件箱里
从那时起就用得越来越频繁了,还用它给班上好几个同学写了一些烦人的报告。在此后的三年间,这个号任凭我切ip换节点,几个设备同时登录,都没有被风控卡过。因此我还经常和朋友吹我这是早期注册的种子账号,是很难被封的。
而今天,在2025年11月5日下午两点半,在我的自投罗网下,Oai发现了我是来自中国大陆的公民,遂封禁了它…… 😥 😥
28 posts - 25 participants
Read full topic
via LINUX DO - 热门话题 (author: mvec)
Invalid media:
image
image
image
image