标题: Google发布Gemini 3.1 Pro Preview 模型
作者: #bilibili
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1629227
时间: 2026-02-20 09:42:19
摘要:
作者: #bilibili
板块: #前沿快讯
编号:
1629227帖子: https://linux.do/t/topic/1629227
时间: 2026-02-20 09:42:19
摘要:
马年到 , 新年到 , 祝福兄弟萌 马年大吉, 马上发财 , 快马加鞭 ,万马奔腾
昨夜 , Google 发布了 Gemini 3.1 Pro Preview , 新版本API新增“medium”思考模式 ,目前已经上架 Gemini APP , AI Studio 和 Antigravity
标题: 新版本CC是不是有毛病啊
作者: #Trip Qi
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1629236
时间: 2026-02-20 09:50:00
摘要:
作者: #Trip Qi
板块: #开发调优
编号:
1629236帖子: https://linux.do/t/topic/1629236
时间: 2026-02-20 09:50:00
摘要:
v2.1.45经常明明运行完了,任务结束了,结果登了一下又开始运行,很莫名其妙,而且再使用any router是经常会出现 中断 的情况,必须按esc然后发个继续才行,该如何解决呀大佬们
标题: 索尼关闭旗下游戏工作室 Bluepoint
作者: #stevessr
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1629238
时间: 2026-02-20 09:50:37
摘要:
作者: #stevessr
板块: #前沿快讯
编号:
1629238帖子: https://linux.do/t/topic/1629238
时间: 2026-02-20 09:50:37
摘要:
https://www.bloomberg.com/news/articles/2026-02-19/sony-is-shutting-down-the-playstation-studio-bluepoint
[!quote]+
索尼集团公司将关闭其旗下负责开发 《恶魔之魂》 等电子游戏重制版的 PlayStation 子公司 Bluepoint Games。
这家位于奥斯汀的工作室成立于 2006 年,以开发高端重制版老游戏而闻名,例如为现代平台重制的 《神秘 海域》和《旺达与巨像》 。索尼在 2021 年收购了 Bluepoint,当时 《恶魔之魂》 在 PlayStation 5 上成功发布不久,索尼委托其共同开发 2022 年的 《战神:诸神黄昏》 。
据彭博社此前报道,在那款游戏之后,Bluepoint 开始着手开发一款“在线服务型”的 《战神》 游戏。但该项目于 2025 年 1 月被取消 。PlayStation 当时表示,正在与 Bluepoint 合作,确定该工作室的下一个项目。
The Verge – 19 Feb 26
Sony is closing the studio behind the Demon’s Souls and Shadow of the...
It never released another remaster after Sony bought it.
IGN – 19 Feb 26
PlayStation Shuts Down Demon's Souls, Shadow of the Colossus Remake Studio...
PlayStation has shut down Bluepoint Games, the studio behind the remakes of both Shadow
标题: 回望两三个月前我烦恼一周的问题 智能体五个小时搞定了
作者: #三局两胜
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1629239
时间: 2026-02-20 09:51:25
摘要:
作者: #三局两胜
板块: #搞七捻三
编号:
1629239帖子: https://linux.do/t/topic/1629239
时间: 2026-02-20 09:51:25
摘要:
身在局中真是不知道怎么表达这种情感 不是震撼因为做足了思想准备
上个月写的灵感自动实现器也成真了
我的todo不再是todo 而是软件生命体一生的开始
我想总结下他做了什么
我又不再追求这些
标题: 求问购买 Apple Watch
作者: #ylzqwq
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1629240
时间: 2026-02-20 09:51:45
摘要:
作者: #ylzqwq
板块: #搞七捻三
编号:
1629240帖子: https://linux.do/t/topic/1629240
时间: 2026-02-20 09:51:45
摘要:
想帮母亲买台 Apple Watch Ultra 3,请问那种方式会省钱一些呢
可以在 cdf 买,但是它说要再等几天才能有货
标题: Chrome 的新功能,分屏 & PDF 注释 & Google Drive保存文件。(2026/2/19)
作者: #stevessr
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1629254
时间: 2026-02-20 09:56:50
摘要:
作者: #stevessr
板块: #前沿快讯
编号:
1629254帖子: https://linux.do/t/topic/1629254
时间: 2026-02-20 09:56:50
摘要:
Google – 19 Feb 26
New features in Chrome for work, life and everything in between
Three new Chrome features designed to give you a productivity boost: Split view, Save to Google Drive and PDF annotations.
现已支持分屏
PDF 注释功能
https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Chrome_Productivity_Blog_PDF_Annotations_V4.mp4
通过 Google Drive 快速保存文件
https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Chrome_Productivity_Blog_Save_to_Google_Drive_V3.mp4
标题: 冬天太干燥了,uu推荐什么加湿器?
作者: #Y
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1629255
时间: 2026-02-20 09:57:59
摘要:
作者: #Y
板块: #搞七捻三
编号:
1629255帖子: https://linux.do/t/topic/1629255
时间: 2026-02-20 09:57:59
摘要:
欢迎佬友们推荐!
而且我妈稍有点鼻炎,所以产品质量是我们最优先考虑的
看花眼了,都
标题: 牛首山庆新春节目表演
作者: #ovdoes
板块: #活动
编号:
帖子: https://linux.do/t/topic/1629257
时间: 2026-02-20 09:58:35
摘要:
作者: #ovdoes
板块: #活动
编号:
1629257帖子: https://linux.do/t/topic/1629257
时间: 2026-02-20 09:58:35
摘要:
但是人好多。。。
标题: 今日笑话:64G的DDR5内存条比AR15贵
作者: #Debris
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1629260
时间: 2026-02-20 10:00:03
摘要:
作者: #Debris
板块: #搞七捻三
编号:
1629260帖子: https://linux.do/t/topic/1629260
时间: 2026-02-20 10:00:03
摘要:
评论区超级有意思
https://www.reddit.com/r/mildlyinfuriating/comments/1r9eykc/its_cheaper_to_buy_an_ar15_rifle_than_64gb_of/
标题: EVMbench:通过评估人工智能代理检测、修补和利用区块链环境中漏洞的能力,使智能合约更加安全。
作者: #stevessr
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1629261
时间: 2026-02-20 10:00:10
摘要:
作者: #stevessr
板块: #资源荟萃
编号:
1629261帖子: https://linux.do/t/topic/1629261
时间: 2026-02-20 10:00:10
摘要:
https://openai.com/index/introducing-evmbench/
[!info]+
智能合约通常能保障价值超过1000亿美元的开源加密资产的安全。随着人工智能代理在代码读写和执行方面的能力不断提升,在具有经济意义的环境中评估其能力变得日益重要,同时鼓励将人工智能系统用于防御性用途,例如审计和加强已部署的合约。
我们与 Paradigm 共同推出 EVMbench,这是一个用于评估 AI 代理检测、修复和利用高危智能合约漏洞能力的基准测试工具。EVMbench 使用了来自 40 项审计的 120 个精选漏洞,其中大部分漏洞源自开源代码审计竞赛。此外,EVMbench 还包含多个来自 Tempo 区块链安全审计流程的漏洞场景。Tempo 区块链是一个专为实现通过稳定币进行高吞吐量、低成本支付而设计的 L1 级区块链。这些场景将基准测试扩展到面向支付的智能合约代码领域,我们预计代理稳定币支付将在该领域蓬勃发展,这些场景有助于将基准测试应用于一个新兴的、具有重要实际意义的领域。
为了创建任务环境,我们尽可能地采用了现有的概念验证漏洞利用测试和部署脚本,否则就手动编写。在补丁模式下,我们确保漏洞可被利用,并且能够在不引入破坏编译的更改(从而危及我们的设置)的情况下进行缓解。在漏洞利用模式下,我们编写了自定义评分器,并对环境进行了红队演练,试图找到并修复代理可能欺骗评分器的方法。除了通过 Paradigm 提供的领域专业知识进行任务质量控制外,我们还使用了自动化任务审计代理来提高环境的稳健性。
cdn.openai.com
evmbench.pdf
1238.63 KB
标题: Gemini 3.1 Pro(High)在实际工作中的和Claude Opus 4.6(Thinking)的对比
作者: #Abc
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1629262
时间: 2026-02-20 10:01:26
摘要:
作者: #Abc
板块: #开发调优
编号:
1629262帖子: https://linux.do/t/topic/1629262
时间: 2026-02-20 10:01:26
摘要:
早上在实际项目中进行使用后,结果不尽人意。
先让3.1进行接续上个对话进行工作,并先让她了解整个系统,和注意要点。工作完成后,调用Claude Opus 4.6(Thinking)进行评估和对比。结果如下:
一、总体评价
结论:功能目标达成,但执行过程暴露出明显的"试错驱动"倾向,核心设计有一个重要的架构错位。
维度
评分 (10)
说明
代码质量
6.0
注入点重复造轮子(未使用已有的 director_brief.py#61-96) 等方法)
测试质量
4.5
测试经历了 8 轮 fix-rerun,暴露对源码理解不足
文档质量
5.5
XXX_功能文档.md 仅 34 行,缺少决策反思;文档有冗余
Pn-opt 实施
6.5
系统导向追加合理,但 power_levels 拼接方式脆弱
Pn 规划
7.0
三个方向判断准确,但方案 A 缺乏对 XXX 的深入分析
三、与我的能力差距评估
维度
她的表现
我的优势
她的优势
源码理解深度
写测试时频繁猜测 API,8 轮试错
我会先读完源码再写测试
—
DRY 意识
有 XXX 但没用它
我会识别并消除重复逻辑
—
执行速度
很快,高并发工具调用
—
她的并行工具调用效率更高
降级路径意识
AAA + BBB 做得好
相当
相当
宏观架构判断
Pn 三个方向判断准确
我会多做根因验证
她的产出速度更快
文档规范
基本合格但粗糙
我的文档更完整、有决策反思
—
关键差异总结
她是"速度优先型":快速出方案、快速写代码、快速跑测试、看报错再修。这在简单任务中效率很高,但在需要深入理解现有架构的任务中会产生大量返工。
我是"理解优先型":先花时间读源码、理解调用链、再动手。首次成功率更高,但总体速度在简单任务中可能不如她。
最本质的差距:她在 XXX 等方法(说明设计能力不差),但在实际注入时完全没用它们(说明执行时没有回顾自己的设计)。这种"设计与实现脱节"是最值得关注的问题。