最近你们用过XAI 的GROK没有?感觉已经彻底废了
我本地有IndexTTS,但是顺手问GROK能不能生成语音,然后就这样了。。。发现它最近超级喜欢胡编,而且语气偏向小混混。
11 posts - 10 participants
Read full topic
via LINUX DO - 最新话题 (author: a106511994)
Invalid media: image
我本地有IndexTTS,但是顺手问GROK能不能生成语音,然后就这样了。。。发现它最近超级喜欢胡编,而且语气偏向小混混。
11 posts - 10 participants
Read full topic
via LINUX DO - 最新话题 (author: a106511994)
Invalid media: image
用AI Studio做了一个AI微信群聊
灵感来源与这个大佬的帖子: 分享一个自己写的多 AI 角色群聊的开源项目, 欢迎体验 - 开发调优 - LINUX DO
做的不是很完善,我把链接发出来大家都可以在AI Studio上面与Gemini 3.0一起完善这个项目
这是AI Studio的链接:https://ai.studio/apps/drive/1qHdAgtnBCJ5JQUMFkvocqI-qxOkL9G_X?fullscreenApplet=true
这个是Github的仓库网址: Qinglianzihan/AI-Wechat-AI-: 可以让模型自由对话,仅娱乐
如果需要放在本地建议大家使用上面大佬的项目,我这个需要环境等等
1.设置里可以设置api与key和选择默认模型
2.群聊右上角可以选择裁判模型,可以安排谁来下一个对话,建议选择轻量模型
感谢站内大佬们的公益站点让我可以测试这个项目
希望大家可以在评论区分享你对这个项目做了哪些优化和改动,让大家都来体验
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 连)
Invalid media: image
灵感来源与这个大佬的帖子: 分享一个自己写的多 AI 角色群聊的开源项目, 欢迎体验 - 开发调优 - LINUX DO
做的不是很完善,我把链接发出来大家都可以在AI Studio上面与Gemini 3.0一起完善这个项目
这是AI Studio的链接:https://ai.studio/apps/drive/1qHdAgtnBCJ5JQUMFkvocqI-qxOkL9G_X?fullscreenApplet=true
这个是Github的仓库网址: Qinglianzihan/AI-Wechat-AI-: 可以让模型自由对话,仅娱乐
如果需要放在本地建议大家使用上面大佬的项目,我这个需要环境等等
1.设置里可以设置api与key和选择默认模型
2.群聊右上角可以选择裁判模型,可以安排谁来下一个对话,建议选择轻量模型
感谢站内大佬们的公益站点让我可以测试这个项目
希望大家可以在评论区分享你对这个项目做了哪些优化和改动,让大家都来体验
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 连)
Invalid media: image
【仙梦指玄】从以梦表法说起
梦境主要分为两类。第一类:日有所思夜有所梦,这些梦从玄学角度来讲解读意义不大,源自自我大脑潜在活动的一系列结果。它可以用心理学来解释,典型的代表是:弗洛伊德的理论。当然了,往往大量地思考,或许会在梦中完成思考,实现问题解决方案,不过此类我不展开讨论,重点关注第二类:用于揭示和表达与仙缘(玄学)相关的现象、问题或解决方案。对于这个类别,我过去写过:梦考解析、梦中食物的意义、《仙梦指玄》(第一辑)等等。因此,在这篇文章中,我将不再系统地阐述如何辨别是否仙梦、如何解读、仙梦分类等。这篇文章主要分享仙梦解读案例和未来的评论回复。
下面是一同修做的梦,他叙述如下:
----------------------
1. 我在这篇文章中详细阐述了传承差异https://blog.buxiantang.top/post/专论出马仙、出道仙、宗教徒传承差异 ↩︎
2. 我在这篇文章中详细阐述了圈堂相关概念https://blog.buxiantang.top/post/你可能正在被仙缘圈堂 ↩︎
3. 我在这篇文章中详细阐述了阴桃花的概念https://blog.buxiantang.top/post/详论阴桃花 ↩︎
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: tiengming)
梦境主要分为两类。第一类:日有所思夜有所梦,这些梦从玄学角度来讲解读意义不大,源自自我大脑潜在活动的一系列结果。它可以用心理学来解释,典型的代表是:弗洛伊德的理论。当然了,往往大量地思考,或许会在梦中完成思考,实现问题解决方案,不过此类我不展开讨论,重点关注第二类:用于揭示和表达与仙缘(玄学)相关的现象、问题或解决方案。对于这个类别,我过去写过:梦考解析、梦中食物的意义、《仙梦指玄》(第一辑)等等。因此,在这篇文章中,我将不再系统地阐述如何辨别是否仙梦、如何解读、仙梦分类等。这篇文章主要分享仙梦解读案例和未来的评论回复。
下面是一同修做的梦,他叙述如下:
梦到自己在旧屋院子里,祠堂门前,有条铁链绑着,上面挂着衣服,金色的衣服有几件,都是我的衣服的模样,但是衣架是蓝色的,所以我全给下了,把衣服衣架拆分,还有我妈的内衣裤也是粉色加蓝色衣架,我照样给她拿下来扔到地上,然后我拿着红色的盆和衣服准备洗澡洗衣服,再把那些给收拾干净。梦境解读比较关注环境(天气、住所、周边)、人物、衣着、行为、物品等等。旧屋祠堂是个关键点,这就代表是老堂,衣服代表传承,金色的为上方传承,但是衣架是蓝色的,这就代表宗教传承[1]。说明这些衣物所代表的传承混杂,并有条铁链绑着。即便金色衣物代表上方传承,也不能接,因为仍然会有局限性。所以这位同修全部收拾了,是正确的:谨防圈堂。[2]他母亲的内衣裤和蓝色衣架,就代表了和宗教传承有关的婚恋圈堂。他拿红色的盆和衣服准备洗澡洗衣服,就说明他是出马传承为主导。
这金色衣服,我不确定是不是自身先天缘分,但还是谨慎比较好。
我后面跟我妈说了,让她不要接宗教传承,她让我别吵她,我也只好闭嘴了,挺气的。
然后又梦到我姐带着我妈和我还有谁忘了,四个人出去,前面的大道矮了点,然后面前有很多水和沙石,我先跳下去,她们在后面笑我笨,有水都踩,然后我就看到自己是蓝色拖鞋,就甩掉了,等她们走到我的前面,我心想还是回家吧,看着自己的脚,想着自己要是想穿鞋,可能还是穿上的蓝色拖鞋,就索性不穿了,不穿也总比穿的蓝色拖鞋要好。
这金色衣服,我不确定是不是自身先天缘分,但还是谨慎比较好。他也在修行,比较了解不同传承的区别,但不确定这个金色衣服是不是他自己的先天缘分。从梦的细节来看,不能完全确定是他的先天传承。为什么呢?一方面,这个金色衣服是自己的衣服模样,但另一方面这个衣服的衣架是蓝色的。是与不是都能解释的通。如果是,那就说明传承混杂,身边有宗教传承的缘分。如果不是,那就是宗教缘分圈堂,制造是自己衣服的假象。无论如何,不确定的东西不接受是最好的。在很多地方,世俗中有个习俗就是人百年之后,所有在世的衣服物品等都烧掉。在传承中,讲衣钵。
我后面跟我妈说了,让她不要接宗教传承,她让我别吵她,我也只好闭嘴了,挺气的。从这里不难看出,同修在梦里面是思维是相对清晰的,能够清楚意识到宗教传承会让人失去自由和混乱的难以隔绝的阴桃花[3]。和现实中一样,当你的观点和别人的观点不一致时,最好的做法就是闭嘴,否则只是徒增烦恼。当然了,在实修过程中,往往不同阶段,思考体会不同,认知也不同。说出来的,争论的未必是正确的。
然后又梦到我姐带着我妈和我还有谁忘了,四个人出去,前面的大道矮了点,然后面前有很多水和沙石,我先跳下去,她们在后面笑我笨,有水都踩,然后我就看到自己是蓝色拖鞋,就甩掉了,等她们走到我的前面,我心想还是回家吧,看着自己的脚,想着自己要是想穿鞋,可能还是穿上的蓝色拖鞋,就索性不穿了,不穿也总比穿的蓝色拖鞋要好。这一段主要是讲的婚恋相关,姐带头出去,说明姐的影响力比较大。蓝色拖鞋就对应露水夫妻,而且婚恋缘分还是宗教体系的。即便扔了后又自动穿上了,这时代表反复,表示宗教体系的阴桃花的影响会反复,如影随形。这种现象在道教、佛教内部都很常见。师兄弟之间、师徒之间,出家人和香客之间等等,往往是一段关系结束,又陷入另一段麻烦的关系中。人们只总结出来好像修行人都是婚姻不顺,但更深层次的东西,多数人都不明白。梦境末尾,索性不穿鞋了。从长远来看,暂时的不要婚恋或许是个好的选择,也需要警惕姐接触宗教体系而导致家人婚姻都不顺利。
----------------------
1. 我在这篇文章中详细阐述了传承差异https://blog.buxiantang.top/post/专论出马仙、出道仙、宗教徒传承差异 ↩︎
2. 我在这篇文章中详细阐述了圈堂相关概念https://blog.buxiantang.top/post/你可能正在被仙缘圈堂 ↩︎
3. 我在这篇文章中详细阐述了阴桃花的概念https://blog.buxiantang.top/post/详论阴桃花 ↩︎
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: tiengming)
佬们,物联卡在哪买?
之前淘宝一搜一大堆,现在咋一个找不到了 😭
10 posts - 7 participants
Read full topic
via LINUX DO - 最新话题 (author: Ayson)
之前淘宝一搜一大堆,现在咋一个找不到了 😭
10 posts - 7 participants
Read full topic
via LINUX DO - 最新话题 (author: Ayson)
公益站的模型降智了吗?
之前很少出现这个问题,自从gemini3出来后,怎么频繁这种告警啊, kilo code
6 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: MacDo)
Invalid media: image
之前很少出现这个问题,自从gemini3出来后,怎么频繁这种告警啊, kilo code
6 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: MacDo)
Invalid media: image
汕头市旅游,有本地土著推荐住哪里吗?
放松心情,目前计划玩三天,之前高铁去过一次,但是碍于夏天太热,没怎么好好玩过
这次自驾去汕头,打算先做做攻略,吃喝拉撒有推荐的话千万别吝啬
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: sicko)
放松心情,目前计划玩三天,之前高铁去过一次,但是碍于夏天太热,没怎么好好玩过
这次自驾去汕头,打算先做做攻略,吃喝拉撒有推荐的话千万别吝啬
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: sicko)
我的Clash Meta 这个时候在干什么?
(话题已被作者删除)
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: tsjbjgs)
(话题已被作者删除)
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: tsjbjgs)
有没有避免或减少Claude(订阅)封号风险的方法
普号用了半个多月了没问题,ChatGPT会员没了想换一下试试,但看l站很多佬说容易封号所以想问下
固定ip(下图)+固定电脑和手机,有实体手机卡和银行卡
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 珞雪)
Invalid media: image
普号用了半个多月了没问题,ChatGPT会员没了想换一下试试,但看l站很多佬说容易封号所以想问下
固定ip(下图)+固定电脑和手机,有实体手机卡和银行卡
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 珞雪)
Invalid media: image
gemini key Tier 1层级 gemini-2.5-flash调用时报429
aistudio里面的key,在Tier 1层级,无论是新建的key还是旧key,都出现gemini-2.0-flash可以用,gemini-2.5-flash调用时报429,请问是怎么回事?
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: MaxPlus)
aistudio里面的key,在Tier 1层级,无论是新建的key还是旧key,都出现gemini-2.0-flash可以用,gemini-2.5-flash调用时报429,请问是怎么回事?
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: MaxPlus)
密码管理工具!你选?
Click to view the poll.
----------------------
----------------------
----------------------
----------------------
----------------------
----------------------
----------------------
----------------------
Read full topic
via LINUX DO - 最新话题 (author: systole_famous)
Click to view the poll.
----------------------
[!success] 1Password
老牌密码管理工具,最早期还是买断制的。
但是慢慢灰度到订阅制。
有非常强大的生态,不只支持多种 OS,还有 CLI 的版本。
更重要的是 CLI 还与 App 有很强的连动。
(e.g., CLI 要验证时可以透过 App 跳出同意视窗)
可以选择.com、.ca、.eu服务器。(欧洲有非常强的隐私保护政策)
有免费的一年试用 (「撸毛」1password 免费试用一年)仅有付费方案跨平台CLISSH Agent
----------------------
[!success] Bitwarden 官方
几乎是最广为人知的开源密码管理工具。
就算是免费的版本也提供非常够用的功能,
若你有 TOTP 需求 (订阅才有),你也可以使用独立的 TOTP App。
像是 Bitwarden Authenticator App、Google Authenticator。
虽然也有 CLI 工具,但整合程度不比 1Password。
若订阅的话,每年也只需要10 USD非常实惠。
可以选择.com与.eu服务器。(欧洲有非常强的隐私保护政策)免费与付费方案跨平台CLISSH Agent
----------------------
[!success] Bitwarden 自架
自己架设的有两种
1. Self-host Bitwarden
2. Vaultwarden
前者是官方的,后者是社群的。
Vaultwarden 非常轻量,且以 Rust 撰写。
Vaultwarden 可以与 Bitwarden 官方的 App, Browser Plugins 配合使用,而且支持 TOTP 功能。免费跨平台CLISSH Agent
----------------------
[!success] KeePass (本地)
KeePass 是一个专注于本地的密码管理工具。
官方只有 Windows Client,但有非常多衍生版本,可以在很多平台上使用。
若你是极致追求安全的,本地保存数据可能是个好选择。免费跨平台CLISSH Agent (KeeAgent)
----------------------
[!success] Proton Pass
后起新秀,主要是 Proton 系列的服务。
1. Proton Pass
2. Proton Mail
3. Proton Calendar
4. Proton Drive
5. Proton Wallet
6. Proton Docs
非常适合要Degoogle(去谷歌)的人。
最近因为隐私问题,传闻有要把总部搬离瑞士前往欧洲 (有非常强的隐私保护政策) 的风声。
黑五通常会有优惠活动免费与付费方案跨平台
----------------------
[!success] Apple Password
如果你使用 Apple 全家桶,那么 Apple Password 就非常适合你。
你可以无缝的在装置间使用同一套密码集。
虽然在 Windows 上也有 Browser Plugins,但是好像听说不太好用。
如果你是跨平台工作的话,Apple Password 可能就不是最佳的选择。算是免费算是跨平台
----------------------
[!success] Google Password Manager (Chrome)
谷歌浏览器内建的工具,可能是大家最早接触的密码管理工具之一。免费依附于浏览器
----------------------
[!note] 自架建议
1. 降低攻击面 (e.g., 只在区网或虚拟区网中使用)
2. 定期备份 (3-2-1 备份原则)
3. 使用强密码与 2FA (e.g., 两个 FIDO Key,一个备用)
4. 采用更消耗资源的 Derivation 方式 (e.g.,Argon2id)
15 posts - 15 participants
[!warning] 注意!!
记得数据无价,特别是密码这种数据。
自架当然非常好,但是自己就必须负责安全的把控,而不是盲目依赖开源专案的安全保护。
无论是自架或是使用官方服务,切记不要产生登入密码管理工具要使用 A 帐号,但是 A 帐号的密码存在密码管理工具中这种死结。
Read full topic
via LINUX DO - 最新话题 (author: systole_famous)
ClashMeta这个时候在干什么?
在APP已经退出的情况下,这个进程CPU占比怎么还这么高?
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: tsjbjgs)
Invalid media: image
在APP已经退出的情况下,这个进程CPU占比怎么还这么高?
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: tsjbjgs)
Invalid media: image
哪吒:变形金刚(中美合拍成真)
这不是恶搞!!!
《孙悟空三打变形金刚》《葫芦娃大战哆啦A梦》什么时候拍?
gcores.com
中美合拍:《我的哪吒与变形金刚》定档12月6日播出 | 机核 GCORES
全片共52集
9 posts - 7 participants
Read full topic
via LINUX DO - 最新话题 (author: 太白)
Invalid media: image
这不是恶搞!!!
《孙悟空三打变形金刚》《葫芦娃大战哆啦A梦》什么时候拍?
gcores.com
中美合拍:《我的哪吒与变形金刚》定档12月6日播出 | 机核 GCORES
全片共52集
9 posts - 7 participants
Read full topic
via LINUX DO - 最新话题 (author: 太白)
Invalid media: image
一个低成本的claude+codex的方法
按照这个佬提供的mcp设置好之后,在cursor里面调用codex即可,把claude.md也放在cursor的规则里面,一个月20刀,就能享受到claude+codex了。
【自己动手,丰衣足食 00】 Claude和CodeX协同办公很好,我很爱,可是官方mcp写的实在太烂(已支持Windows/Linux) 开发调优
数据不经过第三方的情况下,成本最低的使用claude+codex的方法。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: sakuraL)
Invalid media:
image
image
按照这个佬提供的mcp设置好之后,在cursor里面调用codex即可,把claude.md也放在cursor的规则里面,一个月20刀,就能享受到claude+codex了。
【自己动手,丰衣足食 00】 Claude和CodeX协同办公很好,我很爱,可是官方mcp写的实在太烂(已支持Windows/Linux) 开发调优
简单来说, Claude和CodeX协同办公实在太香,但codex官方提供的mcp实在过于难用,那我只好自己来了,所以这个项目实现了以下几个事情: 官方MCP由于有conversationId问题,无法进行多轮对话,那么OK,我来! 官方MCP无法让claude自由选择是否查看codex的推理详情(比如工具调用也是在推理信息里),这点确实比较蛋疼,如果一些流水账式的思考和工具调用记录仍返回…
数据不经过第三方的情况下,成本最低的使用claude+codex的方法。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: sakuraL)
Invalid media:
image
image
小孩吃的DHA、鱼油有推荐的么 3岁了
小红书上都是推广,也不知道到底买哪个
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: zhuoran)
小红书上都是推广,也不知道到底买哪个
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: zhuoran)
Gemini 3 pro preview个人使用体感2 - 稍长上下文的处理能力好像没我想象的差
之前发了一个初步体感,里面提到Gemini 3(pro preview,下面简称3,下文2.5pro也简称2.5)个人体验“智商”算是在线,讨论科研类问题时能提供准确认知和有价值的建议,不过语言表达风格有所精炼。总的来说还是有使用价值。
个人对Gemini 3 pro preview的使用体感 搞七捻三
不过当时并没有体验长上下文的情况,都是有限的几轮问答,最多也没超过15k。后来看很多佬友提到Gemini 3 pro preview在处理长上下文时有比较严重的性能衰减问题,比2.5都有所退步,很多佬友还做了量化的测试,这个佬友这里总结得很全:
fire【大模型系列17】关于Gemini-3-pro和Antigravity,你想知道的一切【更新LiveBench评分】 文档共建
总结各位佬友的结论就是其黄金性能区间大概就30-50k,比2.5有2-3倍的差距。但我今天用Gemini 3尝试了几个长文处理的任务(渠道:ai studio网页版),似乎体验倒没有佬友们说的那么差?不过我的任务类型和佬友们比较有代表性的大海捞针测试任务还是有一点差别,我的任务主要是:
● 小说总结和提炼任务,上下文70-80k tokens区间(是我人为拆分出来的某网文30章的内容)
● 要求ai总结小说剧情梗概,用列表形式提炼关键事件,并在末尾列出重要的未解决的悬念和长期线索
● 要求ai识别小说中的重要角色,按主角、重要配角、次要配角分3个等级进行排序,以及进行简要介绍
● 要求ai对用户指定的角色做画像侧写,如该角色的外貌,性格特征,是否有表里不一,对不同情境的典型反应,语言风格等等,同时明确要求ai在做侧写时引用剧情原文和章节号,涉及转述和总结的地方也要依托原文,有推断成分的必须标【推断】
如上,这些任务既要求ai模型对提供的长文本有优秀的理解、分析、总结能力,也要求它在必要时能准确索引原文内容和位置。然后我发现在这个70-80k的上下文区间,Gemini 3的表现居然并不太差,整体表现和2.5在伯仲之间,绝没有让我感觉两者有什么成倍的差距。Gemini 3在这个上下文等级下,对上述要求的全文理解,情节分析,和索引原文,都是有能力做到的,但它确实有一些不如2.5的地方,不过是体现在其他方面:
● Gemini 3的指令依从度比2.5低。2.5始终能遵循我的命令,大量引用原文,且每一处【推断】的地方都清晰标注。而3则有些“不听话”,尤其是执行步骤多时可能越写越飘,到后面就开始忘记标注【推断】了,而且引用原文也开始减少,很多时候都在转述(尽管它的转述是准确的且文风还原度也不错)。不过这种差异没到“完全崩了”的程度,Gemini 3的成果还算在我可接受范围内(有时也许要重roll一下,说到这个还有Gemini 3的审查也比2.5也严了,输出有时会block,而2.5从没遇到过block)
● Gemini 3的幻觉比2.5稍高。大体还好,执行我上述任务时整体符合预期,基本都是准确贴合或者引用原著的,只是偶尔会出现幻觉。举个例子就类似于女主是兄控+女主无意中发现继兄电脑里的教育片然后偷偷看了起来在Gemini 3中的总结就变成她看片时脑中会想着兄长了 😆 尽管这是个有理的推断。 不过整体还好,这种幻觉在执行若干次任务中就出现过一次。至少我就发现过一次,因为时间久远我对小说内容也不是每个细节都记得清了,不是一眼离谱的内容我也不一定能识别出来 😂
但Gemini 3也有比2.5表现好的时候,在索引细节或提炼剧情事件的时候,它有时也能提供出一些2.5忽略的或者不够详细的地方,且我认为也都是对于剧情和人设构造来说值得记录的点。不过这个我说不好是因为它对长上下文的认知处理能力有时也比2.5有更好的地方,还是单纯是因为它智商更高一些(因为我的提示词中有提炼总结去除无用信息的指引,也说不定这些细节被2.5认为应该省略,而3对剧情逻辑判断的能力比2.5稍高)。
另外Gemini 3的文风感也比2.5强一些,Gemini 3即便是写总结仿佛也在还原原文的文风,比2.5有味道,而且也更少出现2.5文案中常见的八股词。不过这不是我的主要需求,我的任务更希望它准确提炼和总结原文内容,后续真需要模仿文风时则主要依赖总结中提取的小说原文。
由于我的最初目的并不是测试,所以没有特地尝试更长的上下文,但总之在我这种70-80k场景下(已经超过了佬友们普遍说的30-50k),Gemini 3给我的体验竟然意外地并不差。不过刚才提到的两个缺点,尤其第一点指令遵循能力,可能本质上还是注意力机制的问题,或许和大海捞针任务表现差背后有着同样的原因。但不知道为什么它在大海捞针任务表现不佳的情况下,对长文本的理解分析提炼能力却并没那么差。
不过虽然说了这么多,但之后在处理这类任务时,我应该还是优先2.5多一些,毕竟它更老实听话点,偶尔少点闪光点,但整体不出大错 😂 等资料整理完毕,真想让ai进行虚拟创作,仿写,角色扮演的时候,倒是可以交给3来做 :bili_040:
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: ABcopilot)
之前发了一个初步体感,里面提到Gemini 3(pro preview,下面简称3,下文2.5pro也简称2.5)个人体验“智商”算是在线,讨论科研类问题时能提供准确认知和有价值的建议,不过语言表达风格有所精炼。总的来说还是有使用价值。
个人对Gemini 3 pro preview的使用体感 搞七捻三
个人初步体感: Gemini 3的“智商”确实比2.5有所提升,科研体验能感觉到差异,回答更准确了,也更少出现逻辑矛盾。 虽然知识库截止时间都宣称为2025年1月,但Gemini 3的知识库比2.5更加丰富。Gemini 3起码真的知道25年1月的事,而2.5的宣称是假的,实际超过24年7-8月的事就不知道了。 Gemini 3的虚拟创作能力,就是玩酒馆的那个,我暂时还没体验出和…
不过当时并没有体验长上下文的情况,都是有限的几轮问答,最多也没超过15k。后来看很多佬友提到Gemini 3 pro preview在处理长上下文时有比较严重的性能衰减问题,比2.5都有所退步,很多佬友还做了量化的测试,这个佬友这里总结得很全:
fire【大模型系列17】关于Gemini-3-pro和Antigravity,你想知道的一切【更新LiveBench评分】 文档共建
【大模型系列17.3】Gemini-3的几个主要问题 251120 18:04更新 注意力,有效上下文长度50k问题 超过50k容易忘掉前面内容,甚至删代码 对复杂的编程影响巨大,复杂的代码不可能只有50k 对简短的前端影响较小 参考 FictionBench长上下文测试尚未更新,估计表现不如2.5-pro .Fiction.live .gemini 3 翻译字幕也退步了 .http…
总结各位佬友的结论就是其黄金性能区间大概就30-50k,比2.5有2-3倍的差距。但我今天用Gemini 3尝试了几个长文处理的任务(渠道:ai studio网页版),似乎体验倒没有佬友们说的那么差?不过我的任务类型和佬友们比较有代表性的大海捞针测试任务还是有一点差别,我的任务主要是:
● 小说总结和提炼任务,上下文70-80k tokens区间(是我人为拆分出来的某网文30章的内容)
● 要求ai总结小说剧情梗概,用列表形式提炼关键事件,并在末尾列出重要的未解决的悬念和长期线索
● 要求ai识别小说中的重要角色,按主角、重要配角、次要配角分3个等级进行排序,以及进行简要介绍
● 要求ai对用户指定的角色做画像侧写,如该角色的外貌,性格特征,是否有表里不一,对不同情境的典型反应,语言风格等等,同时明确要求ai在做侧写时引用剧情原文和章节号,涉及转述和总结的地方也要依托原文,有推断成分的必须标【推断】
如上,这些任务既要求ai模型对提供的长文本有优秀的理解、分析、总结能力,也要求它在必要时能准确索引原文内容和位置。然后我发现在这个70-80k的上下文区间,Gemini 3的表现居然并不太差,整体表现和2.5在伯仲之间,绝没有让我感觉两者有什么成倍的差距。Gemini 3在这个上下文等级下,对上述要求的全文理解,情节分析,和索引原文,都是有能力做到的,但它确实有一些不如2.5的地方,不过是体现在其他方面:
● Gemini 3的指令依从度比2.5低。2.5始终能遵循我的命令,大量引用原文,且每一处【推断】的地方都清晰标注。而3则有些“不听话”,尤其是执行步骤多时可能越写越飘,到后面就开始忘记标注【推断】了,而且引用原文也开始减少,很多时候都在转述(尽管它的转述是准确的且文风还原度也不错)。不过这种差异没到“完全崩了”的程度,Gemini 3的成果还算在我可接受范围内(有时也许要重roll一下,说到这个还有Gemini 3的审查也比2.5也严了,输出有时会block,而2.5从没遇到过block)
● Gemini 3的幻觉比2.5稍高。大体还好,执行我上述任务时整体符合预期,基本都是准确贴合或者引用原著的,只是偶尔会出现幻觉。举个例子就类似于女主是兄控+女主无意中发现继兄电脑里的教育片然后偷偷看了起来在Gemini 3中的总结就变成她看片时脑中会想着兄长了 😆 尽管这是个有理的推断。 不过整体还好,这种幻觉在执行若干次任务中就出现过一次。至少我就发现过一次,因为时间久远我对小说内容也不是每个细节都记得清了,不是一眼离谱的内容我也不一定能识别出来 😂
但Gemini 3也有比2.5表现好的时候,在索引细节或提炼剧情事件的时候,它有时也能提供出一些2.5忽略的或者不够详细的地方,且我认为也都是对于剧情和人设构造来说值得记录的点。不过这个我说不好是因为它对长上下文的认知处理能力有时也比2.5有更好的地方,还是单纯是因为它智商更高一些(因为我的提示词中有提炼总结去除无用信息的指引,也说不定这些细节被2.5认为应该省略,而3对剧情逻辑判断的能力比2.5稍高)。
另外Gemini 3的文风感也比2.5强一些,Gemini 3即便是写总结仿佛也在还原原文的文风,比2.5有味道,而且也更少出现2.5文案中常见的八股词。不过这不是我的主要需求,我的任务更希望它准确提炼和总结原文内容,后续真需要模仿文风时则主要依赖总结中提取的小说原文。
由于我的最初目的并不是测试,所以没有特地尝试更长的上下文,但总之在我这种70-80k场景下(已经超过了佬友们普遍说的30-50k),Gemini 3给我的体验竟然意外地并不差。不过刚才提到的两个缺点,尤其第一点指令遵循能力,可能本质上还是注意力机制的问题,或许和大海捞针任务表现差背后有着同样的原因。但不知道为什么它在大海捞针任务表现不佳的情况下,对长文本的理解分析提炼能力却并没那么差。
不过虽然说了这么多,但之后在处理这类任务时,我应该还是优先2.5多一些,毕竟它更老实听话点,偶尔少点闪光点,但整体不出大错 😂 等资料整理完毕,真想让ai进行虚拟创作,仿写,角色扮演的时候,倒是可以交给3来做 :bili_040:
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: ABcopilot)
学习Rust语言有感,不能百分百相信AI写的代码
这几天学习Rust语言,每次我写完代码后扔给AI,总结代码的问题.然后自己再修改.
今天心血来潮写了一个替换Vec buf 指针的"偷梁换柱"功能,根据以前掌握的逆向知识,只要替换Vec在内存中结构即可.
输出结果:
扔给AI后,反驳vec的内存结构应该是
但是我测试怎么都是这样的
我以为是ChatGPT模型的问题,后续又问了 grok,claude4.5 ,gemini.得到的结果都认为我代码中的vec结构有问题.
后续总结出,编译器不保证字段按照定义的顺序在内存中排列,这也太坑了吧.我要是一直按照AI的代码写,永远都是错的。
事后想了一下,rust好像也没这种需求吧,怪自己用以前掌握的编程语言思想.用rust来重写
个人总结了一下:
1.C/C++ Rust 这类语言,不能完全依靠AI,如果AI写的代码完全不受自己控制,谁敢用.
2.一直到今天我写C++的代码还是用的 GitHub Copilot Tab补全.
3.Rust包管理太好用了.
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: saki)
这几天学习Rust语言,每次我写完代码后扔给AI,总结代码的问题.然后自己再修改.
今天心血来潮写了一个替换Vec buf 指针的"偷梁换柱"功能,根据以前掌握的逆向知识,只要替换Vec在内存中结构即可.
use std::alloc::{Layout, alloc, dealloc};
use std::mem::ManuallyDrop;
fn main() {
let vec = vec![1, 2, 3, 4, 5, 6, 7, 8, 9, 10];
dump_bytes("src vec data", &vec);
unsafe {
let layout = Layout::array::<i32>(vec.len()).unwrap();
let raw_ptr = alloc(layout) as *mut i32;
if raw_ptr.is_null() {
panic!("Memory allocation failed");
}
let new_ptr = ManuallyDrop::new(raw_ptr );
std::ptr::copy_nonoverlapping(vec.as_ptr(), raw_ptr, vec.len());
new_ptr.add(0).write(99);
new_ptr.add(1).write(98);
new_ptr.add(2).write(97);
let var_ptr = &vec as *const Vec<i32> as *mut u64;
*var_ptr.offset(1) = raw_ptr as u64;
}
dump_bytes("change vec data", &vec);
}
fn dump_bytes(label: &str, t: &Vec<i32>) {
let size = std::mem::size_of::<Vec<i32>>();
let ptr = t as *const Vec<i32> as *const u8;
println!("==== {} ==== (ptr = {:p}, size = {})", label, ptr, size);
unsafe {
for i in 0..size {
if i % 16 == 0 {
print!("\n{:04X}: ", i);
}
print!("{:02X} ", *ptr.add(i));
}
print!("\n====buffer ptr = {:p} len = {}",t.as_ptr(),t.len());
for i in 0..t.len() {
if i % 16 == 0 {
print!("\n{:04X}: ", i);
}
print!("{:02X} ", *t.as_ptr().add(i) as u8);
}
}
println!("\n");
}
输出结果:
==== src vec data ==== (ptr = 0xa3293ef748, size = 24)
0000: 0A 00 00 00 00 00 00 00 D0 C2 C4 B5 74 02 00 00
0010: 0A 00 00 00 00 00 00 00
====buffer ptr = 0x274b5c4c2d0 len = 10
0000: 01 02 03 04 05 06 07 08 09 0A
==== change vec data ==== (ptr = 0xa3293ef748, size = 24)
0000: 0A 00 00 00 00 00 00 00 20 C1 C4 B5 74 02 00 00
0010: 0A 00 00 00 00 00 00 00
====buffer ptr = 0x274b5c4c120 len = 10
0000: 63 62 61 04 05 06 07 08 09 0A
扔给AI后,反驳vec的内存结构应该是
// 字段顺序(64 位平台):
offset 0: *mut T // 指针
offset 8: usize // capacity
offset 16: usize // len
但是我测试怎么都是这样的
// 字段顺序(64 位平台):
offset 0: usize // len
offset 8: ptr // 指针
offset 16: usize // capacity
我以为是ChatGPT模型的问题,后续又问了 grok,claude4.5 ,gemini.得到的结果都认为我代码中的vec结构有问题.
后续总结出,编译器不保证字段按照定义的顺序在内存中排列,这也太坑了吧.我要是一直按照AI的代码写,永远都是错的。
事后想了一下,rust好像也没这种需求吧,怪自己用以前掌握的编程语言思想.用rust来重写
个人总结了一下:
1.C/C++ Rust 这类语言,不能完全依靠AI,如果AI写的代码完全不受自己控制,谁敢用.
2.一直到今天我写C++的代码还是用的 GitHub Copilot Tab补全.
3.Rust包管理太好用了.
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: saki)
一看谷歌账单吓一跳,300多?
一直以为google ai studio里的apikey是免费用的,因为我有一年的那个学生免费使用一年的哪个谷歌pro,前一阵拿来跑了下酒馆,今天没事去一看,我去300多块钱????酒馆这么费token吗?马上问ai怎么申请退费,跟着ai一顿操作,客服给退费了。在跟客服的沟通中,就觉得有点不对劲,我还问ai我这是不是340多人民币账单,ai非常确定是人民币账单,最后我一查,是特么日元,蚊子腿也是肉,日元该退也得退!
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: longcheng)
Invalid media: image
一直以为google ai studio里的apikey是免费用的,因为我有一年的那个学生免费使用一年的哪个谷歌pro,前一阵拿来跑了下酒馆,今天没事去一看,我去300多块钱????酒馆这么费token吗?马上问ai怎么申请退费,跟着ai一顿操作,客服给退费了。在跟客服的沟通中,就觉得有点不对劲,我还问ai我这是不是340多人民币账单,ai非常确定是人民币账单,最后我一查,是特么日元,蚊子腿也是肉,日元该退也得退!
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: longcheng)
Invalid media: image
DNS泄漏检测
przxegjq.pinit.eth.limo
网络出口一致性校验 | Network Consistency Check
5 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: F-Droid)
przxegjq.pinit.eth.limo
网络出口一致性校验 | Network Consistency Check
5 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: F-Droid)
Antigravity浏览器登录之后不跳什么情况啊
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: kobe_24)
Invalid media: image
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: kobe_24)
Invalid media: image
❤1
有没有佬知道使用Antigravity必须一直开全局代理吗,我以为只是登录时候要用,结果进去模型一直转圈加载不出来,后面开了全局代理都就好了,不过这样的话用其他国内软件不太方便
4 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: user12)
4 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: user12)