LinuxDo 新帖推送
177 subscribers
250K photos
311K links
Download Telegram
标题: Abliteration到Heretic
作者: #eve2333
板块: #开发调优
编号: 1759640
帖子: https://linux.do/t/topic/1759640
时间: 2026-03-15 17:53:02
摘要:
看见最近有人发帖说什么魔改版qwen3.5 -9b,发现是huggingface里面的Abliteration版本,想起来最近拿ai汉化漫画的过程;本人在个人电脑上部署过qwen3 30B-A3B的Abliteration版本(Q6)和qwen3.5的35b-a3b Heretic 版本(Q6)
大模型的安全性一直是从gpt4火爆以来老生畅谈的问题,包括Claude母公司Anthropic的公司宗旨也是几家大模型公司里面最贴合安全的,从2025.1deepseek爆火,人们越来越多的走进大模型世界,我当时用的是deepseek的huihui模型,他使用abliteration来破线;
Abliteration
Abliteration在机器学习领域,这种模型内部技术具体方法是“切除”或“禁用”模型的某个部分(例如负责拒绝的神经元、注意力头或一层网络),然后模型性能变化该部分的功能。
Heretic
Heretic 项目正是这一技术的典型实现,通过表示工程,将定向消融与参数优化结合在了一起。
我感觉是Heretic 比Abliteration聪明的多的,具体到不开思维链的qwen上面,要聪明很多,即使qwen在预训练阶段数据人工清洗得实在是太干净了,几乎排除了绝大量的 NSFW数据;(我发了一张色图,qwen说腿中傍边是一颗粉色的痣 )

我有一个问题;针对这种预训练阶段就被物理阉割了知识域的底模,除了重新花高级显卡和大显存挂载外部 LoRA,还有可能通过其他的什么表示工程让它重新产生特定概念的泛化吗?
还有就是现在除开msk的grok,御三家好像现在(就最近1个月)都好像大幅收紧了安全措施啊,老友们是否有感觉?
标题: 我的大脑一片空白
作者: #shaonian_sun
板块: #搞七捻三
编号: 1759647
帖子: https://linux.do/t/topic/1759647
时间: 2026-03-15 17:54:23
摘要:
事情是这样的,昨晚上,我打开电脑,看着我订阅的cc和codex,我想用他们写点什么。当我绞尽脑汁后,我发现我不知道要写些什么,我的脑子没有想法也没有创意。AI不断发展,技术正在变得越来越廉价,好的想法和创意变得越来越重要。而我的脑子却是一片空白。我感到很焦虑。各位佬友,你们是否有类似的感觉。
标题: Linus Torvalds到底是何方神圣
作者: #yu uh
板块: #搞七捻三
编号: 1759650
帖子: https://linux.do/t/topic/1759650
时间: 2026-03-15 17:54:58
摘要:
Linus Torvalds 到底是何方神圣

我看到基本所有帖子 Linus Torvalds 都是秒回,而且回复的内容都是很有逻辑性的,这也太强了吧
这是咋实现的呢
标题: N8N工作流,有大哥懂吗?
作者: #lx4iz
板块: #开发调优
编号: 1759654
帖子: https://linux.do/t/topic/1759654
时间: 2026-03-15 17:56:36
摘要:
N8N工作流自带得 N8Nai,需要付费才能自然语言生成,有没有平替方案啊,这段时间研究N8N工作流,需要自然语言设计,原版得太贵,那么一点积分没用就没有了,有没有大佬知道平替得,我部署到本地得docker,
标题: 【AI大战短评系列3】真1m上下文大战,开始了
作者: #dwqxq1
板块: #文档共建
编号: 1759655
帖子: https://linux.do/t/topic/1759655
时间: 2026-03-15 17:56:59
摘要:
3月5日GPT-5.4在御四家里最后一个上线了1m上下文
3月14日Claude正式开启了1m上下文大战,把业界通行的200k上下文api价格/额度消耗翻倍惯例打破了,就是200k以上和以下同价
这把GPT,Gemini,Grok杠上去了,是跟还是不跟?
来源:1M context is now generally available for Opus 4.6 and Sonnet 4.6 | Claude
其实1m上下文,一年多前gemini和kimi就在搞,后来也没什么声音了,原因是以前的1m上下文,某种角度说可以说是假1m
①假1m = 价格用不起
超过200k价格翻倍,叠加本来消耗就大,例如单价2倍×容量5倍,总成本上限可能10倍,非常不经济
真1m = 200k以下以上同价
②假1m = 超过200k,性能衰减严重,根本没法干活
真1m=这是Claude自己的评测,在1m时,opus性能缩水程度是最小的

以后有第三方评测再补充
③假1m = 以前所有会员都不给1m,只给200k,
3月5日,gpt会员开放1m,其实还是假1m,因为但要自己改toml设置,消耗额度翻倍,其实还是不想让用户用(也可能1m性能太差拿不出手)
真1m = 3月14日Claude max 5x,20x,team都支持了1m上下文(pro没有),且消耗额度不翻倍,这样max/拼车/反代api的价值更高了
Antigravity的opus-4.6跟不跟暂不清楚
标题: 调了一个搞笑的文风活跃下气氛
作者: #heng812
板块: #搞七捻三
编号: 1759660
帖子: https://linux.do/t/topic/1759660
时间: 2026-03-15 17:58:04
摘要:
看多了大模型无意义的大段描述,突然喜欢上大量的对白和内心吐槽的风格
跑个仙剑的文字团图个乐子,大家也可以分享下喜欢的

仙剑奇侠传背景,李逍遥,赵灵儿,林月如,阿奴主角团吃下心蛊用来联络,副作用是知道对方在想什么,结局还有点煽情
标题: macos触摸板放大缩小体验是不是比鼠标要差多了
作者: #强东
板块: #开发调优
编号: 1759663
帖子: https://linux.do/t/topic/1759663
时间: 2026-03-15 17:58:26
摘要:
macos触摸板放大缩小体验是不是比鼠标要差多了,是不是我用的姿势不对,我现在在macos上用obsidian的canvas,经常需要放大和缩小画布,感觉用经常用二指捏合和放开非常不灵敏,而且感觉挺累的
标题: 话说大模型最遵循的prompt模板格式是不是有什么说法
作者: #anzi
板块: #搞七捻三
编号: 1759676
帖子: https://linux.do/t/topic/1759676
时间: 2026-03-15 18:01:00
摘要:
最近我问了gpt5.4,都说大模型最可以理解的是自然语的提示词结构
角色
任务
规则
工作流程
输出格式
只是说调用工具的需要才让输出内容的格式是json,ison,md,等等格式
是不是有这种权威的说法有没有佬说说
标题: 巡检国产龙虾之一(JVS Claw)篇
作者: #lineulb
板块: #国产替代
编号: 1759693
帖子: https://linux.do/t/topic/1759693
时间: 2026-03-15 18:04:33
摘要:
不多言语
地址https://jvs.wuying.aliyun.com/
目前处于测试状态,要求邀请码,但没事,网页的话右上角会有邀请码申请,你随便写一下应该就给了(我是等了一天)。
感觉很良心,是二开的openclaw,内核是
OpenClaw 版本:2026.2.26

右边给你显示一个linux桌面,一个高度定制化的linux系统,你可以点进去直接操作,有外网环境,受到GFW的保护。无法更新openclaw(可能你们可以,我拿它没办法)

然后进去干,agents.md有很多内容(10多k,我就不截图了)。(感觉要做二开竞品的可以借鉴下)
如果你在系统里改它md文档保存,会运行不了(因为你改变了文档权限)
我通过对话框,把它的agents和soul文档都清空了。

然后重启openclaw,限制依旧,让它自己解释了下,Gateway / 运行- 核心安全规则- 身份限制 到很后面才会加载soul啥的,我本以为soul.md是最核心,只能说第一次长见识了。

然后打开终端,干进去,sudo提权转root,然后去找它的真实模型,真实模型感觉是qwen3-max-2026-01-23,
key的话要仔细找,是一个每8或是12小时会更新的key值,在gateway那里找。更多的就没测了。

总结:绝对不会死的openclaw,(我就死了一次,就是强行把它agents.md私自改了,启不动,就把它删了再重建一个),它云部署的版本很不容易卡死,或是说它就算在做长任务,你再提问,它也不会像你自己装的,执行完上个任务再回你。安装skills,我没试,感觉它skills库做了镜像,没法连到世界,这个对我来说就没啥意义了。qwen3-max-2026-01-23这个模型不行,希望以后正式版的时候配个像样的模型。最后我会把这篇文章的link提交给官方,结束,希望还会有下期。