LinuxDo 新帖推送

标题: 新年再添一喜:QQ飞车1/6白嫖的道具就抽到了付费赛车~
作者: #欣欣|林可欣
板块: #搞七捻三
编号: 1409624
帖子: https://linux.do/t/topic/1409624
时间: 2026-01-06 01:44:19
摘要:

周年活动抽奖道具都是免费送的 大概花了200个“水晶”
正好今天是1月6号  有缘分



豆包统计的社区数据:

虽然不一定是这一期的，但是每一期概率差不多

1 view17:46

LinuxDo 新帖推送

标题: 才发现其实苹果ARM架构的CPU真的很强果断下单4台mac mini
作者: #ChenSa
板块: #开发调优
编号: 1409631
帖子: https://linux.do/t/topic/1409631
时间: 2026-01-06 01:47:22
摘要:

买了4台Mac mini m4 跑项目一定很爽 原因是今天测了一下我的m3 macbook 真的很吊 性能比肩我的桌面端R7 7950 …

1 view17:48

LinuxDo 新帖推送

标题: Pt站星陨阁工作组招募
作者: #xiaoyan
板块: #搞七捻三
编号: 1409636
帖子: https://linux.do/t/topic/1409636
时间: 2026-01-06 01:52:42
摘要:

如违反规则请直接删除！
均为黑工）无人民币工资
站点以国漫为主，需要进站的佬可以留下邮箱，id，任意一站低隐私，如无其他站点，也可以说明一下
招 web，美工，UI设计，保种，剪辑，Java Vue
保种5t两年，退休永v
剪辑为去头尾去广告，操作简单
计划Java+Vue进行重构，已新建文件夹，有兴趣和精力的大佬烦请留个联系方式）
有兴趣也可以发送邮箱至y08lin4@gmail
（linuxdo不常访问）

1 view17:53

LinuxDo 新帖推送

标题: 真的，一直到现在，我实在再没有吃到那夜似的好*积分*了
作者: #ggvis
板块: #搞七捻三
编号: 1409639
帖子: https://linux.do/t/topic/1409639
时间: 2026-01-06 01:58:43
摘要:

真的，一直到现在，我实在再没有吃到那夜似的好积分，——也不再看到那夜似的好赞了。

赶上了末班车，水到了几百积分，真怀念这个遍地是赞，到处是积分的好时候啊
PS：新的积分规则真是简洁明了

1 view18:01

LinuxDo 新帖推送

标题: 一些关于积分规则的建议和讨论
作者: #Lison
板块: #运营反馈
编号: 1409640
帖子: https://linux.do/t/topic/1409640
时间: 2026-01-06 02:02:11
摘要:

对于积分规则，有如下建议：

积分主要由登录签到获取，适当提高签到分数的获取，比如 20。
每在线时长一小时 1 分。

在关键板块：

任何发帖都需要消耗 1 积分。防止无意义的水贴。（这样可以保证回复有信息量）
发布任何话题都需要消耗 10 积分。防止出现没有意义的话题（不然可能入不敷出）。
得到回复将得到 1 积分（也就是说让人有讨论的欲望）。
点赞需要消耗积分，给出点赞扣 1 分，则获得点赞的人得 5 分。（让回复有代价但高回报）
积分可以用来问题悬赏。

在水贴板块或者抽奖板块：

回复和主题发布都不消耗和奖励积分。但是点赞仍然是给出点赞扣 1 分，则获得点赞的人得 2 分。鼓励有趣的水贴。

这样可以减少关键板块的水贴量，增加论坛的硬核纯度，降低无用信息密度，同时也保证了浏览量。

1 view18:03

LinuxDo 新帖推送

标题: 【抽奖】GPT 1年 Plus 未绑卡 *1
作者: #Online Mo
板块: #福利羊毛
编号: 1409645
帖子: https://linux.do/t/topic/1409645
时间: 2026-01-06 02:05:09
摘要:

抽奖主题： GPT 1年 Plus 未绑卡 *1
 奖品详情：
[奖品1]：GPT 1年 Plus 未绑卡
 活动时间：
时间：Tue, Jan 6, 2026 12:00 AM CST→Sat, Jan 10, 2026 12:00 AM CST
 参与方式：
在本帖下任意回复。
 抽奖规则：
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
 注意事项：
本活动将在活动截止时间后关闭回帖，以确保公正性。
中奖者将在活动结束后24小时内在本帖公布，并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与，祝您好运！如有任何疑问，欢迎随时联系抽奖发起人。

1 view18:06

LinuxDo 新帖推送

标题: 大家现在codex 官方号用什么轮询？
作者: #你好坏噢
板块: #开发调优
编号: 1409647
帖子: https://linux.do/t/topic/1409647
时间: 2026-01-06 02:07:06
摘要:

搞了plus号不知道用什么轮询好，搞多几个直接不用上中转站了
看了几个中转系统 都是中转中转站的

1 view18:08

LinuxDo 新帖推送

标题: 刚才服务器上的geminicli自动挡把没运行的镜像全当垃圾删了望周知
作者: #啊天
板块: #开发调优
编号: 1409650
帖子: https://linux.do/t/topic/1409650
时间: 2026-01-06 02:09:59
摘要:

自动挡滴神
哭了没’
半夜气的

1 view18:12

LinuxDo 新帖推送

标题: 与claude4.5o-t谈“让AI「随机」”
作者: #欣欣|林可欣
板块: #搞七捻三
编号: 1409657
帖子: https://linux.do/t/topic/1409657
时间: 2026-01-06 02:19:05
摘要:

这几天一上线就看到大事件，然后水一堆
导致本来想发的一直没发
今天清库存!
来自1月3号的灵感:
我最近经常看到让ai进行随机工作的情况
自从知道AI的原理以及概率性逻辑
我一直在思考这个问题
毫无厘头，直接让人家给一个随机的数字
80%的会给42
概率性使然
就算有1亿个人问他这个问题，他每一次也相当于是第一次回答这个问题
而第一次的概率就是如此之大
所以显然让他随机是不可能的
到底为什么不可能？
我的想法是:
人工智能在模仿人类!
你让做这种选择题
本质上就是让人类随机选一个人
太大的主观因素
招聘环节 三个人，你知道他们的所有信息，非要你随机选一个，你肯定会受到某个人颜值是你偏爱的影响 无可厚非，一定有一定影响
具体一个情景
发了一篇文章搞了个抽奖，评论区有100人回复 有人回复很长，有人简单回复支持
有人对你进行批评，有人写了一堆金句
把这100条全部丢给爷爷，让他你随机选一条定位抽奖，目标
100% 他不会去学那些回复支持的人
99%他不会选择那些批评你的人(除非说的精辟 中肯 建设性 而非纯粹攻击性，但是很少)
到底会选谁呢？不言而喻
这是真实发生的 有很多例证
所以ai会怎么想？
叫我随机一下 我看看 有些人回答的很不错 选他们比较好，但是用户要求我随机，让我重新思考
再看看大部分回复很平庸，甚至是简单的两个字 但是他们数量太多了，该选谁呢？ 这很难选择，让我再思考一下
还有些人对用户进行的批评 该选择他们吗？会不会被用户认为是刻意的？ 是否应该照顾用户的情绪呢？ 但这时候又违背了随机
看起来想要随机非常困难 综合考虑，我还是选择这位回答优质的用户吧~
大概就是这样的思路
所以，你怎么看？

1 view18:20

LinuxDo 新帖推送

标题: 深夜闲聊：如果Claude模型全部开源会发生什么？
作者: #氯雷他定
板块: #搞七捻三
编号: 1409659
帖子: https://linux.do/t/topic/1409659
时间: 2026-01-06 02:21:09
摘要:

对比国内的ai厂商，基本上都是开源的，像是什么千问，glm，deepseek等，好像基本都是全参开源。
但是国外的大模型大部分都是闭源，如果Claude开源了，会对我们的生活带来什么不一样的体验吗？

1 view18:23

LinuxDo 新帖推送

标题: 佬们，为啥点赞不行啊
作者: #好哦
板块: #搞七捻三
编号: 1409660
帖子: https://linux.do/t/topic/1409660
时间: 2026-01-06 02:21:57
摘要:

佬们，为什么我经常点赞点不了，会弹出如下图所示的窗口

1 view18:23

LinuxDo 新帖推送

标题: 简单易懂的LLM相关知识梳理-ep.3-1 认识大语言模型
作者: #flymyd
板块: #文档共建
编号: 1409664
帖子: https://linux.do/t/topic/1409664
时间: 2026-01-06 02:25:58
摘要:

目录帖：
  
    
    
    
      简单易懂的LLM相关知识梳理 
  

文档共建
    
  
  
    迫于项目被砍，失业赋闲在家，恰好也快过年了不想动了，想了下写点文章回馈下社区吧。 
PS：如有年后Base重庆的AI/全栈/FAE岗可PM我 
本文从实用角度出发，梦到哪写哪。部分八股文知识就不搬了，这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。 
这里优先介绍LLM/VLM，暂不涉及音频/视频/Omni相关模型（也可能梦到了以后补一下） 
注：文章为本人手写，部分模型介绍搬运自…
  


写着写着梦游了，所以只好改标题单开一章
===============正文分割线===============
警告：本章含有大量Transformer相关的粗浅知识。笔者也不是特别精通，仅供参考。
在又一个普通的清晨，你又在工位上吃着早餐，突然你的领导又又又叫你去会议室，等你再出来时又已经是彻底无语。
“网络安全…公司信息安全…私有化…本地部署”
好，你大概能理解公司领导那莫名其妙的掌控欲，那么有什么卡可以用呢？八张H100还是一张3060？可你根本不了解大模型的知识。
小贴士：

开放模型的权重可以在Huggingface和ModelScope下载。这也是目前世界和国内最流行的两个大模型权重托管平台
Huggingface被墙了，但有镜像站：https://hf-mirror.com
虽然ModelScope在国内，但有时候会遭到莫名其妙的限速，hf-mirror配合Aria2脚本下载也未必见得慢
我个人追踪模型前沿动向的信息源主要有：Reddit-r/LocalLLaMA、小红书、QQ群、知乎（重要程度从大到小排序）
在小红书上多刷大模型的帖子而忍住不去点美女的帖子需要一定的毅力，幸好我坚持下来了

作为一个小萌新，你上次部署大模型还是在闲鱼上花了29.9买了本地部署DeepSeek教程，最终得到了一坨奇怪的东西。这次你不得不静下心来学习一番了。
在看了一堆奇奇怪怪的教程以后，你准备了一份离职报告，准备等领导开完会以后递上去。在等领导开会的期间里，你无聊地刷着LinuxDo…突然发现了一篇行文诡异的帖子，就好像梦呓一样。看完了以后你顿觉醍醐灌顶，好像知识以托梦的形式进入了你的脑子。
如果阅读过ep.1和ep.2，相信你至少已经用过了不少大模型。但这世界上很多事情都是知其然而不知其所以然，大模型的结构到底是什么样子？
这里我将以Qwen3-32B和Qwen3-30B-A3B举例。这是两个参数量相近但结构不同的模型。
Dense模型和MoE模型
在2026年这个节点上，Dense（密集、稠密）结构通常出现于较小参数的模型上，而大参数模型都转向了MoE（混合专家）结构。
通俗一点讲，大模型就是一坨神经网络，里面是一层层的神经网络块，它们由许多参数构成。

Dense：不管你输入了什么，神经网络里的每个参数都要参与计算。比如你去一个诊所里，这里只有一个医生。不管你是感冒还是骨折了，都是他来看这个病，看病的时候还得把脑子里的所有知识都过一遍，无论是生活常识还是医学知识。
MoE：路由层会根据你的输入来判断把你的输入递交给几个特定的专家。医院有大有小，医生水平也各不相同。但无论如何这个医院都存在分诊台和好几个专科医生。每次看病都只会有几个专家来给你看病，而不是集合医院里的所有力量。

看起来MoE更好，但事物都是有两面性的。先看缺点：

Dense：推理计算量要求更高，说白了就是慢。如果这个模型是一个很大参数的Dense，每次推理的速度将会慢的发指。
MoE：很容易就可以通过扩充专家的方法达到很大的总参数量。但思维密度/深度远不如同尺寸的Dense模型。

再看优点：

Dense：在同参数量的对比下，Dense模型比MoE聪明的多。
MoE：因为每次只激活一部分专家，计算速度比同参数量的Dense模型快得多。

对比：
Dense就像是智商150的天才，但一个人的精力有限，精通STEM的时候就不太可能懂得如何炒菜，甚至可能搞出来铁钉炒鸡蛋。
而MoE像是8个智商120的人构成的团队，涉及STEM领域时可能捆起来都打不过智商150的天才（奥数题只存在做得出来和做不出来之分），但他们还掌握了更多其他的技能。
在了解了Dense与MoE之分后，让我们进入实战，通过对比两款典型的模型的样子，来了解大模型的知识。
通过阅读Model Card进行有点硬核的知识分解
首先打开Huggingface，在顶部搜索栏里搜索Qwen3-32B。你将会看到搜索结果里显示Qwen/Qwen3-32B。这是模型ID的常见表示方法：组织机构名/模型名。
点击后跳转到https://huggingface.co/Qwen/Qwen3-32B，首先看到的是Model Card（模型卡）页面。它是一个Markdown，介绍了这个模型。
如果想查看这个模型的变体（如量化版本、微调版本等），可以在网页右侧的Model tree找到。这个稍后讲。
相似总参数量的Dense与MoE的异同点
我们阅读一下Model Card里的描述节选：
Qwen3-32B has the following features:

* Type: Causal Language Models
* Training Stage: Pretraining & Post-training
* Number of Parameters: 32.8B
* Number of Paramaters (Non-Embedding): 31.2B
* Number of Layers: 64
* Number of Attention Heads (GQA): 64 for Q and 8 for KV
* Context Length: 32,768 natively and 131,072 tokens with YaRN.

人话版：
* Dense还是MoE？没标明就是Dense。
* 类型：因果语言模型（现在大模型基本都属于此类，基于前面的内容预测下一个Token，属于自回归类）
* 训练阶段：预训练与后训练（先用海量数据学习通用知识，再用各种手段如SFT和RLHF等进行后训练。如果是Base模型则没有后训练）
* 总参数量：32.8B（即328亿，通常都取个整来讲）
* 非嵌入参数量：31.2B（总参数量-非嵌入参数量=词表嵌入层参数量，算下来这里有1.6B的词汇表，这意味着有多语言支持。单英语会比这个数小不少）
* 层数：64层（64个Transformer模块堆叠，通常层数越深，模型的抽象推理能力就越强）
* 分组查询注意力：64个查询头（Q）和8个键值头（KV）。这样有利于在有限的显存里跑更长的上下文。
* 上下文长度：原生32K，通过YaRN（基于旋转位置编码 RoPE 的修改）可以扩展到128K。

补充知识：什么是GQA？
这里涉及了注意力结构的知识：

Q的数量代表思考并行度，决定了模型每一层能从Q个不同的角度去理解当前的输入。
KV的数量代表需要缓存多少数据，也就是记忆的存储成本。KV要存在显存里，所以KV多了就需要更多的显存搬运，拖慢速度。
Q:KV=1:1是典型的多头注意力（MHA），对细节的理解能力最强但显存占用很大，推理很慢。
Q有很多但KV只有1个则是多查询注意力（MQA），推理快但容易丢细节。
Q和KV都不止一个，而是按照一定比例分配，则为本模型的分组注意力（GQA），每组Q共享一个KV。属于折中方案。

补充知识：什么是YaRN？
为什么上下文长度既有32K又有128K？这里使用了常见的上下文外推技术YaRN：

原生32K意味着这个模型在预训练阶段实际见过的最大文本长度。在这个上下文长度内性能是最好的。
当需要处理长文本的时候，可以通过旋转位置编码（RoPE）来取巧，把模型的视野拉长，但会损失精度和细节。
比如说这个模型是一把尺子，只有0到32K的刻度。如果你用它去量64K的文本，那后面对于模型来说就是古神，看一眼就会发疯，开始乱吐Token。
但RoPE会把64K的文本压缩到32K（动态压缩倍率=输入长度/原生长度）。这样，虽然被拍扁以后的文字变糊了，但至少能差不多看清楚了。
YaRN是RoPE的扩展，对于宏观结构进行压缩，对于微观细节尽量不压缩。这样即保证了模型能通读，又尽可能地保留细节。

又臭又长的前置知识看完了，那么看看相似参数量的Qwen3-30B-A3B换换脑子：
Qwen3-30B-A3B has the following features:

* Type: Causal Language Models
* Training Stage: Pretraining & Post-training
* Number of Parameters: 30.5B in total and 3.3B activated
* Number of Paramaters (Non-Embedding): 29.9B
* Number of Layers: 48
* Number of Attention Heads (GQA): 32 for Q and 4 for KV
* Number of Experts: 128

1 view18:26

LinuxDo 新帖推送

标题: 🤣用erzi.me邮箱注册的gptai被封啦
作者: #chancat
板块: #搞七捻三
编号: 1409666
帖子: https://linux.do/t/topic/1409666
时间: 2026-01-06 02:31:34
摘要:

如题。。昨天翻帖子看大佬说用这个注册就是教师资格，果然如此，爽了我一晚上美滋滋的睡觉了，第二天吃午饭呢就收到邮件通知违反将停用。是ip不干净的原因吗?

还有捣鼓的两天才通过那个一年的认证，有领取资格了，结果验卡的时候傻眼，我用的小红卡被拒绝。烦死了。 来晚了啥都没赶上

1 view18:33

LinuxDo 新帖推送

标题: 导师给买了Cursor Ultra ,想咨询一下Ultra的使用上限大概是多少呢？
作者: #Yiyabo!
板块: #搞七捻三
编号: 1409667
帖子: https://linux.do/t/topic/1409667
时间: 2026-01-06 02:33:37
摘要:

如题图，今晚上导师给安排了Cursor Ultra。想咨询一下各位 Ultra 订阅我只用4.5 opus thinking，差不多能用多少呢？或者就是这个订阅的额度上限是多少呢？可以超限使用，这个号可能以后就不用了，目前这个卡也无所谓。

1 view18:33

LinuxDo 新帖推送

标题: 闲聊一下，说说自己最近对codex skills manus等一系列2025年下半年已经发生2026年将要发生的推断
作者: #ShiroEirin
板块: #搞七捻三
编号: 1409669
帖子: https://linux.do/t/topic/1409669
时间: 2026-01-06 02:34:47
摘要:

主要是涉及到目前AI代理中出现的一个新特性，名为skills，该特性翻译为“技能”，主要是把一串规范和工具包装成可复用功能，让模型调用。但是就是基于这个特性，我突然发现这可能和今年下半年市场对agent产品热情熄灭、Manus被Meta收购（Manus自己也急着出售）有关。不知道我的推测是否合理，佬友可以听我讲述一番。
skills这项功能绝对是颠覆性的，在Claude推出它时大伙都低估了它的能力。第一是工具调用，Claude code等支持skills的AI代理本身就可以使用，Window、Linux终端持有的命令，执行的代码脚本例如.py、.sh脚本，而skills内部则是编写触发后内部的流程规划。而2025年下半年的模型基座能力提升，终于是触摸到长链路任务的复杂规划能力，skills本质就是规划任务能力的体现。skills中包含的各类情景，例如出现错误应该如何操作、获得响应应该如何返回、等待时长通过什么得知，这都是写在skills内部的。而且模型还会基于情景进行纠错，继续任务task的流程直至交付完善。
Manus急着卖大概率是发现市面上的确模型基座已经快具备长链路任务规划能力和情景纠错能力了，他们的工具本质上是个多Agent交互系统，基于上下文工程+文件系统+沙箱组成了一整套自循环场景，而skills也是一种自循环场景，两者在功能性上实际上是相同的。甚至skills在交付能力上更大于Manus，因为内部不需要那么多Agent反复迭代，导致长链路任务的幻觉，所以Manus这类产品已经被技术迭代了。大厂都不复刻Manus大概也是清晰地知道这类产品只是玩具，市场并不需要那么不稳定的工具。
另外就是我自己的感知，2026年开始模型厂商都会开始卷长链路的自动化流程任务，完全自动循环实现的落地交付，这种情形是最接近我们未来设想的AGI的愿景。只要通过想要的落地交付物，AI就能通过链路规划的任务自动实现结果的交付，通过基座强大的纠错机制，人类就可以放弃理解黑盒中的实际业务，只要知道开头和结尾就行。所以说Manus急着卖自己，2025年的下半年Manus的技术就已经属于落后的了。在Codex中的GPT5.2基座就已经有长链路规划和自动纠错能力，他们测试后恐慌的急着找出路，通用agent的这条路，终究是被模型厂商轻松超越了。
目前最大的恐慌就是下半年语言没啥优势了，2026年我推测真正富有架构能力且有认知结果推断能力的工程师才能活下去，再比较语言能力的强弱估计都没啥意义了。属于程序员的失业潮应该快了。我不敢想，只要自己想要，通过skills、流程分析、自动规划，加分支纠错，场景测试，最终落地，就能实现一个商业化的产品。我调试代码写代码干嘛呢？跳过中间直接落地，就像炼金术一样。
因为我推测skills的能力后，突然发现AI离操作现实应用也不远了。AI通过curl就可以触发接口，而现代互联网都是各种REST风格的API接口，只要得知这些接口内容就可以组合成一套链路复杂的任务流，去实现以前想都不敢想的能力，例如航空分析、商业化的调研。抓取一些被设有爬虫保护的网站，就算不知道这些接口，也可以通过chrome devtools、MCP浏览器工具去获取，甚至写playwright抓取页面元素。还有像数据库操作、Docker操作、SSH远程的服务器操作，这些只要能获得细节内容再编制成skills，就能实现自动化分析，产生实际想要的页面结果、实际的产品。
我现在愈发觉得skills就是一个产品，只是他们包裹在现在的Claude code、Codex等各类AI代理中。不在意中间流程只想知道交付，把skills包装成一个绘图工具，内部编写使用OpenAI格式或者Google格式，去访问对应的能实现功能的小香蕉api端点，剩下等待就是出图，把他包裹在一个Web页面上，它就是一个出图网站。业务流程的具体实现需要用到哪些代码，无非是工具链路需要给它一些实际情景：等待响应、获取返回、得到结果如何包装，以及一些编辑好的工具，这不都是写在skills里的吗？与其说是技能包，不如说就是打包的一整套交付流程。
如此强大的功能，都得益于GPT5.2那夸张的执行能力。在Codex里面GPT5.2甚至能工作22个小时不被阻断，持续性到交付。例如n8n之流，我看在2026年上半年就会迎来死亡。

1 view18:35

LinuxDo 新帖推送

标题: 准备开发一个AI助理(助手)有什么好的想法可以说说
作者: #诺河
板块: #开发调优
编号: 1409671
帖子: https://linux.do/t/topic/1409671
时间: 2026-01-06 02:41:05
摘要:

1.支持邮箱管理
2.信息渠道通知
3.能帮忙自动发帖
4.直接操控浏览器
5.能监控电脑屏幕
6.需要支持后台并发运行(类似于豆包手机)
7.对文件整理那些文件修改生成文档那些就不必多说了
8.自动对git连接进行docker部署 包括对项目请求
9.双mcp模式 有mcp接口 也可对接mcp
10.基于浏览器的自动化测试
11.能自己后台运行脚本curl等白名单命令
最重要的就是环境隔离大部分的我已经实现了
可以和大家说一下想法 其实软件实现非常之容易(skills+agent)

1 view18:43

LinuxDo 新帖推送

标题: 请求账户注销/封禁
作者: #shinya
板块: #运营反馈
编号: 1409672
帖子: https://linux.do/t/topic/1409672
时间: 2026-01-06 02:43:40
摘要:

如题，未找到自助注销账户的功能，请求管理注销/封禁

1 view18:46

LinuxDo 新帖推送

标题: 问一下有没有佬推荐一下适合沉浸式翻译的 api 服务，中转站或者官方的都行
作者: #Tooom
板块: #搞七捻三
编号: 1409675
帖子: https://linux.do/t/topic/1409675
时间: 2026-01-06 02:51:04
摘要:

之前用 openrouter 的模型，感觉体验还可以，就是价格有点高，主要是都没有谷歌翻译那么快，所以有没有佬推荐一下自己在用的 api 服务

1 view18:53

LinuxDo 新帖推送

标题: 如果 AI 图像生成 / 编辑被用来做恶...
作者: #timmm
板块: #搞七捻三
编号: 1409681
帖子: https://linux.do/t/topic/1409681
时间: 2026-01-06 03:04:30
摘要:

看到了这个知乎帖子后有感…
https://zhuanlan.zhihu.com/p/1991118212100798067
简单总结一下，似乎是某个微博上的人发了和很多明星睡觉 / 干其他事的照片，去锤明星。
类似这样的东西。

我不知道这是不是真的，也不关心。但这样的图片可以 用 AI 生成吧？
拿 AI 生成的图片用作退款证据或法律证据的事件，现在已经在发生了。
或许法庭可以未来不采用图片数据，商家可以不采信或是采用更严格的流程，但恶意的 AI 生成图片依旧可以发到公开平台引导舆论，进行造谣，抹黑…

这样的问题有几种潜在的解决方案。
一种，是让 AI 图像生成模型不生成名人。这个方案随着开源图像生成模型的进展和微调技术的普及，已经失败了。反破限再强，也跟开源模型没啥关系。而且这只能保护名人… 如果是普通人被抹黑呢？被造谣呢？
另一种，是让 AI 模型生成的图自带水印，比如谷歌 nano banana 生成的模型自带隐形 SynthID 水印。但如果开源模型能够做出类似的效果，就有很多 AI 生成图像会没有水印。你不太可能在开源模型上强制加隐形水印，总有人能移除模型中添加水印的部分的。(连 LLM 权重中的反 nsfw 倾向都能给干掉的话，很难想象添加水印的部分会移除不掉)
我认为比较靠谱的，不是标识假的图片，而是标识真的图片。让手机/相机拍的图片有办法验证真实性和完整性。只能是手机厂商让照片自身有办法证明自己的完整性和真实性了。
不检测假的图片，只验证真的图片？反正你验证不了你是真的，我们就默认你是假的。

简单研究了一下，发现已经有解决方案了？
有个叫 Content Authenticity Initiative (内容真实性倡议，CAI) 的东西，开发了一套开源的工具链，可以让图片证明自己的编辑历史，并且能够验证所有的图像编辑历史？
密码学，朋友


但这样的倡议，核心难点在拍摄设备的支持和相关工具的普及。大部分的普通人不会主动去使用这类工具，所以成功与否完全取决于手机和相机拍摄的照片是否自带类似功能。
这样的技术被应用到了小米 1

1 view19:06

About

Blog

Apps

Platform