标题: 抢到了一套马钞,但是预约时间是周二,没时间取,该怎么整呢
作者: #ml_z
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446109
时间: 2026-01-14 11:44:07
摘要:
作者: #ml_z
板块: #搞七捻三
编号:
1446109帖子: https://linux.do/t/topic/1446109
时间: 2026-01-14 11:44:07
摘要:
抢到了一个马钞,但是预约时间是周二,没时间取,又不能改预约时间,想问一下马钞只能预约的时间取吗
标题: 2026年贺岁钞 和朋友都预约到了 你呢
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446112
时间: 2026-01-14 11:44:50
摘要:
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
1446112帖子: https://linux.do/t/topic/1446112
时间: 2026-01-14 11:44:50
摘要:
标题: 新闻学发展的未来困惑
作者: #wangzi123
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446120
时间: 2026-01-14 11:45:28
摘要:
作者: #wangzi123
板块: #搞七捻三
编号:
1446120帖子: https://linux.do/t/topic/1446120
时间: 2026-01-14 11:45:28
摘要:
各位佬友们好,本人是个新闻学专业的人文社科领域的大学生,但我发现随着科技时代进步新闻传统的技能已经不满足现在发展需求。我发现数据分析+新闻已经慢慢成为一种潮流,但我本人没有任何编程基础。我想学习一下这方面东西特别是关于数据分析,ai使用,网络安全等这些领域,请问各位佬友有什么看法以及我该怎么入门学习路径。万分感谢
标题: 求国外服务器推荐
作者: #zwy0724
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446121
时间: 2026-01-14 11:45:35
摘要:
作者: #zwy0724
板块: #搞七捻三
编号:
1446121帖子: https://linux.do/t/topic/1446121
时间: 2026-01-14 11:45:35
摘要:
用途:部署小型项目,个人网站和私有化项目,还有一些ai反代服务,例如cpa,无需求
配置:无特殊要求,最好是延迟看的过去
预算:年付200上下,可视配置或性价比上浮预算
求推荐喵
标题: 这是什么矛盾行为
作者: #啊天
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1446122
时间: 2026-01-14 11:45:51
摘要:
作者: #啊天
板块: #开发调优
编号:
1446122帖子: https://linux.do/t/topic/1446122
时间: 2026-01-14 11:45:51
摘要:
标题: 看了DS的Engram,和大众想的记忆系统偏差很大
作者: #umbrella
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446131
时间: 2026-01-14 11:47:41
摘要:
作者: #umbrella
板块: #搞七捻三
编号:
1446131帖子: https://linux.do/t/topic/1446131
时间: 2026-01-14 11:47:41
摘要:
github.com
GitHub - deepseek-ai/Engram: Conditional Memory via Scalable Lookup: A New Axis...
Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models
原工作镇楼,我讲讲我自己的理解。
这个工作的初步想法是作者观察到大模型的transformer层的很多算力被浪费在固定知识的匹配上[1],浪费了这个结构推理的潜力。(参阅文章的引言)
因此作者在模型的结构中新增一个模块,在attension块(可以理解为transformer层最精髓核心的计算块)前加入一个engram块,这个engram块的计算其实说起来很简单,就是对于当前处理的token,找到这个token前的token序列,用这个序列来查一个表[2],查出的结果融合回当前计算结果供后续模块参考。(如果这段看不懂可以先看后面的例子再回来看)
举一个简单的例子,假设模型正在输出“中国|首都|…”(…为正在处理的即将生成的下一个token,|表示token的分隔)。
换做以前的模型结构,模型要计算出下一个token是“北京”,需要attension去注意前面的“中国”“首都”这两个token,还需要moe层存储中国首都是北京的知识;
有了engram之后,这个层取前token序列“中国|首都”[3],查表得到一个和“北京”概念相关的结果,将这个结果融合进当前计算结果交给attension和moe继续计算,也就省下了这两个模块存储和计算这个知识的资源,让其专注于组合推理的工作,提升智力。
文章的后续部分就是将这种新结构的模型和原结构模型性能进行对比,并且摸索了一下同时应用moe和engram的优化时有没有一个最佳配比(两边模块分配多少参数量合适),就不多说了。
所以直观上看这个工作主
标题: ima任务模式邀请码
作者: #𝓕-𝓓𝓻𝓸𝓲𝓭
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1446136
时间: 2026-01-14 11:49:41
摘要:
作者: #𝓕-𝓓𝓻𝓸𝓲𝓭
板块: #福利羊毛
编号:
1446136帖子: https://linux.do/t/topic/1446136
时间: 2026-01-14 11:49:41
摘要:
抽奖主题: [ima任务模式邀请码]
奖品详情:
[奖品]:[ima任务模式邀请码]
一个邀请码可以邀请3个人,所以抽3个。
活动时间:
截止时间:[2026-1-15 20:30]
参与方式:
在本帖下随意回复。
抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
标题: p站富可敌国佬顶风作案掺kiro?n佬可以进来解释一下了
作者: #FoxCode小助手
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1446139
时间: 2026-01-14 11:50:50
摘要:
作者: #FoxCode小助手
板块: #开发调优
编号:
1446139帖子: https://linux.do/t/topic/1446139
时间: 2026-01-14 11:50:50
摘要:
最近A各种搞事情(不退款)官渠很难稳定,结果看到这俩天n佬挺稳的,就随手测了一下,结果发现了一些猫腻:
询问提示词时发现加了限制,这个操作有点意思了:
接下来继续测试看看能不能饶过,结果发现了什么?
使用的渠道claude code分组,0.75倍率,可不是逆向分组。
如下完整请求可自行测试:
curl 'https://privnode.com/v1/messages' \
-H 'accept: */*' \
-H 'accept-language: zh-CN' \
-H 'anthropic-beta: interleaved-thinking-2025-05-14' \
-H 'anthropic-version: 2023-06-01' \
-H 'content-type: application/json' \
-H 'http-referer: https://cherry-ai.com' \
-H 'priority: u=1, i' \
-H 'sec-ch-ua: "Not=A?Brand";v="24", "Chromium";v="140"' \
-H 'sec-ch-ua-mobile: ?0' \
-H 'sec-ch-ua-platform: "macOS"' \
-H 'sec-fetch-dest: empty' \
-H 'sec-fetch-mode: cors' \
-H 'sec-fetch-site: cross-site' \
-H 'user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) CherryStudio/1.7.8 Chrome/140.0.7339.249 Electron/38.7.0 Safari/537.36' \
-H 'x-api-key: sk-xxxx' \
标题: 我在大A -永辉躲牛市的一天!
作者: #bart.yang
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446163
时间: 2026-01-14 11:52:06
摘要:
作者: #bart.yang
板块: #搞七捻三
编号:
1446163帖子: https://linux.do/t/topic/1446163
时间: 2026-01-14 11:52:06
摘要:
佬友们,今天A股4000+上涨,有跟我一样在永辉躲牛市的吗
标题: 突然发现和女朋友在一起 11 年 11 个月了
作者: #congwa
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446165
时间: 2026-01-14 11:52:45
摘要:
作者: #congwa
板块: #搞七捻三
编号:
1446165帖子: https://linux.do/t/topic/1446165
时间: 2026-01-14 11:52:45
摘要:
我们的故事:从校园到家园
2013年 07月:那年夏天,我大一你大二,我们在最美好的年纪相识。
2014年 02月:我们正式在一起,开启了长达六年的恋爱长跑。
2020年 09月:我们结婚了,给彼此一个坚定的承诺。
2022年 10月:宝宝出生,二人世界升级为温暖的三口之家。
2026年 1月:11 年多啦。
求祝福
标题: 年关将至,找工作擦亮眼睛避免进入骗局。
作者: #LINUX 小编
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446166
时间: 2026-01-14 11:52:49
摘要:
作者: #LINUX 小编
板块: #搞七捻三
编号:
1446166帖子: https://linux.do/t/topic/1446166
时间: 2026-01-14 11:52:49
摘要:
年底了对象一直在找工作。具体内容如下
昨天qq邮箱内收到一份面试邀请。内容大概是次日通过腾讯会议沟通并通过腾讯会议来进行线上面试。
已知信息:未投过这家公司,不知道对方是通过什么渠道获得简历发送邮箱面试邀请的;
主流三个招聘平台都在上面注册并进行投递;
面试前找我查了下这家企业也确实有且存在;
昨天和对象聊天的时候 也聊过但是对象没印象 投递过 但是也没啥 先面了再说;
想问下这是什么套路?后面链接下载东西就明显不对劲了;
猜测 骗子随便捏造滥用真实企业信息 诱骗下载软件 实时第二步诈骗?
已让对象停止与对方沟通
懂的佬 来看下 里面的软件 如果下载安装了 会有什么问题
今日准备面试过程中的对话
标题: 怪不得反重力那么笨 原来是偷换模型了
作者: #豆沙包
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1446174
时间: 2026-01-14 11:55:34
摘要:
作者: #豆沙包
板块: #开发调优
编号:
1446174帖子: https://linux.do/t/topic/1446174
时间: 2026-01-14 11:55:34
摘要:
标题: 为什么都在秀恩爱?
作者: #doomer
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1446183
时间: 2026-01-14 11:57:21
摘要:
作者: #doomer
板块: #搞七捻三
编号:
1446183帖子: https://linux.do/t/topic/1446183
时间: 2026-01-14 11:57:21
摘要:
不是第一个帖子,我还以为来了相亲站