标题: 今天有佬在12306上抢到30号的票吗?
作者: #尘叶风凌
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960167
时间: 2025-09-16 10:29:21
摘要:
作者: #尘叶风凌
板块: #搞七捻三
编号:
960167帖子: https://linux.do/t/topic/960167
时间: 2025-09-16 10:29:21
摘要:
我居然又是抢到了候补,抓狂(`Д´)
标题: 关于恶意脚本检测模型的一点记录
作者: #yongru cheng
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/960168
时间: 2025-09-16 10:29:25
摘要:
作者: #yongru cheng
板块: #开发调优
编号:
960168帖子: https://linux.do/t/topic/960168
时间: 2025-09-16 10:29:25
摘要:
最近在做一个恶意脚本检测的小型模型,一些思考过程在这里记录一下,辛苦佬友们提提建议
前提
由于模型要在pc端侧部署, 考虑到性能和内存占用等限制,RNN、Transformer之类的架构基本上也是没法用了,所以我最初的考虑的就是采用1D CNN来搞一个端到端的分类模型。(其实之前也做了一个基于CPG异构图的GNN模型,但是效果不佳,可能还是数据集质量不佳或者其他哪里出问题了吧)
恶意脚本的局部性
不管是javascript/python还是其他语言的恶意脚本,真正有问题的可能就那么一两句,而CNN的感受野也不是无限的,所以基本上滑动窗口来做预测。
将长脚本看作一个长序列,把它切分成多个有重叠的“块”(chunks),利用模型分别对每个块进行预测,最后聚合所有块的预测结果。比如我们可能得到这样一个概率列表:[0.1, 0.05, 0.98, 0.95, 0.2](如下图), 只要有一个块的恶意概率超过阈值(比如0.5),就将整个脚本标记为恶意。在上面例子中,因为有0.98,所以整个脚本是恶意的。
训练思路
要采用上面这个策略, 首先我得有一个训练良好的模型,那么遇到的第一个问题就是如何处理在训练阶段, 同一个脚本被切分为多个chunk, 但是标签一致带来的噪声问题?
一个包含10个分块的恶意脚本,可能只有1个分块含有真正的恶意代码,而其他9个分块是完全良性的(例如,函数定义、注释、良性逻辑等)。如果把这9个良性块也当作正样本来训练,会让模型感到“困惑”。
这里我选择多实例学习(MIL)的策略,如下图所示
当然这其中肯定还有很多细节,不再详述,举个例子:超长脚本会引入超大的bag,会爆显存。
碎碎念,有些还没想好怎么解决的问题
抗混淆,有些混淆是真的恶心,人分析起来都费劲,总不能混淆就报毒吧
怎么处理上下文关联,可能在第一块中定义的恶意负载变量,在最后一块中才真的用到(resnet天下无敌?)
做数据集好费劲。。。。
标题: 北京运营商的套餐,这个价格怎么样?
作者: #wxl
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960174
时间: 2025-09-16 10:31:04
摘要:
作者: #wxl
板块: #搞七捻三
编号:
960174帖子: https://linux.do/t/topic/960174
时间: 2025-09-16 10:31:04
摘要:
北京移动/联通合25元/月,60G全国+200分钟,送副卡
(可转网办不换号也能新开)
电信/移动政企套餐35元/月,220G+2900分钟 (付费办理)
标题: 佬友们都在用的内网远程工具是什么
作者: #curiosity
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960175
时间: 2025-09-16 10:31:32
摘要:
作者: #curiosity
板块: #搞七捻三
编号:
960175帖子: https://linux.do/t/topic/960175
时间: 2025-09-16 10:31:32
摘要:
想用 windwos 内网远程 macmini
标题: 韩顺平教学一周学会 Linux
作者: #zimab
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/960202
时间: 2025-09-16 10:38:16
摘要:
作者: #zimab
板块: #资源荟萃
编号:
960202帖子: https://linux.do/t/topic/960202
时间: 2025-09-16 10:38:16
摘要:
韩顺平的《小白一周学会 Linux》是一套经典且受欢迎的 Linux 学习视频课程。
我用夸克网盘给你分享了「韩顺平教学一周学会Linux」,点击链接或复制整段内容,打开「夸克APP」即可获取。
/~42af38Idv3~:/
链接:夸克网盘分享
标题: 正能量的人真的多
作者: #Redv
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960206
时间: 2025-09-16 10:39:17
摘要:
作者: #Redv
板块: #搞七捻三
编号:
960206帖子: https://linux.do/t/topic/960206
时间: 2025-09-16 10:39:17
摘要:
好快啊~~~哈哈哈
标题: 今天更新了一下发现用老版本的PowerShell 5.1运行claudecode或者codex会卡死
作者: #xdtz
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960209
时间: 2025-09-16 10:39:48
摘要:
作者: #xdtz
板块: #搞七捻三
编号:
960209帖子: https://linux.do/t/topic/960209
时间: 2025-09-16 10:39:48
摘要:
换成PowerShell 7就可以了,不知道cc更新了啥玩意,codex也跟着更新
标题: Veloera Zone | 我们在大量的题目内发现了少量的兑换码
作者: #铎
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960210
时间: 2025-09-16 10:39:48
摘要:
作者: #铎
板块: #搞七捻三
编号:
960210帖子: https://linux.do/t/topic/960210
时间: 2025-09-16 10:39:48
摘要:
#476
将多项式
a_{1} x^{10} + a_{2} x + a_{3}
无量纲化,化为如下形式:
\epsilon y^{10} + y^{1} + 1
请将 \epsilon 表示为 a_1, a_2, a_3 的函数。
#874
将多项式
P(x) = 4 x^{10} + 2 x^{9} - 6 x^{5}
无量纲化,化为如下形式:
\epsilon y^{10} \pm y^{9} \pm 1
并解出 \epsilon。答案保留2位小数。
将题1答案中所有数字从大到小排列,英文逗号分隔后第2个数字加上题2的答案即为兑换码(例:3,2,1 → 3,3.34,1。其中3,3.34,1为兑换码。)
兑换地址:https://zone.veloera.org/app/wallet
标题: 大家上班早八都是怎么过的
作者: #lzy168
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960218
时间: 2025-09-16 10:41:10
摘要:
作者: #lzy168
板块: #搞七捻三
编号:
960218帖子: https://linux.do/t/topic/960218
时间: 2025-09-16 10:41:10
摘要:
闷一口咖啡?喝点茶?咖啡因感觉都喝出免疫力了,上午困,中午困,下午困,春困,秋乏,夏累,东冷,一年四季困困困困
标题: L 站的五年历史
作者: #KXG
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960219
时间: 2025-09-16 10:41:15
摘要:
作者: #KXG
板块: #搞七捻三
编号:
960219帖子: https://linux.do/t/topic/960219
时间: 2025-09-16 10:41:15
摘要:
“已读乱回“ 申请小作文大赏
原来 L 站已经五年历史了
请问有人是五年老佬友吗?
标题: 求佬友推荐济南历下区美食(历下区附近)
作者: #木木
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960223
时间: 2025-09-16 10:42:33
摘要:
作者: #木木
板块: #搞七捻三
编号:
960223帖子: https://linux.do/t/topic/960223
时间: 2025-09-16 10:42:33
摘要:
快在济南上班一年,还没吃到附近的美食,请佬友推荐几家美食(备注:本人四川人能吃辣)
标题: cursor 跑满200次 tool calls ,记录一下
作者: #Hollow
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/960224
时间: 2025-09-16 10:42:38
摘要:
作者: #Hollow
板块: #开发调优
编号:
960224帖子: https://linux.do/t/topic/960224
时间: 2025-09-16 10:42:38
摘要:
200次tool calls 认证
单次请求费用
题主是按次计费模式,所以这次血赚
标题: icloud过期怎么处理
作者: #bibubibu
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960232
时间: 2025-09-16 10:45:12
摘要:
作者: #bibubibu
板块: #搞七捻三
编号:
960232帖子: https://linux.do/t/topic/960232
时间: 2025-09-16 10:45:12
摘要:
由于土区涨价,目前在考虑怎么处理icloud数据。
我准备到手机撑不住了,再去购买icloud服务,让icloud免费存储这部分很少查看的照片。
请教一下各位佬,如果我不续期,数据还会保存吗?
我在国服icloud官网看到很多人说 icloud过期30天后会删除数据。
标题: 佬们今天抢到票了么,都是用什么软件抢的,分流最近几次都是排队然后无票~
作者: #老往
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960234
时间: 2025-09-16 10:45:21
摘要:
作者: #老往
板块: #搞七捻三
编号:
960234帖子: https://linux.do/t/topic/960234
时间: 2025-09-16 10:45:21
摘要:
小红书看到飞猪能在放票前就出票,怎么做到的
标题: macOS Tahoe26 大家都更新了吗
作者: #Leon
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/960235
时间: 2025-09-16 10:45:29
摘要:
作者: #Leon
板块: #开发调优
编号:
960235帖子: https://linux.do/t/topic/960235
时间: 2025-09-16 10:45:29
摘要:
iOS 26 (23A341)
iPadOS 26 (23A341)
macOS 26 (25A354)
tvOS 26 (23J353)
visionOS 26 (23M336)
watchOS 26 (23R352)
标题: 我,秦始皇?打钱? 真有现实版本哎
作者: #包子
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960239
时间: 2025-09-16 10:46:20
摘要:
作者: #包子
板块: #搞七捻三
编号:
960239帖子: https://linux.do/t/topic/960239
时间: 2025-09-16 10:46:20
摘要:
标题: 开始求职啦,吭哧吭哧
作者: #糖糖软萌喵
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960244
时间: 2025-09-16 10:46:59
摘要:
作者: #糖糖软萌喵
板块: #搞七捻三
编号:
960244帖子: https://linux.do/t/topic/960244
时间: 2025-09-16 10:46:59
摘要:
休整了一个多月,调整好了心情,重装了电脑系统。
现在要开始求职啦~
武汉还是很锻炼人的,我还没开始投,论坛就有关联的帖子了。
求教下佬,武汉除了汗血工厂,还有没有相对好的公司呢?求推荐
咱卑微Java崽一枚
标题: 吐槽苹果备份,iCloud 备份
作者: #TalexDS
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/960249
时间: 2025-09-16 10:48:06
摘要:
作者: #TalexDS
板块: #搞七捻三
编号:
960249帖子: https://linux.do/t/topic/960249
时间: 2025-09-16 10:48:06
摘要:
本来想一大早上备份完就升级的,然后我已经很精简了,只备份了微信QQ这些,没想到从早上8:30到现在都还没有备份完
应该昨天提前备份的!