linux.do
21K subscribers
116K photos
195 videos
115 files
248K links
linux.do最新话题和热议话题
Download Telegram
如题,有没有可以关键词搜飞书公开文档的网站

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: linux.do)
gmail 被风控如何解决

求问佬友们:我从接码平台用一个美区手机号注册了一个 gmail ,绑定了 2FA,指纹和一个+86 的手机号,第二天登录时让我重新验证手机号,但那个美区手机号已经注销了,切换方式按钮点了之后没反应,只能美区手机号验证…这种情况下应该怎么办呀 😭

6 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: smart-lty)

Invalid media: image
求助cc和cx中断怎么无缝衔接

很多次需求或疑问提出后cc和cx分析到一半因为各种原因中断结束,怎么从一半接上继续分析。

极少时候自己不注意突然退出去了进去后在询问都是全新的了。

佬友们有什么好的解决办法 😖

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: AskHeart)
佬友们 有没有Safari上好用的广告屏蔽软件,求推荐

最好是也能屏蔽在Safari上看YouTube时的广告的,求推荐 🙏

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 涛 薛)
免费领取一个月Trae国际版pro用量

由于下周二 1 月 20 日是Trae 国际版上线一周年!官方决定在生日前一周开始福利大放送!

今天(1 月 14 日)10:00 起向 Trae 国际版全部用户赠送 Fast Request 权益(不少于 1 个月 Pro 会员的用量)!

面向用户:TRAE 国际版全部用户(Free + Pro)

权益说明:
Free 用户:账号增加 600 次 Fast Request,有效期至 2 月 14 日 10:00
Pro 用户:账号增加 800 次 Fast Request,有效期至 3 月 14 日 10:00

适用范围:TRAE 国际版 IDE + SOLO 模式,权益有效期内所有模型均可使用

领取方式:
访问Trae国际版官网 trae.ai,点击主页右上角「Claim Anniversary Gift」按钮,进入活动页面领取

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: sunhong9ai)
这个登录不上,怎么解决啊

6 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: dimmer)

Invalid media: image
我们讲的标准化归一化,到底是什么?|整治Normalization与Standardization的乱象|详细解析我们都在讲标准化、归一化,这到底是什么,有什么区别?是否是翻译的不准确的问题?|详细解析

什么是 Normalize?它干嘛的?为什么 std 和 mean 要设成 0.5?归一化和标准化,这到底是什么?

网上的说辞各执一词,没有一个统一的标准和意见。现在,笔者尽量以最严谨的方式(包括用词、公式、翻译不统一之处使用英文原文等等),把对于标准化与归一化(即所谓的StandardizationNormalization)的最权威解释分享出来试图解释这个问题。如有纰漏,欢迎各位佬友指正 🤔

首先从源头讲起。让我们把脑海中的所谓 标准化 、 归一化 这些中文翻译抛到九霄云外,之所以中文里有 “标准化”、“归一化” 混用和很多人搞不清区别,是因为目前中文翻译对几种 Normalization 的翻译是有些歧义 ,尤其是部分博客文章完全混用。
通常来说,它们都是指特征工程 中的特征缩放过程,由于中文翻译的原因,网上对它们的解释也是五花八门,但其实我们不考虑它们的名字,直接看它们的作用和操作方法,可能会更容易理解。
强烈建议直接用 Normalization 来区分和理解,不用中文翻译了,这样可以省很多理解时间。

1. Feature scaling

先看维基原文。
en.wikipedia.org

Feature scaling

Feature scaling is a method used to normalize the range of independent variables or features of data. In data processing, it is also known as data normalization and is generally performed during the data preprocessing step. Since the range of values of raw data varies widely, in some machine learning algorithms, objective functions will not work properly without normalization. For example, many classifiers calculate the distance between two points by the Euclidean distance. If one of the feature...

即特征缩放,特征缩放是用来统一资料中的自变项或特征范围的方法,在资料处理中,通常会被使用在资料前处理这个步骤。(简介中,维基官方翻译巧妙地避开了对 normalization 的解释)。

Normalization 操作被用于对数据属性进行缩放,使其落在较小的范围之内(即变化到某个固定区间中),比如 [-1,1] 和 [0, 1],简单理解就是特征缩放过程。但是为什么要缩放?这里图片更为清晰直观一些:

看到了没?使用 feature scaling 时,梯度下降的收敛速度比不使用特征缩放时要快得多。
而 feature scaling 一共有四种方法:Rescaling (min-max normalization)、Mean normalization、Standardization (Z-score Normalization) 与 Scaling to unit length
至于其余的公式、叫法、翻译、解释,本文一概不涉及。

先看公式。

2 Rescaling (min-max normalization)
x' = a + \frac{(x - \min(x)) \times (b - a)}{\max(x) - \min(x)}
用处:重新缩放特征范围,将范围缩放到 [a, b] 之间。

rescaling(直译为重缩放)为什么又叫 min-max normalization 呢?很简单,该缩放是通过引入最小、最大值(min x,max x)实现缩放。例如,假设我们有学生的体重资料,范围落在 [160 磅,200 磅],为了重新缩放这个资料,我们会先将每个学生的体重减掉 160,接着除以 40 (最大体重与最小体重的差值)。

[0,1] 的最小 - 最大值的一般公式为
x' = \frac{x - \min(x)}{\max(x) - \min(x)}
该公式的使用次数最多。

3 Mean normalization

公式为
x' = \frac{x - \mu}{\max(x) - \min(x)}
个人认为其与 min-max normalization 的区别就是将 min x 换为均值,从而使其在 x 轴上有均匀的正负分布。

4 Standardization (Z-score Normalization)

公式为
x' = \frac{x - \mu}{\sigma}
把每个特征值中的所有数据,变成平均值为 0,标准差为 1 的数据,这有点像正态分布(注意,并不是正态分布,与正态分布是否相像只取决于原始数据),见下图:

该公式也为经常使用的公式。

5 Scaling to unit length

公式:
x' = \frac{x}{\|x\|},
其中||x|| 为向量的范数.该公式笔者认为,包括所谓的 MaxAbsScaler(原始数据除以数据最大绝对值)以及 Normalizer(将每个样本的特征向量调整到单位范数(即长度为 1))。它的作用就是将原始数据简单粗暴地除以某值,以求达到缩放到 [0,1] 中的目的。

Normalize 的用法及原理?

现在我们熟悉了 feature scaling 的四个公式,回头转向最初的问题。
什么是 normalize?我们依旧不做翻译,只能说它是一种对张量作计算的方法,将某张图片转化为 normalization 形式。
那么它的计算过程是什么?
贴出源码:
import torch
from torchvision import transforms
from PIL import Image
from torch.utils.tensorboard import SummaryWriter

# 引入png格式图片
img_path = "dataset/0000.png"
img = Image.open(img_path)

# 将png格式转化为totensor格式
writer = SummaryWriter("logs")
trans_to_tensor = transforms.ToTensor()
tensor_img = trans_to_tensor(img)

# 进行normalize计算
trans_to_norm = transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5]) # 前一个为均值,后一个为标准差
img_norm = trans_to_norm(tensor_img)

第一步不必多说,我们从第二步看起。
很多人都说 Normalize 是按照 x = (x - mean) / std 得来的,实则大错特错。这个用法实际上并不是这个函数的本意,只是借用了(x-mean)/std 这个公式。

1. ToTensor 在将图片转换为 Tensor 格式时,使用了 feature scaling 中的公式 Scaling to unit length(所谓的 MaxAbsScaler),即out = in / 255,将原 tensor 缩放为 [0,1] 之间。
2. 之后使用区间化公式 Rescaling (min-max normalization),a,b 分别取 - 1,1,将缩放为 [0,1] 区间的图像再次缩放为 [-1,1] 区间。
3. 将a = -1,b = 1带入公式

x' = a + ((x - min(x)) * (b - a)) / (max(x) - min(x))
结合 ToTensor 后的 [0,1] 范围(此时 min (x)=0,max (x)=1),推导可得
x' = -1 + \frac{(x - 0) \times (1 - (-1))}{1 - 0} = 2x - 1
而当 mean=0.5、std=0.5 时,
(x - 0.5) / 0.5 = 2x - 1
与上述推导结果一致,所以笔者并不认为是x = (x - mean) / std,只是形式恰好为此而已。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 連清琦)

Invalid media:
image
image
太好了,这是新特性!

打开外链多了一重保护,体贴又周到。 👏

17 posts - 13 participants

Read full topic

via LINUX DO - 最新话题 (author: 𝕹𝖔𝖙𝖍𝖎𝖓𝖌 𝖎𝖘 𝕿𝖗𝖚𝖊. 𝕰𝖛𝖊𝖗𝖞𝖙𝖍𝖎𝖓𝖌 𝖎𝖘 𝖕𝖊𝖗𝖒𝖎𝖙𝖙𝖊𝖉.)

Invalid media: image
大善人变小善人了?

Gemini Enterprise,以前模型选择这里可以选Claude模型来着……
5 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 十万破界)

Invalid media: image
佬们羊毛不好薅啊,还以为能稳了

还以为能使用多久,两个月就嘎啦,是不是过了试用期没有升级导致的

7 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: langkey)

Invalid media: image
反代反重力额度有点迷啊

之前都是正常的,就在半个小时前我用gemini-3-pro-image-preview全部429了。一共加了16个号轮询,有的号调用了12次有的号一次都没用,现在全部都是429了

7 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: 李霸霸)
有没有佬友遇到过reddit手机端死活登不上的问题

手欠退出了一次就登不上了,这个垃圾软件,真是恶心

3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: Alex)
Gork真的很好用呀。

说下我喜欢的点:

只要稍微加一点提示词,就能把搜索中的图片展示出来,我感觉这种方式比纯文字展示的方式好太多了。

3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: openorange)

Invalid media:
image
image
Ascend选手

有没有在CANN昇腾生态上面玩的?我一直都是国产芯片的选手,感觉cann生态实在是差劲,开发起来很痛苦

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: llinxiao)
逆天 python openai 库, 自带数据统计请求头

昨天尝试接一下中转站发现一直被 blocked, 但是 curl 一直可以, 后面排查方向转到这个 package 上发现它会携带 x-stainless-* 的请求头和 AsyncOpenAI/PythonUA, 如下:
=== 请求 Headers ===
...
user-agent: AsyncOpenAI/Python 1.31.0
x-stainless-lang: python
x-stainless-package-version: 1.31.0
x-stainless-os: MacOS
x-stainless-arch: arm64
x-stainless-runtime: CPython
x-stainless-runtime-version: 3.13.5
x-stainless-async: async:asyncio
...

然后写了一个 http_client 覆盖了这些头就解决了.
后面检索了一下这个 x-stainless-* 发现是这家公司的私货, 用来做数据统计和分析的…

3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: Siykt)
微信小程序以个人备案的,能分享给别人使用么,有被封的风险么?

做了个小程序,用于记录周边的美食,也会分享给业主群使用。

4 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: zzz22333)
公益站登录不上,使用姿势不对吗?

好几个公益站登录发现失败的情况,我的网络问题还是什么?

比如:http://router.tumuer.me/ 现在就登不上去

13 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: Nothing)

Invalid media: image
气笑了,哈哈

😅 😅
(1)下载matlab安装包。
(2)果然有诈:

8 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: kingstacker)

Invalid media:
image
image
一个简单易用的局域网唤醒工具,支持通过Web界面管理主机、发送WOL唤醒包、检测服务器状态以及测试端口连通性。

功能特性

✨️ 主机管理(添加、编辑、删除)
⚡️ WOL唤醒发送Magic Packet
🔍️ 服务器状态检测(ping/SSH/RDP并发检测)
🔌 端口连通性测试(3秒超时)
📤️ 数据导入导出(JSON格式)
🔐 密码保护功能
🌙 深色/浅色主题切换, 兼容移动端

项目地址

https://github.com/dhjz/dwol

功能示例图

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 月亮之上)

Invalid media:
image
image
马斯克称2月14日之后FSD停售,改用按月订阅

https://x.com/elonmusk/status/2011324998653513810?s=20

5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: zj.z)

Invalid media: image
用open code的佬,你们的到了下午还稳定吗?

我是1.1.15版本,从昨天和今天,上午就很正常,一到下午就频繁进入假死状态,就是发消息没有任何回应,切换模型也不行,关了再开能跑一两条任务又进入假死。烦的很。你们有遇到吗?

3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: hel)