钉子 ZINE
27 subscribers
16 photos
14 links
Download Telegram
大家好!从今天开始我会在这个频道“钉子 ZINE”中更新关于艺术与科技、商业和多媒体相关的各种小短文与小发现,欢迎在 https://t.me/dimzine 或者 https://twitter.com/dimchenofficial 订阅更新。

另外附送几张由 Midjourney 创作的频道图标变体, enjoy
👍21🔥1
Channel photo updated
life2vec:一个将丹麦统计局提供的人生事件序列进行向量编码和预测的项目
Using Sequences of Life-events to Predict Human Lives

https://www.nature.com/articles/s43588-023-00573-5 / https://arxiv.org/abs/2306.03009

这是丹麦统计局和国家社交网络项目支持的一项研究,数据源未公开,基于 Transformer 网络。该网络最后能够将每个人一生的事件序列编码为一个单一向量,随后使用了 TCAV 概念激活向量测试,即手动挑选具有给定特征不同值的数据样本形成一个概念向量并验证其是否激来进行模型含义的解释。

模型仅仅通过 NLP 方法,在没有任何预先知识的情况下最终生成了有效的概念编码和概念集群(如图),并且能够理解文本化的数值字符串之间的严格邻近和正负关系。对于健康、职业等概念也有有意义的结果。

模型进行了预测死亡率和死亡年龄的尝试。模型在年轻和女性人群中预测效果更好,生活事件的数量对模型的影响并不明显。另外,该模型能够预测人格细微差别,包括内向性和外向性。

#论文 #机器学习 #人工智能 #Transformer #NLP
ICN/CCN:信息中心网络以及内容中心网络

我长久以来有一个想法,即创建一个个性化的个人文件 URI 系统,它基于我的使用习惯和规范,能跨平台工作,无需进行全量同步,同时保持一个唯一独特资源指向。例如,我在 Mac 和 Windows 设备上都有一些特定于平台的资源,比如 Windows 上的游戏和 Mac 上的 shell 文件,出于各种原因,我不希望这些资源在不同平台间同步。然而,我仍然使用 Dropbox 或 OneDrive 等服务来部分同步文件目录结构,实现非全量同步。我想知道,是否可能在使用一个类似于 Obsidian 这样的个人信息管理库的同时,创建一个由我为不同平台指定的软链接支持的树形附件目录?举个例子,让 Obsidian/attachments/music 目录在 Windows 和 Mac 上分别链接到不同的本地目录,而 Obsidian/attachments/papers 目录则指向两个系统下的另一组不同目录,并且允许某些链接在特定平台下不可用。

后来,我发现类似的想法(指跨物理设备和跨云的非 Hosts 单一服务绝对路径导向文件/网络系统)已经有人想过了。这就是所谓的 ICN ,他们期望改变以主机 Host 为中心端到端网络通信机制,通过内容的发布/订阅范式来提供服务。当然,这会让我们想到 P2P 和 Torrent ,但 ICN 实现在网络层,规模更为庞大。ICN 本身也是一个已经进行十多年的研究,(或许对互联网的基本结构动手动脚总是容易像 IPv6 和 Xanadu 那样烂尾),目前已经有了 CCN, (来自施乐公司 Palo Alto 研究中心), DONA (美国), PSIRP (欧洲), NetInf, TRAID, CBCB 等多个实例,其中争议也不少。

1/2 ICN/CCN:信息中心网络以及内容中心网络
#论文 #计算机网络 #网络架构 #云计算
钉子 ZINE
ICN/CCN:信息中心网络以及内容中心网络 我长久以来有一个想法,即创建一个个性化的个人文件 URI 系统,它基于我的使用习惯和规范,能跨平台工作,无需进行全量同步,同时保持一个唯一独特资源指向。例如,我在 Mac 和 Windows 设备上都有一些特定于平台的资源,比如 Windows 上的游戏和 Mac 上的 shell 文件,出于各种原因,我不希望这些资源在不同平台间同步。然而,我仍然使用 Dropbox 或 OneDrive 等服务来部分同步文件目录结构,实现非全量同步。我想知道,是否可能在使用一个类似于…
ICN 的基本特点就是全局统一、位置无关的资源命名,那么对资源命名是使用带树状结构的分层命名,还是 hash 的扁平命名?对于后者, MobilityFirst 设计了一种类似现在互联网 NS 机构那样的独立命名组织,可以将人类可读名字映射到其真正的网络地址 GUID (某种类似 UUID 的东西)。 GUID 本身可以自我证明,但为了可读增加了命名机构;而前者(直接用树状格式命名资源)不使用命名机构,地址可读,反过来就必须有一个类似证书机构那样的证明机构来确保资源的控制权,这是一个两难的矛盾。类似的,路由方法上,用类似 IP 那样的无结构洪泛广播还是树状/分布式哈希表,也将带来不同的路由负担和弹性后果。

当然,尽管有很多困难, ICN 的好处还是明确的。由于 ICN 实现在网络层,相比实现在应用层的 P2P 能够更高效的对多点多向传输进行缓存。内容请求者也不需要知道资源在哪个服务器上。这有点像每个路由器都带有了一定的内容中心的 CDN 功能,而已经十分广泛使用的 CDN 也是 ICN 最大的竞争者。但论文中特别强调了:现有 CDN 对内容并没有语义理解和复杂的网络感知,是难以预测详细高峰流量的数量和方向的,而且命名的数据包也避免了深度数据包检查 DPI 等开销昂贵的技术、以及对加密数据不起作用的情况。由于订阅者驱动的特性,也可以减少客户端没有主动要求的无用信息的反复广播。

近些年来,国内外(包括欧美和清华、武汉大学的一些实验室)仍旧在组织相关的研究和实验,但似乎仍旧局限于小打小闹的可研性尝试阶段。在我看来, ICN 在解决“存储命名实体的多中心网络"这个问题上有许多有益的启发,但考虑到目前的区块链等发展,网络基础设施正朝着越来越廉价、越来越不在乎计算和传输成本的趋势发展,所以除非带来应用层的极大受益,否则是难以推广了。


注: 2010 年,美国 NSF 就资助了 4 个 FIA 未来互联网体系结构研究项目,分别是 NDN (Named Data Networking), MobilityFirst, NEBULA , XIA (eXpressive Internet Architecture, 其中侧重点各有不同,也非常有趣。MobilityFirst 假设所有设备都是移动的,利用延时可容忍网络 DTN 提供鲁棒性,天然适合环境和内容感知。 NEBULA 则假设一切上云。 XIA 直接假设未来会有无数种不同的应用模式,专注做其中的兼容层。

参考资料:
- A Survey of Information-Centric
Networking Research, IEEE https://www2.aueb.gr/users/vsiris/publications/p24_ICN_survey.pdf
- Advances in Research on Information-Centric Networking 以信息为中心的网络研究进展, 李军, 陈震, 石希 清华大学 计算机系 信息技术研究院网络安全实验室信息国家实验室, https://blog.51cto.com/sddai/3075518
- ICN信息与中心网络介绍,ICN,NDN路由过程 https://blog.csdn.net/weixin_42134034/article/details/105558459
- 内容中心网络 CCN 研究进展探析 https://www.researchgate.net/publication/235248452_neirongzhongxinwangluo_CCN_yanjiujinzhantanxi


2/2 ICN/CCN:信息中心网络以及内容中心网络
#论文 #计算机网络 #网络架构 #云计算
基于连接的创造力:通过研究制药行业的开发活动,利用德勒兹的根茎概念,建立创造力的本体论和认识论模型
https://www.researchgate.net/publication/220438728_Creativity_as_connectivity_A_rhizome_model_of_creativity

这是一个跨界大混搭文章,里面出现的概念和组织都是我(学术而非社会意义上)的老朋友了。正如我接触 AGI 和命名标记实体/RDF 的路径那样,该研究的首要背景来自组织管理学,而论文作者是瑞典查尔姆斯理工大学的一位副教授及其博士生,他们同时服务于欧盟 FENIX 项目(*见尾注),且该教授最近出版了一本书,名为《理解组织中的知识管理和知识共享》。我猜这是一个博士学位级别的工作,作者只有学生本人和导师,所以内容并不是非常 solid ,更像是单纯在给组织管理学届科普个新概念。

我很久以前就有过类似的笼统的推论(参考传统的 DIKW 数据-信息-知识-智慧模型),先于接触到德勒兹的根茎概念之前,我就在思考创造力过程能否通过被证明为某种图网络式的“有意义的连接创建”,从而在计算创意学层面上被严格的本体论模式化。当然,德勒兹提供了一个强大且文学性的概念工具,从而能够有力的将这种“模式科学”的创造力视角从硬核知识管理的 Nerd 兴趣和模式识别/知识图谱科研的应用,用文科生听得懂的话语推向知识生产的组织与社会学科和艺术界。

这篇文章前部本身是一个很好的知识管理文献综述,包括如何区分显性和隐性知识,个人知识和命题知识,知识和情感等。其也探索了组织内部和组织之间转移知识的概念模型(which of 我想过的跨组织知识库迁移问题)。但本文的重点(或者它认为的空白)即是知识管理在组织学习和组织创造力方面的应用。不赘述对所谓创造力就是灵感的批判和对德勒兹的介绍,他给出了核心定义:根茎总是水平运作,这是“连接和异质性原理”;它并不追求把所有知识和陈述追溯到根(起源),是反谱系学、而是地质学的,只要根茎内容存在联系,知识和陈述就会出现。此处简述了德勒兹对这种民主化知识生产过程的政治主张。

此后,它将新药开发这个具体的实例过程分成了发现(目标鉴别,化学)、早期发展(概念证明,生物学),晚期发展(临床研究,生理医学)几个阶段,并且将目标对象,实验中中的新药 NCE 称为“在活动线上像代币一样传递”。该论文将该过程和根茎结构进行了比较,同时提出了观点:加强组织内部建立联系的能力将有利于平滑的创造力空间的出现,同时提到了虚拟公司或者项目化组织等公司“去功能化”的实践尝试。

到此就戛然而止了。总的来说,这是一篇很没头没尾的研究,发表在 International Journal of Internet and Enterprise Management 上,查了一下这是应该是个没有中科院也没有 JCR 分区的水刊(有错可打脸)。也不知道这是应该加强我对组织管理学还是德勒兹研究的坏印象,不过只看对当前学科进展引用或综述的部分,还是很有参考价值的。


注:ICEI(人脑项目交互式计算电子基础设施)项目由欧盟委员会根据人脑项目(HBP)框架合作协议提供资助。在该项目中,五个领先的欧洲超级计算中心正在共同开发一套电子基础设施服务,这些服务将联合起来形成 Fenix 基础设施。简而言之,这是给欧盟 HPC 超算系统提供基建的一套项目,最近的成果是对 CoVid-19 相关研究进行原子分子动力学模拟,也包量子科学、石油相变、小行星岩石形成等其他跨领域合作,见 https://www.fenix-ri.eu/news/how-fenix-infrastructure-advances-research-multiple-scientific-domains

#论文 #知识管理 #德勒兹 #组织管理学 #文献学
钉子 ZINE pinned «中文 / English 分享关于艺术、科技、人文、商业和多媒体相关的小发现。 网页版»
最近在 XGP 体验了一下城市天际线2,先给结论:性能需求大,低配下画质提升不高且十分卡顿,且 MOD 目前还没开放,不推荐顶着 200 的高价入手,目前只建议 3080+ 高配党先行体验。

不过,二代从底层上改进了车流车道、行人AI等的逻辑,规划起来比一代舒服的地方很多。而且对于真正有高配能够释放画面潜力的 UP 主来说,二代除了可以得心应手的拉立交造桥,还能以穿梭机、第一人称视角体验各种细节的汽车、行人、建筑内饰模拟,还是非常适合云的。

只从搞笑和娱乐节目效果的角度来说,更推荐看一代各种 UP 的整活视频(或许今后我也会整理一下推荐的视频列表),这里我就先安利几个最近在看的二代系列 UP 主。

1/3 城市天际线2 UP主/视频分享
#视频 #Bilibili #游戏 #城市天际线 #P社
1
钉子 ZINE
最近在 XGP 体验了一下城市天际线2,先给结论:性能需求大,低配下画质提升不高且十分卡顿,且 MOD 目前还没开放,不推荐顶着 200 的高价入手,目前只建议 3080+ 高配党先行体验。 不过,二代从底层上改进了车流车道、行人AI等的逻辑,规划起来比一代舒服的地方很多。而且对于真正有高配能够释放画面潜力的 UP 主来说,二代除了可以得心应手的拉立交造桥,还能以穿梭机、第一人称视角体验各种细节的汽车、行人、建筑内饰模拟,还是非常适合云的。 只从搞笑和娱乐节目效果的角度来说,更推荐看一代各种 UP 的…
【都市天际线2】开门!从零开始系列 首发-预告 | UP 佳欣凯
https://www.bilibili.com/video/BV1EH4y1R7He

这个 UP 主比较偏向全流程体验流,很适合直观的体验整个2代的真实游戏体验,最精彩的是他对交通动线流向人流和片区的规划,还有各种造桥造路上下飞跨详细讲解。和观众的互动也很多,每集都会剪一文艺的风景片,可以按需取用~

2/3 城市天际线2 UP主/视频分享
#视频 #Bilibili #游戏 #城市天际线 #P社
钉子 ZINE
【都市天际线2】开门!从零开始系列 首发-预告 | UP 佳欣凯 https://www.bilibili.com/video/BV1EH4y1R7He 这个 UP 主比较偏向全流程体验流,很适合直观的体验整个2代的真实游戏体验,最精彩的是他对交通动线流向人流和片区的规划,还有各种造桥造路上下飞跨详细讲解。和观众的互动也很多,每集都会剪一文艺的风景片,可以按需取用~ 2/3 城市天际线2 UP主/视频分享 #视频 #Bilibili #游戏 #城市天际线 #P社
全球首部天际线2经营+造景城展!从零开始建造世界最高城!【Lee Town建城记】第一期《都市:天际线2》 | UP 夕林樱花
https://www.bilibili.com/video/BV1am4y1K7Su/

这个 UP 是标准的配置党+城建规划美化党,视频信息密度高、编排紧凑,CBD布局、山体地形、公园造景……完全展现出了2代的画质上限。另外对地铁和轨道系统以及道路系统的各种技巧也讲解的很棒。

3/3 城市天际线2 UP主/视频分享
#视频 #Bilibili #游戏 #城市天际线 #P社
This media is not supported in your browser
VIEW IN TELEGRAM
https://braid.org/

Braid 是一个开放工作组,致力于为网络应用创建可互操作的状态同步算法、应用、工具和标准。他们的目标是让我们能像读写本地变量一样轻松地跨网络协同读写分布式状态。

Braid 的核心项目是 Braid-HTTP,这是对 HTTP 协议的扩展,让 HTTP 从状态传输协议进化为状态同步协议。具体来说,它为 HTTP 增加了以下特性:

- 为 HTTP 资源增加版本管理
- 为 GET 请求增加订阅推送机制
- 为 Range 请求增加 Patch 修改
- 增加 Merge-Types 以支持 OT 或 CRDT 行为

有了这些特性,一个 Web 资源就能在多个客户端、服务器和代理之间自动同步,支持多个写入者在任意网络延迟和分区下的并发编辑,并通过 OT、CRDT 等算法保证最终一致性。

Web 应用可以用 Braid 扩展来实现协同编辑、离线模式、P2P 网络等功能。Braid 已经有了 JavaScript、Haskell、Lua 等多种语言的库,兼容现有的 Web 架构。感兴趣的朋友可以关注他们的 IETF 草案和 GitHub 仓库。

#分布式系统 #同步算法 #网络协议 #开源项目
从神经机制看,理解计算机代码似乎是一种独特的认知活动,既不同于语言,也不等同于数学逻辑
https://news.mit.edu/2020/brain-reading-computer-code-1215

研究者让熟练的程序员在接受 fMRI 扫描时阅读 Python 和 ScratchJr 代码片段。结果发现,相比自然语言处理,代码阅读主要激活了一个名为多需求网络 (multiple demand network) 的脑区。这个分布式的脑网络通常在执行数学题、填字游戏等复杂认知任务时被激活。
另一方面,代码阅读虽然也调动了多需求网络,但激活的脑区与数学逻辑任务并不完全重合。这表明编程在认知需求上似乎也不能等同于数学。

#神经科学 #认知心理学 #计算机科学 #编程
Shadama:适合所有人的粒子模拟编程环境
https://tinlizzie.org/~ohshima/shadama2/live2017/

今天我们可用的计算能力是惊人的。在 90 年代末,实现 1 teraflop 的性能对于建筑物大小的超级计算机来说是一个里程碑,但现在我们预计智能手机很快就能达到同样的里程碑。未来计算性能只会继续提高。

但人们使用这种力量的目的是什么?无意批评,但人们通常对观看猫视频和玩游戏更感兴趣,而不是尝试发明自动驾驶个人飞机或发现引力子。抛开开玩笑不谈,我们今天面临的重大问题之一是我们在提高科学素养方面的努力,即使是在技术先进的社会中也是如此。我们需要下一代更多地而不是更少地拥抱科学。

#编程 #物理
Rete 算法:高效模式匹配算法及其在专家系统中的应用
https://www.drdobbs.com/architecture-and-design/the-rete-matching-algorithm/184405218

Rete 算法是一种用于加速专家系统中的模式匹配过程的经典算法。在像 OPS5 这样的基于规则的生产系统中,系统需要不断地将工作内存中的事实与规则内存中的模式进行匹配,以决定接下来要执行哪些规则。例如,侦探的专家系统在生产内存中可能具有以下规则:

如果一个人 x 做了违法的事情,那么这个人 x 就是犯罪分子。
如果属于 x 的指纹位于物体 y 上,则 x 在过去的某个时刻触摸过 y。
如果 x 射杀了 y,那么 x 就做了违法的事情。
如果 x 已经去世,则不应邀请 x 来吃晚饭。

所有这些都需要大量的模式匹配。每次推理引擎循环时,模式匹配器必须将存储在数据存储器中的数据与存储在生产存储器中的规则进行比较,以查看哪些规则满足其所有条件。如果生产系统像许多实际系统一样具有数百个数据项和数千个规则,则此比较过程可能会非常漫长。Rete 算法通过构建一个高效的匹配网络,避免了重复和冗余的匹配过程。Rete 及其变种被广泛应用于规则引擎、业务流程管理、复杂事件处理等领域。

虽然 Rete 诞生于上世纪 70 年代的 LISP 时代,但它的设计思想在今天仍具有启发性。比如我们在设计状态管理库、响应式框架时,也会遇到类似的增量计算、依赖追踪的问题。Rete 展示了如何通过 trade-off 时间和空间,在动态变化的数据上高效执行大量的模式匹配。

#算法 #人工智能 #编程范式 #专家系统
钉子 ZINE pinned «频道 钉子 ZINE 目录 #论文 5 #工具 4 #Bilibili 3 #游戏 3 #人工智能 3 #城市天际线 3 #P社 3 #视频 3 #计算机网络 2 #机器学习 2 #软件工程 2 #Transformer 2 #Hack 2 #投资 2 #网络架构 2 #云计算 2 #小技巧 2 #Medium 2 #编程 2 #NLP 2 #知识管理 1 #城市 1 #专家系统 1 #网络协议 1 #神经科学 1 #公共空间 1 #编程范式 1 #同步算法 1 #现代艺术 1 #开源项目 1 #算法 1…»