#周五发版必挂
本来想着没啥大改动,随手发了一个 pre-release,结果真的挂了…
挂在 docker export cache 上面 https://github.com/tensorchord/envd/issues/1974#issuecomment-2643216076
这时候先怀疑是最近 bump buildkit 导致的,搜 changelog 完全没看到相关的,看了下代码似乎也没相关的。
本地试了下用 docker 内置的 buildkit 一定挂,自己开一个 buildkit container 就正常了,怀疑是以前写的对接 moby builder 的代码有问题,查了半天啥都没发现。
开启 GPT 小黄鸭 debug 来整理思路。GPT先怀疑版本对不上,之后怀疑 builder 不支持 export cache to registry。我心想 GPT 也不行啊,不支持 export to s3 还能理解,registry 这么基本的功能还能不支持吗?
虽然但是,还是专门查了一下,嘿,还真不支持,打脸了 🤡 还得开启 containerd image store 才能支持
本来想着没啥大改动,随手发了一个 pre-release,结果真的挂了…
挂在 docker export cache 上面 https://github.com/tensorchord/envd/issues/1974#issuecomment-2643216076
这时候先怀疑是最近 bump buildkit 导致的,搜 changelog 完全没看到相关的,看了下代码似乎也没相关的。
本地试了下用 docker 内置的 buildkit 一定挂,自己开一个 buildkit container 就正常了,怀疑是以前写的对接 moby builder 的代码有问题,查了半天啥都没发现。
开启 GPT 小黄鸭 debug 来整理思路。GPT先怀疑版本对不上,之后怀疑 builder 不支持 export cache to registry。我心想 GPT 也不行啊,不支持 export to s3 还能理解,registry 这么基本的功能还能不支持吗?
虽然但是,还是专门查了一下,嘿,还真不支持,打脸了 🤡 还得开启 containerd image store 才能支持
GitHub
bug: cannot export cache with moby builder · Issue #1974 · tensorchord/envd
Are you use the envd server? Yes, I am using the envd server. No, I am not using the envd server. Describe the bug release failed on cache-export: https://github.com/tensorchord/envd/actions/runs/1...
https://endler.dev/2019/tinysearch
用 XOR filter 做简单的搜索引擎,虽然有 false positive,但胜在简单、轻量,可以作为网站的一个小文件,不占服务器资源
用 XOR filter 做简单的搜索引擎,虽然有 false positive,但胜在简单、轻量,可以作为网站的一个小文件,不占服务器资源
endler.dev
A Tiny, Static, Full-Text Search Engine using Rust and WebAssembly
I wrote a basic search mod…
https://blog.cloudflare.com/building-vectorize-a-distributed-vector-database-on-cloudflare-developer-platform/
cloudflare vector search
- use IVF + PQ
- can return PQ results or precise results (still approx but using full precision? or without IVF?)
- eventually consistent
- WAL with sqlite based durable object
- batch the updates before reaching the WAL
- retrain on the fly
- filter the metadata with Chunked Sorted List Indexes
- performance https://blog.cloudflare.com/workers-ai-bigger-better-faster/#how-fast-is-vectorize
cloudflare vector search
- use IVF + PQ
- can return PQ results or precise results (still approx but using full precision? or without IVF?)
- eventually consistent
- WAL with sqlite based durable object
- batch the updates before reaching the WAL
- retrain on the fly
- filter the metadata with Chunked Sorted List Indexes
- performance https://blog.cloudflare.com/workers-ai-bigger-better-faster/#how-fast-is-vectorize
The Cloudflare Blog
Building Vectorize, a distributed vector database, on Cloudflare’s Developer Platform
Vectorize was recently upgraded and made generally available, now supporting indexes of up to 5 million vectors, delivering faster responses, with lower pricing and a free tier. This post dives deep into how we built Vectorize to enable these improvements.
https://github.com/tigerbeetle/tigerbeetle/blob/main/docs/internals/ARCHITECTURE.md
选 zig 而不是 rust 的主要原因是他们需要 static memory allocation,rust 提供的 safety 对他们的架构来说收益并不算大,很有意思的设计
选 zig 而不是 rust 的主要原因是他们需要 static memory allocation,rust 提供的 safety 对他们的架构来说收益并不算大,很有意思的设计
GitHub
tigerbeetle/docs/internals/ARCHITECTURE.md at main · tigerbeetle/tigerbeetle
The financial transactions database designed for mission critical safety and performance. - tigerbeetle/tigerbeetle
https://modelcontextprotocol.io/introduction
来回看了好几遍,感觉核心还是 LLM (claude) decide which tool to use based on the description。
- 依赖 LLM 的能力和对应的支持
- LLM 行为的依据是 MCP 里面提供的 description
假如我有一个 LLM,能解析 OpenAPI,那是不是已经囊括了 MCP 的所有功能了?🧐是我理解有问题吗?
来回看了好几遍,感觉核心还是 LLM (claude) decide which tool to use based on the description。
- 依赖 LLM 的能力和对应的支持
- LLM 行为的依据是 MCP 里面提供的 description
假如我有一个 LLM,能解析 OpenAPI,那是不是已经囊括了 MCP 的所有功能了?🧐是我理解有问题吗?
Model Context Protocol
What is the Model Context Protocol (MCP)? - Model Context Protocol
Android SIMD with Rust
https://gendignoux.com/assets/pdf/2023-06-08-zurich-rust-meetup-slides.pdf
https://gendignoux.com/assets/pdf/2023-06-08-zurich-rust-meetup-slides.pdf
及时吃药
SELECT * FROM your_table WHERE xmin = pg_current_xact_id()::xid; #TIL filter rows inserted in the current transaction
在 https://github.com/tensorchord/vechord 里面用到了这个技巧。作用是在 transaction pipeline 里面,后续步骤 select 只会看到当前 transaction 里面 inserted rows,从而做到只处理当前 transaction 的数据,避免了使用 metadata 来 track 数据插入的进度。
不过这个项目的定位还不明确,从一开始的 design doc 就没有明确目标。总之肯定不是 langchain/llamaindex 之类的,也不像一个纯粹的 VectorChord SDK,里面还掺杂了一点 Python ORM 的意思,玩了一些 metaprogramming,甚至还提供了一个生成 HTTP service 的功能(我也不知道为什么
不过这个项目的定位还不明确,从一开始的 design doc 就没有明确目标。总之肯定不是 langchain/llamaindex 之类的,也不像一个纯粹的 VectorChord SDK,里面还掺杂了一点 Python ORM 的意思,玩了一些 metaprogramming,甚至还提供了一个生成 HTTP service 的功能(我也不知道为什么
GitHub
GitHub - tensorchord/vechord: Turn PostgreSQL into your search engine in a Pythonic way.
Turn PostgreSQL into your search engine in a Pythonic way. - tensorchord/vechord
https://github.com/FedericoPonzi/Horust/pull/273
这个 PR 花了好大力气。一开始觉得有趣,想借此机会学习一下 cgroups 或者 eBPF,最后选了 cgroups 求稳妥。
本来以为 rust 就算 eBPF 生态不成熟,那都有几个 container runtime 了,起码 cgroups 没啥问题吧。没想到还真不行🤡
kata containers 自己 fork 了一个 cgroups-rs 但是年久失修,搜了一下发现他们自己都不用这个了。
youki 有一个 libcgroups,单独拆出来一个 crate,很好,只不过是给他们定制的,interface 很 container。没文档,没例子,甚至搜了一下发现几乎只有 youki 在用🤡
测试部分,我本来试了一下 testcontainers,结果 rust 版也是个残废🤡心累就先不加了。
结果也不完美,这个工具本意是想要在 containers 里面用作 supervisor,但是 containers 里面 cgroups 默认不给 write 权限(虽然我觉得 cgroups v2 默认给了也没啥安全隐患?我猜
podman 和 containerd 各有一些方案来做,只不过 docker 就得上 privileged 再加 cgroupns=host 才能用起来了🤡
这个 PR 花了好大力气。一开始觉得有趣,想借此机会学习一下 cgroups 或者 eBPF,最后选了 cgroups 求稳妥。
本来以为 rust 就算 eBPF 生态不成熟,那都有几个 container runtime 了,起码 cgroups 没啥问题吧。没想到还真不行🤡
kata containers 自己 fork 了一个 cgroups-rs 但是年久失修,搜了一下发现他们自己都不用这个了。
youki 有一个 libcgroups,单独拆出来一个 crate,很好,只不过是给他们定制的,interface 很 container。没文档,没例子,甚至搜了一下发现几乎只有 youki 在用🤡
测试部分,我本来试了一下 testcontainers,结果 rust 版也是个残废🤡心累就先不加了。
结果也不完美,这个工具本意是想要在 containers 里面用作 supervisor,但是 containers 里面 cgroups 默认不给 write 权限(虽然我觉得 cgroups v2 默认给了也没啥安全隐患?我猜
podman 和 containerd 各有一些方案来做,只不过 docker 就得上 privileged 再加 cgroupns=host 才能用起来了🤡
GitHub
feat: use cgroups to limit cpu and memory usage by kemingy · Pull Request #273 · FedericoPonzi/Horust
fix Per-service resource limits #12
Motivation and Context
Description
How Has This Been Tested?
Types of changes
Bug fix (non-breaking change which fixes an issue)
New feature (non-br...
Motivation and Context
Description
How Has This Been Tested?
Types of changes
Bug fix (non-breaking change which fixes an issue)
New feature (non-br...
再次遇到了诡异的环境问题,本地怎么跑 pytest 都会挂在一个新的 test case 上,debug 半天找不出来任何问题,随手
envd new -t uv && envd up,再跑测试就直接过了 🥲https://www.bilibili.com/video/BV1tjdoY9EUk
耿同学还是在自己的舒适圈战斗力强。
至于马逆,默许自己的工作室给益生菌打广告,他自己说司马南清楚谁的钱最好骗才过去几天啊,这么快就被回旋镖打了
耿同学还是在自己的舒适圈战斗力强。
至于马逆,默许自己的工作室给益生菌打广告,他自己说司马南清楚谁的钱最好骗才过去几天啊,这么快就被回旋镖打了
Bilibili
视频去哪了呢?_哔哩哔哩_bilibili
undefined, 视频播放量 undefined、弹幕量 undefined、点赞数 undefined、投硬币枚数 undefined、收藏人数 undefined、转发人数 undefined, 视频作者 undefined, 作者简介 undefined,相关视频:
https://b23.tv/CiUY6hi
manjusaka 推荐的,这个课没必要冲着操作系统去,因为这个老师做了一堆违背祖宗的决定…整个课程到处都是 LLM,并不是 AI boy,是真的教你怎么提升自己的学习效率。即使抛开 LLM,这个老师的 Linux 水平也是一流的。
现在这是我的下饭节目。
manjusaka 推荐的,这个课没必要冲着操作系统去,因为这个老师做了一堆违背祖宗的决定…整个课程到处都是 LLM,并不是 AI boy,是真的教你怎么提升自己的学习效率。即使抛开 LLM,这个老师的 Linux 水平也是一流的。
现在这是我的下饭节目。
Bilibili
01 - AI 时代的操作系统课 [2025 南京大学操作系统原理]_哔哩哔哩_bilibili
01 - AI 时代的操作系统课 [2025 南京大学操作系统原理], 视频播放量 106849、弹幕量 248、点赞数 2970、投硬币枚数 1926、收藏人数 5550、转发人数 900, 视频作者 绿导师原谅你了, 作者简介 https://jyywiki.cn,相关视频:操作系统概述 (为什么要学操作系统) [南京大学2022操作系统-蒋炎岩-P1],操作系统(2025年春),浙大翁恺有多厉害?,计算机学不下去的时候,看看这个,翁凯老师真的说的很对,The xv6 Kernel【38集完整版】,…
💩1
🥹 今天 bump version 之后测试挂了,因为上游 interface 有 breaking change,我一直以为是我的改动里面有 bug,来回看了好几遍都找不出问题,新增了一个测试还是挂了,但是我回退版本就没问题。
我有点不想 debug,因为这个项目涉及一个极其麻烦的算法实现,中间步骤太多了,还有一堆 random 矩阵。。
最后硬着头皮 build 了两份,freeze 所有 random seed,一个一个对比。。
然后发现上游对 Row 的减法实现成了加法 🤡
我有点不想 debug,因为这个项目涉及一个极其麻烦的算法实现,中间步骤太多了,还有一堆 random 矩阵。。
最后硬着头皮 build 了两份,freeze 所有 random seed,一个一个对比。。
然后发现上游对 Row 的减法实现成了加法 🤡
👍5❤1
拖了好久,总算是把 comments 和 reactions 功能加上了,CSS 比较粗糙
https://github.com/kemingy/isite
现在算是有比较全面的 GitHub integration
示例可以看 yihong 的 https://blog.yihong0618.me/
https://github.com/kemingy/isite
现在算是有比较全面的 GitHub integration
示例可以看 yihong 的 https://blog.yihong0618.me/
GitHub
GitHub - kemingy/isite: convert GitHub issues to a website
convert GitHub issues to a website. Contribute to kemingy/isite development by creating an account on GitHub.
❤2