codedump的电报频道
4.42K subscribers
149 photos
4 videos
2 files
619 links
发布个人博客(主页 codedump.info)、想法、推荐等。RSS订阅地址:https://rsshub.app/telegram/channel/codedump_notes,过往汇总搜索可以到:https://app.shokichan.com/c/tg/codedump_notes。
Download Telegram
#编程
编程中的命名是一个大难题,其中还包括了给项目命名。《Vector Naming Discussion》中,列举了给Arrow项目(内存中的列存格式)取名过程中的备选方案,最后才选择了Arrow:
math symbol for vector. and arrows are fast. also alphabetically will show up on top
#人工智能
#开源项目
前两天的Deepseek v3发布,效果有点震惊,看论文所说,只用了2048张H800显卡,2个月不到时间训练完毕,计算预算只有不到600万美元就训练出来了新的模型。

与其他大模型玩家不同的是,deepseek背后是一家叫幻方量化的公司,不是传统的互联网企业,前几个月看到的采访《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,更早的一篇采访《疯狂的幻方:一家隐形AI巨头的大模型之路》。
👍10
#Rust
#C++
2024年了,C++项目解决库依赖管理还是一坨XX
🥰132👍1
#新年
2025年了,我隐约预感到未来不少于我很重要的事情,都会在今年有一个开始。
🥰23😁1
#分布式
开写我的分布式原理教程,初步想好的名字是《图解分布式系统原理》。想写这个教程,是因为重读DDIA的过程中,发现在分布式这块,有很多地方没有展开写。例如happen before关系,例如共识算法(作者一笔带过,我严重怀疑他可能不会:)。

目前先在Latex上写,后续写好了会逐章公布在网站上。
👍62👏53💋2👨‍💻1
👍1
#数据库
看到一个很有意思的视角(出处): 把数据库当做一个VM(Virtual Machine)的话,SQL就是操作这个VM的高级语言。
👍31
#数据库
#sqlite
前两天和一位同行聊起来:给传统的tp型数据库,增加列式数据处理能力,比如存取parquet数据、比如增加时序型数据的处理,好像还有点搞头。

有不少给postgresql增加了这些能力的项目了(例如pg_duckdb),我在想:也许也可以把这些做法照搬到sqlite上面。

另外,他也提到另一个观点:对于大部分企业来说,时序类+文本搜索类场景,应该覆盖了90%以上的AP需求了。
👍5
#Rust
国内知名Rust社区贡献者Folyd,之前曾经给Rust贡献了一个优化的二分查找实现:《优化 Rust 标准库的 binary_search》。

但是这个实现,会导致在有多个重复元素的情况下,返回是不确定的,最终导致了币圈某产品的翻车,这里可以看到作者的后续推文
我们回到这个问题本身:除了撤销这个修改,下一步应该在Rust标准库里增加多个重复元素的测试用例了吧?
🤡7👍2🤷‍♀1👎1
#杂
一个国家的最高领导人,明目张胆发币敛财,叹为观止、闻所未闻。

(本来不想发这顿吐槽,实在是这几天被评论区的spam搞烦了)
👏2
distributed system illustrate(cn).pdf
1.3 MB
#分布式
从2025年开年后开始写一本分布式教程,到现在过去了20天(中间还花了小一周时间准备面试,最后还不合适),初步写好了两章,大家可以看看。由于只是初稿,错漏在所难免,就是给大家看看目前的完成度。两章内容里,自己手画了20多张图,按照我预估全部完成可能有8章的内容,所以最后可能要画200+张的图。我挺喜欢画图解释原理的,一图胜千言。
👍307