codedump的电报频道
4.42K subscribers
149 photos
4 videos
2 files
619 links
发布个人博客(主页 codedump.info)、想法、推荐等。RSS订阅地址:https://rsshub.app/telegram/channel/codedump_notes,过往汇总搜索可以到:https://app.shokichan.com/c/tg/codedump_notes。
Download Telegram
#人工智能
#开源项目
前两天的Deepseek v3发布,效果有点震惊,看论文所说,只用了2048张H800显卡,2个月不到时间训练完毕,计算预算只有不到600万美元就训练出来了新的模型。

与其他大模型玩家不同的是,deepseek背后是一家叫幻方量化的公司,不是传统的互联网企业,前几个月看到的采访《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,更早的一篇采访《疯狂的幻方:一家隐形AI巨头的大模型之路》。
👍10
#Rust
#C++
2024年了,C++项目解决库依赖管理还是一坨XX
🥰132👍1
#新年
2025年了,我隐约预感到未来不少于我很重要的事情,都会在今年有一个开始。
🥰23😁1
#分布式
开写我的分布式原理教程,初步想好的名字是《图解分布式系统原理》。想写这个教程,是因为重读DDIA的过程中,发现在分布式这块,有很多地方没有展开写。例如happen before关系,例如共识算法(作者一笔带过,我严重怀疑他可能不会:)。

目前先在Latex上写,后续写好了会逐章公布在网站上。
👍62👏53💋2👨‍💻1
👍1
#数据库
看到一个很有意思的视角(出处): 把数据库当做一个VM(Virtual Machine)的话,SQL就是操作这个VM的高级语言。
👍31
#数据库
#sqlite
前两天和一位同行聊起来:给传统的tp型数据库,增加列式数据处理能力,比如存取parquet数据、比如增加时序型数据的处理,好像还有点搞头。

有不少给postgresql增加了这些能力的项目了(例如pg_duckdb),我在想:也许也可以把这些做法照搬到sqlite上面。

另外,他也提到另一个观点:对于大部分企业来说,时序类+文本搜索类场景,应该覆盖了90%以上的AP需求了。
👍5
#Rust
国内知名Rust社区贡献者Folyd,之前曾经给Rust贡献了一个优化的二分查找实现:《优化 Rust 标准库的 binary_search》。

但是这个实现,会导致在有多个重复元素的情况下,返回是不确定的,最终导致了币圈某产品的翻车,这里可以看到作者的后续推文
我们回到这个问题本身:除了撤销这个修改,下一步应该在Rust标准库里增加多个重复元素的测试用例了吧?
🤡7👍2🤷‍♀1👎1
#杂
一个国家的最高领导人,明目张胆发币敛财,叹为观止、闻所未闻。

(本来不想发这顿吐槽,实在是这几天被评论区的spam搞烦了)
👏2
distributed system illustrate(cn).pdf
1.3 MB
#分布式
从2025年开年后开始写一本分布式教程,到现在过去了20天(中间还花了小一周时间准备面试,最后还不合适),初步写好了两章,大家可以看看。由于只是初稿,错漏在所难免,就是给大家看看目前的完成度。两章内容里,自己手画了20多张图,按照我预估全部完成可能有8章的内容,所以最后可能要画200+张的图。我挺喜欢画图解释原理的,一图胜千言。
👍307
我特别喜欢在技术文章中画图,有两个原因:对作者而言,如果能用图表达思路,侧面说明是真的掌握了;对读者而言,图形也比一维的文字更容易理解、信息量更大,图形中可以增加联系、颜色、形状等多维度信息。

所以一方面要让自己真的掌握一个知识点,另一方面要锻炼自己的画图表达的能力,以画图来反向验证自己对知识的掌握。画图的一些心得,参考我以前写的文章:《技术配图的一些心得》。

至于我用的画图工具,现在如果是随手画的图,就用excalidraw;一些更为正式的图,就用Mac上的OmniGraffle,可以很方便得对齐、调整颜色、字号大小等等,大几百买断的单机单平台软件,但是超值。
🥰6
#杂
#人工智能
最近DeepSeek的新闻着实有点多啊,例如《中国AI初创公司DeepSeek是如何与硅谷巨头竞争的》。

时间回到两年前,彼时Chatgpt刚刚发布,当时我的判断是人工智能三大要素算力、算法、数据里,至少在算力和算法上我们是落后很多的。如果有人说,两年以后大模型领域中国能追赶到现在这个程度,我这样对中国科技有信心的人恐怕也会觉得过于乐观了。

现在两年时间过去了,我倒是觉得,可以将大模型领域做为一个切入的视角,一窥中国如何在一个垂直领域,在早期相对落后(尤其是还有层层封锁和限制)的情况下如何追赶。什么两弹一星、C919、航空母舰,毕竟离老百姓的生活还是有些远,技术细节普通人也难掌握。但是大模型领域,一来不乏开源项目,所谓“代码之前没有秘密”,二来更偏向民用,普通人也能马上看到效果。

引用《揭秘DeepSeek:一个更极致的中国技术理想主义故事》一文中的话:
我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。
但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。
👍143