#编程
编程中的命名是一个大难题,其中还包括了给项目命名。《Vector Naming Discussion》中,列举了给Arrow项目(内存中的列存格式)取名过程中的备选方案,最后才选择了Arrow:
编程中的命名是一个大难题,其中还包括了给项目命名。《Vector Naming Discussion》中,列举了给Arrow项目(内存中的列存格式)取名过程中的备选方案,最后才选择了Arrow:
math symbol for vector. and arrows are fast. also alphabetically will show up on top
Google Docs
Vector Naming Discussion
❤2🐳2
#人工智能
#开源项目
前两天的Deepseek v3发布,效果有点震惊,看论文所说,只用了2048张H800显卡,2个月不到时间训练完毕,计算预算只有不到600万美元就训练出来了新的模型。
与其他大模型玩家不同的是,deepseek背后是一家叫幻方量化的公司,不是传统的互联网企业,前几个月看到的采访《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,更早的一篇采访《疯狂的幻方:一家隐形AI巨头的大模型之路》。
#开源项目
前两天的Deepseek v3发布,效果有点震惊,看论文所说,只用了2048张H800显卡,2个月不到时间训练完毕,计算预算只有不到600万美元就训练出来了新的模型。
与其他大模型玩家不同的是,deepseek背后是一家叫幻方量化的公司,不是传统的互联网企业,前几个月看到的采访《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,更早的一篇采访《疯狂的幻方:一家隐形AI巨头的大模型之路》。
👍10
#分布式
开写我的分布式原理教程,初步想好的名字是《图解分布式系统原理》。想写这个教程,是因为重读DDIA的过程中,发现在分布式这块,有很多地方没有展开写。例如happen before关系,例如共识算法(作者一笔带过,我严重怀疑他可能不会:)。
目前先在Latex上写,后续写好了会逐章公布在网站上。
开写我的分布式原理教程,初步想好的名字是《图解分布式系统原理》。想写这个教程,是因为重读DDIA的过程中,发现在分布式这块,有很多地方没有展开写。例如happen before关系,例如共识算法(作者一笔带过,我严重怀疑他可能不会:)。
目前先在Latex上写,后续写好了会逐章公布在网站上。
👍62👏5❤3💋2👨💻1
👍3❤1
#数据库
#sqlite
前两天和一位同行聊起来:给传统的tp型数据库,增加列式数据处理能力,比如存取parquet数据、比如增加时序型数据的处理,好像还有点搞头。
有不少给postgresql增加了这些能力的项目了(例如pg_duckdb),我在想:也许也可以把这些做法照搬到sqlite上面。
另外,他也提到另一个观点:对于大部分企业来说,时序类+文本搜索类场景,应该覆盖了90%以上的AP需求了。
#sqlite
前两天和一位同行聊起来:给传统的tp型数据库,增加列式数据处理能力,比如存取parquet数据、比如增加时序型数据的处理,好像还有点搞头。
有不少给postgresql增加了这些能力的项目了(例如pg_duckdb),我在想:也许也可以把这些做法照搬到sqlite上面。
另外,他也提到另一个观点:对于大部分企业来说,时序类+文本搜索类场景,应该覆盖了90%以上的AP需求了。
GitHub
GitHub - duckdb/pg_duckdb: DuckDB-powered Postgres for high performance apps & analytics.
DuckDB-powered Postgres for high performance apps & analytics. - duckdb/pg_duckdb
👍5
#人物
前阵子推过DeepSeek背后公司幻方量化的消息,这家公司的创始人梁文锋在网上能找到的公开信息很少,正好看到一篇文章更详细介绍了他和他的公司。(题目过于标题党就不贴出来了,可以点击上面的文章链接直达网页)
前阵子推过DeepSeek背后公司幻方量化的消息,这家公司的创始人梁文锋在网上能找到的公开信息很少,正好看到一篇文章更详细介绍了他和他的公司。(题目过于标题党就不贴出来了,可以点击上面的文章链接直达网页)
Telegram
codedump的电报频道
#人工智能
#开源项目
前两天的Deepseek v3发布,效果有点震惊,看论文所说,只用了2048张H800显卡,2个月不到时间训练完毕,计算预算只有不到600万美元就训练出来了新的模型。
与其他大模型玩家不同的是,deepseek背后是一家叫幻方量化的公司,不是传统的互联网企业,前几个月看到的采访《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,更早的一篇采访《疯狂的幻方:一家隐形AI巨头的大模型之路》。
#开源项目
前两天的Deepseek v3发布,效果有点震惊,看论文所说,只用了2048张H800显卡,2个月不到时间训练完毕,计算预算只有不到600万美元就训练出来了新的模型。
与其他大模型玩家不同的是,deepseek背后是一家叫幻方量化的公司,不是传统的互联网企业,前几个月看到的采访《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,更早的一篇采访《疯狂的幻方:一家隐形AI巨头的大模型之路》。
❤3
#Rust
国内知名Rust社区贡献者Folyd,之前曾经给Rust贡献了一个优化的二分查找实现:《优化 Rust 标准库的 binary_search》。
但是这个实现,会导致在有多个重复元素的情况下,返回是不确定的,最终导致了币圈某产品的翻车,这里可以看到作者的后续推文。
我们回到这个问题本身:除了撤销这个修改,下一步应该在Rust标准库里增加多个重复元素的测试用例了吧?
国内知名Rust社区贡献者Folyd,之前曾经给Rust贡献了一个优化的二分查找实现:《优化 Rust 标准库的 binary_search》。
但是这个实现,会导致在有多个重复元素的情况下,返回是不确定的,最终导致了币圈某产品的翻车,这里可以看到作者的后续推文。
我们回到这个问题本身:除了撤销这个修改,下一步应该在Rust标准库里增加多个重复元素的测试用例了吧?
GitHub
Folyd - Overview
Rust, Music enthusiast. Founder of @geddle. . Folyd has 63 repositories available. Follow their code on GitHub.
🤡7👍2🤷♀1👎1
distributed system illustrate(cn).pdf
1.3 MB
#分布式
从2025年开年后开始写一本分布式教程,到现在过去了20天(中间还花了小一周时间准备面试,最后还不合适),初步写好了两章,大家可以看看。由于只是初稿,错漏在所难免,就是给大家看看目前的完成度。两章内容里,自己手画了20多张图,按照我预估全部完成可能有8章的内容,所以最后可能要画200+张的图。我挺喜欢画图解释原理的,一图胜千言。
从2025年开年后开始写一本分布式教程,到现在过去了20天(中间还花了小一周时间准备面试,最后还不合适),初步写好了两章,大家可以看看。由于只是初稿,错漏在所难免,就是给大家看看目前的完成度。两章内容里,自己手画了20多张图,按照我预估全部完成可能有8章的内容,所以最后可能要画200+张的图。我挺喜欢画图解释原理的,一图胜千言。
👍30❤7