duangsuse::Echo

#DB 同意。如果王垠真的是那么说的，那么我觉得他错了，他的理解太偏向结构化编程范式了，无视了数据库的确只是为应用提供数据持久化、查询等操作的服务，不是什么结构体(C Struct)、数据项目实例和一大堆函数接口，那就把数据库当成 GC 堆了。 “就是C的struct，就是指针, 为什么不能RPC” 这句话... 不是很容易理解，我的理解是：为什么关系型数据库的『记录』上的操作不能直接被拿来当成远端过程调用去实现而非得 SQL，那显然就混淆了操作界面（接口）和实现，在面向侧面编程（AOP）甚至模块化里…

这就是为什么你几乎总是需要手动指定索引的原因，而且这种索引需要数据库“内部支持”。你一次又一次的希望 SQL 能够自动为你生成高效的索引和算法，却一次又一次的失望，也就是这个原因。当然，你永远可以使用所谓的 stored procedure 来扩展你的数据库，然而这就像是我的 IU 同学们用 miniKanren 来实现 HM 类型系统的方式——他们总是先使用一种过程式语言（Scheme）来添加这种描述性语言的“相关特性”，然后欢呼：“哇，miniKanren 解决了这个问题！”而其实呢，还不如直接使用过程式语言来得直接和容易。

首先“过程式语言（Scheme）” 我记得你自己之前好像喷过部分 Haskell 民『Scheme 不是函数式』言论的，显然 R6RS、Racket 这类 Scheme 都可以使用过程式的方法编程，但一般都认为它们更像函数式
然后你说的描述性语言是指使用 Hindley-Milner polymorphic type system 的 Haskell 吗？可 Haskell 真的不是逻辑式吧...
后半句的逻辑完全是冲突的，而且 miniKanren 这种类似自动定理证明器的东西（虽然我不了解）明显会比纯过程式编写类型检查器推导器上会强很多（比如，它就可以描述某个未知量 t 的类型符合 HM 的类型约束，而不是手写检查算法过程），因为它长得和形式化逻辑系统很像。

而其实，数据结构的理论，可以很容易的解释所有关系式数据库里面的操作

肯定的啊，因为都是现代的计算机来执行，数据结构肯定比关系型数据库要广。

每一个“foreign key”，其实就是一个指针

差不多，但回答者也给了个补充：更接近于一个”reference“，而不是 C 的 Pointer
何况还有 ON DELETE CASCADE 呢，它就更像是完整的对象引用了

在实现上，join跟指针引用有一定差别，因为 join需要查“索引”（index），所以它比指针引用要慢。

JOIN

只是指明了抽象语义！（划重点）
即便你说是在实现上，你讨论的也太泛泛了

所谓的查询（query），本质上就是函数式语言里面的filter, map等操作。只不过关系式代数更加笨拙，组合能力很弱。

这就是 SQL 的需求，若是单单这些『组合能力』能一手遮天，那为啥没人用 Python 写 SQL 解释器？为了性能和现实世界不可避免的东西抛弃『组合性』『重用』的例子比比皆是，比如现在的人工神经网络组成粒度问题，（如果用 OOP 方法设计）肯定没有人会“灵活”到每个神经元一个对象吧。

[sin(1/x) for x in xs if x > 0]

[sin (1/x) | x <- xs, x > 0]
  where xs = [-100..200]

这 Python, Haskell 的 List comprehension 算不算组合能力弱，可偏偏还是有人用

由于“行”只能有固定的宽度，所以导致了你没法在里面放进任何“变长”的对象

这就不对了，比如 Lua 吧，你是不是可以说，因为 Lua 的 union Value （它是 CommonHeader(struct GCObject) 和 ByCopy objects 的 Product type，具名融合结构体，或者叫结构体）只有固定的长度

size_t

就不能利用 Typed value struct TValue 来依照 tag 解释它的值是『指针』呢，还是 fixed size 呢？
就像 Rust 里也有 DSTs，Dynamic sized types 的支持一样，就是使用 slice fat pointer 实现的，为什么刚才说数据结构可以解释 Rel DB，现在又说 DB 是『青出于蓝而菜于蓝』

比如，如果你有一个数组，那你是不能把它放在一个行里的。

即便是数组，甚至 BitMap 也是可以的，没有听说过『指针』（刚才还提到）吗？

你需要把数组拿出来，旋转90度，做成另一个表B。从原来的表A，用一个“foreign key”指向B。这样在表B的每一行，这个key都要被重复一次，产生大量冗余。

这里“旋转九十度”其实是说给它的每个 Key 命同一个名字（用来表示这是一个数组 a 里的值）
然后每次去做 SELECT * FROM B WHERE id=?; （这里 id 是一个『数组』的名字，B 其实可以是一堆数组所有项目组成的表）这样的操作？
这一点已经是神仙打架了，看不懂原回复，我只负责辅助理解观点。

使用基本的数据结构，其实可以完全的表示关系模型以及被它所“超越”的那些数据模型

废话。

数据模型可以完全被普通的数据结构所表示，然而它们却不可能表达数据结构带有的所有信息

有区别吗？听起来和 ORM 的思想背道而驰，正好 OOP 就是 SP 的数据、操作的融合加上多态。

最早试图冲破关系模型和SQL限制的一种技术，叫做“列模式数据库”（column-based database），比如Vertica, HBase等。

这里复制原回复
Vertica是使用SQL的RDBMS。Column-Store诞生是为了更有效地解决大数据分析的问题（OLAP workloads），节省硬盘I/O（就是所谓列压缩），运用SIMD等等。不知道这和逃脱SQL有什么关系。

很显然，每一个数组需要一个字段来表示它的长度N，剩下的空间用来依次保存每一个元素，这样你只需要一个key就可以找到数组里所有的元素，而不需要把key重复N遍。

c++11 的 std::string 就是类似的实现

Key 的问题的确是关系数据模型的一个问题，因为它（ORM）的确是强行要求关系，然后利用关系查询哪怕是本来可以直接 select where 的，比如，你想“破格”为一些本质上是双向关系（a ~>(type) b）的数据建模，那就得把一个 nosense 的 ID Key 重复 N 遍，非常无聊。

上面的特性称为 random access，随机访问，意味给地址就可以读写数据，不过这里它是在描述一种关系表格

arys:
key | n | seq
'foods' | 3 | ['apple', 'pineapple', 'pen']
'discs' | 2 | ['江南皮革厂倒闭了', '只因你太美']

SELECT n, seq FROM arys WHERE key='foods';

SELECT COUNT(obj), obj FROM arys WHERE key='foods';

不要在实际工程中使用这种结构，它是错误的（不一定保证顺序，而且低性能且不符合实际用途）

我这个菜鸡最开始弄 GeekApk 的一些双向关系，比如 user <~(star)~> app 的时候就遇到过。实际上，这不止是 GeekApk 尝试的问题，所有要求动态双边关系的应用程序都得想办法解决，解决方法往往是：把关系也认为是『有地址（id）』的实体(entity)...

CREATE TABLE users(id INT PRIMARY KEY, name Char NOT NULL, nick VarChar);
CREATE TABLE apps(id INT PRIMARY KEY, package Char NOT NULL, name VarChar);

CREATE TABLE relation_user_app_star(id INT PRIMRAY KEY, user INT references users(id), app INT references apps(id));

对这个回答者的回复也有点奇怪

这是什么压缩算法？把字典压缩理解错了？把run-length压缩理解错了？这怎么解决变长问题?

我不知道这和压缩算法有啥关系... 明显只是打算存的数据本身长度缩短了，不过最后一句是对的，照王垠的说法，没法解决变长问题。

其实数据库的问题哪有那么困难，它其实跟“远过程调用”（RPC）没什么两样

又是以偏概全，其实编译原理的问题哪里有那么困难，它和 kotlinc File.kt 有啥不一样？
其实软件逆向工程哪里有什么困难，我 jad ComplexClass.class 就完成了
其实垃圾回收的问题哪里有那么困难，它和“系统自带”的『堆』分配器 malloc() 明明没区别
其实 malloc() 的问题哪里有那么复杂，mmap() 就好了

觉得一个东西很简单甚至等同另一件东西分两种情况：
第一种是你刚入门，对自己似是其非的发现欣喜若狂；第二种是你已经看破人事，游刃有余。
把使用和实现混为一谈的属于第一种情况。

46 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 15:27