/tmp/duangsuse.sock

非常抱歉... 因为时间不够的原因，这次就只教这个了（请大家原谅呐

10 views13:56

合影留念~

13 views15:43

首先是咱们的求值器，咱的复用解析器，已经被作为一个 CommonJS 模块包装好了。下面来科普下，怎么写简单的求值器 — 就是后序遍历语法树。为什么我们要自顶向下、从左到右解析这个代码呢？因为代码存在诸多分支和不确定，右边最终 reduce 出的结构可能依赖左边的输入字符来决定。LookAhead(1) 也是这个原因（因为不允许重置流，但有时候如果没有手段去重置的话，很多语法哪怕是 "" 字符串都几乎不能实现）为什么我们要后序遍历语法树？求值的顺序（AST Walker 对语法树遍历，或者说扩普排序的顺序）有关系吗？…

作为一个附属的内容，接下来我说一下作局部用域的问题。 #PLT #Parser
我自己是没时间实现更多的东西了... 大家了解这些理论呢... 可以回去尝试一下。
首先咱们谈谈 Lexical Scoping.

介个 lexical scoping，词法作用域呢，是 1932 年 Lambda calculus 引入的一个（迫真）概念

Lambda calculus is a formal system in mathematical logic for expressing computation based on function abstraction and application using variable binding and substitution. It is a universal model of computation that can be used to simulate any Turing machine. It was first introduced by mathematician Alonzo Church in the 1930s as part of his research of the foundations of mathematics.

Lambda calculus 呢.... 就是早先没有那种泛型（就是可以依据程序做各种工作）电子计算机的时候，
希望对计算机处理进行基本的理论模型构造的理论（这是我第三次讲了，有喜欢的人肯定知道）

这个 lambda calculus 是理论，它是很抽象的。是一个由『项(item)』构造的形式化系统，
里面可以进行形式化定义好的操作。有这么三种项：

var 这个叫做 variable，变量
λ vars . body 这个叫做 abstraction，抽象
( (λ ...) args ) 这个叫做 application，应用。动词是 apply

当然以上的项目是在一个上下文里讨论的。变量和抽象(λ) 引入了两个集合 — Variables 和 Lambda Terms（准确的说第一个集合只是『分配』集合...）
所有 Variable 都是 Lambda Term，并且 M,N in Lambda => (M N) 这种 application 可以引入新的 lambda term
(λx. M) 这样的 abstraction 也是一个道理
理论上的细节也就不讲了，都是会编程的...
此外，还有两比较基本的操作（都是希腊字母起的...）：

1. alpha-conversation
alpha-conversation 引入了 alpha-equivalence，表名只有变量名称不同的两个 abstraction 是等价(equivalence) 的
λx. x equiv λy. y
(λx. x) a equiv (λy. y) a

2. beta-reduction
beta-reduction 可以简化 lambda 项目，应用 lambda calculus 的『替换(substitute)』
((λx. M) a) equiv M [x := a]
这就表示了 M 里面的『free variable』 x 将被『替换』成 a。
比如 ((λa. λb. a + b) 1) 里面，我们最终得到的就是 (λb. 1 + b)
或者说：(λb. a + b) [a := 1]
那个喂基上讲的很细，有点啰嗦... 举个例子，这个 beta-reduction 居然是这么写：

(λa. λb. x x b) [x := zz]
equiv (λa'. λb' x x b') [x := zz]
equiv λa' b'. (z z) b'
nequiv λa'. λz. (z z) z

Lambda 演算是左递归文法的，就是说 (λf. f a b) 是 (λf. (f a) b) 的惯常表述方式

eta-reduction 和 currying 就不说了，FP.js 里也有 currying

举个例子，你看这个 identity... （输入即输出函数）
I = λx. x 它里面这个 x 叫『被前面的 λ bound（绑定）了』
Kst = λy x. y = λy. λx. y => (Kst 1) 它里面的这个 y 被绑定到了 1，x 也被绑定了，没有被使用
λx. y 这个里面的 y 是 free-variable，它没有被 lambda abstraction 绑定
Lambda 演算是支持自己应用自己的 (λx. (x x))

不多赘述了，这里讲的那个 wiki 都很好（

所以先说这个 lexical scoping
看完了 lambda calculus 就应该知道啥是 lexical scoping 了

比如

infinity = λx. λy. (cons x (infinity y x))

beta-reduction (infinity a b) 后是 (cons a (infinity b a))...（递归情况）
当然不让命名也可以用 Y 组合子的

λx y. (λf. (λc. f (c c)) (λc. f (c c))) (λrec. cons x (rec y x) )

这里，我们注意到里面的 lambda 演算项的『y』被绑定为 b
这个 y 引用了外层 lambda(λx.) 抽象绑定(bound)的变量，就叫做 Upvalue（上值）
这个函数 λy. 就叫做『内嵌函数(inner function)』、λx. 就叫做『外包函数』，由 λx. 绑定引入的变量，在 λy. 里面就称为上值。
包含词法作用域的函数被称为闭包（和匿名函数什么的区分开啊...）
接受（参数）或者产生（"返回"值）函数的函数叫做高阶函数（这本来就是数学上的概念）

那么理论暂时就到这里了。咱说说怎么实现。

lexica scoping 是很好的。为什么？一个只有全局变量的编程语言，你敢想像吗？现在绝大部分稍微正常一点的编程语言，哪怕是 bash 等 shell，基本都实现了 lambda 演算的部分基本概念（比如函数抽象）

这个 lexical scoping 本身和 lambda calculus 关系很大，但是在实际编程的时候，也不一定非得是纸面上的那一套，还可以有副作用、各种判断循环、引用... 不过有一点 — 就是『箭头函数』 — 创建一个闭包，而这个闭包拥有当前词法作用域上下文的引用，闭包『包含』了创建时语言的部分上下文，比如『绑定』们

def konst(k)
  return ->() { k }; end

konst(1)() #=> 1

一个『不那么引人注意』的细节就是 — 为什么这个 ->() （箭头函数）可以得到 k 的值？
虽然这很符合逻辑，但是恰恰也就让我们以为理所当然了 — 事实上在很多编程语言里这种代码都是无效的，因为他们不实现 lexical scoping

为什么呢？如果你使用 dynamic scoping（时序作用域），那就会明白：在 konst 函数返回这个函数的时候，它的『局部变量』 k 已经失效了、过期了，根本不能再次访问（除非复制，说你呢，Java 8）
可是有『嵌套序』作用域的话，就不会有这种问题了。所以就说是『词法』上才产生的作用域区分『词法作用域』。

实现这种解释器（这里特定于 AST-walker 讨论，但部分技巧不限于 AST-walker）的时候：

0. 除非你是在造玩具，否则不要通过遍历语法树手动替换该 abstraction 要 bind 的 variable
它比较慢，而且这种行为有点不够优雅...
1. 每层 abstraction 都可能覆盖上一层的 variable binding，注意 alpha-equivalence 是理论上的... 准确的说实现语言求值器不太需要考虑、程序分析和变换才去想
2. 每层 abstraction 都可能新建 binding，并且一个函数要可以保留自己词法作用域的拷贝（或者引用的 upvalue 什么的）
3. 离开当前词法作用域的时候必须撤销所有修改
4. 尽可能减少复制和使用数据结构的数量

咱就说三个情况。

1. 你是 Schemer/Haskeller，一般他们理论上讨论的很多，所以不会想太多复制开销什么的，

入门（ Haskell 就直接用

Data.Map.Strict

import Data.Map.Strict
kvs = fromList [ ("monkey", "猴子"), ("penguin", "企鹅") ]
monk = findIndex "monkey" kvs
peng = findIndex "penguin" kvs
terris = insert "pig" "猪" monk

然后在递归的求值程序里，造一个 env table（就是不断复制的 Map）...
这样就能保证『每层都有自己独立的 Map』『每层的 Map 都可以访问父作用域的所有变量』了...

要找符号引用就 findKey，给 body 做 variable binding，递归下去求值在 env 里 insert 一堆 key-value 就可以了

2. 你是和我一样的半吊子，采用了一种非常清奇但是又可行的方法实现

这种方法就是遍历 S-表达式列表，然后替换每个『符号』引用... 对自己实现使用语言的 GC 的依赖更明显一些
不过我开始的时候实现的是一个错的，比如

(lambda (x) (lambda (x) x))

brilliant.org

Lambda Calculus | Brilliant Math & Science Wiki

The Lambda calculus is an abstract mathematical theory of computation, involving ...

12 viewsedited 01:03