duangsuse::Echo
LL 是什么呢,我举道『编译原理(指模式匹配机)』题 (大写代表规则=非终结符) 在分词器即”不需要stack“的N/DFA状态机走完一步action,就拿到1token,喂给解析器;所有喂完没报错,应该就组织出了语法树(没错,不能用调用栈组织AST) tok=[],i=0; st = [S] // S 是根语法. LL(1)匹配 while((it=st.top) !=null) if(it !in G)//终结符 if(t==tok[i++])pop(); //匹配一项 else 回退或error;…
王垠对CS科班编译原理侧重点的质疑是对的(然而并没暖用,就像教育也不只是为培育人才一样;你没法让所有人相信简单是对的
倒不如说是老师举例和对照的方法不好,LL 这样入门级的程序编号化还是比较好教的,可是他们一举例就是很生硬,非常莫名其妙的常量 也不先说目标,上来就“贴代码”、贴做的图(也不简洁、记流水帐),让人很迷糊:
③ T → FT ' FIRST ( T ) = { ( id }
④ T' → *FT ' |ε FIRST ( T' ) = {* ε }
⑤ F → (E)|id FIRST ( F ) = { ( id }
……
以下的内容全都是流水帐,没有任何解释和其他等价形式,学起来非常麻烦
https://zhuanlan.zhihu.com/p/70895051 这个人教的SSA就很好,公共子表达式消除CSE、常量折叠、死代码消除 都是SSA(执行序节点图)的直接优点,他对指令选择的解释”烧水,做菜,切菜 顺序..“一点没有专业人士的架子,对基本块BB x=1; if(q){k=1; a=k+x} else a=c+d; 里前 a 相当于 x+1 和放大SSA BB范围 x=1; if(!q)goto B; k=1;a=k+1; .. 还有范围分析,就说得好实际
”最近在做一个 x86 到 x86 的 jit 编译器…… 中间表示一般有两种形式,树:[+a t1=[+b c] d] 或者展开的序列表示:t1 = b + c; a = t1 + d;
……
当追踪不了的时候只要按照最保守的范围进行优化就能保证程序正确性。同时这也可以用于程序静态分析,比如未初始化变量的分析。
数据流分析可以对各种数据进行分析,比如在变量有别名(比如指针)的时候,纯粹的数值分析就会有问题,因为你并不知道指针会指向哪儿,这个时候就可以对指针所指的目标做数据流分析,继而对对应的数值进行分析。“
他还解释了这里的SSA形状
-相同的名字不出现两遍(无重赋值
-每个节点下面(最多)只有两个节点
-父节点的值直接依赖子节点的值
的原因:具体的说每一行只能有两个输入变量和一个输出变量,也就是 z = x op y,从树表示到结果,我们只要先子节点的遍历整棵树,在每个节点上输出一行对应的操作语句就好了。
在语义阶段结束后程序就变成统一IR组:跳转基本块BB,有入出口、前后项,分析都在基本块
https://zhuanlan.zhihu.com/p/47099755 然后这个 #ce #reveng 反编译原理也非常好。 如果按执行的方式把 if(q) a; else b; 即
推荐 http://zneak.github.io/fcd/2016/11/25/revisiting-regions.html
Dom树是入口到某一BB 的必经点 -及这些的必经点在前 -构成的树 ;最简解O(nm) 是枚举+BFS ,最常是 Iterative(20行 O(nn) )
https://blog.csdn.net/Dong_HFUT/article/details/121375025 列了一大堆实现,L-T支配树构造法本身代码比Dij搜索长3倍, O(logn+M)
两点互有路称强联通,然后还有强联通子集(分量,=SCC),tarjan 法(N+节点数M) 就能求一点的集
https://security.tencent.com/index.php/blog/msg/112] CFG Flatten 是利用运行期switch派发器的方法混淆代码 🤔都是些基于 CFG(控制流图) 的东西,对正常编程而言其实优化分析都是虚的,代码写好才最重要,不过这些还挺有意思的,至少比把程序打散为编号强
高级的科班编译原理除了龙书还有虎书鲸书,但语言的设计不需要懂太多知识,王垠在前也怼过 CFG analysis ,确实这些对编程并不重要,不通用的工具做着还是容易的,但它们也是个领域啊
倒不如说是老师举例和对照的方法不好,LL 这样入门级的程序编号化还是比较好教的,可是他们一举例就是很生硬,非常莫名其妙的常量 也不先说目标,上来就“贴代码”、贴做的图(也不简洁、记流水帐),让人很迷糊:
③ T → FT ' FIRST ( T ) = { ( id }
④ T' → *FT ' |ε FIRST ( T' ) = {* ε }
⑤ F → (E)|id FIRST ( F ) = { ( id }
……
以下的内容全都是流水帐,没有任何解释和其他等价形式,学起来非常麻烦
https://zhuanlan.zhihu.com/p/70895051 这个人教的SSA就很好,公共子表达式消除CSE、常量折叠、死代码消除 都是SSA(执行序节点图)的直接优点,他对指令选择的解释”烧水,做菜,切菜 顺序..“一点没有专业人士的架子,对基本块BB x=1; if(q){k=1; a=k+x} else a=c+d; 里前 a 相当于 x+1 和放大SSA BB范围 x=1; if(!q)goto B; k=1;a=k+1; .. 还有范围分析,就说得好实际
”最近在做一个 x86 到 x86 的 jit 编译器…… 中间表示一般有两种形式,树:[+a t1=[+b c] d] 或者展开的序列表示:t1 = b + c; a = t1 + d;
……
当追踪不了的时候只要按照最保守的范围进行优化就能保证程序正确性。同时这也可以用于程序静态分析,比如未初始化变量的分析。
数据流分析可以对各种数据进行分析,比如在变量有别名(比如指针)的时候,纯粹的数值分析就会有问题,因为你并不知道指针会指向哪儿,这个时候就可以对指针所指的目标做数据流分析,继而对对应的数值进行分析。“
他还解释了这里的SSA形状
-相同的名字不出现两遍(无重赋值
-每个节点下面(最多)只有两个节点
-父节点的值直接依赖子节点的值
的原因:具体的说每一行只能有两个输入变量和一个输出变量,也就是 z = x op y,从树表示到结果,我们只要先子节点的遍历整棵树,在每个节点上输出一行对应的操作语句就好了。
在语义阶段结束后程序就变成统一IR组:跳转基本块BB,有入出口、前后项,分析都在基本块
https://zhuanlan.zhihu.com/p/47099755 然后这个 #ce #reveng 反编译原理也非常好。 如果按执行的方式把 if(q) a; else b; 即
q ?not B; a; ?jmp C; B:b C: 切BB再反编译规约,(符号执行)只能得到q为true 或false 的语法树,较好的方法就是 Node Split ,即对两个枝都继续,匹配出 if 结构再规约出表达式(纯符号执行估计不行.. 嵌套几个if就会爆炸吧(引文 Handling Irreducible Loops),此外 DJ-graph (支配前驱|可能前驱) 的BB切分也比较好推荐 http://zneak.github.io/fcd/2016/11/25/revisiting-regions.html
Dom树是入口到某一BB 的必经点 -及这些的必经点在前 -构成的树 ;最简解O(nm) 是枚举+BFS ,最常是 Iterative(20行 O(nn) )
https://blog.csdn.net/Dong_HFUT/article/details/121375025 列了一大堆实现,L-T支配树构造法本身代码比Dij搜索长3倍, O(logn+M)
两点互有路称强联通,然后还有强联通子集(分量,=SCC),tarjan 法(N+节点数M) 就能求一点的集
https://security.tencent.com/index.php/blog/msg/112] CFG Flatten 是利用运行期switch派发器的方法混淆代码 🤔都是些基于 CFG(控制流图) 的东西,对正常编程而言其实优化分析都是虚的,代码写好才最重要,不过这些还挺有意思的,至少比把程序打散为编号强
高级的科班编译原理除了龙书还有虎书鲸书,但语言的设计不需要懂太多知识,王垠在前也怼过 CFG analysis ,确实这些对编程并不重要,不通用的工具做着还是容易的,但它们也是个领域啊
知乎专栏
编译器优化了什么
[经 @污博士 提醒,我决定把题目改了…]最近在做一个 x86 到 x86 的 jit 编译器,因之前大多接触的是编译器前端知识,所以重新学习了一遍中后端原理,做个整理,也欢迎交流拍砖。 这里不打算涉及具体的工程细节,…
但是像这个就很离谱了(#zhihu by Gene,#5)。
图1在说 F=(Lit val)|'('E')'
|(E T |E+T)|(T F|T*F) —加,乘
他还特意写成 E=E1+T ?这是什么意思(分支.语法属性写很长
语法属性=综合a+b|继承{let a=1; a+1}-上下文 ;这种废话根本是因为没有良好区分 text 和 AST/IR form 才导致的,因为 AST 级就是语言内数据了,谁会用写字作画的方法描述语义?直接上代码跑起来了,还有空讨区分继承和综合eval()? Visitor后序遍历,求子项前置的步骤不叫继承?
图2 就是继承,只是这个人和 ANTLR 一样,都没好好分清文法和语义需求值的关系,逗号是不存在的,它只是种校验,煞有介事把它作为一个居中节点... 链表都用了,还嫌求值不够乱吗?
#zhihu 许阳 的LL,LR 里写:
“ 前两天有朋友评论,工业界编译器在使用什么分析器。这个问题并不想看起来那么简单,虽然我们有许多parser generator,如yacc menhir anltr,但往往它们只支持某一种分析算法(当然,这对于非编译向程序是够用的)。实际使用时,我们可能会想要结合LL与LR:得到一个有算法层次的parser。这意味着我们很可能不能借助parser generator。
至于原因:一般,运算符的复杂优先级关系会需要LR文法,但high level的语法结构往往只需要LL文法,前面提到,LL文法有一些好处,尤其对于错误信息的报告。一门语言的语法设计,会遵循类似歧义的层次,high level很难有歧义。”
ANTLR不够用?然而他在评论区仍说LL1就够了,真是舍本逐末的编译原理;靠这样的做法, 你还想做编译器?其实不做 parser 都能写 codegen 了,编译就是形式扁平化 ,非得带这种,那一 toy语言不分分种变1年开发大项目!
一些人中文都嗦不利索就开始想计算机语言, 难道不能用递归下降优化的吗?好像正常前缀提取return 或逆波兰有问题一样,就不想想别的做法。
只知状态机不知正经编程手段,又不是为学习目的,让我想到华为方舟IR 里人说那个2k行代码的手写 parser... 我类个去, 这都2022年了,编译目标都是汇编了,还在手写汇编解释器呢!有处理Linux源码的性能,也没编译它的资格啊,你手写C语法状态表写猴年马月去
图1在说 F=(Lit val)|'('E')'
|(E T |E+T)|(T F|T*F) —加,乘
他还特意写成 E=E1+T ?这是什么意思(分支.语法属性写很长
语法属性=综合a+b|继承{let a=1; a+1}-上下文 ;这种废话根本是因为没有良好区分 text 和 AST/IR form 才导致的,因为 AST 级就是语言内数据了,谁会用写字作画的方法描述语义?直接上代码跑起来了,还有空讨区分继承和综合eval()? Visitor后序遍历,求子项前置的步骤不叫继承?
图2 就是继承,只是这个人和 ANTLR 一样,都没好好分清文法和语义需求值的关系,逗号是不存在的,它只是种校验,煞有介事把它作为一个居中节点... 链表都用了,还嫌求值不够乱吗?
#zhihu 许阳 的LL,LR 里写:
“ 前两天有朋友评论,工业界编译器在使用什么分析器。这个问题并不想看起来那么简单,虽然我们有许多parser generator,如yacc menhir anltr,但往往它们只支持某一种分析算法(当然,这对于非编译向程序是够用的)。实际使用时,我们可能会想要结合LL与LR:得到一个有算法层次的parser。这意味着我们很可能不能借助parser generator。
至于原因:一般,运算符的复杂优先级关系会需要LR文法,但high level的语法结构往往只需要LL文法,前面提到,LL文法有一些好处,尤其对于错误信息的报告。一门语言的语法设计,会遵循类似歧义的层次,high level很难有歧义。”
ANTLR不够用?然而他在评论区仍说LL1就够了,真是舍本逐末的编译原理;靠这样的做法, 你还想做编译器?其实不做 parser 都能写 codegen 了,编译就是形式扁平化 ,非得带这种,那一 toy语言不分分种变1年开发大项目!
一些人中文都嗦不利索就开始想计算机语言, 难道不能用递归下降优化的吗?好像正常前缀提取return 或逆波兰有问题一样,就不想想别的做法。
只知状态机不知正经编程手段,又不是为学习目的,让我想到华为方舟IR 里人说那个2k行代码的手写 parser... 我类个去, 这都2022年了,编译目标都是汇编了,还在手写汇编解释器呢!有处理Linux源码的性能,也没编译它的资格啊,你手写C语法状态表写猴年马月去
duangsuse::Echo
#bilibili >那你现场写代码😄 回复 @iiicp :以上是()和算数表达式的求值栈生成,加起来10行。 活动期分析后就可以临时变量到寄存器,或者干脆每个+-用既有栈变量。 当然,C会比JS多费不少代码 但我是认真觉得40分钟太长。如果真的细节到此程度,你可以加提纲,先说说要写啥、涉及啥流程和修改,再放PPT 你能火是我想不到的,第一期视频我就认为会石沉大海。因为我也会写些涉及文本结构和计算机绘制的东西,在B站这些很少,因此更要注意可重看性。 如果你打算更100天,回头发现这些录屏复习起来…
我tm 5行代码写完AST和表达式链(Lua同款),要是复杂也肯定是在尊重原理、尊重统一的前提下提升可读性和加入语言特性
LL左递归都不能解决中缀算符优先级,但LR可以? 连着来不行,打碎了可以(no backtrack); 正着来不行,反着就可以(bottom up, LR);而且只有这样可以,其他做法我不看? 贵圈是什么逻辑,而且 ANTLR 那么重都不能解决需求了?自己打自己啊。 GitHub 上排名前位的脚本语言没一个用 compiler compiler 的,有的甚至在用函数组合解析器😐😐
编译器不是编译原理的产物,它是计算过程表示形式的礼物。编译器也是正常软件,任何程度的应用都可以包含编译器能依靠的算法,而RegExp 多次exec也不是分词器特有或唯一选择,就像一种翻转的写法可以作为思维游戏,但不宜到处乱贴、霸占新手的精力
*LL是把(栈顶,初始=文件级)规则peek(1),替换为(规则|词条)序列,测试词条相等到下个规则;LR是把规则最右自(常量级)逐步匹配规约 直到顶规则. 它们的前项 预测解析器和SLR简单点
*无论LL或LR, 现行教程笔记都是非常俗套的,比N/DFA里更稀奇古怪的希腊字母和不先声明的示例张口就来,一大堆毫无特点的示例数据充斥整篇文章,更有C语言和GLSL臭名昭著的单复数混淆 等未有说明,到最后都不懂“规则” “非终结符”到底是啥结构,只晓得他是怎么完成了不起的 FIRST FOLLOW TERMINAL 表转化,连原因都不懂就要学做法
*CPy以前就是缓存解析位置结果避免 AB|A 即A(B)?时回退,这也是函数式常见的方法;但其实语法里会回退的情况并不多。词条peek/take=用调用栈LL1,也方便报错。
let a="(1 (2 3))".split(/([()\s])/g).filter(s=>s!=''),i=0;Mivik的kamet 也是用OOP子类和 Kotlin 的双this
层=(tk)=>{for(let x,q;x=a[i];){i++;if(x==')')break;q=x=='('; tk.push(q?(x=[]):x); if(q)层(x)} }
符链=(s,l={['+']: 1,['*']: 2})=>{let a=[],add=x=>a.push(x),
o,x=()=>add(Number(s())),
one=ed=>{x(); for(o=s(); l[o]>=l[ed];)one(o); add(ed)}
one('');a.pop(); return a
}
层(树根=晚执行=t0=[])
class XNode{ override fun Context.cg():llvm.Value } 求值,实现了很标准的仿rust语言,还支持多态和泛型、类型推导;除了 types&struct ,我都没见到啥和文本处理有关的,除了lexer是专门仿正则实现的DFA action,靠继续lex() peek/take和手写parser交换。 啊?有那么多解析器吗,编译器=解析器?没听说过啊!LL左递归都不能解决中缀算符优先级,但LR可以? 连着来不行,打碎了可以(no backtrack); 正着来不行,反着就可以(bottom up, LR);而且只有这样可以,其他做法我不看? 贵圈是什么逻辑,而且 ANTLR 那么重都不能解决需求了?自己打自己啊。 GitHub 上排名前位的脚本语言没一个用 compiler compiler 的,有的甚至在用函数组合解析器😐😐
编译器不是编译原理的产物,它是计算过程表示形式的礼物。编译器也是正常软件,任何程度的应用都可以包含编译器能依靠的算法,而RegExp 多次exec也不是分词器特有或唯一选择,就像一种翻转的写法可以作为思维游戏,但不宜到处乱贴、霸占新手的精力
*LL是把(栈顶,初始=文件级)规则peek(1),替换为(规则|词条)序列,测试词条相等到下个规则;LR是把规则最右自(常量级)逐步匹配规约 直到顶规则. 它们的前项 预测解析器和SLR简单点
*无论LL或LR, 现行教程笔记都是非常俗套的,比N/DFA里更稀奇古怪的希腊字母和不先声明的示例张口就来,一大堆毫无特点的示例数据充斥整篇文章,更有C语言和GLSL臭名昭著的单复数混淆 等未有说明,到最后都不懂“规则” “非终结符”到底是啥结构,只晓得他是怎么完成了不起的 FIRST FOLLOW TERMINAL 表转化,连原因都不懂就要学做法
*CPy以前就是缓存解析位置结果避免 AB|A 即A(B)?时回退,这也是函数式常见的方法;但其实语法里会回退的情况并不多。词条peek/take=用调用栈LL1,也方便报错。
GitHub
kamet/Parser.kt at master · Mivik/kamet
kamet - a simple programming language written in Kotlin. - kamet/Parser.kt at master · Mivik/kamet
duangsuse::Echo
王垠对CS科班编译原理侧重点的质疑是对的(然而并没暖用,就像教育也不只是为培育人才一样;你没法让所有人相信简单是对的 倒不如说是老师举例和对照的方法不好,LL 这样入门级的程序编号化还是比较好教的,可是他们一举例就是很生硬,非常莫名其妙的常量 也不先说目标,上来就“贴代码”、贴做的图(也不简洁、记流水帐),让人很迷糊: ③ T → FT ' FIRST ( T ) = { ( id } ④ T' → *FT ' |ε FIRST ( T' ) = {* ε } ⑤ F → (E)|id FIRST ( F…
https://zhuanlan.zhihu.com/p/99509681 #reveng #recommended #ce 虚拟机壳都弱爆了,不影响性能的OLLVM多好(那自动重构命名和类全名 的岂不是仍不够强 草..
在纵向70% state= angr汇编符号执行, -3行: 若执行踏入了 相关块addrs, 返回其目标地址,否则忽略此分支(消除无用块. hook地址是块内最后call)
然后会修复真实块间加jmp
把假条件 cmovz(zf?1:2) 改成jz +jmp 后随地址
在纵向70% state= angr汇编符号执行, -3行: 若执行踏入了 相关块addrs, 返回其目标地址,否则忽略此分支(消除无用块. hook地址是块内最后call)
然后会修复真实块间加jmp
把假条件 cmovz(zf?1:2) 改成jz +jmp 后随地址
https://zhuanlan.zhihu.com/p/385042207 #ce
看完我算是满意但又比较失望的。 其实他的AST可视化(是用 pyecharts. 一个children;text 的结构)做得好,但就最开始的那篇博文就走偏了
我以为那个计算机是逆波兰栈的(据说现在一些大学这样教, iseki 表示他上过课来问群朋友,当时吓得我以为是几百行代码才能做,赶紧抱紧那个民科优先级算法... 😂)
他的计算器只能算 "1+2", (很可惜递归下降不适合解决优先级) 但把分词/解析的职责和求值流程教了下,感觉鸡肋(因为30行parse()就算个加法..)。我不满意的是这个Python 实现没有简洁性, interpreter 会构造大量 dataclass ,故这个人每期代码都4,5百行
https://zhuanlan.zhihu.com/p/24035780 这是 #JS React 的爱好者写的,他举的 Expr+Factor=>Expr+'('+Expr+')'=>1+(2*3) 展开和 if Expr then BB (else BB)? 很实际,Java 里 if() if()a;else b; 的else是就近原则,但 LL里要写明 if() WithElse else Stmt 这样
然后左递归 A='a'|A'b' 就是 A='a'|'a'A1 ;A1='b'A1|null
可惜这种写法有多少层优先级就要有多少调用栈,在 Kotlin 里都有快10种,规则不重要,最终代码你要全部手写我敬你 😐
而且组织AST的方法也有点怪,是用
最后 visit 的方法也是依赖 + * 的层次性的,不可能推广到同层次 +-或 */ ,命名也不简洁
200赞。。。应该说在流行编程界教这些东西会更好…… 贺师俊 hex老也来了
https://zhuanlan.zhihu.com/p/208906640 #Go .这个的原理一样,但解析时求值了
https://zhuanlan.zhihu.com/p/331794661 他们的那套编译原理的真理论( 🤷♂️
https://zhuanlan.zhihu.com/p/26660940 #JS 这个和我最近设计的一个有点像... 不过也不够简洁(20行深拷贝... 30行都能实现miniKanren了),但非常直白
#learn 那我就讲下 N/D Finite Automaton (状态机,别瞎听他们加绝对前缀,没意义),下简称 N/D
N是一个状态列表,从列表:起始/begin状态号到含完成/final 状态,一次匹配就成功。 每状态有 CharClass 对应,成功则转移到许多?状态,否则原位
abc , a[be]c , \d\w+ 都可写成字符类的状态机,^$ 蛮特殊的,它断言当前在输入首尾
N不如D适合 match ,N的所有状态是平级的,ab?c 时状态会回退a,类似 when 变 if-else 会更实际些f
a[bc]*$ 里, (S0 a (S1 [b b1-S1] [c c1-S1] ) $) b,b1 这些"连接态"是等价的,a和$ 是等价的
把 通过S0通过a 能走到(transit)的态记为 q1, q1通过b 滤出q2 ,而只要q里包含 finalCell 就是结束态 ,继续下去可把N转为D。
“ 在这里是 {n5} 。之后求它的边界, 即每一个元素都通过 ε 走到能走到的所有状态,记为 q1 的闭包。” ... 其实就是BFS/DFS
“不动点算法:算法可以提前运行终止,因为状态数是有限的” ...
在mivik的正则库里,
在流程构造里 begin,end 是常被extend()的, link(cell, final)是状态尾部
repeat(1..2) 是最有趣的,repeatAtLeast 只是把 m.copy() extend N遍然后 m*,rep(a..b) 则是在a后放 b-a 个可跳end 的单元,遇到不在内的自然就跳出了
讲不完... 🤪 没有精力了,图形学应用还鸽着呢
正则能不能直接变DFA?
最魔怔的就是直接替换为规则集的规则 a=b|c|$ ;bc=c;cb=b; 还有cb$ ,'b' 本身没喂对可以不转移,也能等价它link到的字,这是什么构造.. 1字符1转移都没会还要整理这个 🤪
看完我算是满意但又比较失望的。 其实他的AST可视化(是用 pyecharts. 一个children;text 的结构)做得好,但就最开始的那篇博文就走偏了
我以为那个计算机是逆波兰栈的(据说现在一些大学这样教, iseki 表示他上过课来问群朋友,当时吓得我以为是几百行代码才能做,赶紧抱紧那个民科优先级算法... 😂)
他的计算器只能算 "1+2", (很可惜递归下降不适合解决优先级) 但把分词/解析的职责和求值流程教了下,感觉鸡肋(因为30行parse()就算个加法..)。我不满意的是这个Python 实现没有简洁性, interpreter 会构造大量 dataclass ,故这个人每期代码都4,5百行
https://zhuanlan.zhihu.com/p/24035780 这是 #JS React 的爱好者写的,他举的 Expr+Factor=>Expr+'('+Expr+')'=>1+(2*3) 展开和 if Expr then BB (else BB)? 很实际,Java 里 if() if()a;else b; 的else是就近原则,但 LL里要写明 if() WithElse else Stmt 这样
然后左递归 A='a'|A'b' 就是 A='a'|'a'A1 ;A1='b'A1|null
可惜这种写法有多少层优先级就要有多少调用栈,在 Kotlin 里都有快10种,规则不重要,最终代码你要全部手写我敬你 😐
而且组织AST的方法也有点怪,是用
let p1=new Node("Mul"); p.push(p1); readTerm(); p=p1; ,没有用参数 也没提及 p=p1; 得每次readXX 重设最后 visit 的方法也是依赖 + * 的层次性的,不可能推广到同层次 +-或 */ ,命名也不简洁
200赞。。。应该说在流行编程界教这些东西会更好…… 贺师俊 hex老也来了
https://zhuanlan.zhihu.com/p/208906640 #Go .这个的原理一样,但解析时求值了
https://zhuanlan.zhihu.com/p/331794661 他们的那套编译原理的真理论( 🤷♂️
https://zhuanlan.zhihu.com/p/26660940 #JS 这个和我最近设计的一个有点像... 不过也不够简洁(20行深拷贝... 30行都能实现miniKanren了),但非常直白
#learn 那我就讲下 N/D Finite Automaton (状态机,别瞎听他们加绝对前缀,没意义),下简称 N/D
N是一个状态列表,从列表:起始/begin状态号到含完成/final 状态,一次匹配就成功。 每状态有 CharClass 对应,成功则转移到许多?状态,否则原位
abc , a[be]c , \d\w+ 都可写成字符类的状态机,^$ 蛮特殊的,它断言当前在输入首尾
N不如D适合 match ,N的所有状态是平级的,ab?c 时状态会回退a,类似 when 变 if-else 会更实际些f
a[bc]*$ 里, (S0 a (S1 [b b1-S1] [c c1-S1] ) $) b,b1 这些"连接态"是等价的,a和$ 是等价的
把 通过S0通过a 能走到(transit)的态记为 q1, q1通过b 滤出q2 ,而只要q里包含 finalCell 就是结束态 ,继续下去可把N转为D。
“ 在这里是 {n5} 。之后求它的边界, 即每一个元素都通过 ε 走到能走到的所有状态,记为 q1 的闭包。” ... 其实就是BFS/DFS
“不动点算法:算法可以提前运行终止,因为状态数是有限的” ...
while(que.size)得到 (S0 a (S1 [b [S2 bb bc] ] [c [S3 cc cb] ] ) )
q=que.pop()
for(c in q)
G[q,c] =t=dfs(links(q,c))
if(t not in Q)// Q = {q0, q1} , workList = [q1]
Q.add(t);que.add(t)
在mivik的正则库里,
NFA.from(append="a").oneOrMore 是 NFA的Builder ,StaticNFA.toDFA . CellList=StateList ;因为 outs 是 BitSet (IntSet) 还支持序列化所以很乱,但这个算法就难..在流程构造里 begin,end 是常被extend()的, link(cell, final)是状态尾部
repeat(1..2) 是最有趣的,repeatAtLeast 只是把 m.copy() extend N遍然后 m*,rep(a..b) 则是在a后放 b-a 个可跳end 的单元,遇到不在内的自然就跳出了
讲不完... 🤪 没有精力了,图形学应用还鸽着呢
正则能不能直接变DFA?
a(b|c)*$ 转NFA还好, a 喂b,c 或$ 会转移,而 cb,bc 是互相转移的最魔怔的就是直接替换为规则集的规则 a=b|c|$ ;bc=c;cb=b; 还有cb$ ,'b' 本身没喂对可以不转移,也能等价它link到的字,这是什么构造.. 1字符1转移都没会还要整理这个 🤪
知乎专栏
一起来写个简单的解释器(七):抽象语法树AST
本章,我们会推翻之前解释器的实现方法,将用“树”这种数据结构来实现解释器。为什么会用树来实现?因为算术表达式最适合用树这种数据结构来描述了。比如6/3*2+4*5,可以通过不断叠加的二叉树来表达: 这种树叫做…
Forwarded from Phonograph (Ralph 萌新喵)
https://github.com/RalXYZ/RalOS
由于 OS 课出成绩了,那么我就把我写的 OS 开源了。
它的完成度显然远远没有 Pintos 之类的高。但,作为一个单人完成、从零开始的大作业,我也只能做这么多了。
由于 OS 课出成绩了,那么我就把我写的 OS 开源了。
它的完成度显然远远没有 Pintos 之类的高。但,作为一个单人完成、从零开始的大作业,我也只能做这么多了。
GitHub
GitHub - RalXYZ/RalOS: A toy OS built from scratch, the final project of ZJU Operating System course
A toy OS built from scratch, the final project of ZJU Operating System course - GitHub - RalXYZ/RalOS: A toy OS built from scratch, the final project of ZJU Operating System course
#Rust 的 struct/impl-fn 设计非常好(好像还能作union.. ) ,也支持闭包
std 有一些 box,ref,Vec,Map 的对C++ 习惯也很直接,而且有unsafe 能取代C
值类型&mut和(i8,i8)、流控匹配, FFI 和 Emscripten 也很好 (尽管不如Kt重视语义性
总之和 #Go 这种民科语言是完全不同的,mivik/kamet,rin 都是以rs 为原型(尽管不支持匹配解构)
但是设置环境是要花时间的,如果你的程序就那样,用什么语言其实没必要。 Rust 的分配期推导越来越好了,语言工具也完善内部。基本可以直接从其他语言翻译,但是什么语言其实都一样的..
std 有一些 box,ref,Vec,Map 的对C++ 习惯也很直接,而且有unsafe 能取代C
值类型&mut和(i8,i8)、流控匹配, FFI 和 Emscripten 也很好 (尽管不如Kt重视语义性
总之和 #Go 这种民科语言是完全不同的,mivik/kamet,rin 都是以rs 为原型(尽管不支持匹配解构)
但是设置环境是要花时间的,如果你的程序就那样,用什么语言其实没必要。 Rust 的分配期推导越来越好了,语言工具也完善内部。基本可以直接从其他语言翻译,但是什么语言其实都一样的..
#js [Forwarded from 每日 AWESOME 观察]
francisrstokes / super-expressive
一个轻量级 JavaScript 库,它允许您用可读性非常高的代码构建正则表达式。让你在几个月后,仍然能读懂自己写的正则表达式。
Rime RainSlide, [2022/1/18 下午2:08]
那么,能把已有的正则表达式转换为它的函数链吗
duangsuse, [2022/1/19 下午10:22]
魔怔了, Kiot 也是这样的,但还是有正则解析
根本无关可读性, 等人学会了正则只会烦于无法重构,你多写几个试试。 又不能config ,concatRe("^" , ()=>rand()? "a":"B" ) 都强
如果一个人不懂正则.. 那他第一次是怎么写的,而且这货都不知道有没有 converter , 不能反向兼容,有整这些字串拼接的心不如写个科普文档
和 Javapoet 一样都是属于低级抽象,某知乎大佬的 ObjectRegex 或 py _re.SRE 正则对象多好,列表/嵌套文法都能处理,不会弄这种类似C宏的低意义代码。 regexp101.com 才真好呢
这是正则引擎…… 不是 regexp code 封装
呃... 现在缩进文法的语言 lexer确实应该识别 : 后的空格 ,但这是整个 lex-yacc的问题(??
脸黑君 (我會很生氣, [2022/1/19 下午10:46]
那你想重用的时候是亲自封装还是搞个这东西
duangsuse, [2022/1/19 下午10:48]
这个是实验,我是说那个 "a".repeat() = "(a)*" 的东西,还弄什么 .end() ,怕是内部维护了一个 [] push pop 吧,估计才学会这个就整框架了,还把API做成这样,没有误人子弟的嫌疑吗
如果没做 re 到他框架的转换,就只会带来麻烦(虽然类似的“正则简化” 不是第一次了
duangsuse, [2022/1/19 下午10:42]
至少这个re 可以写成
调用链应该起到强化可选配置的作用,如果没有,那应该写成
这个高大上的语法,我来个 this 上的调用归个类:
start/end ^$ 是 当前层+='^|$'
optional 不创建新层,其上 string 这些append 行为直接写入当前层[]
capture 和 exact(N) 是push(a=['()'|'{}']),等它们 end() 时按 a[0] 信息 join 一层 — capture^.exact(2).str('x').end.str(y).end 的^ end 时会拼合 x{2}和y
anyOf 看当前层是不是只有 a-b 类的单项,若是则
所以说技巧是好的,但是学会就用还需要多思考
他不会用 {noop: ``}["noop"] 吗... 果然像是JSer会做的 🌑(虽然我也是
还好吧,我觉得火不起来,要不然就说明前端只能靠 重写既有代码play 了
毕竟是涉及"二进制格式"的东西,刚才可能有点过火
francisrstokes / super-expressive
一个轻量级 JavaScript 库,它允许您用可读性非常高的代码构建正则表达式。让你在几个月后,仍然能读懂自己写的正则表达式。
Rime RainSlide, [2022/1/18 下午2:08]
那么,能把已有的正则表达式转换为它的函数链吗
duangsuse, [2022/1/19 下午10:22]
魔怔了, Kiot 也是这样的,但还是有正则解析
根本无关可读性, 等人学会了正则只会烦于无法重构,你多写几个试试。 又不能config ,concatRe("^" , ()=>rand()? "a":"B" ) 都强
如果一个人不懂正则.. 那他第一次是怎么写的,而且这货都不知道有没有 converter , 不能反向兼容,有整这些字串拼接的心不如写个科普文档
和 Javapoet 一样都是属于低级抽象,某知乎大佬的 ObjectRegex 或 py _re.SRE 正则对象多好,列表/嵌套文法都能处理,不会弄这种类似C宏的低意义代码。 regexp101.com 才真好呢
这是正则引擎…… 不是 regexp code 封装
呃... 现在缩进文法的语言 lexer确实应该识别 : 后的空格 ,但这是整个 lex-yacc的问题(??
脸黑君 (我會很生氣, [2022/1/19 下午10:46]
那你想重用的时候是亲自封装还是搞个这东西
duangsuse, [2022/1/19 下午10:48]
这个是实验,我是说那个 "a".repeat() = "(a)*" 的东西,还弄什么 .end() ,怕是内部维护了一个 [] push pop 吧,估计才学会这个就整框架了,还把API做成这样,没有误人子弟的嫌疑吗
如果没做 re 到他框架的转换,就只会带来麻烦(虽然类似的“正则简化” 不是第一次了
duangsuse, [2022/1/19 下午10:42]
至少这个re 可以写成
Re().inpStart.maybe('0x').capture(repeat("A-Fa-f0-9",4) ).inpEnd.ok 这样的形式,调用链也别整太长了调用链应该起到强化可选配置的作用,如果没有,那应该写成
User().alsoIt{name="xx";age=9} 和 {clas:"main", } 的直接形式,滥用不是很好这个高大上的语法,我来个 this 上的调用归个类:
start/end ^$ 是 当前层+='^|$'
optional 不创建新层,其上 string 这些append 行为直接写入当前层[]
capture 和 exact(N) 是push(a=['()'|'{}']),等它们 end() 时按 a[0] 信息 join 一层 — capture^.exact(2).str('x').end.str(y).end 的^ end 时会拼合 x{2}和y
anyOf 看当前层是不是只有 a-b 类的单项,若是则
[a-b] 否则 (a|b)所以说技巧是好的,但是学会就用还需要多思考
他不会用 {noop: ``}["noop"] 吗... 果然像是JSer会做的 🌑(虽然我也是
还好吧,我觉得火不起来,要不然就说明前端只能靠 重写既有代码play 了
毕竟是涉及"二进制格式"的东西,刚才可能有点过火
GitHub
GitHub - francisrstokes/super-expressive: 🦜 Super Expressive is a zero-dependency JavaScript library for building regular expressions…
🦜 Super Expressive is a zero-dependency JavaScript library for building regular expressions in (almost) natural language - francisrstokes/super-expressive
http://www.yinwang.org/blog-cn/2015/04/03/paradigms
“JS 没法访问外层的 this,非得“bind”一下。Python 的变量定义和赋值不分,所以你需要访问全局变量的时候得用 global 关键字,后来又发现如果要访问“中间层”的变量,没有办法了,所以又加了个 nonlocal 关键字。Ruby 先后出现过四种类似 lambda 的东西,每个都有自己的怪癖…… 有些人问我为什么有些语言设计成那个样子,我只能说,很多语言设计者其实根本不知道自己在干什么。
🤔其实这是半对半错的。var self=this 问题可以用 ()=> 解决了,Python3 的 nonlocal 也不是没意义的,比 Java 的
尽管它们都不如 Kotlin 。你看王垠批判Go,质疑 Rust ,但他敢直接怼Kt 的语言设计吗?只好捡了没
http://www.yinwang.org/blog-cn/2013/04/01/lazy-evaluation
Haskell 的参数惰性计算确实需要一个0参闭包,而且是运行时的,较难优化 🤔 所以我觉得如果用指针set 去init 一个变量比较好,然而实际上
Unification(值/变量归一求解) 能用于简单类型系统,且不能推导 subtype 交集,他的逻辑性质名词(symm对称性)也是对的
代数数据类型(带类型参的 Sumtype brach) data A t { Lit :: Int->A Int ; Obj :: t->A t } 其实在 subtype+typeparam 里也能做吧
后来我还在这里看到 recursive type 是指
我以前都把 Bool*Bool=4 state, B+B=2 当冷知识看,没想到真有人把它当东西,置顶一个计科专业还说类型 +* ,还有 0=Void 1=() .. 于是 0*1=0, 0+1=1 ?还不如 insect/union 直白呢. [绝对报错/无尽]计算&T=Nothing, 它|T=T ,因为能算到的Nothing?就肯定不是throw,exit()等,所以意义? 我跟数学老师说 Sigma_i=0^6 表示不如 (0..6).sumBy{} ,老师说那不过是个形式,无关意义。
乱ref英文名词和小众概念,老实说我现在是完全不吃这一套,要么你给我讲明白、指出我的误解,要么拿代码和解决的问题来, 抽象代数x编程,只当耳边风;要是具体一点还夸你厉害,毕竟大家都没空了解这些碎片,我怎么知道你有逻辑自恰性,或者只是碰巧通过检查的数学摘抄?
不过缩进文法(layout) 是香的..也没严重影响解析器的复杂性
http://www.yinwang.org/blog-cn/2014/04/18/golang
这个点评就写得不错,尤其是 TSorter{Swap,Len, Less} 真的比java.Comparator弱智了。
妈的, callback 都能叫 CPS(不返回编程/面向程续编程),这么一想也是噢,调用能决定之后的取舍,怎么不是CPS形式.. Kt协程就是把 suspend fun 加个 callback 交互,因为它没有 TS 的 __awaiter 也不便用闭包this做Generator吧. 再通过StateMachine yield恢复 #kotlin
这里就体现了王垠这人是有真才实学的, 他的知识集不比 #zhihu 一众(公知都算不上,因为从不做科普)的PLT人差
很可惜后来越来越极端,而且也不乐意分享他的compiler.ss外一些其他成果;但就讲课&讲故事而言,
我觉得知乎的大家都没资格评价这个人,因为你们在这点甚至不如他.. 他的博客确实没逼格,话也没轻没重,但对CS科普的贡献是巨大的,真的不夸张。
大家都喜欢轻视「娱乐编程界」,但仔细想想,我们何尝不是娱乐编程人士? 你的回答里贴了多少思路和代码,有多为提问者和公众程序员着想?
如果是为自娱自乐,不算在另一种娱乐编程吗?
ps. 我是不认为太自我的「个人博文」能算科普的。科普必须对不同做法有一定了解,有穿插和客观解读比对,告诉大家好坏要点,而不是代码的解说。不然本质上和"Java入门"教程也没区别
“JS 没法访问外层的 this,非得“bind”一下。Python 的变量定义和赋值不分,所以你需要访问全局变量的时候得用 global 关键字,后来又发现如果要访问“中间层”的变量,没有办法了,所以又加了个 nonlocal 关键字。Ruby 先后出现过四种类似 lambda 的东西,每个都有自己的怪癖…… 有些人问我为什么有些语言设计成那个样子,我只能说,很多语言设计者其实根本不知道自己在干什么。
🤔其实这是半对半错的。var self=this 问题可以用 ()=> 解决了,Python3 的 nonlocal 也不是没意义的,比 Java 的
int a;new T(){a=1;} Error: effective final 好,因为闭包一般不会mut变量,乃至 global ;然后 Ruby 的 ->(){} 和 do|| , Proc.new(&f) 确实是有严重问题,这方面它不如 Python , Matz 对技巧太贪心了。像 C# 尽管技巧多也不会出现函数值有几种写法的问题,但一入 Ruby 你就要学会 1.yield_self{|x| } 和 do|x| end 这些... 坦白说不值,但Rb是有历史包袱.尽管它们都不如 Kotlin 。你看王垠批判Go,质疑 Rust ,但他敢直接怼Kt 的语言设计吗?只好捡了没
throws Exception 强制检查的问题(然而 runCatching{}.getOrNull 用的香谁会管他呢http://www.yinwang.org/blog-cn/2013/04/01/lazy-evaluation
Haskell 的参数惰性计算确实需要一个0参闭包,而且是运行时的,较难优化 🤔 所以我觉得如果用指针set 去init 一个变量比较好,然而实际上
if(!init)x=initizr(); 里这个if确实要执行成千上万次,除非动态改汇编。也不是编译能优化的”解释器开销“Unification(值/变量归一求解) 能用于简单类型系统,且不能推导 subtype 交集,他的逻辑性质名词(symm对称性)也是对的
代数数据类型(带类型参的 Sumtype brach) data A t { Lit :: Int->A Int ; Obj :: t->A t } 其实在 subtype+typeparam 里也能做吧
后来我还在这里看到 recursive type 是指
type R= T0+ Int*R (常规意义: +=| *=,),于是 T0*Int*Int 都是这种.. 就是编译期允许递归 Type.check(inst:Type) 吧.. 算了,唉,我只是讨厌没有编译期计算我以前都把 Bool*Bool=4 state, B+B=2 当冷知识看,没想到真有人把它当东西,置顶一个计科专业还说类型 +* ,还有 0=Void 1=() .. 于是 0*1=0, 0+1=1 ?还不如 insect/union 直白呢. [绝对报错/无尽]计算&T=Nothing, 它|T=T ,因为能算到的Nothing?就肯定不是throw,exit()等,所以意义? 我跟数学老师说 Sigma_i=0^6 表示不如 (0..6).sumBy{} ,老师说那不过是个形式,无关意义。
乱ref英文名词和小众概念,老实说我现在是完全不吃这一套,要么你给我讲明白、指出我的误解,要么拿代码和解决的问题来, 抽象代数x编程,只当耳边风;要是具体一点还夸你厉害,毕竟大家都没空了解这些碎片,我怎么知道你有逻辑自恰性,或者只是碰巧通过检查的数学摘抄?
不过缩进文法(layout) 是香的..也没严重影响解析器的复杂性
http://www.yinwang.org/blog-cn/2014/04/18/golang
这个点评就写得不错,尤其是 TSorter{Swap,Len, Less} 真的比java.Comparator弱智了。
妈的, callback 都能叫 CPS(不返回编程/面向程续编程),这么一想也是噢,调用能决定之后的取舍,怎么不是CPS形式.. Kt协程就是把 suspend fun 加个 callback 交互,因为它没有 TS 的 __awaiter 也不便用闭包this做Generator吧. 再通过StateMachine yield恢复 #kotlin
这里就体现了王垠这人是有真才实学的, 他的知识集不比 #zhihu 一众(公知都算不上,因为从不做科普)的PLT人差
很可惜后来越来越极端,而且也不乐意分享他的compiler.ss外一些其他成果;但就讲课&讲故事而言,
我觉得知乎的大家都没资格评价这个人,因为你们在这点甚至不如他.. 他的博客确实没逼格,话也没轻没重,但对CS科普的贡献是巨大的,真的不夸张。
大家都喜欢轻视「娱乐编程界」,但仔细想想,我们何尝不是娱乐编程人士? 你的回答里贴了多少思路和代码,有多为提问者和公众程序员着想?
如果是为自娱自乐,不算在另一种娱乐编程吗?
ps. 我是不认为太自我的「个人博文」能算科普的。科普必须对不同做法有一定了解,有穿插和客观解读比对,告诉大家好坏要点,而不是代码的解说。不然本质上和"Java入门"教程也没区别
https://zhuanlan.zhihu.com/p/34064655 #zhihu #fp 这是个物理爱好者18年的 CPS 解释器实现文
这个代码质量.. 其实我是讨厌看lisp 系的,非常讨厌嵌套括号,而且这个人似乎在代码里插debug print ,以C的方法写Racket .. ,那我就把要点挑出来看看
函数式除了伪递归也可做尾调用优化,当 f=()=>g(), g=()=>1 时g可return 到f.retAddr ,类似函数内联。CPS也是尾调用
显然return/即 callstk.pop() 两次不叫优化,那么我们就需要 pop 外的方式使用调用栈,即保存 continuation程续 。(call/cc setAs-f) 抓住了调用后的步骤, (f) 就能跳回原位(可用ES6 func* 体验);在工业语言里程续被用于断续执行一个函数,意味它可yield暂时回交执行权, call/cc 也一样,不过能替换调用栈。 这样调用栈就变调用图了,因为你可 longjmp() 到之前的栈帧..
call/cc 可在 generator 里实现yield ,乃至throwcc-恢复 (不过认为Lisp throw更高科技真的不现实。
想实现程续可不容易,因为解释器的执行是不可暂停的,而我们还要替换调用栈 ,于是要手写新的..
cps 解释器可以实现 callcc 。考虑 "1".eval() 时要等待、更大的 "1+2.." 要等待,若碰到 "(call/cc f)" 也等待,f 就拿不到 callcc f后的程续,因为callcc 是立即执行f的?
他是用了 handle-decision-tree , 一个 (eval exp env cont) 扩展,
eval-continuation-call 简单让 eval 的 cont=被闭包状态 ,因为[接下来的步骤 回调] cont 本身就是解释器状态
CPS化 eval() 就能保存状态..我之前只想过 func* 化,确实对 #PLT 了解不够。 比如 a+1 里 add: lit(v=> a,b=v) , cont(a+b) ,那如果 lit 把 add() 闭包保留住,确实就留住了当前程续,如果env 参数也在内,就是整个状态副本…… 不过没看懂单步操作为啥需 decision-tree (好像说 eval-fcall 的没这个就不能在 callcc 函数内运行
文末说要点是 callcc f 创建了 continuation 喂给 f,我只看到 cps 使得后序树遍历 Expr>Add>Lit 变成 Lit>Add>Expr 的反向形式,因此可回馈值 而非等待值,就能suspend ;我之前设计的 tvr 求值步骤模型里 r(treeRes) 好像也是这个效果,能保留树路径。从自顶向下组合 到自底向上化简,碰到callcc抓callback..我好像明白下面那个GLL 是什么意思了
eval-conti-call 则把包住的 env ,cont 重设,就替换了调用栈和当前 scope
如果 f=(k)=>的程续k没被恢复,callcc f 的值就是f()值。 callcc的eval(里cont= "call f" ) ,就指定此默认值
不过说起来函数式解释器 env 表全复制也挺高明的,就没有什么继承综合语法的破事了,解析期都构造好的深先序
以前那些人都说得太复杂…… 之前还有个CPS写解析组合子的,能实现memo..用了什么CPS特性? tramp(循环转化)和memo? GLL文法? 代码太长.. 就没发现CPS有啥特殊技巧的说
🥲我想起了去年冰封说”Kotlin coroutine 的 Context 就是CPS Context“ (
函数式妙……实在是妙啊, callback 这么的土,Kt 竟然用它实现协程?它竟是CPS? 真的大跌眼镜。看来相同的东西,动手操作不同,名词也就不同了
解释器,我自己也在写一篇。
http://www.yinwang.org/blog-cn/2012/08/01/interpreter
王某这个racket 再定解释器就是S-expr 系非常经典的写法了, 变量/常量和env, lambda/call, (eval expr env) ,但其实要说短也有更短的:好像删了..
😐坏耶,只是个后序遍历还藏那么深,殊不知Lisp系解释器作用域是代码最低的... 改天我写一个
看到这里,其实这些人除了S-表达式看起来很牛逼,代码质量真的不行;不是我讨厌圆括号,而是
许多人尽管是大佬,但写的代码仍不敢恭维,或者有改进空间;而因为他的思想正确、领域牛逼,言辞有特性,就觉得他什么都好, 我大可不必。错就是错,风格是慢慢改进的。 尽管牛逼,如果言不及义,也只能说他不善表达..意识到才有改进空间
除了PLT,我也在发展一些其他的API见闻,在我眼里什么领域都是平等的,表达只有目的和废话,没有谁更牛逼的说法。
这个代码质量.. 其实我是讨厌看lisp 系的,非常讨厌嵌套括号,而且这个人似乎在代码里插debug print ,以C的方法写Racket .. ,那我就把要点挑出来看看
函数式除了伪递归也可做尾调用优化,当 f=()=>g(), g=()=>1 时g可return 到f.retAddr ,类似函数内联。CPS也是尾调用
显然return/即 callstk.pop() 两次不叫优化,那么我们就需要 pop 外的方式使用调用栈,即保存 continuation程续 。(call/cc setAs-f) 抓住了调用后的步骤, (f) 就能跳回原位(可用ES6 func* 体验);在工业语言里程续被用于断续执行一个函数,意味它可yield暂时回交执行权, call/cc 也一样,不过能替换调用栈。 这样调用栈就变调用图了,因为你可 longjmp() 到之前的栈帧..
call/cc 可在 generator 里实现yield ,乃至throwcc-恢复 (不过认为Lisp throw更高科技真的不现实。
想实现程续可不容易,因为解释器的执行是不可暂停的,而我们还要替换调用栈 ,于是要手写新的..
cps 解释器可以实现 callcc 。考虑 "1".eval() 时要等待、更大的 "1+2.." 要等待,若碰到 "(call/cc f)" 也等待,f 就拿不到 callcc f后的程续,因为callcc 是立即执行f的?
他是用了 handle-decision-tree , 一个 (eval exp env cont) 扩展,
x[0](res=>res? only(decision=x[1])? exec(d=decision) : decide(d) : decide(tail)) eval-continuation-call 简单让 eval 的 cont=被闭包状态 ,因为[接下来的步骤 回调] cont 本身就是解释器状态
CPS化 eval() 就能保存状态..我之前只想过 func* 化,确实对 #PLT 了解不够。 比如 a+1 里 add: lit(v=> a,b=v) , cont(a+b) ,那如果 lit 把 add() 闭包保留住,确实就留住了当前程续,如果env 参数也在内,就是整个状态副本…… 不过没看懂单步操作为啥需 decision-tree (好像说 eval-fcall 的没这个就不能在 callcc 函数内运行
文末说要点是 callcc f 创建了 continuation 喂给 f,我只看到 cps 使得后序树遍历 Expr>Add>Lit 变成 Lit>Add>Expr 的反向形式,因此可回馈值 而非等待值,就能suspend ;我之前设计的 tvr 求值步骤模型里 r(treeRes) 好像也是这个效果,能保留树路径。从自顶向下组合 到自底向上化简,碰到callcc抓callback..我好像明白下面那个GLL 是什么意思了
eval-conti-call 则把包住的 env ,cont 重设,就替换了调用栈和当前 scope
如果 f=(k)=>的程续k没被恢复,callcc f 的值就是f()值。 callcc的eval(里cont= "call f" ) ,就指定此默认值
不过说起来函数式解释器 env 表全复制也挺高明的,就没有什么继承综合语法的破事了,解析期都构造好的深先序
以前那些人都说得太复杂…… 之前还有个CPS写解析组合子的,能实现memo..用了什么CPS特性? tramp(循环转化)和memo? GLL文法? 代码太长.. 就没发现CPS有啥特殊技巧的说
🥲我想起了去年冰封说”Kotlin coroutine 的 Context 就是CPS Context“ (
runBlocking{ launch{ delay(1000) } } 两个suspend调用里啥算内部协程,还是两个孤立调度的),然后我一脸蒙蔽- 断续函数就是可暂断回调度器的函数,和CPS有啥关系? ES6 里也只和 __awaiter 自动.then(resume) 有关啊,现在才知道 Kt coro 是自动callback:Continuation{suspend,resume} 化suspend fun,内部调用等待,完成后交给最外层...函数式妙……实在是妙啊, callback 这么的土,Kt 竟然用它实现协程?它竟是CPS? 真的大跌眼镜。看来相同的东西,动手操作不同,名词也就不同了
解释器,我自己也在写一篇。
http://www.yinwang.org/blog-cn/2012/08/01/interpreter
王某这个racket 再定解释器就是S-expr 系非常经典的写法了, 变量/常量和env, lambda/call, (eval expr env) ,但其实要说短也有更短的:好像删了..
😐坏耶,只是个后序遍历还藏那么深,殊不知Lisp系解释器作用域是代码最低的... 改天我写一个
看到这里,其实这些人除了S-表达式看起来很牛逼,代码质量真的不行;不是我讨厌圆括号,而是
(def prechk(x) (if (not (ok x))(err "fxxk") 正常逻辑 ) ) 还占缩进这种写法真的难看,我最讨厌平铺直叙的程序 🙏 许多人尽管是大佬,但写的代码仍不敢恭维,或者有改进空间;而因为他的思想正确、领域牛逼,言辞有特性,就觉得他什么都好, 我大可不必。错就是错,风格是慢慢改进的。 尽管牛逼,如果言不及义,也只能说他不善表达..意识到才有改进空间
除了PLT,我也在发展一些其他的API见闻,在我眼里什么领域都是平等的,表达只有目的和废话,没有谁更牛逼的说法。
知乎专栏
柯里化的前生今世(八):尾调用与CPS
关于本文是系列文章中的第八篇,发布在 业余程序员的个人修养这个专栏中: 柯里化的前生今世(一):函数面面观 柯里化的前生今世(二):括号神教 柯里化的前生今世(三):语言和同像性 柯里化的前生今世(四)…
duangsuse::Echo
但是像这个就很离谱了(#zhihu by Gene,#5)。 图1在说 F=(Lit val)|'('E')' |(E T |E+T)|(T F|T*F) —加,乘 他还特意写成 E=E1+T ?这是什么意思(分支.语法属性写很长 语法属性=综合a+b|继承{let a=1; a+1}-上下文 ;这种废话根本是因为没有良好区分 text 和 AST/IR form 才导致的,因为 AST 级就是语言内数据了,谁会用写字作画的方法描述语义?直接上代码跑起来了,还有空讨区分继承和综合eval()? Visitor后序遍历…
This media is not supported in your browser
VIEW IN TELEGRAM
AST with Scope - 脚趾头的文章 - 知乎
https://zhuanlan.zhihu.com/p/75073557
SKI 是”替换、重命名、即得“的意思吗, de Bur.xx Indices 是拿编号替代参数?
代表一个变量的索引 为 距离 该变量所定义的 作用域之间 的距离(之间嵌套了多少个作用域),比如:
这tm不就是词法域编译期变换吗? de Bur .. 干掉了α-conversion(重命名. eta是规约=单步),还干掉了shadow和capture (层叠域和 dict.copy)
我们将变量区分为“绑定”/“自由”变量:
你认真的?Lua 里有完全等效的逻辑
这货上的FV(key) 还得用特殊函数来检出和替换。woc ,动态作用域表1次解决的事情,DBI 写得如此麻烦,仿佛它看不到工业界通用的方法存在一样,或者改个名字就是”lambda技术“专有的了
现在这个AST可以看做一个放着FV的容器,并实现了Functor,Foldable,Traversable(甚至可以实现Monad),可以通过一些通用的函数对AST进行操作,比如说判定一颗语法树对应的项是否是闭项(无Upvalue.. 不对,无global var):
DBI是一个很好的让变量带上作用域信息的方案,但是就上面定义的AST的定义来说还不够安全,还无法禁止构造像Lam (BV 2)这样的不合法项。
First-Order Abstract Syntax —最简单直接的方法就是直接用字符串保存变量名 —有必要起FOAS 这样的”术语“?y
High-Other Abstract Syntax — HOAS???
这种函数式有资格说 OOP 术语是废话吗?直接学编译原理就成, HOAS 希腊字母? 除了语义丢了,有变化吗?
不过HOAS的缺点也是十分明显的,我们不能“看进”一颗HOAS里,于是就不能对其做很多操作,比如pretty print、优化 —Expr|=(Hole v) , 即内联注释...
^请问您说的Hole,是不是指符号的元数据(metadata)啊?
这真的需要代码示例?! 一句话就全说明白了,然后我再贴这些废话代码示例
在有dt(datatype? dependent type...)的语言里,HOAS过不了strictly positive check(Agda, Coq 严停机检查),也过不了total check。
-- λx.λy.x y z
-- Lam (Lam (BV 1 @@ BV 0 @@ FV "z"))
就很inductive,很abstract,很safe,很nice。(来自于paper)
装模作样..好像JS和Lua不是如此处理变量一样 ;顺序又不是人眼来填充的
移植的一个算法,仿佛是 lambda 自有的东西一样,还起个啥 de Bur啥的名字,带空格哈
https://dannypsnl.github.io/blog/2021/05/02/cs/strictly-positive-check
这个检查是针对程序即证明的,只要写出符合类型签名的程序就OK,因此类型系统比较强大,甚至都能不停机(死循环)啦
其实可以从检查上预否决 Bad,Term 的问题
已有 A->B , A是逆变 B是协变,在那个类型轮用 -A,+B 表达,推广到 Pi(product,组合) type (有点像Scala
检查: Arg/Type 的左边(受值处)和本身属性相反 ; 的右边和本身属性(正负)相同;
比较怪的是我听说 type checker positive代表有错,negative代表通过…… 唉,总之别相信理论。 我想起某门CS公开课录屏上说,计算机是工程学科…… 理论界不统一啊,都是和数学拓扑啥的杂交来的啊……
我算是知道为啥这些不能实用了,因为实用领域有更通俗的等效做法了。而对另外一些能实用的,它们又太复杂(其实是有简单形式的但这些”语言“研究者不在乎,主不在乎) 😂 真是太可惜啦...
https://zhuanlan.zhihu.com/p/75073557
SKI 是”替换、重命名、即得“的意思吗, de Bur.xx Indices 是拿编号替代参数?
代表一个变量的索引 为 距离 该变量所定义的 作用域之间 的距离(之间嵌套了多少个作用域),比如:
这tm不就是词法域编译期变换吗? de Bur .. 干掉了α-conversion(重命名. eta是规约=单步),还干掉了shadow和capture (层叠域和 dict.copy)
我们将变量区分为“绑定”/“自由”变量:
你认真的?Lua 里有完全等效的逻辑
data Expr a—叠Buff呢,不然没灵魂了
= FV a -- 自由变量不一定用String表示
| BV !Int
| App (Exp a) (Exp a)
| Lam (Scope Exp a)
deriving (Eq,Show,Read,Functor,Foldable,Traversable)
这货上的FV(key) 还得用特殊函数来检出和替换。woc ,动态作用域表1次解决的事情,DBI 写得如此麻烦,仿佛它看不到工业界通用的方法存在一样,或者改个名字就是”lambda技术“专有的了
现在这个AST可以看做一个放着FV的容器,并实现了Functor,Foldable,Traversable(甚至可以实现Monad),可以通过一些通用的函数对AST进行操作,比如说判定一颗语法树对应的项是否是闭项(无Upvalue.. 不对,无global var):
DBI是一个很好的让变量带上作用域信息的方案,但是就上面定义的AST的定义来说还不够安全,还无法禁止构造像Lam (BV 2)这样的不合法项。
First-Order Abstract Syntax —最简单直接的方法就是直接用字符串保存变量名 —有必要起FOAS 这样的”术语“?y
High-Other Abstract Syntax — HOAS???
这种函数式有资格说 OOP 术语是废话吗?直接学编译原理就成, HOAS 希腊字母? 除了语义丢了,有变化吗?
不过HOAS的缺点也是十分明显的,我们不能“看进”一颗HOAS里,于是就不能对其做很多操作,比如pretty print、优化 —Expr|=(Hole v) , 即内联注释...
^请问您说的Hole,是不是指符号的元数据(metadata)啊?
这真的需要代码示例?! 一句话就全说明白了,然后我再贴这些废话代码示例
在有dt(datatype? dependent type...)的语言里,HOAS过不了strictly positive check(Agda, Coq 严停机检查),也过不了total check。
data Vec : Nat -> Type -> Type where—DBI 也可以用Expr 编码住,不专门分支
Nil : Vec Z a --带长列表
(::) : a -> Vec n a -> Vec (S n) a
data Expr a
= Var a
| Lam (Expr (Maybe a))
| Expr a :@ Expr a
-- λx.λy.x y z
-- Lam (Lam (BV 1 @@ BV 0 @@ FV "z"))
就很inductive,很abstract,很safe,很nice。(来自于paper)
装模作样..好像JS和Lua不是如此处理变量一样 ;顺序又不是人眼来填充的
移植的一个算法,仿佛是 lambda 自有的东西一样,还起个啥 de Bur啥的名字,带空格哈
https://dannypsnl.github.io/blog/2021/05/02/cs/strictly-positive-check
这个检查是针对程序即证明的,只要写出符合类型签名的程序就OK,因此类型系统比较强大,甚至都能不停机(死循环)啦
data Bad{ bad : (Bad -> Bottom) -> Bad }
absurd : Bottom —荒谬
absurd = notBad isBad
isBad : Bad
isBad = bad notBad
notBad : Bad -> Bottom --由Bad得到空集,是不可能的,但这里
notBad (bad f) = f (bad f) —f:Bad->Bot , (bad f):Bad
data Term{lam: (Term -> Term) -> Term}
type T=Term
app : T->T ->T
app (lam f) t = f t
w,loop : T
w = lam (\x -> app x x)
loop = app w w
前排提示: Y组合子(匿名递归)是 \f. (\c. f cc)(\c. f cc) 的形式,这个是 ((\x. xx) (\x. xx))
问题是这个 loop的值会在检查时计算(dependent type=type依赖值,即编译期计算) 会死机其实可以从检查上预否决 Bad,Term 的问题
已有 A->B , A是逆变 B是协变,在那个类型轮用 -A,+B 表达,推广到 Pi(product,组合) type (有点像Scala
检查: Arg/Type 的左边(受值处)和本身属性相反 ; 的右边和本身属性(正负)相同;
比较怪的是我听说 type checker positive代表有错,negative代表通过…… 唉,总之别相信理论。 我想起某门CS公开课录屏上说,计算机是工程学科…… 理论界不统一啊,都是和数学拓扑啥的杂交来的啊……
我算是知道为啥这些不能实用了,因为实用领域有更通俗的等效做法了。而对另外一些能实用的,它们又太复杂(其实是有简单形式的但这些”语言“研究者不在乎,主不在乎) 😂 真是太可惜啦...
知乎专栏
AST with Scope
AST是用来表示语法构造的数据结构,而在大多数语言中都有“变量”的概念。 那么应在AST中用什么方式表示一个“变量”呢?怎么进行变量的替换呢?怎么进行变量作用域的检查呢?First-Order Abstract Syntax最简单直…
duangsuse::Echo
AST with Scope - 脚趾头的文章 - 知乎 https://zhuanlan.zhihu.com/p/75073557 SKI 是”替换、重命名、即得“的意思吗, de Bur.xx Indices 是拿编号替代参数? 代表一个变量的索引 为 距离 该变量所定义的 作用域之间 的距离(之间嵌套了多少个作用域),比如: 这tm不就是词法域编译期变换吗? de Bur .. 干掉了α-conversion(重命名. eta是规约=单步),还干掉了shadow和capture (层叠域和 dict.copy)…
This media is not supported in your browser
VIEW IN TELEGRAM
把我给整不会了。之前冰封每次念叨“你会 de Bur啥 Indices”,什么HOAS, 竟然是“善”用 #Haskell 实现 Lua(Upvalue,closure)早有,C语言(尽管无词法闭包) 早有了的函数参编号化/作用域闭包,而且装作不知道这回事一样?
是没有人教过他们怎么写 native 编译器吗,还 alpha conversation ,还 name shadowing 和 env-table capture ,a-自动重命名防冲突是不?先整体遍历 substitute 替换完再规约是不?文本repr 和变量实质的关系都没搞清楚,搁这学 ANTLR/PEG 呢!它们连JSON列表的',' 都没法忽略;
函数式连变量名String的语言分配都要搞“系统”!AST的阴影面,那我就用 First-order/首次 AST 和env表浅copy存储咋了,变量解析好好的为啥要动呢?Lua 的首次不仅把 free/bound 啥区分了,连寄存器都分配了,序列化也完成了;函数式是玩AST树玩疯了吧,个求值序 单步走之前最简单的值ref 还整幺蛾子,有种你和任何一门正经IR编程语言比,不要搞窝里斗
刚才我还夸函数式闭包CPS支持程续值的 interpreter approch 牛逼,现在就看到阴暗面了——env-copy,不思进取,等到想改进的时候,一大堆有的没的“专业术语”就出来了。 函数式根本不适合搞这个优化(每次写visit都得好长,还链表解构呢),好不容易写出来。也难怪非得用术语显得牛逼,
然而并没有暖用,复杂性是多参列表处理带来的,JS完整实现要不了10行, Hs 的遍历法注定了它要给 extract instantiate 这样的树重构写些无用分支 make compiler happy——因为要纯要exhaustive穷举啊,于是你转换半天,最终还不如首次用嵌套表就分配好了函数的内外关系,而且你起一大堆“数学性”名字,也不能让代码跑得更快或更好读
或者是没写过 typeparam 或 unification 吗?类型参数的意义就是一致性、unification 的前置条件就是a=b=1的传递性,变量的语义是:第j参、上i层第j参、全局键名k ,统一个语义指代就得了,closure 就是把这些上层的Upvalue 复制保留下来,它是一个函数值的创建动作,因为函数内引用了外局部值也要存储空间
我就不服了,同样一个东西,就像lam叫抽象我们叫函数子程序,lam里叫应用,我们叫调用,lam叫bound/free我们叫局部和全局量,lam 里叫替换参数我们叫变量和存储空间,lam叫beta规约我们叫执行单步,eta规约我们叫内联,项我们叫返回值;Hs里查instance overload我们用subtype多态override;Hs 写伪递归 case/参数guard匹配我们用 forEach ;哪里有不一样,凭什么函数的就牛我们就土?他们就像拿刀背切菜, 如果不是为研究;如果自以聪明;就是蠢。 那人家刀锋你刀背,和人切得一样才你牛啊、比人切得效率才厉害啊,仅仅会几个等价 没意识到智商是搁在那的 人类极限是在那的 表达费力成品就辣鸡 只是分出了亏本精力用刀背就牛, 这叫做和plain编译器等效了?还有一大堆变形你没做呢,市面上没有多少AST形式的虚拟机!
我们把鬼都看不懂的lam 整理成了大家都实用于代码简洁复用的程序工具,而且本质就是lam,而 lam 呢?停留在纸面和扭曲符号莫名"严谨"记法里,写不出几个算法、适应不了大千世界;空洞夸张还自诩是原理,去你的原理,好像 eat(makeSoup(boiler,plate)) 任谁想不出一样,好像代码有定a=1 不letin就算副作用。整理几个重构就能叫优美,咋不说现在随便一个linter 都更能修改问题呢?
现代语言除了有替换和单步化简,还支持主语this、同名不同义、非侵入式拓展的特性,这些lam理论都描述不了,它的再生理论也说得迷迷糊糊,它有什么资格说自己是编程这个巨大集合的本源和“理论”?就因为最迷你?
而且Scheme 那套 eval(exp, env=copy) 根本就不能放编译器上用,编译时命名就消失了,变成调用栈上位置了,在解析后就已没有"a b c" 这种名字了,也就动态语言能玩 env 表浅复制当存储空间用,编译器的闭包创建哪可能把所有外层局部量,乃至全局量复制下来蛤? 那也不比预先知道啥变量是 upvalue 更简单啊!
而且Lua 的func(){global=g+1} 编译结果,看有没有
一大堆废话,变量就是和作用域名绑定的,从函数式和符号表看都是如此,还什么方案,这就是唯一途径;而且它也一点不 abstract ,相反更靠近汇编了;它当然很 inductive(归纳性) ,因为0年以前汇编和JVM就是 work as this way —哦,JVM是把Upvalue存在匿名子类上 也算内部field
这个 paper 就仿佛是在那个珠穆朗玛峰卖冰棒,还是在大兴安岭滑雪呢,怎么就这么飒呢,拿人东西改名还不礼貌用语,在代码里也不加致敬不给credit,直接把工业界通行的做法来了个狸猫换太子,我思量着Lua的作者93年 一个“民科”怎么可能知道函数式的这些呢,怎么就“英雄所见略同”呢 ,那JVM里
真是受不了他们,Lam 演算由 单项Subst 函数Abst 调用Apply 甚至let这种语法糖构成,显然apply有些东西时(如 + 1 2)会直接得值,类似Java的native。函数可以引用任何绑定变量(词法域)
还把 Abstract 简写为 abs 、name 写成 n,这是数学??绝对值和函数有毛线关系?你可以起短像f,fn,e,但语义不该含糊,更不能错位!
相比之下,王垠把 Currying 瞎起了个咖喱就好太多了,至少不是拽无意义洋文;反正对于不知道 Haskell B. Curry (一个组合数学家) 的人这个名字毫无语义
真不知道写过的人为什么会把这个当哲学,两个等价的东西,进入函数层深++ ,看见变量求个层差,就没什么好说了;亏纯函数戏多,所以我不太喜欢不实际的纯函数写法\
那段时间冰封知乎挂的都是这个 de Burj啥和HOAS+啥理论 ,我有关注他的博文,但都不是关于这些的入门级的东西;他的 slogan 还曾是“你懂(这个啥)Indices”吗?弄得我以为是高级类型系统的应用,没想到是这个代数杂交。那他是像让人知道所以问,还是不想让人知道 但害怕人不知道 所以问呢?
是没有人教过他们怎么写 native 编译器吗,还 alpha conversation ,还 name shadowing 和 env-table capture ,a-自动重命名防冲突是不?先整体遍历 substitute 替换完再规约是不?文本repr 和变量实质的关系都没搞清楚,搁这学 ANTLR/PEG 呢!它们连JSON列表的',' 都没法忽略;
函数式连变量名String的语言分配都要搞“系统”!AST的阴影面,那我就用 First-order/首次 AST 和env表浅copy存储咋了,变量解析好好的为啥要动呢?Lua 的首次不仅把 free/bound 啥区分了,连寄存器都分配了,序列化也完成了;函数式是玩AST树玩疯了吧,个求值序 单步走之前最简单的值ref 还整幺蛾子,有种你和任何一门正经IR编程语言比,不要搞窝里斗
刚才我还夸函数式闭包CPS支持程续值的 interpreter approch 牛逼,现在就看到阴暗面了——env-copy,不思进取,等到想改进的时候,一大堆有的没的“专业术语”就出来了。 函数式根本不适合搞这个优化(每次写visit都得好长,还链表解构呢),好不容易写出来。也难怪非得用术语显得牛逼,
然而并没有暖用,复杂性是多参列表处理带来的,JS完整实现要不了10行, Hs 的遍历法注定了它要给 extract instantiate 这样的树重构写些无用分支 make compiler happy——因为要纯要exhaustive穷举啊,于是你转换半天,最终还不如首次用嵌套表就分配好了函数的内外关系,而且你起一大堆“数学性”名字,也不能让代码跑得更快或更好读
或者是没写过 typeparam 或 unification 吗?类型参数的意义就是一致性、unification 的前置条件就是a=b=1的传递性,变量的语义是:第j参、上i层第j参、全局键名k ,统一个语义指代就得了,closure 就是把这些上层的Upvalue 复制保留下来,它是一个函数值的创建动作,因为函数内引用了外局部值也要存储空间
我就不服了,同样一个东西,就像lam叫抽象我们叫函数子程序,lam里叫应用,我们叫调用,lam叫bound/free我们叫局部和全局量,lam 里叫替换参数我们叫变量和存储空间,lam叫beta规约我们叫执行单步,eta规约我们叫内联,项我们叫返回值;Hs里查instance overload我们用subtype多态override;Hs 写伪递归 case/参数guard匹配我们用 forEach ;哪里有不一样,凭什么函数的就牛我们就土?他们就像拿刀背切菜, 如果不是为研究;如果自以聪明;就是蠢。 那人家刀锋你刀背,和人切得一样才你牛啊、比人切得效率才厉害啊,仅仅会几个等价 没意识到智商是搁在那的 人类极限是在那的 表达费力成品就辣鸡 只是分出了亏本精力用刀背就牛, 这叫做和plain编译器等效了?还有一大堆变形你没做呢,市面上没有多少AST形式的虚拟机!
我们把鬼都看不懂的lam 整理成了大家都实用于代码简洁复用的程序工具,而且本质就是lam,而 lam 呢?停留在纸面和扭曲符号莫名"严谨"记法里,写不出几个算法、适应不了大千世界;空洞夸张还自诩是原理,去你的原理,好像 eat(makeSoup(boiler,plate)) 任谁想不出一样,好像代码有定a=1 不letin就算副作用。整理几个重构就能叫优美,咋不说现在随便一个linter 都更能修改问题呢?
现代语言除了有替换和单步化简,还支持主语this、同名不同义、非侵入式拓展的特性,这些lam理论都描述不了,它的再生理论也说得迷迷糊糊,它有什么资格说自己是编程这个巨大集合的本源和“理论”?就因为最迷你?
而且Scheme 那套 eval(exp, env=copy) 根本就不能放编译器上用,编译时命名就消失了,变成调用栈上位置了,在解析后就已没有"a b c" 这种名字了,也就动态语言能玩 env 表浅复制当存储空间用,编译器的闭包创建哪可能把所有外层局部量,乃至全局量复制下来蛤? 那也不比预先知道啥变量是 upvalue 更简单啊!
而且Lua 的func(){global=g+1} 编译结果,看有没有
getglobal 指令就知道是不是“闭合”函数了,比你信息量还大,你就只能知道有没有FV节点,它直接平展为列表了,这种引用统计性的分析不在话下一大堆废话,变量就是和作用域名绑定的,从函数式和符号表看都是如此,还什么方案,这就是唯一途径;而且它也一点不 abstract ,相反更靠近汇编了;它当然很 inductive(归纳性) ,因为0年以前汇编和JVM就是 work as this way —哦,JVM是把Upvalue存在匿名子类上 也算内部field
这个 paper 就仿佛是在那个珠穆朗玛峰卖冰棒,还是在大兴安岭滑雪呢,怎么就这么飒呢,拿人东西改名还不礼貌用语,在代码里也不加致敬不给credit,直接把工业界通行的做法来了个狸猫换太子,我思量着Lua的作者93年 一个“民科”怎么可能知道函数式的这些呢,怎么就“英雄所见略同”呢 ,那JVM里
aload_0, getfield Main$0.lvar 又是干啥的呢 ,摇身一变蹭 lambda 热度,我球球您了 Lam 它是 1920s 年的老人了,别再混血了S f g x = f x (g x); -- 值复制S(f,g(x)). a=1; f(a,a); = S(f,I,a) . jvm dup指令那个红姐(thautwarm)脾气又不好,上次(木兰)听什么 Py3to2 Lambda lifting 我还挺感兴趣的,网上搜到1资料,最后看代码-不就是匿名外提为局部吗?
K x y = x; -- 值选择. 见Church编码 (true a b)
I x = x; --S K K x = I x = x
see(Lam)=lv.add(it.code); see(Def){...; for(lv.unnamed){stmt.unshift("k=v")} return it}
自己也说简单,那就在标题写明是兼容变换backport(lambda extract)啊,美其名曰lambda提升,我还以为是优化呢. JS也tm有var 提升呢,怎么还被人喷呢真是受不了他们,Lam 演算由 单项Subst 函数Abst 调用Apply 甚至let这种语法糖构成,显然apply有些东西时(如 + 1 2)会直接得值,类似Java的native。函数可以引用任何绑定变量(词法域)
还把 Abstract 简写为 abs 、name 写成 n,这是数学??绝对值和函数有毛线关系?你可以起短像f,fn,e,但语义不该含糊,更不能错位!
相比之下,王垠把 Currying 瞎起了个咖喱就好太多了,至少不是拽无意义洋文;反正对于不知道 Haskell B. Curry (一个组合数学家) 的人这个名字毫无语义
真不知道写过的人为什么会把这个当哲学,两个等价的东西,进入函数层深++ ,看见变量求个层差,就没什么好说了;亏纯函数戏多,所以我不太喜欢不实际的纯函数写法\
那段时间冰封知乎挂的都是这个 de Burj啥和HOAS+啥理论 ,我有关注他的博文,但都不是关于这些的入门级的东西;他的 slogan 还曾是“你懂(这个啥)Indices”吗?弄得我以为是高级类型系统的应用,没想到是这个代数杂交。那他是像让人知道所以问,还是不想让人知道 但害怕人不知道 所以问呢?
本文并不是讲解 Finally Tagless 的,只是讲解它和 Visitor 这种设计模式之间的对应关系的。 对于 Finally Tagless 本身的讲解和推导,可以看下面的文章。一个语文极好的人写的『一不小心发明 de Bruijn Indices, SKI 组合子和 Finally Tagless』一个语文极差的人写的『解决 HOAS 无法 look into 的问题,同时一不小心发明 SKI 组合子』链接:https://zhuanlan.zhihu.com/p/53810286
作者:老废物千里冰封
Zhihu
java 双冒号是什么操作符? - 知乎
eta-conversion 支持lambda表达式的语言大多都支持eta转换,scala和 haskell 里的 eta转换写法比较简洁:…
类型系统简介 - 知乎用户frBud6的文章 - 知乎
https://zhuanlan.zhihu.com/p/65626985
超市买菜 - 圆角骑士魔理沙的文章 - 知乎
https://zhuanlan.zhihu.com/p/66349646
#PLT 魔法店里一些文章还是不错的(lambda类型系统, SystemF一大堆TypeNode 集),可惜表达方式太弱了.(他们写LaTeX时仿佛不知道这些在Rust等土直里就是tuple/struct/enum-union ,所以只是贴了无语序的“数学公式”,没有告诉读者这些严谨符号, Product=tuple, Record={} ,其实和user视角是一样的,换了“除法”语序和符号而已,甚至没告诉他咋写typecheck,只是举了程序形式的 with a,b=M:=A*B do N:=R 类的例子,还有(Type inBasic)(Type Arrow AB) 后Valx/fn/app 一致性;我就觉得奇怪了,难道作者不知道这些在“工程世界”都有对应更直白的名词和示例写法?没见过另外一个世界?
一个简单的问题都找不到联系来比对,所以我可以合理推测更有意思的依赖值-类型 其实是因为他们语言和归纳能力的贫瘠,才弄得非常隐晦。可惜那样我就不懂了。
现在我也真是很草,喜欢用自创名词,
Continuation程续 reduce单步 tailrec伪递归 Unification值变量归一 CPS不返回编程=传程续=传回调 Currying颗粒化喂参
polymorphism同名多义 variance型参in-out位 closure变量域闭包 coroutine断续函数 prod/sum组合分支类型 first-class值
combinator可组合器具 callByName传闭包晚求值 EDSL码构语法树 Exception非局部级联返回
gradual-type部分类型 duck/dynamic-type无类型 <T,R>类型一致位
常量Lit 引用Var 表达式Expr 语句Stmt|组合句Block post-order-walk深先树重写/遍历 rev-polish算符执行序重排 recursive-descent前缀提取-return解析 数值类型提升-数值拓宽
还真是挺不严谨的呢🌚 几个字就定义,果然还是不如多态好,那样涵义就不确定了,可以随便外链和修改了。 再加上杂交数学表示法,就能过滤不少外行呢
“ 所以 co- 有了太多太多的译法:coerce 是围在一起,成了约制;covariant 是一起变型,成了协变;collect 是选出来放在一起,成了收集;conjugate 比作马车曲木的两端,成了共轭。coauthor 是合作者;codomain 是陪域。余、共、互、逆、陪、伴、协、同、交、合、配、对、逆、反、偶、上……我们在看到这个词头时,不必像意呆利那个把胸部当成 jiba 的曲直不分的家伙那样直译,而是像徐光启那样,直接看清它的本质是什么。知其变,守其恒,为天下式。当我看到陈意云老师把 coinduction 翻译成「余归纳」的时候,我很困惑:「余」在哪了?而当我发现 coinduction 就是把归纳的过程反过来后,自然就有了它的译法:逆归纳。「反」是一个静态的描述,而「逆」是一个动态的表述。当归纳的箭头有了流动的方向,逆流而上便是把箭头反过来最自然的想法了。于是在英语世界,有了很多关于 co- 的妙语:Q : What does a category theorist call a reader?A : A "co-author".问:范畴论学家把读者称为什么?答:「协作者」。
负负得正,看来 co- 是对合(involution)的。
如果你对知识进行了彻底的分析而非某种机械的套弄,在你脑中生成的概念与生硬的文字之间已经没有很强的相似性,我们就认为这个概念是被理解的。彻底的分析和非凡的变换,是获得真知的标志性特征。
作者:Oling Cat
链接:https://zhuanlan.zhihu.com/p/56285253
得了吧。天下没有一个理论那么简单,理论能涵盖自己,却忘了世界有许多它描述不住的东西。这只是个游戏,情绪自信什么也优化不了 #statement
知其变,领域太多你知不穷,更何谈变化。守其恒,抽象太多涵盖万物等于什么没抽象,抽象徳不配位、言不及义,仍需再优化学习。
从变中得不变,这种一时的欣喜终究是因为接触不够广导致的,它只是发展的第0步。人作为大自然的产物,一种动物,是永远无法获得真理的。
如果你总是自认为彻底理解了知识,你仍在排斥它。因为真正的理解彻底是与之相融,让它成为自己的语言,而不是把它当成独立概念;这个过程和那真知亦无不平凡,只是朝朝暮暮,反复出现,边角不断消磨,本质才得以显现; 一个人一类知识是有时间线的,哪像编译器那样彻底变换 一次成功;得到之后,只是相处的开始。获得真知 只是冷落了真知
"SICP"附近有点好玩的内容,像关于 表述-函数-描述式编程(不过描述式解释器我写过,感觉还是不能实现函数式的功能.. 那就要看 SWI-Prolog.org 啥的能不能用于查询外的功能,应该不能独立存在
https://zhuanlan.zhihu.com/p/65626985
超市买菜 - 圆角骑士魔理沙的文章 - 知乎
https://zhuanlan.zhihu.com/p/66349646
#PLT 魔法店里一些文章还是不错的(lambda类型系统, SystemF一大堆TypeNode 集),可惜表达方式太弱了.(他们写LaTeX时仿佛不知道这些在Rust等土直里就是tuple/struct/enum-union ,所以只是贴了无语序的“数学公式”,没有告诉读者这些严谨符号, Product=tuple, Record={} ,其实和user视角是一样的,换了“除法”语序和符号而已,甚至没告诉他咋写typecheck,只是举了程序形式的 with a,b=M:=A*B do N:=R 类的例子,还有(Type inBasic)(Type Arrow AB) 后Valx/fn/app 一致性;我就觉得奇怪了,难道作者不知道这些在“工程世界”都有对应更直白的名词和示例写法?没见过另外一个世界?
一个简单的问题都找不到联系来比对,所以我可以合理推测更有意思的依赖值-类型 其实是因为他们语言和归纳能力的贫瘠,才弄得非常隐晦。可惜那样我就不懂了。
现在我也真是很草,喜欢用自创名词,
Continuation程续 reduce单步 tailrec伪递归 Unification值变量归一 CPS不返回编程=传程续=传回调 Currying颗粒化喂参
polymorphism同名多义 variance型参in-out位 closure变量域闭包 coroutine断续函数 prod/sum组合分支类型 first-class值
combinator可组合器具 callByName传闭包晚求值 EDSL码构语法树 Exception非局部级联返回
gradual-type部分类型 duck/dynamic-type无类型 <T,R>类型一致位
常量Lit 引用Var 表达式Expr 语句Stmt|组合句Block post-order-walk深先树重写/遍历 rev-polish算符执行序重排 recursive-descent前缀提取-return解析 数值类型提升-数值拓宽
还真是挺不严谨的呢🌚 几个字就定义,果然还是不如多态好,那样涵义就不确定了,可以随便外链和修改了。 再加上杂交数学表示法,就能过滤不少外行呢
“ 所以 co- 有了太多太多的译法:coerce 是围在一起,成了约制;covariant 是一起变型,成了协变;collect 是选出来放在一起,成了收集;conjugate 比作马车曲木的两端,成了共轭。coauthor 是合作者;codomain 是陪域。余、共、互、逆、陪、伴、协、同、交、合、配、对、逆、反、偶、上……我们在看到这个词头时,不必像意呆利那个把胸部当成 jiba 的曲直不分的家伙那样直译,而是像徐光启那样,直接看清它的本质是什么。知其变,守其恒,为天下式。当我看到陈意云老师把 coinduction 翻译成「余归纳」的时候,我很困惑:「余」在哪了?而当我发现 coinduction 就是把归纳的过程反过来后,自然就有了它的译法:逆归纳。「反」是一个静态的描述,而「逆」是一个动态的表述。当归纳的箭头有了流动的方向,逆流而上便是把箭头反过来最自然的想法了。于是在英语世界,有了很多关于 co- 的妙语:Q : What does a category theorist call a reader?A : A "co-author".问:范畴论学家把读者称为什么?答:「协作者」。
负负得正,看来 co- 是对合(involution)的。
如果你对知识进行了彻底的分析而非某种机械的套弄,在你脑中生成的概念与生硬的文字之间已经没有很强的相似性,我们就认为这个概念是被理解的。彻底的分析和非凡的变换,是获得真知的标志性特征。
作者:Oling Cat
链接:https://zhuanlan.zhihu.com/p/56285253
得了吧。天下没有一个理论那么简单,理论能涵盖自己,却忘了世界有许多它描述不住的东西。这只是个游戏,情绪自信什么也优化不了 #statement
知其变,领域太多你知不穷,更何谈变化。守其恒,抽象太多涵盖万物等于什么没抽象,抽象徳不配位、言不及义,仍需再优化学习。
从变中得不变,这种一时的欣喜终究是因为接触不够广导致的,它只是发展的第0步。人作为大自然的产物,一种动物,是永远无法获得真理的。
如果你总是自认为彻底理解了知识,你仍在排斥它。因为真正的理解彻底是与之相融,让它成为自己的语言,而不是把它当成独立概念;这个过程和那真知亦无不平凡,只是朝朝暮暮,反复出现,边角不断消磨,本质才得以显现; 一个人一类知识是有时间线的,哪像编译器那样彻底变换 一次成功;得到之后,只是相处的开始。获得真知 只是冷落了真知
"SICP"附近有点好玩的内容,像关于 表述-函数-描述式编程(不过描述式解释器我写过,感觉还是不能实现函数式的功能.. 那就要看 SWI-Prolog.org 啥的能不能用于查询外的功能,应该不能独立存在