duangsuse::Echo – Telegram

duangsuse::Echo

717 subscribers

4.26K photos

130 videos

583 files

6.48K links

import this:
美而不丑、明而不暗、短而不凡、长而不乱，扁平不宽，读而后码，行之天下，勿托地上天国。
异常勿吞，难过勿过，叹一真理。效率是很重要，盲目最是低效。
简明是可靠的先验，不是可靠的祭品。
知其变，守其恒，为天下式；穷其变，知不穷，得地上势。知变守恒却穷变知新，我认真理，我不认真。

技术相干订阅~
另外有 throws 闲杂频道 @dsuset
转载频道 @dsusep
极小可能会有批评zf的消息如有不适可退出
suse小站(面向运气编程)： https://WOJS.org/#/

Download Telegram

About

Blog

Apps

Platform

duangsuse::Echo

717 subscribers

duangsuse::Echo

duangsuse::Echo

所以说了这么多，我们谈谈怎么用Kotlin写计算器吧……（也就是我要引入这次用小技巧来优化的递归算法）计算器很简单： Expr = AddSub AddSub = MulDiv [+-] MulDiv MulDiv = <int> [*/] <int> 这里为了方便我们不使用scannerless parsing的风格…… <int> 表示它是一个有状态存储的 Token 的意思，而 for、void 这种就是『无状态存储』的 Token。（不知道是不是有点不良实践了，emmm） Scanner:…

所以先梗概一下：其实这个所谓的优化就是显式的递归栈。

我们知道这个二元链解析器是这么工作的：

1+^2*3

每层我们都结合一个中缀[(a+b)什么的]。我们扫描到^的时候，会向前看一个中缀，目的是判断rhs1(这里的"2")该和谁结合
+ 如果 (+) 的优先级大，(1+2)
+ 否则(*)的优先级大，1+ (2*...)
注意上面的， (2 * ...) 这已经暴露了递归子程序需要的参数了：一个是 base (左边的那个表达式)、一个是 (*) 运算符
当它不是作为第一个解析器解析的时候，op_left 为空，就自动运行 scanInfix()，得到第一个 infix
当然也可能得不到，这是属于当前不是 infix 链的情况（一般所有的编程语言无论传统还是函数式还是啥子的，值基本都是表达式链表达的，所以也可能是一个单独的表达式）

在这个过程中，为了能够看到前面的一个op(op2)我们要多consume() 一个，但是这个很可能会失败。
举个例子，上面的 ...(2*3^) 扫描的时候就会找不到后面的op2，就必须返回 op1(base, rhs1) 的结果，而且你递归下去 infixChain(op1(base, rhs1)) 也不能少写这点代码，这是不可以省略的。

但是 rhs1 不可能失败，如果失败了就属于用户输入了 (1+) 这种不完整的中缀表达式。

所以怎么样呢？我想说，直接用数据栈而不是系统的调用栈建模递归会更高效一些。

比如说（当然是对于 1+(2*...) 这种等右结合的情况），这里我们为了保证递归回溯的时候能正常，不得不保留全部的栈帧变量：
+ base，op.join 的目标A
+ op1，op.join 的目标B
+ rhs1，这个已经非必须了
+ op2，这个也已经非必需了

其实这个栈帧的体积是可以缩小一半的（其实栈本来就应该是 [(1+), (2*3)] 这种形式）
然后我们利用面向对象的抽象，可以非常容易第弄出一个 Recursion<T> 数据结构，在上面用 mapTop 操作可以实现 tco、add 操作来增加入栈、reduce 来对 LIFO(LastInFirstOut) 进行归约就好了

return stack.reduce { x, r -> when (x) {
  is Base -> x.expr
  is Tail -> x.join(r)
} }

就可以鸟。

26 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 15:51

duangsuse::Echo

暂时只能写这么多了，写不出来鸟

22 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 16:45

duangsuse::Echo

duangsuse::Echo

暂时只能写这么多了，写不出来鸟

少建了一处Base，不过不打紧，我明天改

24 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 16:49

duangsuse::Echo

只要智商不滑坡，方法总比问题多（跑

73 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 16:50

duangsuse::Echo

求心疼本苏身体的dalao帮忙补充

26 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 16:51

duangsuse::Echo

duangsuse::Echo

暂时只能写这么多了，写不出来鸟

说起来，用显式栈也真是很长很麻烦，还是直白递归下降好

26 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 16:53

duangsuse::Echo

https://github.com/Netrvin/PageGuard.js

检测developer console打开状况的方法：
+ Function.toString + console.log
+ Regex.toString + console.log
+ Chrome console.profiles
+ window.innerHeight

不让复制的CSS：

* {
  user-select: none;
  -?-user-select: none;
}

input { -?-user-select: auto; }

@media print { * { display: none; } }

GitHub - Netrvin/PageGuard.js: No copying, printing as well as opening developers tools.

No copying, printing as well as opening developers tools. - Netrvin/PageGuard.js

23 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 01:12

duangsuse::Echo

duangsuse::Echo

所以先梗概一下：其实这个所谓的优化就是显式的递归栈。我们知道这个二元链解析器是这么工作的： 1+^2*3 每层我们都结合一个中缀[(a+b)什么的]。我们扫描到^的时候，会向前看一个中缀，目的是判断rhs1(这里的"2")该和谁结合 + 如果 (+) 的优先级大，(1+2) + 否则(*)的优先级大，1+ (2*...) 注意上面的， (2 * ...) 这已经暴露了递归子程序需要的参数了：一个是 base (左边的那个表达式)、一个是 (*) 运算符当它不是作为第一个解析器解析的时候，op_left…

咱来说说为什么少了一个 base。

其实这个递归是非常有模式的，比如说，
在 infixChain1 里我们会提供 base 让它去扫，而不是什么都不加，仅仅遗忘自己刚才扫描的 rhs1

然后 infixChain 也一样
[(1 +), 2] 👈 这就是『新的base』
就是这样，喵。

20 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 01:15

duangsuse::Echo

现在这个程序是这个样子，咱来看看。

21 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 01:22

duangsuse::Echo

duangsuse::Echo

现在这个程序是这个样子，咱来看看。

我们举一大堆输入示例，然后一步一步算。

1 — scanInfix() ?: return atomAt0
1 + 1 — op1=(+), [Base(1)], rhs1=1, [Base(+ join 1, 1)]
1 + 2 * 3 — op1=(+), [Base(1)], rhs1=2,
op2=(*), [Tail(1, (+)), Base(2)]
看到了吗？上面 ^
就是第一个『等待结合』的情况，我们又回到了「递归」的原点 — 一次递归扫描的开始
当然，这里我们的 tail 会直接 reduce 一次，显然它必须保证当前栈顶一定是 Base
这是可以保证的，因为我们在每次 push 上 Tail 的时候，都会接着 push 一个 Base，而第一次 push 的是一个 Base。

比如说，假设有 () 优先级大于 (*)，0 + 1 * 2 3 显然需要 [Tail(0 +), Tail(1 *), Base(2 3)] — 扫描 op1=() 的时候 scanInfix() 失败，于是它会直接开始规约过程
可是这个栈它是这么构造的：
[Base(0)]
[Tail(0 +), Base(1)] op1=(+), op2=(*)
[Tail(0 +), Tail(1 *), Base(2)] op1=(*), op2=()
[Tail(0 +), Tail(1 *), Base(2)] rhs1=3, op1=(), op2=fail
找不到比较的第二个参数，中缀链扫描完毕，开始回溯组织语法结构。

[Tail(0 +), Tail(1 *), Base(2 3)]
[Tail(0 +), Base(1* (2 3) )]
[Base(0 + (1* (2 ** 3)) )]

至于我要写成连 [Tail(...), Tail(...), Base(...)] 都兼容的模式，用reduce，是没道理的（因为相邻两项都会自然折叠好的……）。
好吧，其实是有道理的，这样会优雅一些（迫真）

22 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 01:47

duangsuse::Echo

进一步优化还可以用 JDK 的 Thread local storage，因为每个线程同时只能运行一个函数。
换句话说一个线程对 infixChain() 函数调用有一个栈就够了，用完 clear() 就可以，这是个存储分配方面的优化。
当然，如果你的那个 fun 是 suspend fun 当我没说

为了兼容性这个优化我没有做。

20 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 01:52

duangsuse::Echo

运行的时候就是这样

19 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 01:55

duangsuse::Echo

结合就是这样结合 (1 + 2 ^*)

15 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 01:57

duangsuse::Echo

然后你接着往下输入 +1, 到扫描下一个 infix 的时候它要阻塞等待输入

15 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 01:59

duangsuse::Echo

最后你要回溯的栈就是这样 (1 +) ((2 * 3) + 1)，得 8。

15 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 02:01

duangsuse::Echo

duangsuse::Echo

运行的时候就是这样

然后咱再来测试一下 0 + 1 * 2 ** 3 这种情况，假定 (**) 也是左结合的：
一确保算法在多个 Tail 同时出现的情况下（看起来）可以正常工作。

17 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 02:04

duangsuse::Echo

咱先改一下咱的Op定义，加入新的中缀

我们可以注意到，因为代码结构复用良好，所以没花多大力气我们就支持了一个新的中缀运算符（而且轻松解决了左右结合的问题）。

咱的词法分析器也不需要修改，因为它是这么定义的：

scanSpaces(); return if (peek in Calc.Op.keys) Calc.Op[consume()] else null

17 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 02:14

duangsuse::Echo

咱输入：

0+1*2!3

的意思是：0 + (1 * (2 ! 3))

咱回溯的时候是这样的，
2 ! 3 (2%3)的结果是 2

看来咱写的代码不对……？

16 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 02:22

duangsuse::Echo

的确不对…… 0+2*3!4 明明应该成[Tail(0+), Tail(2*)] 的

18 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 02:25

duangsuse::Echo

噢是我定义新前缀的时候搞错了，本来是 ascending order 的 🐱

16 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 02:27

duangsuse::Echo

0+2*3!4!1

现在咱看看这个的临时栈

17 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], 02:29