duangsuse::Echo
717 subscribers
4.26K photos
130 videos
583 files
6.48K links
import this:
美而不丑、明而不暗、短而不凡、长而不乱,扁平不宽,读而后码,行之天下,勿托地上天国。
异常勿吞,难过勿过,叹一真理。效率是很重要,盲目最是低效。
简明是可靠的先验,不是可靠的祭品。
知其变,守其恒,为天下式;穷其变,知不穷,得地上势。知变守恒却穷变知新,我认真理,我不认真。

技术相干订阅~
另外有 throws 闲杂频道 @dsuset
转载频道 @dsusep
极小可能会有批评zf的消息 如有不适可退出
suse小站(面向运气编程): https://WOJS.org/#/
Download Telegram
duangsuse::Echo
所以说了这么多,我们谈谈怎么用Kotlin写计算器吧……(也就是我要引入这次用小技巧来优化的递归算法) 计算器很简单: Expr = AddSub AddSub = MulDiv [+-] MulDiv MulDiv = <int> [*/] <int> 这里为了方便我们不使用scannerless parsing的风格…… <int> 表示它是一个有状态存储的 Token 的意思,而 for、void 这种就是『无状态存储』的 Token。 (不知道是不是有点不良实践了,emmm) Scanner:…
所以先梗概一下:其实这个所谓的优化就是显式的递归栈。

我们知道这个二元链解析器是这么工作的:

1+^2*3

每层我们都结合一个中缀[(a+b)什么的]。我们扫描到^的时候,会向前看一个中缀,目的是判断rhs1(这里的"2")该和谁结合
+ 如果 (+) 的优先级大,(1+2)
+ 否则(*)的优先级大,1+ (2*...)
注意上面的, (2 * ...) 这已经暴露了递归子程序需要的参数了:一个是 base (左边的那个表达式)、一个是 (*) 运算符
当它不是作为第一个解析器解析的时候,op_left 为空,就自动运行 scanInfix(),得到第一个 infix
当然也可能得不到,这是属于当前不是 infix 链的情况(一般所有的编程语言无论传统还是函数式还是啥子的,值基本都是表达式链表达的,所以也可能是一个单独的表达式)

在这个过程中,为了能够看到前面的一个op(op2)我们要多consume() 一个,但是这个很可能会失败。
举个例子,上面的 ...(2*3^) 扫描的时候就会找不到后面的op2,就必须返回 op1(base, rhs1) 的结果,而且你递归下去 infixChain(op1(base, rhs1)) 也不能少写这点代码,这是不可以省略的。

但是 rhs1 不可能失败,如果失败了就属于用户输入了 (1+) 这种不完整的中缀表达式。

所以怎么样呢?我想说,直接用数据栈而不是系统的调用栈建模递归会更高效一些。

比如说(当然是对于 1+(2*...) 这种等右结合的情况),这里我们为了保证递归回溯的时候能正常,不得不保留全部的栈帧变量:
+ base,op.join 的目标A
+ op1,op.join 的目标B
+ rhs1,这个已经非必须了
+ op2,这个也已经非必需了

其实这个栈帧的体积是可以缩小一半的(其实栈本来就应该是 [(1+), (2*3)] 这种形式)
然后我们利用面向对象的抽象,可以非常容易第弄出一个 Recursion<T> 数据结构,在上面用 mapTop 操作可以实现 tco、add 操作来增加入栈、reduce 来对 LIFO(LastInFirstOut) 进行归约就好了

return stack.reduce { x, r -> when (x) {
is Base -> x.expr
is Tail -> x.join(r)
} }

就可以鸟。
暂时只能写这么多了,写不出来鸟
duangsuse::Echo
暂时只能写这么多了,写不出来鸟
少建了一处Base,不过不打紧,我明天改
只要智商不滑坡,方法总比问题多(跑
Calc.kt
4.6 KB
求心疼本苏身体的dalao帮忙补充
duangsuse::Echo
暂时只能写这么多了,写不出来鸟
说起来,用显式栈也真是很长很麻烦,还是直白递归下降好
https://github.com/Netrvin/PageGuard.js

检测developer console打开状况的方法:
+ Function.toString + console.log
+ Regex.toString + console.log
+ Chrome console.profiles
+ window.innerHeight

不让复制的CSS:

* {
user-select: none;
-?-user-select: none;
}

input { -?-user-select: auto; }

@media print { * { display: none; } }
现在这个程序是这个样子,咱来看看。
duangsuse::Echo
现在这个程序是这个样子,咱来看看。
我们举一大堆输入示例,然后一步一步算。

1 — scanInfix() ?: return atomAt0
1 + 1 — op1=(+), [Base(1)], rhs1=1, [Base(+ join 1, 1)]
1 + 2 * 3 — op1=(+), [Base(1)], rhs1=2,
op2=(*), [Tail(1, (+)), Base(2)]
看到了吗?上面 ^
就是第一个『等待结合』的情况,我们又回到了「递归」的原点 — 一次递归扫描的开始
当然,这里我们的 tail 会直接 reduce 一次,显然它必须保证当前栈顶一定是 Base
这是可以保证的,因为我们在每次 push 上 Tail 的时候,都会接着 push 一个 Base,而第一次 push 的是一个 Base。

比如说,假设有 () 优先级大于 (*),0 + 1 * 2 3 显然需要 [Tail(0 +), Tail(1 *), Base(2 3)] — 扫描 op1=() 的时候 scanInfix() 失败,于是它会直接开始规约过程
可是这个栈它是这么构造的:
[Base(0)]
[Tail(0 +), Base(1)] op1=(+), op2=(*)
[Tail(0 +), Tail(1 *), Base(2)] op1=(*), op2=()
[Tail(0 +), Tail(1 *), Base(2)] rhs1=3, op1=(
), op2=fail
找不到比较的第二个参数,中缀链扫描完毕,开始回溯组织语法结构。

[Tail(0 +), Tail(1 *), Base(2 3)]
[Tail(0 +), Base(1* (2
3) )]
[Base(0 + (1* (2 ** 3)) )]

至于我要写成连 [Tail(...), Tail(...), Base(...)] 都兼容的模式,用reduce,是没道理的(因为相邻两项都会自然折叠好的……)。
好吧,其实是有道理的,这样会优雅一些(迫真)
进一步优化还可以用 JDK 的 Thread local storage,因为每个线程同时只能运行一个函数。
换句话说一个线程对 infixChain() 函数调用有一个栈就够了,用完 clear() 就可以,这是个存储分配方面的优化。
当然,如果你的那个 fun 是 suspend fun 当我没说

为了兼容性这个优化我没有做。
运行的时候就是这样
结合就是这样结合 (1 + 2 ^*)
然后你接着往下输入 +1, 到扫描下一个 infix 的时候它要阻塞等待输入
最后你要回溯的栈就是这样 (1 +) ((2 * 3) + 1),得 8。
duangsuse::Echo
运行的时候就是这样
然后咱再来测试一下 0 + 1 * 2 ** 3 这种情况,假定 (**) 也是左结合的:
一确保算法在多个 Tail 同时出现的情况下(看起来)可以正常工作。
咱先改一下咱的Op定义,加入新的中缀

我们可以注意到,因为代码结构复用良好,所以没花多大力气我们就支持了一个新的中缀运算符(而且轻松解决了左右结合的问题)。

咱的词法分析器也不需要修改,因为它是这么定义的:

scanSpaces(); return if (peek in Calc.Op.keys) Calc.Op[consume()] else null
咱输入:0+1*2!3
的意思是:0 + (1 * (2 ! 3))

咱回溯的时候是这样的,
2 ! 3 (2%3)的结果是 2

看来咱写的代码不对……?
的确不对…… 0+2*3!4 明明应该成[Tail(0+), Tail(2*)] 的
噢是我定义新前缀的时候搞错了,本来是 ascending order 的 🐱
0+2*3!4!1

现在咱看看这个的临时栈