duangsuse::Echo

systemStack: 20 reports of: 12.580254ms, 529.422micros, ... min=129.954micros, max=12.580254ms, mean=824.48265micros, std=2.6990074188995345ms ascending: 129.954micros, 132.066micros, ... 25%=135.936micros, 50%(median)=154.33micros, 75%=217.637micros AdtStack:…

这是中缀链解析和 NumUnits 单位 format，当然这不稀奇……就是descending accumulator div+mod，我后来又写了一遍……

34 viewsduangsuse, 12:36

duangsuse::Echo

我们举一大堆输入示例，然后一步一步算。 1 — scanInfix() ?: return atomAt0 1 + 1 — op1=(+), [Base(1)], rhs1=1, [Base(+ join 1, 1)] 1 + 2 * 3 — op1=(+), [Base(1)], rhs1=2, op2=(*), [Tail(1, (+)), Base(2)] 看到了吗？上面 ^ 就是第一个『等待结合』的情况，我们又回到了「递归」的原点 — 一次递归扫描的开始当然，这里我们的 tail 会直接…

这是中缀单栈解析的例子 #PLT

32 viewsduangsuse, 12:39

duangsuse::Echo

Lexical Scoping 我不用说吧，递归下降解析了解到 (lambda (a b) (+ a b)) 的 formals 里的 "a" "b" 与 body 里 (+ a b) 存在的1:1对应关系，就可以很自然地把他们联系起来了，之后怎么处理都好，例如像 Lua 一样把它们翻译为函数局部寄存器的编号，然后每次调用的时候给它们分配一对一的存储空间，caller调用侧和callee被调用侧都知道那个"a" "b"是指代哪片分配就好。

29 viewsduangsuse, edited 12:41

duangsuse::Echo

既然都这么弄了，还不如直接把优化写成代码算了……

虽然那个栈的中缀链貌似很高级，而且貌似递归下降的在很极端的情况下输出和 JS 不同，但我还是觉得应该选它，至少它看起来很简单，只 (base, op_left) 两个递归参数就够了，最重要的是它使用的栈是在语言层面受到支持的，而且这个支持本身实现的也很优雅很妥帖（要不然那语言还有用么……）。

27 viewsduangsuse, edited 12:46

duangsuse::Echo

看了某位大佬的 reley （一个类似 Haskell 编译到 Python VM Bytecode 的程序设计语言）我觉得，其实 Java 和 Kotlin 的 package…… 都不利于代码的简洁性，我是好好想了一会的，其实未必没有办法引入『导出』文法，代价是，必须去掉包声明，不然不好看 ……还是留着吧，毕竟 Java 系的不是 Haskell 的风格绝句还不是绝句Script 呢。不过我觉得可以给「包」声明一个扩展： — 数域.jue 包绝句.区间，物，节域、短数域、数域、长数域、…

绝句开始的时候的「包」是这样的，和Kotlin一点的不像，可能是Kotlin要预备原谅了吧 😂

25 viewsduangsuse, 12:56

duangsuse::Echo

运算符：前、后 (dec/inc) +（加）、-（减）、*（乘）、/（除）、%（取余） -~（取负）大(>)、小(<) 不大(<=)、不小(>=) — 这一行括号里的表示法仅参考用汉语里就不要用小于号、小于等于了。取负的 -~ 只是注释，绝句不存在前缀记法，只有前缀算符 &（且） |（或） !~（取非）（异） — 只有真假类型有绝句的且或非逻辑都是短路计算的，也就是说假 & 不可能, 真 | 不可能我相信，既然绝句已经改了这么多了，不会有人觉得让 (&) 官复原职很奇怪第一眼看了…

这是早期的（部分）定义了

24 viewsduangsuse, edited 13:04

duangsuse::Echo

关于汉字数值怎么读这个问题，我这里提供一个算法： fun <A, B> Iterable<Pair<A, B>>.toMap() = this.fold(HashMap<A, B>(10)) { m, vi -> val (v, i) = vi; m[v] = i; m } // 上面的函数其实 Kotlin 标准库也有 val 汉位至数: Map<Char, Int> = "零一二三四五六七八九".withIndex().map { vk -> vk.value to vk.index }.toMap()…

这个就是汉字读取教学……

23 viewsduangsuse, 13:16

duangsuse::Echo

dnaugsuz

这个问题我可以到时候弄出我设计那个语言第一个编译器的时候再找其他人谈谈，之前我没考虑过 break 什么的类型级别可以是 Noting 这件事…… 我之前以为 Kotlin 是不允许这样，但我得慢慢去想，举出实际使用例子来其实这也不是没好处，好像是可以放在 block(closure) 里面的，不过我也不是很确定。我打算设计的这门语言叫『绝句』，这里有一个简单的例子：引记法绝句.区间.数域 (投、换) 对何<项>皆有括物(我: 行<项>) 为私下、尾递归的事二分查找(你: 项、区:…

这可能是相当早的一个早期设计……

24 viewsduangsuse, edited 13:18

duangsuse::Echo

好了，我整理完了，包含两部分：代码和定义
待会我还要把 ParserKt JSON (jison) 的解析器定义代码也打印了

24 viewsduangsuse, 13:31

duangsuse::Echo

jue.txt

22.1 KB

30 viewsduangsuse, 13:31

duangsuse::Echo

jue.odt

30.3 KB

31 viewsduangsuse, 13:31

duangsuse::Echo

cat /usr/share/katepart/syntax/logohighlightstyle.en_GB.xml

这好像有分词高亮的，我考虑一下是不是可以……

绝句有些软关键字（就是仍然可以直接作为名字的，一般它们都跟在其他关键字后面）
不过没关系，可以全都视作关键字看待

29 viewsduangsuse, 13:42

duangsuse::Echo

https://kate-editor.org/syntax/data/syntax/kotlin.xml

牛批啊，这么说我就照着Kotlin的样子不需要几秒钟能定义 syntax highlight？ 🤪？？

27 viewsduangsuse, 13:51

duangsuse::Echo

package import sealed data class enum interface companion object private public protected internal open final get set fun var val constructor inline reified crossinline tailrec in out is as by where vararg get set return throw typealias typeof override infix operator if else when for while do try catch finally continue break yield this super null true false Unit Nothing String Char Int Long Byte Short Float Double Boolean

包为其中引引全成除
定记法引记法属别名类物例况物储物例物记物内物内联物伴生例
私下族内公开内部
开放终定覆写
抽象实现
待例实际
内联晚成
算符尾递归
许多跨嵌不嵌
记法
若否则
判判断于
对解对里的
重复若重复若
尝试接迎成终焉
真入出
属不属作试作存于不存于
回抛下停下略过断续
造于我亲
空真假
效果断止文字
真假字节短数数长数短实数实数
取者置者代者
事量解量常变常参变参

27 viewsduangsuse, edited 14:07

duangsuse::Echo

哈，还好我肯定是理解状态机的，可是，绝句的 """ 为 是代不可枚举上下文的，没办法支持啊……

28 viewsduangsuse, 14:44

duangsuse::Echo

🤔突然发现那不是人手工维护的事，应该由某些工具自动生成。

28 viewsduangsuse, 14:58

duangsuse::Echo

https://kate-editor.org/2005/03/24/writing-a-syntax-highlighting-file/

我真是服了，这么多明显是机器做的东西他们搞个什么 detect2Chars, detectWord, detect... 还甚至lineEndContext, lineBeginContext，写Haskell规则的那位那么Haskell都没见能支持Indented Heredoc（当然词法阶段和目的也没法怎么样）
我开始考虑那种Heredoc虽然看起不错，是不是对许多语言工具都会产生大问题，还是去掉，和Kotlin一样trimIndent、trimPrefix好了……

dynamic if true, the context remembers strings/placeholders saved by dynamic rules. This is needed for HERE documents for example. Default: false.

好利害的样子啊…… 居然能够支持 heredoc…… 而且死板一点的 layout 布局文法也可以支持吧，不过那就是文法阶段的事情了。

Kate | Get an Edge in Editing

Writing a Syntax Highlighting File

Note: Please refer to the Kate Handbook for the most recent version of how to write syntax highlighting files.
Hint: If you want to write a syntax highlighting file, the XML Completion plugin might be …

28 viewsduangsuse, edited 15:16

duangsuse::Echo

9012 年了还用XML且不提供其他的翻译方案，真不知道那语言支持规则该如何维护是好。
想要弄回来还得『反编译』，也真是佩服工程师们的精力和耐力。

27 viewsduangsuse, edited 15:20

duangsuse::Echo

来给整理一下，这Kotlin词法(包括TODO，『待写』)：
\b[_\w][_\w\d]*(\.[_\w][_\w\d]*)*(\.\*)? 据说这是全称名(qualified-name)的regex，绝句里叫『无的复名』，因为能带「的」的全称更常见

Symbol 符号
Comment 注释

“(Comment|.)*?”

"String Char" Unicode转义

\\u[0-9a-fA-F]{4}

String 常文

Char 常字

'(Unicode转义|.)'

Decimal 常数
"Data Type" 物类
Annotation 记物修饰
Import 书引入

包 (无的复名) 为
引 (复名) [成 名]
引全 (复名) [除 joinBy(同行空格(、),名)]
定记法 「.+」
引记法 无的复名 [除] 「.+」

Variable 变量
Function 事定义
ControlFlow 控制流构词
Keyword 普通构词
"Normal Text" 代码文本

很绝望，我估计如果加了基于布局的"Heredoc"，不能支持的编辑器会多10k倍…… 🤪

29 viewsduangsuse, edited 15:29

duangsuse::Echo

有学有样了……

23 viewsduangsuse, 15:59

duangsuse::Echo

绝句词法.txt

2.3 KB

虽然最后（而且现在太晚了……）没有完成对「的」「去」的高亮分词兼容，但是我总结出了这个，很方便继续修改。

30 viewsduangsuse, 17:03

About

Blog

Apps

Platform