/tmp/duangsuse.sock – Telegram

/tmp/duangsuse.sock

23 subscribers

303 photos

3 videos

92 files

337 links

从 duangsuse::Echo (@dsuse) 跟进出来的分支，将在作者恢复原帐号访问的时候合并删除。

Download Telegram

About

Blog

Apps

Platform

/tmp/duangsuse.sock

/tmp/duangsuse.sock

Forwarded from Deleted Account

他们和 @iseki_w 也不一样，iseki 虽然总体上好像比较菜，偶尔也是能研究的。

感觉这些人呢，虽然一直有在努力，可几乎从未进步过，甚至好像是因此才希望有中文编程来帮助他们”重整旗鼓“，不得不考虑。

11 views11:06

/tmp/duangsuse.sock

Forwarded from Deleted Account

https://github.com/duangsuse-valid-projects/Share/blob/master/Others/kt_misc/pkt_9/Parser.kt#L1293

@iseki_w 我用来处理缩进布局的算法概念上没有问题了，但还没测试 🤔

不过我注意到现在的情况好像有点缺陷，它不能解析

class Dog(name: String) where
  val somePropDef = 1
  fun speak(): String where
    return "$name speaking"

这种情况，因为 LayoutPattern<IN, T, L> 还没支持根据 item, tail 动态决定 children 采用的 pattern…… 🤔

duangsuse-valid-projects/Share

🐕 duangsuse's shared files(e.g. productive software projects, documents) - duangsuse-valid-projects/Share

9 views02:54

/tmp/duangsuse.sock

Forwarded from Deleted Account

找到了两个 bug，但原因在确定

>>> p.read("12334\n1234\n122->\n  1->\n   22\n2\n3\n0\n")
res29: Deep<kotlin.Int, kotlin.String>? = Root(nodes=[Term(item=12334), Term(item=1234), Nest(item=122, tail=->, children=[Nest(item=1, tail=->, children=[Term(item=22)]), Term(item=2)]), Term(item=3), Term(item=0)])

>>> p.read("12334\n1234\n122->\n  1\n 2\n  3\n0\n")
res18: Deep<kotlin.Int, kotlin.String>? = Root(nodes=[Term(item=12334), Term(item=1234), Nest(item=122, tail=->, children=[Term(item=1)])])

9 views02:54

/tmp/duangsuse.sock

Forwarded from iseki

呀…能处理那种缩进风格的文法了？🤔

10 views02:54

/tmp/duangsuse.sock

Forwarded from Deleted Account

两个 bug 都解决了。我把一个整数大小比较写错了。

10 views02:54

/tmp/duangsuse.sock

Forwarded from Deleted Account

@iseki_w 是的，支持 layout 的解析和（调试性）复显了（毕竟正经的语言肯定会重写这类代码，我没保留 layout 本身的解析结果）。

61 views02:54

/tmp/duangsuse.sock

Forwarded from Deleted Account

This media is not supported in your browser

VIEW IN TELEGRAM

13 views02:54

/tmp/duangsuse.sock

Forwarded from Deleted Account

~~这么做都是为了 ParserKt……~~

12 views02:54

/tmp/duangsuse.sock

Forwarded from Deleted Account

有很大把握可以在明天完成对 contextual LayoutPattern 的支持以及对 ParserKt 最后的检查，这样绝句的实现从 Layout 到 Infix 动态解析到汉字数值终于扫清了所有障碍，终于可以松口气了。

12 views02:54

/tmp/duangsuse.sock

Forwarded from Deleted Account

val item = RepeatUn(asInt(), digitFor('0'..'9')) { i -> i.toString().map { it - '0' } }
val tail = Seq(::CharTuple, item('-'),item('>')).toStringPat()
val layout = Convert(Repeat(asString(), item(' ')).Many() prefix item('\n'), { it.length }, { "".padStart(it) })
val p = LayoutPattern(item, tail, layout)

就是这四行代码定义的布局解析器，现在我重构后已经支持依据 item 和 tail 确定新布局里的解析项目了，但还没测试。

  /** [Pattern.show] for resulting pattern should be general, since [show] does not use this function */
  protected open fun decideLayerItem(parsed: T, parsedTail: L): Pattern<IN, T> = item

14 views02:54

/tmp/duangsuse.sock

在我看来，ParserKt 的 LayoutPattern 和传统方法最大的差别就是
- PKT 的是 scannerless parsing，lexer-parser 的话那不是最后一层操作（各有优缺）
- Lexer 用数据栈、PKT 用系统栈（个人 profile，用系统栈貌似块那么几ms）
- PKT 没有利用 state，而把 state 建立在递归用栈里（当然它其实也是完全支持 contextual parsing 的）
- PKT 依赖 Deep { Root, Nest, Term } 这种递归数据结构存储解析结果，要再次转化为 AST 必须使用 Deep.Visitor（缺点）
- PKT 的 LayoutPattern 支持 rebuild，对调试很方便
- PKT 的 decideLayerItem; item, tail, layout 都是抽象的，而且 onNestIndent、onTermIndent 也都可重写。代码复用性很高（优点）

13 viewsedited 03:03

/tmp/duangsuse.sock

Forwarded from Deleted Account

@CodeHz 大佬，冰封之前也写过 lexer 层面把布局解析为内部 END token 的做法，你觉得我们这两个实现有啥优缺点呢 ~ 请dalao分析……

14 views03:03

/tmp/duangsuse.sock

https://github.com/daorys1/mulan/blob/master/ulang/runtime/env.py#L213

mulan/ulang/runtime/env.py at master · daorys1/mulan

[UNOFFICIAL] re-implementation of mulan(also known as muLang) - daorys1/mulan

15 views06:28

/tmp/duangsuse.sock

/tmp/duangsuse.sock

https://github.com/daorys1/mulan/blob/master/ulang/runtime/env.py#L213

lg.add('LBRACE', '{\\r*\\n*', flags=(re.DOTALL))
lg.add('RBRACE', '\\r*\\n*}', flags=(re.DOTALL))

代码质量奇差、异想天开
空格语法结构分不清，也不知道是简单了还是困难了，还是本来很 low 却很难伺候。

15 viewsedited 06:36

/tmp/duangsuse.sock

ParserKt 坚守节操，不修改 Feed 的基本定义，LL(1) 的问题完全可以利用 contextual 解析器，去区分……

16 views13:56

/tmp/duangsuse.sock

Forwarded from Deleted Account

开始想 LL(1) 了，ParserKt 的 Feed，不可能 lookhead 任何字符，处理 / 和 // 的分词，进退两难……
不知道是不是应该把分词降低到更低的层次、不知道是不是该模拟 state machine、不知道可不可能专门做兼容……

17 views13:56

/tmp/duangsuse.sock

#music https://music.163.com/song?id=544687951 （康康舞曲）

网易云音乐

歌曲名《CanCan》，由 Smashtrax 演唱，收录于《Orchestral Trailer Themes Collection, Vol. 9: Classical, Vintage & Quirky》专辑中

15 views02:19

/tmp/duangsuse.sock

/tmp/duangsuse.sock

ParserKt 坚守节操，不修改 Feed 的基本定义，LL(1) 的问题完全可以利用 contextual 解析器，去区分……

ParserKt 针对 greedy trie pattern 根本没办法修复，因为它的 Feed 模型相当严格，一旦出现 peek = sticky end 的问题，非常难以解决——要判断是不是，必须 consume，consume 完若不是则一定会导致此字符已被消耗无法再用。

也不是不能利用扩展 Pattern 解决，确实是可以添加一个上下文，要求顺序解析 p1 p2 其中之一不为 notParsed，可那毕竟不是个容易复用的办法……

17 views02:29

/tmp/duangsuse.sock

这个计算器足够，$#%#@……

71 viewsedited 03:16

/tmp/duangsuse.sock

/tmp/duangsuse.sock

ParserKt 针对 greedy trie pattern 根本没办法修复，因为它的 Feed 模型相当严格，一旦出现 peek = sticky end 的问题，非常难以解决——要判断是不是，必须 consume，consume 完若不是则一定会导致此字符已被消耗无法再用。也不是不能利用扩展 Pattern 解决，确实是可以添加一个上下文，要求顺序解析 p1 p2 其中之一不为 notParsed，可那毕竟不是个容易复用的办法……

在 ParserKt 里，读取字符串非常简单，只需要 lookahead-1

val digit = digitFor('0'..'9')
val hex = Decide(digit, digitFor('A'..'Z', 'A', 10), digitFor('a'..'z', 'a', 10)).mergeFirst { if (it in 0..9) 0 else 1 }

val escapes = mapOf('"' to '"', 't' to '\t', 'b' to '\b', 'n' to '\n', 'r' to '\r', '\\' to '\\')
val namedEscape = MapPattern(escapes) { error("unknown escape '$it'"); '?' }
val unicodeEscapePart = object: Repeat<Char, Int, Int>(asInt(16), hex) {
  override val bounds = 4..4
  override val greedy = false
  override fun unfold(value: Int) = value.toString(16).padStart(4, '0').map { hex.read(SingleFeed(it))!! } }
}
val unicodeEscape = Convert(unicodeEscapePart, Int::toChar, Char::toInt).clamWhile(hex, '?') {"bad unicode escape"}

val escaped = Decide(namedEscape, unicodeEscape).mergeFirst { if (it in escapes.values) 0 else 1 } prefix item('\\')

13 viewsedited 03:45

/tmp/duangsuse.sock

https://github.com/duangsuse-valid-projects/Share/blob/master/Others/kt_misc/pkt_9/String.kt#L17
ParserKt 总算稳当了些…… 🥳

duangsuse-valid-projects/Share

🐕 duangsuse's shared files(e.g. productive software projects, documents) - duangsuse-valid-projects/Share

10 views04:39