duangsuse::Echo
今天下午在实现 Tokenizer DOM/JS 应用(基本就是包一下 Trie 树,方便咱唱有日文假名字的歌用的,这个功能苹果有,网易云音乐早就该加了哼。) 因为这个家伙设计得比较方便,可以查看字典树结构和合并后的词对应关系表(而且还能用来查单词……带自动补全草),必须设计一个字典树 string-value 遍历算法。 这个算法咱在 ParserKt 里实践过(毕竟字典树是一遍过解析关键字的重要结构),那时候写了一个纯函数(优点是没有参数所以直接 public 即可),大概就是各种 flatMap…
嗯…… 现在 github.io 没了,只好看看 coding pages 副本吧
这个墙烦死人了,还要不要程序猿活了,日你妈(指
https://github.com/duangsuse-valid-projects/Share/blob/master/HTMLs/Tokenizer/Tokenizer_es5.ts
https://duangsuse-valid-projects.github.io/Share/HTMLs/Tokenizer/?simple=a_dict.txt+a_dict.txt%3Ea_dict.txt&reverse=~a_dict.txt&text=Hello%20Rolld
这个墙烦死人了,还要不要程序猿活了,日你妈(指
https://github.com/duangsuse-valid-projects/Share/blob/master/HTMLs/Tokenizer/Tokenizer_es5.ts
https://duangsuse-valid-projects.github.io/Share/HTMLs/Tokenizer/?simple=a_dict.txt+a_dict.txt%3Ea_dict.txt&reverse=~a_dict.txt&text=Hello%20Rolld
GitHub
duangsuse-valid-projects/Share
🐕 duangsuse's shared files(e.g. productive software projects, documents) - duangsuse-valid-projects/Share
Tokenizer 支持了计划的最后一个特性——用于支持英语分词的 inword grep
Coding-Pages
Tokenizer 分词器
利用建-值对应字典进行组合、处理文本序列、查询单词
duangsuse::Echo
Tokenizer 支持了计划的最后一个特性——用于支持英语分词的 inword grep
This media is not supported in your browser
VIEW IN TELEGRAM
索引 slice (视口计算) 起来还挺麻烦的,开始用脑子都搞错了,亏了我的工程/调试经验…… 勉强试出来了 😥
老实说我对这个内带优化元素的特性本身认知都不明确,不过终于是写出来了
改日,这个项目会被重写打包成支持 ES5 的 Web Extension ,感谢 #TypeScript .
老实说我对这个内带优化元素的特性本身认知都不明确,不过终于是写出来了
改日,这个项目会被重写打包成支持 ES5 的 Web Extension ,感谢 #TypeScript .
duangsuse::Echo
索引 slice (视口计算) 起来还挺麻烦的,开始用脑子都搞错了,亏了我的工程/调试经验…… 勉强试出来了 😥 老实说我对这个内带优化元素的特性本身认知都不明确,不过终于是写出来了 改日,这个项目会被重写打包成支持 ES5 的 Web Extension ,感谢 #TypeScript .
现在为了支持新的 UCD (Unicode 字符典) 带来的性能问题,尝试为 iter, tokeize 支持惰性下层 Trie routes 的初始化(以前的 Kotlin 版本是每层存 value 而不是字典里存的,就不需要专门考虑惰性问题)
现在单单只有 Object 到 Map 的性能提升,还不足以到处理普通话发音字典的程度,麻烦死了。
足足卡了我一天,问题解决不了 WebExt 当然也难产了。
现在单单只有 Object 到 Map 的性能提升,还不足以到处理普通话发音字典的程度,麻烦死了。
足足卡了我一天,问题解决不了 WebExt 当然也难产了。