ksco 的工作日志
245 subscribers
168 photos
10 videos
4 files
84 links
内容主要取决于我正在做的东西,目前主要是模拟器 / DBT 之类的散乱话题。
Download Telegram
Forwarded from 刘阳
给跪了
新年快乐!
给自己放了 5 天假,今天上班儿了
🥰5
年前在 DynamoRIO 遇到一个比较好玩的东西:

首先 RISC-V 直接跳转的范围只有 +/- 4 KiB,而 AArch64 则是 +/- 32 KiB,所以这个问题算是 RV 独有的。这个范围也直接决定了代码块的最大尺寸,也就是说,RV 中的一个代码块不能超过 4096 个字节(否则块内的直接跳转就有危险了)。
其次,DynamoRIO 有一个叫 clean call 的插桩机制,可以允许用户在任意的两条指令之间插入一个 C 函数的调用。
这个机制的实现方式是,在调用这个 C 函数之前,会保存当前所有寄存器的状态,切换到一个干净的栈上,按照 C 调用约定设置好参数,然后调用 C 函数。函数返回后,再恢复所有的现场,把栈切换回去。
所以大致估算一下,整个 clean call 的主要指令开销就是 context switch 了,32 个整形寄存器 + 32 个浮点寄存器,save + restore 总共是 32 * 2 * 2 * 4 = 512 字节,但是 RV 的 C 扩展刚好提供了 c.ldsp/c.fldsp/c.sdsp/c.fsdsp 指令,所以我们还可以再减个半,也就是 256 字节。

这样一来,在 RISC-V 中每个代码块中最多只能有 15 条指令。
box64 中的 CALL/RET 优化

这个优化基于一个假设:当一个 x86 程序执行 CALL 指令的时候,它大概是在做函数的调用;当执行 RET 指令的时候,它大概是在做函数的返回。
正常情况下,模拟 CALL / RET 的开销是比较大的,因为当 RET 的时候,需要从栈上获取到 return 的地址,然后去 jumptable 中查到该地址对应的代码块,再跳转过去。
但如果接受了上面的假设,则在 CALL 的时候可以把 guest x86 的返回地址以及下一个代码块的地址(CALL 指令会结束当前的代码块)同时压到 host 的栈上。在 RET 的时候,就可以检查 %rip 和 host 栈上的 guest x86 addr 是否相等,如果相等,这时候就可以省去了 jumptable 查表的流程了,直接跳转回 CALL 指令保存的下一个代码块的地址即可。
但如果不相等,此时有多种补救措施,box64 选择直接清空当前 jit frame 的栈空间。这个机制是通过在进入 dynarec 的时候,记录一下当时的 host 栈的位置到一个专用寄存器来实现的。
饿,吃了一大口猫粮,好香啊
🤯5🤔2
约莫看懂了 dynarmic AArch64 后端的寄存器分配模块,接下来就是给 RV 也照抄一份。
👍1😁1
刘阳
https://github.com/ptitSeb/box64/pull/1180
说起来之前就注意到这哥们总是时不时地给 box64 实现一些比较大的 feature,直到昨天才知道他是原作者的儿子 🤯
🤯8
好久没吃炒饭了,炒了一大锅
🥰2
RV64 要将某个 u64 imm 装入寄存器,总共分几步?

欢迎使用 Mov64 Calculator(单寄存器版):

https://godbolt.org/z/8cfPP9Y7x
在高铁上顶着高 ping 用 code remote 完成了一个 patch 的提交,最后发现这个项目可以在 macOS 上编译🥲
出差一周,感冒又一周,周末肝了 30 个小时的帕鲁,明天上班儿了
🥰3
开工大吉,今年希望可以把

1)DynamoRIO RV64 做到官方支持的程度;
2)dynarmic RV64 做好合进主线,Citra 和 yuzu 可以正常使用;
3)box64 Loongarch 做到能用的程度。
昨天给 3A6000 装机然后安装了 AOSC OS,今天在上面做了一整天 box64 开发。不得不夸的是,不管是硬件还是系统,体验都是无可挑剔的。
🤔1
LoongArch 的 LBT 扩展也相当好玩,为了方便之后对比手动模拟 eflags 和直接使用 LBT 扩展的性能差距,我们同时实现了这两套方案。我已经等不及实现足够的指令后 benchmark 一下了
🤯1
真漂亮
LoongArch VSCode 折腾小计

最近因为需要在 LoongArch 上写一些 C 代码,所以折腾了一下 VSCode 环境。

本体下载:

https://github.com/Xiao-Tao/vscode-LA64/releases

在 Loongson 群里搜到的群友打包的 code-oss,解压就能用,版本是 1.80.1。

VSCode 插件:

因为没有 marketplace,所以需要手动下载 VSIX 文件来安装。

- GitLens:

https://github.com/gitkraken/vscode-gitlens/releases/tag/v13.0.0

需要下载旧版本,新版本不兼容。我用的是 13.0.0,再新一点的可能也能用,但我懒得试了。

- LoongArch Assembly:

https://github.com/FreeFlyingSheep/loongarch-assembly/releases

汇编语法高亮。

- C/C++ IntelliSense

https://github.com/microsoft/vscode-cpptools/releases

直接下载最新版的 cpptools-linux.vsix (x86_64)安装即可正常使用(需要安装 latx)。