新版本 多屏幕(虚拟或物理屏幕)管理
🤔11😱2😁1
👍51🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
下载链接 Releases
Ruto 正在参加 AutoGLM 实战派开发者激励活动!
如果您喜欢这个项目,请为我们投上宝贵的一票,点一个 star。
🚀 Ruto (Run, Auto) v1.0.0
发布 Ruto 的第一个正式版本!Ruto 不仅仅是一个自动化工具,它是一个赋予 Android 系统“多线程并行”能力的 AI 任务框架。
AI 自动化任务: 基于 Open-AutoGLM 模型,Ruto 可以理解您的指令,并在您的设备上自动执行 UI 操作,如点击、滑动等。
虚拟屏幕与应用多开: 创建独立的虚拟屏幕,让应用在其上运行。这不仅能实现应用的多实例运行(应用分身),还能在后台执行任务而不干扰您的前台操作。
桌面级多窗口管理: 我们开发了一个全新的、类似桌面系统的多窗口管理界面,让您在 Android 上也能体验高效的多任务处理。
AI 对话集成: 内置了与大语言模型对话的界面,您可以轻松添加自己的模型 API,与 AI 进行智能交流。
灵活的任务执行: 自动化任务既可以在主屏幕上运行,也可以在任何一个虚拟屏幕上执行,实现真正的后台自动化。
如果您喜欢这个项目,请为我们投上宝贵的一票,点一个 star。
下载链接 Releases
Ruto 正在参加 AutoGLM 实战派开发者激励活动!
如果您喜欢这个项目,请为我们投上宝贵的一票,点一个 star。
🚀 Ruto (Run, Auto) v1.0.0
发布 Ruto 的第一个正式版本!Ruto 不仅仅是一个自动化工具,它是一个赋予 Android 系统“多线程并行”能力的 AI 任务框架。
AI 自动化任务: 基于 Open-AutoGLM 模型,Ruto 可以理解您的指令,并在您的设备上自动执行 UI 操作,如点击、滑动等。
虚拟屏幕与应用多开: 创建独立的虚拟屏幕,让应用在其上运行。这不仅能实现应用的多实例运行(应用分身),还能在后台执行任务而不干扰您的前台操作。
桌面级多窗口管理: 我们开发了一个全新的、类似桌面系统的多窗口管理界面,让您在 Android 上也能体验高效的多任务处理。
AI 对话集成: 内置了与大语言模型对话的界面,您可以轻松添加自己的模型 API,与 AI 进行智能交流。
灵活的任务执行: 自动化任务既可以在主屏幕上运行,也可以在任何一个虚拟屏幕上执行,实现真正的后台自动化。
如果您喜欢这个项目,请为我们投上宝贵的一票,点一个 star。
下载链接 Releases
👍59🤔7🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
ROOT 做好支持了,等下发 今天发不了了,发现出了点 bug,修了再发
👍61🔥8
联发科用不了 Shizuku 激活的试试刚传上去的新版本 prelease。
加了一个 Shizuku Terminal 模式,绕过UserService 的一个实现方式。
https://github.com/iamr0s/Ruto-GLM/releases
加了一个 Shizuku Terminal 模式,绕过UserService 的一个实现方式。
https://github.com/iamr0s/Ruto-GLM/releases
👍23🔥2
InstallerX
AI在阅读微信使用说明书后,一次跑通发红包流程。
还记得你第一次使用手机打开你刚下载的软件,你可能要经过好长一段时间的摸索,才能够掌握这个软件的使用技巧。
其实AI也是一样的,当你给AI下达任务,帮我给某某某发个红包时,AI看着屏幕上显示的画面,它可能不知道红包在哪个位置,屏幕内一堆扁平化的按钮图标,放大镜、箭头、三角形、圆形、椭圆到底在哪个里面?所以你可能经常看到AI在运行的过程中会犯错、会陷入死胡同,找不到要执行的任务的入口。
所以想要解决这个问题,只有两条路可以走,要么对AI进行专业的训练,也叫做模型微调。当训练的次数足够多,AI会使用的软件也会逐渐增多。
但是软件的个数是无限的,就像明天也可能会有一个新软件发布。所以,让AI学会如何使用软件,还有另一条路可走。就是给AI准备一个软件说明书。
当你让AI帮你给某某发红包时,在没有说明书时,AI仅通过屏幕分析,根本找不到红包功能在哪里。我们使用了这个软件成百上千次,当然知道放大镜可能是搜索按钮,一个箭头可能是返回,可能是前进。
现在,AI首先会去查阅说明书,说明书会告诉他。微信的红包功能,在个人聊天界面的右下角加号菜单展开当中。
其实AI也是一样的,当你给AI下达任务,帮我给某某某发个红包时,AI看着屏幕上显示的画面,它可能不知道红包在哪个位置,屏幕内一堆扁平化的按钮图标,放大镜、箭头、三角形、圆形、椭圆到底在哪个里面?所以你可能经常看到AI在运行的过程中会犯错、会陷入死胡同,找不到要执行的任务的入口。
所以想要解决这个问题,只有两条路可以走,要么对AI进行专业的训练,也叫做模型微调。当训练的次数足够多,AI会使用的软件也会逐渐增多。
但是软件的个数是无限的,就像明天也可能会有一个新软件发布。所以,让AI学会如何使用软件,还有另一条路可走。就是给AI准备一个软件说明书。
当你让AI帮你给某某发红包时,在没有说明书时,AI仅通过屏幕分析,根本找不到红包功能在哪里。我们使用了这个软件成百上千次,当然知道放大镜可能是搜索按钮,一个箭头可能是返回,可能是前进。
现在,AI首先会去查阅说明书,说明书会告诉他。微信的红包功能,在个人聊天界面的右下角加号菜单展开当中。
👍15😱1
这是我写的一个说明书模板:微信使用说明书。
在这个程序当中,说明书的实现参考了Agent SKILLS的概念,也就是说渐进式披露。
在开始前AI只会知道它有哪些说明书,而不知道具体的内容,当要用到的时候,才会翻开相应软件的说明书进行阅读。
AI其实分不清猫狗,但是有一群数据标注员给AI提供了猫狗的样本图片,告诉AI猫的特征是什么,狗的特征是什么。
而今天,想要让AI真正学会帮助人类操控软件,自然要从撰写软件说明书开始。
欢迎大家分享自己撰写的软件说明书,讨论、完善、优化、分享。
在这个程序当中,说明书的实现参考了Agent SKILLS的概念,也就是说渐进式披露。
在开始前AI只会知道它有哪些说明书,而不知道具体的内容,当要用到的时候,才会翻开相应软件的说明书进行阅读。
AI其实分不清猫狗,但是有一群数据标注员给AI提供了猫狗的样本图片,告诉AI猫的特征是什么,狗的特征是什么。
而今天,想要让AI真正学会帮助人类操控软件,自然要从撰写软件说明书开始。
欢迎大家分享自己撰写的软件说明书,讨论、完善、优化、分享。
👍8
InstallerX
PicoClaw 小龙虾接收TG消息实现远程操控手机
ruto-phone-mcp 则是我撰写并开源的运行在手机端或者任何能adb连接手机的位置。
你可以通过向其中加入更多的 skill(说明书),让你的AI更加聪明,更加灵活的帮你操作手机简化工作。
当然,还有第二方面,你可以建立一个MCP服务器把手机开放给OpenClaw等小龙虾。让手机的应用生态也能成为小龙虾🦞能管理的一部分,具体可以看上面的视频演示。
项目地址:https://github.com/iamr0s/ruto-phone-mcp/
很遗憾的是我的工作太忙了,目前还有很多没有完成,Web界面、输入文字等
你可以通过向其中加入更多的 skill(说明书),让你的AI更加聪明,更加灵活的帮你操作手机简化工作。
当然,还有第二方面,你可以建立一个MCP服务器把手机开放给OpenClaw等小龙虾。让手机的应用生态也能成为小龙虾🦞能管理的一部分,具体可以看上面的视频演示。
项目地址:https://github.com/iamr0s/ruto-phone-mcp/
很遗憾的是我的工作太忙了,目前还有很多没有完成,Web界面、输入文字等
👍23
从我的想法来看,现在的各种 Claw 的正确路线应该是部署在手机上,比如小米的 MiClaw,能通过电源键或语音唤醒。
如果要用 A 手机控制 B 手机,就在 B 手机上装好接口供 Claw 调用。电脑上也装好接口给手机调用。以手机做为一个操作终端,其它一切设备提供接口去给手机调用。 而不是现在的好多把模型部署在电脑上,然后接到 qq、微信之类的聊天软件当中去。
甚至在家中设备或者服务器上部署好大模型,手机只有一个小型模型,下达任务后,简单任务就手机小模型处理,复杂任务就传到大算力设备上的模型去处理,手机只充当一个调度中心,调度算力和任务分配。
这样才算是真正的分布式系统,mcp 本质不就是 ai 远程调用一个工具,工具返回结果告诉你完成的怎么样?就和米家远程操控个洗衣机,洗衣机返回洗衣状态一样的?米家本可以把自己的协议作为 ai 时代的标准协议的,在如此深厚的米家生态设备基础上,哪轮得上现在的 mcp 协议上位。
本来我想趁着放假时间把这些东西实现一下,把手机操作实现成 mcp 接口给模型控制;把电脑操作实现成 mcp 给模型控制;甚至把路由器操作实现成 mcp 给模型调用,ai 通过 mcp 远程操控路由器再控制 homeassistant 实现局域网内所有设备控制。
如果要用 A 手机控制 B 手机,就在 B 手机上装好接口供 Claw 调用。电脑上也装好接口给手机调用。以手机做为一个操作终端,其它一切设备提供接口去给手机调用。 而不是现在的好多把模型部署在电脑上,然后接到 qq、微信之类的聊天软件当中去。
甚至在家中设备或者服务器上部署好大模型,手机只有一个小型模型,下达任务后,简单任务就手机小模型处理,复杂任务就传到大算力设备上的模型去处理,手机只充当一个调度中心,调度算力和任务分配。
这样才算是真正的分布式系统,mcp 本质不就是 ai 远程调用一个工具,工具返回结果告诉你完成的怎么样?就和米家远程操控个洗衣机,洗衣机返回洗衣状态一样的?米家本可以把自己的协议作为 ai 时代的标准协议的,在如此深厚的米家生态设备基础上,哪轮得上现在的 mcp 协议上位。
本来我想趁着放假时间把这些东西实现一下,把手机操作实现成 mcp 接口给模型控制;把电脑操作实现成 mcp 给模型控制;甚至把路由器操作实现成 mcp 给模型调用,ai 通过 mcp 远程操控路由器再控制 homeassistant 实现局域网内所有设备控制。
👍51👎4🔥1