OKHK
579 subscribers
2.63K photos
53 videos
33 files
3.12K links
👋 不定期碎碎念

资讯文档 / Bing 每日壁纸

👉 实用工具服务 / GitHub 开源项目

https://tg.okhk.net
Download Telegram
OKHK
https://fxtwitter.com/Medeo_AI/status/1923332483103510721
AI 视频剪辑

https://ai.medeo.app/

生成科普短视频,做菜短视频效果还不错

还能用于小说视频化、儿童动画等等

无需邀请码,直接用,流量高峰可能需要排队

#AI #Video #Tool #URL
workflow-use

https://github.com/browser-use/workflow-use

workflow-use 是一个用于创建和执行确定性工作流的工具,属于 RPA 2.0(机器人流程自动化的进阶版本)。它通过录制浏览器操作,自动生成可复用的工作流,实现自动化任务的快速执行和自我修复,提升自动化流程的可靠性和效率。

🔁 一次录制,永久复用:只需录制一次浏览器交互操作,之后可以无限次重复执行该工作流。

展示操作,无需复杂提示:通过展示操作给录制器,自动生成工作流,避免重复编写复杂提示语。

⚙️ 结构化且可执行的工作流:将录制内容转换为确定性、快速且可靠的工作流,自动提取表单变量。

🪄 类人交互理解:智能过滤录制过程中的噪声,生成更有意义的工作流步骤。

🔒 企业级基础架构:支持自我修复机制和工作流差异比较,便于未来扩展和维护。

🚀 Python 集成简便:支持在 Python 代码中直接加载和运行工作流文件。

🛠 自我修复与智能回退:当某步骤失败时,自动回退并尝试修复工作流,保证流程持续运行。

#GitHub #AI #Tool
Browser-use

https://github.com/browser-use/browser-use

https://browser-use.com/

Browser-use 是一个易于使用的 Python 库,可以让 AI 代理控制浏览器。它提供了一种简单的方式来连接 AI Agent 和浏览器,使得自动化各种网络任务变得更加容易。

1. 支持使用 LLM (大语言模型)控制浏览器,如 GPT-4、DeepSeek-V3 等。
2. 提供了丰富的示例和教程,帮助用户快速上手。
3. 支持在云端运行,无需本地安装。
4. 提供了强大的 DOM 元素提取功能,可以轻松获取网页上的各种数据。
5. 支持重复执行任务,并提供 LLM 作为后备。
6. 正在开发更好的代理内存管理、任务规划和优化等功能。

#AI #Tool #GitHub
Awesome Cursor Rules MDC - Cursor MDC 规则文件生成工具

https://github.com/sanjeed5/awesome-cursor-rules-mdc

一个用于生成 Cursor MDC (Markdown Cursor) 规则文件的工具。

它从一个结构化的 JSON 文件中获取库信息,并使用 Exa 进行语义搜索和 LLM (Gemini) 进行内容生成。

为各种库生成全面的 MDC 规则文件
使用 Exa 进行语义网络搜索以收集最佳实践
利用 LLM 创建详细、结构化的内容
支持并行处理以提高效率
跟踪进度以允许恢复中断的运行
智能重试系统,默认关注失败的库

#GitHub #AI #Editor #Tool
stagewise - 连接前端 UI 元素与 AI Coding Agent

https://github.com/stagewise-io/stagewise

stagewise 是一个浏览器工具栏,可以将前端 UI 与代码编辑器中的 AI Agent 连接起来。

它让前端开发者能够直接在浏览器中选择 UI 元素并进行注释和交互,将元素截图、DOM 结构等关键信息一键发送给 AI Agent 。

直接在浏览器中选择任意 UI 元素并发送给 AI 助手;
自动连接 VS Code 扩展,无需额外配置;
支持多种前端框架:React、Vue、Next.js、SvelteKit 等;
可通过自定义插件系统扩展功能;
提供 DOM 元素、截图和元数据给 AI 代理;
不会影响应用的打包体积,仅在开发模式下生效。

#AI #Tool #GitHub #Design
Google Stitch

https://stitch.withgoogle.com/

号称是生成出色设计和 UI 界面最简单、最快捷的产品

Stitch是一个 AI 驱动的工具,帮助应用程序构建器为移动和 Web 应用程序生成高质量的用户界面,并轻松将它们导出 Figma,或直接访问前端代码。

#Google #AI link
Kilo Code - 开源 AI 编程助手

https://github.com/Kilo-Org/kilocode

Kilo Code 是一个开源的 VS Code AI 编程助手。

融合了 Roo CodeCline 的功能,提供了代码生成、任务自动化、代码重构等功能。

内置了最新的 AI 模型,如 Claude 3.7 Sonnet 和 Gemini 2.5 Pro,提供 $20 免费额度,无需配置 API 密钥即可使用。

代码生成: 使用自然语言生成代码
任务自动化: 自动化重复性编码任务
自动重构: 重构和改进现有代码
MCP Server 市场: 轻松找到和使用 MCP Server 来扩展 Agent 功能
多种模式: 包括规划、编码和调试等模式,并支持自定义模式

#VSCode #Extension #AI #Tool #GitHub
Grok System Prompts

https://github.com/xai-org/grok-prompts

Grok 3 聊天助手的系统提示词
DeepSearch 功能的系统提示词
Grok Explain 功能的系统提示词
𝕏 平台上 Grok 机器人的系统提示词

#AI #Prompt #GitHub
MiniMax Speech-02 语音模型

项目地址:

https://minimax-ai.github.io/tts_tech_report

体验地址:

内地: https://www.minimaxi.com/audio

海外: https://www.minimax.io/audio

全球第一个真正实现多样化、个性化定义的语音模型。

除了常用的语音克隆及TTS外,还可以实现通过对音色的文字描述生成对应音色(C端暂未上线),在同一段语音中,也可实现跨语言的高质量语音合成。

#TTS #AI #Voice #Tool #URL link