ai-agent-papers:AI智能体研究资源库。它为研究人员和开发者提供了一个全面的AI智能体论文集合,助力快速了解领域前沿动态。
涵盖多种智能体能力与应用场景;定期更新,紧跟最新研究成果;提供详细分类,方便快速定位感兴趣的内容
#资源参考 #AI #Agent
涵盖多种智能体能力与应用场景;定期更新,紧跟最新研究成果;提供详细分类,方便快速定位感兴趣的内容
#资源参考 #AI #Agent
GitHub
GitHub - masamasa59/ai-agent-papers: A collection of AI Agents papers (Updated biweekly)
A collection of AI Agents papers (Updated biweekly) - masamasa59/ai-agent-papers
YouMind 是人人可用的 AI 创作工具。让每一个想创作的人,都有能力从起心动念到开始行动。
今天发布 0.3 版本,增加了类似 Manus 的一键找资料写文档功能,能搜索并保存高质量资料,同时文档可类似 Cursor 一样进行编辑。还可生成好看的配图、生成播客等。
无需邀请码,注册即可用:youmind.ai
需 PC 下访问
你是你的船,YouMind 是你的桨。
#资源参考 #Agent #AI
今天发布 0.3 版本,增加了类似 Manus 的一键找资料写文档功能,能搜索并保存高质量资料,同时文档可类似 Cursor 一样进行编辑。还可生成好看的配图、生成播客等。
无需邀请码,注册即可用:youmind.ai
需 PC 下访问
你是你的船,YouMind 是你的桨。
#资源参考 #Agent #AI
agent-rules:为AI编程助手打造的实用规则库,助力高效开发
提供标准化的开发流程规则,涵盖代码提交、问题分析、文档生成等;支持多种语言和框架的代码质量检查与优化;全球规则配置,一键提升AI助手能力
#资源参考 #agent
提供标准化的开发流程规则,涵盖代码提交、问题分析、文档生成等;支持多种语言和框架的代码质量检查与优化;全球规则配置,一键提升AI助手能力
#资源参考 #agent
GitHub
GitHub - steipete/agent-rules: Rules and Knowledge to work better with agents such as Claude Code or Cursor
Rules and Knowledge to work better with agents such as Claude Code or Cursor - steipete/agent-rules
将简单邮箱列表转化为丰富数据集的AI驱动工具。
多Agent系统,分阶段提取数据,准确率更高;支持自定义字段,满足个性化数据需求;实时流式更新,数据处理过程一目了然
fire-enrich | #工具 #资源参考 #Agent
多Agent系统,分阶段提取数据,准确率更高;支持自定义字段,满足个性化数据需求;实时流式更新,数据处理过程一目了然
fire-enrich | #工具 #资源参考 #Agent
GitHub
GitHub - firecrawl/fire-enrich: 🔥 AI-powered data enrichment tool that transforms emails into rich datasets with company profiles…
🔥 AI-powered data enrichment tool that transforms emails into rich datasets with company profiles, funding data, tech stacks, and more using Firecrawl and multi-agent AI - firecrawl/fire-enrich
openai-cs-agents-demo:基于OpenAI Agents SDK构建的客户服务Agent演示项目
模块化设计,轻松定制和扩展Agent逻辑;智能路由,精准匹配用户需求到对应Agent;支持多种交互场景,涵盖航班查询、座位变更、取消订单等
#资源参考 #Agent #客服Agent
模块化设计,轻松定制和扩展Agent逻辑;智能路由,精准匹配用户需求到对应Agent;支持多种交互场景,涵盖航班查询、座位变更、取消订单等
#资源参考 #Agent #客服Agent
GitHub
GitHub - openai/openai-cs-agents-demo: Demo of a customer service use case implemented with the OpenAI Agents SDK
Demo of a customer service use case implemented with the OpenAI Agents SDK - openai/openai-cs-agents-demo
ai_agents_az:AI Agents A-Z项目,提供了一系列n8n模板,助力你快速构建各种AI驱动的自动化任务。
丰富的模板资源,涵盖从内容创作到社交媒体管理的多种场景;社区支持,加入Skool社区获取更多优质内容;持续更新,每周都有新模板上线
#资源参考 #AI #Agent
丰富的模板资源,涵盖从内容创作到社交媒体管理的多种场景;社区支持,加入Skool社区获取更多优质内容;持续更新,每周都有新模板上线
#资源参考 #AI #Agent
GitHub
GitHub - gyoridavid/ai_agents_az
Contribute to gyoridavid/ai_agents_az development by creating an account on GitHub.
AlphaEvolve:由Gemini驱动的算法发现智能编程Agent,开启算法设计新纪元
核心能力:
🔹 设计更快的矩阵乘法算法,超越AlphaTensor
🔹 解决开放数学难题,涵盖分析✍️、几何📐、组合➕、数论🔂
🔹 优化谷歌数据中心调度、芯片设计及AI训练效率
技术优势:
🔵 结合大型语言模型,整合问题信息与历史解法,创新算法提案
🔵 自动化评估体系,精准量化算法质量与准确性
🔵 采用进化框架,迭代优化并融合多方案优势,持续提升性能
实际应用:
🔧 让谷歌计算生态更高效,节省算力资源,推动硬件与软件协同创新
🔧 加速AI模型训练,提升核心计算内核性能达23%,大幅缩短研发周期
🔧 在复杂数学领域实现75%已知最优解重现,20%超越现有最佳成果
前瞻展望:
AlphaEvolve具备跨领域广泛应用潜力,未来或突破材料科学、药物研发、可持续发展及更多技术商业场景。
#工具 #资源参考 #Agent #框架
核心能力:
🔹 设计更快的矩阵乘法算法,超越AlphaTensor
🔹 解决开放数学难题,涵盖分析✍️、几何📐、组合➕、数论🔂
🔹 优化谷歌数据中心调度、芯片设计及AI训练效率
技术优势:
🔵 结合大型语言模型,整合问题信息与历史解法,创新算法提案
🔵 自动化评估体系,精准量化算法质量与准确性
🔵 采用进化框架,迭代优化并融合多方案优势,持续提升性能
实际应用:
🔧 让谷歌计算生态更高效,节省算力资源,推动硬件与软件协同创新
🔧 加速AI模型训练,提升核心计算内核性能达23%,大幅缩短研发周期
🔧 在复杂数学领域实现75%已知最优解重现,20%超越现有最佳成果
前瞻展望:
AlphaEvolve具备跨领域广泛应用潜力,未来或突破材料科学、药物研发、可持续发展及更多技术商业场景。
#工具 #资源参考 #Agent #框架
Google DeepMind
AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms
New AI agent evolves algorithms for math and practical applications in computing by combining the creativity of large language models with automated evaluators
Graphiti:实时构建面向AI智能体的知识图谱框架,专为动态环境设计,支持连续增量更新、双时间维度管理及高效混合检索,极大提升AI记忆与推理能力。| #框架 #智能体 #Agent #资源参考
核心亮点:
• 实时整合用户交互、结构化与非结构化数据,动态维护知识图谱
• 支持语义、关键词(BM25)与图遍历混合检索,响应延迟低至亚秒级
• 自定义实体定义,灵活构建适合业务的本体模型
• 双时间模型,精准记录事件发生与数据摄取时间,支持历史时点查询
• 高度可扩展,支持Neo4j、FalkorDB等后端,适合企业级大规模数据环境
• 开源免费,基于Apache 2.0协议,社区活跃,持续迭代优化
应用场景:
• AI助手记忆管理与上下文推理
• 动态企业数据整合与知识管理
• 多模态复杂查询与任务自动化
快速上手:
Python 3.10+,搭配Neo4j或FalkorDB,默认集成OpenAI LLM及嵌入服务,支持Google Gemini、Anthropic、Groq及本地Ollama模型。
核心亮点:
• 实时整合用户交互、结构化与非结构化数据,动态维护知识图谱
• 支持语义、关键词(BM25)与图遍历混合检索,响应延迟低至亚秒级
• 自定义实体定义,灵活构建适合业务的本体模型
• 双时间模型,精准记录事件发生与数据摄取时间,支持历史时点查询
• 高度可扩展,支持Neo4j、FalkorDB等后端,适合企业级大规模数据环境
• 开源免费,基于Apache 2.0协议,社区活跃,持续迭代优化
应用场景:
• AI助手记忆管理与上下文推理
• 动态企业数据整合与知识管理
• 多模态复杂查询与任务自动化
快速上手:
Python 3.10+,搭配Neo4j或FalkorDB,默认集成OpenAI LLM及嵌入服务,支持Google Gemini、Anthropic、Groq及本地Ollama模型。
GitHub
GitHub - getzep/graphiti: Build Real-Time Knowledge Graphs for AI Agents
Build Real-Time Knowledge Graphs for AI Agents. Contribute to getzep/graphiti development by creating an account on GitHub.
#Google #Gemini #AI #Agent
⭐️ Google 推出开源 AI 开发工具「Gemini CLI」
⭐️ 开源页面
Gemini CLI 与目前市面上的 AI 编程工具最大的区别是,它提供了业界最大的免费额度:每分钟 60 次请求,每天 1000 次请求,几乎等于完全免费
它支持处理超过 100 万 token 的代码上下文,也就是说你可以用于分析大型代码库。还支持生成多模态内容、工作流自动化、媒体生成集成、实时搜索、MCP等功能
⭐️ Google 推出开源 AI 开发工具「Gemini CLI」
⭐️ 开源页面
Gemini CLI 与目前市面上的 AI 编程工具最大的区别是,它提供了业界最大的免费额度:每分钟 60 次请求,每天 1000 次请求,几乎等于完全免费
它支持处理超过 100 万 token 的代码上下文,也就是说你可以用于分析大型代码库。还支持生成多模态内容、工作流自动化、媒体生成集成、实时搜索、MCP等功能
Google
Gemini CLI: your open-source AI agent
Free and open source, Gemini CLI brings Gemini directly into developers’ terminals — with unmatched access for individuals.
AI Doc Gen:多智能体驱动的代码库自动文档生成系统,提升代码理解与开发者入门效率。
• 多智能体架构:专门的AI agent负责代码结构、数据流、依赖关系、请求流及API分析,确保文档精准全面。
• 自动文档生成:支持自动创建结构化README,章节可灵活配置,保持文档始终更新且易维护。
• GitLab集成:无缝接入GitLab,支持自动分析与合并请求创建,优化团队协作流程。
• 并发处理:多agent并行执行,加速代码分析与文档生成,适应大型项目需求。
• 多LLM兼容:兼容OpenAI、OpenRouter及本地模型等多种LLM API,灵活选择最佳模型。
• 配置灵活:基于YAML配置文件,支持环境变量覆盖,满足不同项目定制需求。
• 可观测性:内置OpenTelemetry和Langfuse监控,实时追踪分析过程,保障系统稳定性。
• 技术栈前沿:采用Python 3.13与pydantic-ai进行agent编排,结合GitPython和python-gitlab实现仓库操作。
从根本上解决文档“腐烂”问题,推动文档与代码同步进化,实现长期维护价值最大化。适合追求高效、自动化文档管理的开发团队及开源项目。
#资源参考 #Agent #AI
• 多智能体架构:专门的AI agent负责代码结构、数据流、依赖关系、请求流及API分析,确保文档精准全面。
• 自动文档生成:支持自动创建结构化README,章节可灵活配置,保持文档始终更新且易维护。
• GitLab集成:无缝接入GitLab,支持自动分析与合并请求创建,优化团队协作流程。
• 并发处理:多agent并行执行,加速代码分析与文档生成,适应大型项目需求。
• 多LLM兼容:兼容OpenAI、OpenRouter及本地模型等多种LLM API,灵活选择最佳模型。
• 配置灵活:基于YAML配置文件,支持环境变量覆盖,满足不同项目定制需求。
• 可观测性:内置OpenTelemetry和Langfuse监控,实时追踪分析过程,保障系统稳定性。
• 技术栈前沿:采用Python 3.13与pydantic-ai进行agent编排,结合GitPython和python-gitlab实现仓库操作。
从根本上解决文档“腐烂”问题,推动文档与代码同步进化,实现长期维护价值最大化。适合追求高效、自动化文档管理的开发团队及开源项目。
#资源参考 #Agent #AI
GitHub
GitHub - divar-ir/ai-doc-gen: AI-powered multi-agent system that automatically analyzes codebases and generates comprehensive documentation.…
AI-powered multi-agent system that automatically analyzes codebases and generates comprehensive documentation. Features GitLab integration, concurrent processing, and multiple LLM support for bette...
多Agent协同提升代码质量的自动化框架
• 并行运行20+ Claude Code agents,最高支持50个,极大加速大规模代码库的自动化改进
• 三大工作流支持:传统Bug修复、系统化最佳实践落地、多Agent协同复杂开发
• 先进锁机制保障多Agent无冲突作业,自动管理任务分配和状态同步,避免重复和冲突
• 涵盖34种主流技术栈(Next.js、Python、Rust、Go、Java、Flutter等),配置丰富,适配广泛项目
• 实时监控面板直观显示Agent状态、上下文使用率、心跳频率及错误信息,支持tmux多视图操作
• 自动恢复与上下文管理:Agent异常自动重启,自动清理上下文防止状态溢出,支持一键广播清理命令
• 配套24套环境搭建脚本,覆盖从前端、后端到DevOps及数据工程,极大简化开发环境配置
• 细粒度Git集成:支持定制分支、增量提交与详尽HTML运行报告,保证代码变更透明且易追踪
• 灵活JSON配置系统,支持变量替换与动态块大小调整,满足不同项目和团队的个性化需求
• 安全稳健:自动备份与恢复Claude设置,文件锁定防止并发冲突,异常清理确保环境干净
该框架不仅是多Agent任务调度工具,更是面向大规模代码库的智能协同开发平台,充分利用AI并行能力与严格的作业协调机制,解决传统自动化工具难以兼顾的代码冲突与任务重复问题,极大提高代码质量和团队开发效率,具备长期演进和多场景复用价值。
Claude Code Agent Farm | #框架 #资源参考 #Agent
• 并行运行20+ Claude Code agents,最高支持50个,极大加速大规模代码库的自动化改进
• 三大工作流支持:传统Bug修复、系统化最佳实践落地、多Agent协同复杂开发
• 先进锁机制保障多Agent无冲突作业,自动管理任务分配和状态同步,避免重复和冲突
• 涵盖34种主流技术栈(Next.js、Python、Rust、Go、Java、Flutter等),配置丰富,适配广泛项目
• 实时监控面板直观显示Agent状态、上下文使用率、心跳频率及错误信息,支持tmux多视图操作
• 自动恢复与上下文管理:Agent异常自动重启,自动清理上下文防止状态溢出,支持一键广播清理命令
• 配套24套环境搭建脚本,覆盖从前端、后端到DevOps及数据工程,极大简化开发环境配置
• 细粒度Git集成:支持定制分支、增量提交与详尽HTML运行报告,保证代码变更透明且易追踪
• 灵活JSON配置系统,支持变量替换与动态块大小调整,满足不同项目和团队的个性化需求
• 安全稳健:自动备份与恢复Claude设置,文件锁定防止并发冲突,异常清理确保环境干净
该框架不仅是多Agent任务调度工具,更是面向大规模代码库的智能协同开发平台,充分利用AI并行能力与严格的作业协调机制,解决传统自动化工具难以兼顾的代码冲突与任务重复问题,极大提高代码质量和团队开发效率,具备长期演进和多场景复用价值。
Claude Code Agent Farm | #框架 #资源参考 #Agent
GitHub
GitHub - Dicklesworthstone/claude_code_agent_farm: Orchestration framework for running 20+ Claude Code agents in parallel: automated…
Orchestration framework for running 20+ Claude Code agents in parallel: automated bug fixing, best-practices sweeps, lock-based coordination, and real-time tmux monitoring - Dicklesworthstone/claud...
#资源参考 #AI #Agent #ai_agents #genai
您可以探索医疗保健、金融、教育、客户服务等众多行业的大量 AI 代理项目和用例。这些 AI 代理可自动执行医疗诊断、股票交易、个性化辅导、客户支持、产品推荐和供应链优化等任务。这些项目包含开源代码和框架,例如 CrewAI、Autogen、Agno 和 Langgraph,它们可帮助您构建、管理和协作 AI 代理,以执行编码、多代理团队合作、数据分析和工作流自动化等任务。利用这些资源可以节省您的时间、提高效率,并激发您创建满足您需求的 AI 解决方案。
https://github.com/ashishpatel26/500-AI-Agents-Projects
您可以探索医疗保健、金融、教育、客户服务等众多行业的大量 AI 代理项目和用例。这些 AI 代理可自动执行医疗诊断、股票交易、个性化辅导、客户支持、产品推荐和供应链优化等任务。这些项目包含开源代码和框架,例如 CrewAI、Autogen、Agno 和 Langgraph,它们可帮助您构建、管理和协作 AI 代理,以执行编码、多代理团队合作、数据分析和工作流自动化等任务。利用这些资源可以节省您的时间、提高效率,并激发您创建满足您需求的 AI 解决方案。
https://github.com/ashishpatel26/500-AI-Agents-Projects
GitHub
GitHub - ashishpatel26/500-AI-Agents-Projects: The 500 AI Agents Projects is a curated collection of AI agent use cases across…
The 500 AI Agents Projects is a curated collection of AI agent use cases across various industries. It showcases practical applications and provides links to open-source projects for implementation...
Motia:AI Agents的缺失后台,一站式统一后端框架,整合API、后台任务、事件与智能代理,轻松构建复杂工作流。
• 多语言支持:Python、JavaScript、TypeScript无缝协作,灵活选择最佳工具。
• 插件化Step设计:业务逻辑即Step,支持HTTP请求、事件驱动和定时任务触发。
• 内建全链路观测:自动追踪日志与状态变更,零配置实现端到端可视化调试。
• 事件驱动工作流:步骤间通过事件发布与订阅解耦,简单声明式代码构建多阶段流程。
• 统一状态管理:共享键值存储,实时追踪数据生命周期,提升调试与维护效率。
• 一键部署体验:快速启动项目,内置Workbench UI便于实时开发测试。
• 100%开源,社区活跃,持续迭代支持多种语言和云平台。
Motia解决了碎片化后端带来的部署复杂性和运维难题,是构建稳定、可扩展AI Agent系统的理想选择。
#资源参考 #Agent #AI #后端框架
• 多语言支持:Python、JavaScript、TypeScript无缝协作,灵活选择最佳工具。
• 插件化Step设计:业务逻辑即Step,支持HTTP请求、事件驱动和定时任务触发。
• 内建全链路观测:自动追踪日志与状态变更,零配置实现端到端可视化调试。
• 事件驱动工作流:步骤间通过事件发布与订阅解耦,简单声明式代码构建多阶段流程。
• 统一状态管理:共享键值存储,实时追踪数据生命周期,提升调试与维护效率。
• 一键部署体验:快速启动项目,内置Workbench UI便于实时开发测试。
• 100%开源,社区活跃,持续迭代支持多种语言和云平台。
Motia解决了碎片化后端带来的部署复杂性和运维难题,是构建稳定、可扩展AI Agent系统的理想选择。
#资源参考 #Agent #AI #后端框架
GitHub
GitHub - iii-hq/iii: iii unifies your existing backend stack with a single engine and three primitives: Function, Trigger, and…
iii unifies your existing backend stack with a single engine and three primitives: Function, Trigger, and Worker. - iii-hq/iii
Just Talk To It - the no-bs Way of Agentic Engineering:简明无废话的Agentic Engineering实战经验分享 | #经验 #资源参考 #AI实战 #Agent经验
基于Agentic Engineering的开发流程已到能自动写几乎100%代码的地步。但很多人还在绕圈子,忙着制造复杂“假象”,反而没真正产出。
这里分享了作者这一年AI辅助开发的心得,直击核心,帮你少走弯路
基于Agentic Engineering的开发流程已到能自动写几乎100%代码的地步。但很多人还在绕圈子,忙着制造复杂“假象”,反而没真正产出。
这里分享了作者这一年AI辅助开发的心得,直击核心,帮你少走弯路
steipete.me
Just Talk To It - the no-bs Way of Agentic Engineering | Peter Steinberger
A practical guide to working with AI coding agents without the hype.
《从零开始构建智能体》从基础理论到实际应用,全面掌握智能体系统的设计与实现
Hello-Agents 是 Datawhale 社区的系统性智能体学习教程。如今 Agent 构建主要分为两派,一派是 Dify,Coze,n8n 这类软件工程类 Agent,其本质是流程驱动的软件开发,LLM 作为数据处理的后端;另一派则是 AI 原生的 Agent,即真正以 AI 驱动的 Agent。
本教程旨在带领大家深入理解并构建后者——真正的 AI Native Agent。教程将带领你穿透框架表象,从智能体的核心原理出发,深入其核心架构,理解其经典范式,并最终亲手构建起属于自己的多智能体应用。我们相信,最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点,能够从一名大语言模型的"使用者",蜕变为一名智能体系统的"构建者"。
✨ 你将收获什么?
📖 Datawhale 开源免费 完全免费学习本项目所有内容,与社区共同成长
🔍 理解核心原理 深入理解智能体的概念、历史与经典范式
🏗 亲手实现 掌握热门低代码平台和智能体代码框架的使用
🛠 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架
⚙️ 掌握高级技能 一步步实现上下文工程、Memory、协议、评估等系统性技术
🤝 模型训练 掌握 Agentic RL,从 SFT 到 GRPO 的全流程实战训练 LLM
🚀 驱动真实案例 实战开发智能旅行助手、赛博小镇等综合项目
📖 求职面试 学习智能体求职相关面试问题
#资源参考 #Agent开发 #智能体开发 #教程
Hello-Agents 是 Datawhale 社区的系统性智能体学习教程。如今 Agent 构建主要分为两派,一派是 Dify,Coze,n8n 这类软件工程类 Agent,其本质是流程驱动的软件开发,LLM 作为数据处理的后端;另一派则是 AI 原生的 Agent,即真正以 AI 驱动的 Agent。
本教程旨在带领大家深入理解并构建后者——真正的 AI Native Agent。教程将带领你穿透框架表象,从智能体的核心原理出发,深入其核心架构,理解其经典范式,并最终亲手构建起属于自己的多智能体应用。我们相信,最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点,能够从一名大语言模型的"使用者",蜕变为一名智能体系统的"构建者"。
✨ 你将收获什么?
📖 Datawhale 开源免费 完全免费学习本项目所有内容,与社区共同成长
🔍 理解核心原理 深入理解智能体的概念、历史与经典范式
🏗 亲手实现 掌握热门低代码平台和智能体代码框架的使用
🛠 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架
⚙️ 掌握高级技能 一步步实现上下文工程、Memory、协议、评估等系统性技术
🤝 模型训练 掌握 Agentic RL,从 SFT 到 GRPO 的全流程实战训练 LLM
🚀 驱动真实案例 实战开发智能旅行助手、赛博小镇等综合项目
📖 求职面试 学习智能体求职相关面试问题
#资源参考 #Agent开发 #智能体开发 #教程
datawhalechina.github.io
Hello-Agents
Description
价值20亿美元的AI Agent秘密:三个Markdown文件如何解决上下文漂移难题
Meta刚以20亿美元收购了Manus。一位开发者深入研究了其核心工作原理,并将关键模式开源分享。
AI Agent面临一个普遍困境:经过大量工具调用后,它们会逐渐迷失目标。上下文膨胀、错误被淹没、任务偏离轨道。
Manus的解决方案出奇简单——仅用三个Markdown文件:
- task_plan.md:用复选框追踪进度
- notes.md:存储研究内容,避免塞满上下文
- deliverable.md:最终交付物
核心机制是:Agent在每次决策前都会重新读取计划文件,确保目标始终停留在注意力窗口内。
这个发现引发了社区热烈讨论,也暴露出一些关键洞见:
关于"这不是什么新东西"的质疑,确实如此。Claude Code本身就会自动创建plan.md文件,Spec-kit、APM等开源工具早已实现类似工作流。但这恰恰验证了这个模式的有效性——当多个独立开发者不约而同地收敛到同一解决方案时,说明它确实解决了真实问题。
关于"写入notes.md不也是在填充上下文吗"的技术追问,这是个精准的观察。写入操作确实会产生token消耗。但关键不在于减少token数量,而在于注意力操控。LLM存在"大海捞针"问题——随着上下文增长,它们会逐渐遗忘早期目标。通过在每次重大决策前重新读取计划文件,目标被强制拉回注意力窗口。
社区提出了更进阶的方案:使用子Agent处理上下文密集型任务。主Agent保持轻量,只负责追踪进度和协调;子Agent在独立上下文中完成繁重工作后汇报结果。这样既保持了主Agent上下文的清洁,又能处理复杂任务。
一位开发者分享了他的实战经验:将Claude视为员工,一次只分配一个任务,每完成一步就提交git,全程人工审核。这是8小时工作日的节奏,不是"设置后就忘"的自动化。
关于工作流设计的最佳实践:保持CLAUDE.md极度精简,只描述核心行为预期;将数据库、API等专项知识拆分到独立文件,仅在相关任务时加载;维护一个愿望清单,让未来功能不干扰当前工作。
有人一针见血地指出:20亿美元买的不是三个Markdown文件,而是一家6个月创造1亿美元收入的公司,以及其虚拟机能力、浏览器自动化和完整Agent平台。这个模式只是其中一块拼图。
这场讨论揭示了一个更深层的趋势:上下文工程正在成为一门独立学科。我们正在见证"Agent工程师"这个新角色的诞生——他们是软件工程师,但具备云服务、API和Agent能力的综合知识。
最实用的一句话总结来自社区:Claude是我的员工,我给它分配任务、检查每个任务、控制每个步骤。不要试图让Claude一次完成所有事情,那是不可能的。
reddit | 原始技能仓库 |Spec-kit |多Agent管理框架APM | Manus上下文工程博客
#资源参考 #Agent #智能体 #AI
Meta刚以20亿美元收购了Manus。一位开发者深入研究了其核心工作原理,并将关键模式开源分享。
AI Agent面临一个普遍困境:经过大量工具调用后,它们会逐渐迷失目标。上下文膨胀、错误被淹没、任务偏离轨道。
Manus的解决方案出奇简单——仅用三个Markdown文件:
- task_plan.md:用复选框追踪进度
- notes.md:存储研究内容,避免塞满上下文
- deliverable.md:最终交付物
核心机制是:Agent在每次决策前都会重新读取计划文件,确保目标始终停留在注意力窗口内。
这个发现引发了社区热烈讨论,也暴露出一些关键洞见:
关于"这不是什么新东西"的质疑,确实如此。Claude Code本身就会自动创建plan.md文件,Spec-kit、APM等开源工具早已实现类似工作流。但这恰恰验证了这个模式的有效性——当多个独立开发者不约而同地收敛到同一解决方案时,说明它确实解决了真实问题。
关于"写入notes.md不也是在填充上下文吗"的技术追问,这是个精准的观察。写入操作确实会产生token消耗。但关键不在于减少token数量,而在于注意力操控。LLM存在"大海捞针"问题——随着上下文增长,它们会逐渐遗忘早期目标。通过在每次重大决策前重新读取计划文件,目标被强制拉回注意力窗口。
社区提出了更进阶的方案:使用子Agent处理上下文密集型任务。主Agent保持轻量,只负责追踪进度和协调;子Agent在独立上下文中完成繁重工作后汇报结果。这样既保持了主Agent上下文的清洁,又能处理复杂任务。
一位开发者分享了他的实战经验:将Claude视为员工,一次只分配一个任务,每完成一步就提交git,全程人工审核。这是8小时工作日的节奏,不是"设置后就忘"的自动化。
关于工作流设计的最佳实践:保持CLAUDE.md极度精简,只描述核心行为预期;将数据库、API等专项知识拆分到独立文件,仅在相关任务时加载;维护一个愿望清单,让未来功能不干扰当前工作。
有人一针见血地指出:20亿美元买的不是三个Markdown文件,而是一家6个月创造1亿美元收入的公司,以及其虚拟机能力、浏览器自动化和完整Agent平台。这个模式只是其中一块拼图。
这场讨论揭示了一个更深层的趋势:上下文工程正在成为一门独立学科。我们正在见证"Agent工程师"这个新角色的诞生——他们是软件工程师,但具备云服务、API和Agent能力的综合知识。
最实用的一句话总结来自社区:Claude是我的员工,我给它分配任务、检查每个任务、控制每个步骤。不要试图让Claude一次完成所有事情,那是不可能的。
reddit | 原始技能仓库 |Spec-kit |多Agent管理框架APM | Manus上下文工程博客
#资源参考 #Agent #智能体 #AI
Reddit
From the ClaudeAI community on Reddit
Explore this post and more from the ClaudeAI community
在线使用 AI Agent 经常遇到一个难题——让它读懂推特、Reddit、YouTube、小红书等网络内容,不得不面对付费 API、封锁、登录、数据清洗一大堆麻烦。
一个超级实用的开源项目 Agent Reach,能给你的 AI Agent 装上“互联网之眼”:一条命令装好工具,立刻免费读推特、搜 Reddit、看 B站视频字幕、小红书内容,全网覆盖,零 API 费用。
最强大的是,支持的平台多且丰富:Twitter、YouTube、Reddit、GitHub、Bilibili、小红书、抖音、LinkedIn、Boss直聘……还支持 RSS 订阅,覆盖你工作生活学习中的绝大多数线上信息源。
特色功能:
- 一键安装,自动配置依赖,告别复杂折腾;
- 多平台多工具联动,内置网页阅读器、视频字幕提取、语义搜索等强大功能;
- 支持 Cookie 登录,安全隐私更有保障,Cookie 只存本地不外传;
- 持续更新,渠道堵点和封锁随时修复,维护者每天都在用全力支持;
- 可插拔架构,自由替换底层工具,灵活满足个性需求。
支持所有能跑命令行的 AI Agent,如 Claude Code、Cursor、OpenClaw 等。只要一句话“帮我安装 Agent Reach”,几分钟就能给它网眼,让它驰骋于互联网海量信息。
#资源参考 #工具 #AI #Agent #智能体
一个超级实用的开源项目 Agent Reach,能给你的 AI Agent 装上“互联网之眼”:一条命令装好工具,立刻免费读推特、搜 Reddit、看 B站视频字幕、小红书内容,全网覆盖,零 API 费用。
最强大的是,支持的平台多且丰富:Twitter、YouTube、Reddit、GitHub、Bilibili、小红书、抖音、LinkedIn、Boss直聘……还支持 RSS 订阅,覆盖你工作生活学习中的绝大多数线上信息源。
特色功能:
- 一键安装,自动配置依赖,告别复杂折腾;
- 多平台多工具联动,内置网页阅读器、视频字幕提取、语义搜索等强大功能;
- 支持 Cookie 登录,安全隐私更有保障,Cookie 只存本地不外传;
- 持续更新,渠道堵点和封锁随时修复,维护者每天都在用全力支持;
- 可插拔架构,自由替换底层工具,灵活满足个性需求。
支持所有能跑命令行的 AI Agent,如 Claude Code、Cursor、OpenClaw 等。只要一句话“帮我安装 Agent Reach”,几分钟就能给它网眼,让它驰骋于互联网海量信息。
#资源参考 #工具 #AI #Agent #智能体
GitHub
GitHub - Panniantong/Agent-Reach: Give your AI agent eyes to see the entire internet. Read & search Twitter, Reddit, YouTube, GitHub…
Give your AI agent eyes to see the entire internet. Read & search Twitter, Reddit, YouTube, GitHub, Bilibili, XiaoHongShu — one CLI, zero API fees. - Panniantong/Agent-Reach
Hermes Agent:来自 Nous Research,一个开源自主 Agent、服务器驻留、定时任务、可接入多个 IM 平台,而且能持续学习你的项目、习惯和需求。
六个核心能力解析
1. 多平台消息网关
并非简单的 webhook 推送,是双向对话同步:
· 在 Telegram 发起任务,可以在 CLI 继续跟进
· 支持语音消息转录
· 所有平台共享同一个上下文状态
对需要移动办公的开发者很有价值——你可以在通勤时语音交代任务,回到电脑前查看完整结果。
2. Skills 系统
它会自动把解决过的问题写成"技能文档":
解决了一个复杂的 Docker 部署问题
→ 自动生成 SKILL.md
→ 下次遇到类似问题时直接调用
技能文件遵循 agentskills. io 开放标准,可以:
· 搜索已有技能
· 从社区 hub 安装(ClawHub、LobeHub、Claude Code Marketplace)
· 分享给其他用户
这比传统的 prompt 模板或 function calling 更有弹性——它是程序性记忆,会随着使用自动积累。
3. 定时任务(Cron)
内置调度器支持自然语言设定:
"每天早上 8 点给我发昨日代码提交摘要"
"每周五晚上备份数据库"
任务可以输出到任意已连接的消息平台。
4. Subagents 并行
可以派生隔离的 Subagents 处理并行工作流:
· 每个 Subagent 有独立的会话和终端
· 支持 Python RPC 调用工具
· 多步骤 pipeline 可以压缩成单次交互
你可以同时让多个"数字员工"处理不同任务,而主 Agent 只接收最终结果。
5. 沙箱执行环境
提供五种终端后端,安全级别递进:
· Local - 本地执行
· Docker - 容器隔离(只读 root、降权、PID 限制)
· SSH - 远程机器
· Singularity - HPC 场景
· Modal - 云函数执行
这种设计考虑到了不同场景的安全需求——日常任务用 Docker,敏感操作用更严格的隔离。
6. 完整浏览器控制
· 导航、点击、输入、截图
· 结合视觉模型分析页面
· 图像生成、TTS 集成
这让 Agent 可以处理需要人机交互的 Web 任务,比如填写表单、操作后台系统。
技术栈与部署
安装
支持的 LLM 提供商
· Nous Portal(OAuth 认证)
· OpenRouter(API Key)
· 自定义端点
Nous Research 本身是模型研发机构,他们主推的 Nous Portal 应该会有优化。
40+ 内置工具
覆盖开发工作的各个维度:
· 文件系统、终端、浏览器
· 网络搜索、视觉分析、图像生成
· 内存管理、任务规划、定时任务
· 代码执行、Subagents、Skills 管理
面向研究者的功能
作为研究机构的产品,Hermes 内置了批量处理与 RL 训练能力:
· Batch Processing - 并行生成数千条 tool-calling 轨迹,自动 checkpoint
· RL Training - 通过 Atropos 集成,支持对 Agent 行为进行强化学习训练
· Trajectory Export - 导出 ShareGPT 格式数据用于微调,支持轨迹压缩控制 token 消耗
#资源参考 #Agent #HermesAgent #Skills
六个核心能力解析
1. 多平台消息网关
并非简单的 webhook 推送,是双向对话同步:
· 在 Telegram 发起任务,可以在 CLI 继续跟进
· 支持语音消息转录
· 所有平台共享同一个上下文状态
对需要移动办公的开发者很有价值——你可以在通勤时语音交代任务,回到电脑前查看完整结果。
2. Skills 系统
它会自动把解决过的问题写成"技能文档":
解决了一个复杂的 Docker 部署问题
→ 自动生成 SKILL.md
→ 下次遇到类似问题时直接调用
技能文件遵循 agentskills. io 开放标准,可以:
· 搜索已有技能
· 从社区 hub 安装(ClawHub、LobeHub、Claude Code Marketplace)
· 分享给其他用户
这比传统的 prompt 模板或 function calling 更有弹性——它是程序性记忆,会随着使用自动积累。
3. 定时任务(Cron)
内置调度器支持自然语言设定:
"每天早上 8 点给我发昨日代码提交摘要"
"每周五晚上备份数据库"
任务可以输出到任意已连接的消息平台。
4. Subagents 并行
可以派生隔离的 Subagents 处理并行工作流:
· 每个 Subagent 有独立的会话和终端
· 支持 Python RPC 调用工具
· 多步骤 pipeline 可以压缩成单次交互
你可以同时让多个"数字员工"处理不同任务,而主 Agent 只接收最终结果。
5. 沙箱执行环境
提供五种终端后端,安全级别递进:
· Local - 本地执行
· Docker - 容器隔离(只读 root、降权、PID 限制)
· SSH - 远程机器
· Singularity - HPC 场景
· Modal - 云函数执行
这种设计考虑到了不同场景的安全需求——日常任务用 Docker,敏感操作用更严格的隔离。
6. 完整浏览器控制
· 导航、点击、输入、截图
· 结合视觉模型分析页面
· 图像生成、TTS 集成
这让 Agent 可以处理需要人机交互的 Web 任务,比如填写表单、操作后台系统。
技术栈与部署
安装
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash支持的 LLM 提供商
· Nous Portal(OAuth 认证)
· OpenRouter(API Key)
· 自定义端点
Nous Research 本身是模型研发机构,他们主推的 Nous Portal 应该会有优化。
40+ 内置工具
覆盖开发工作的各个维度:
· 文件系统、终端、浏览器
· 网络搜索、视觉分析、图像生成
· 内存管理、任务规划、定时任务
· 代码执行、Subagents、Skills 管理
面向研究者的功能
作为研究机构的产品,Hermes 内置了批量处理与 RL 训练能力:
· Batch Processing - 并行生成数千条 tool-calling 轨迹,自动 checkpoint
· RL Training - 通过 Atropos 集成,支持对 Agent 行为进行强化学习训练
· Trajectory Export - 导出 ShareGPT 格式数据用于微调,支持轨迹压缩控制 token 消耗
#资源参考 #Agent #HermesAgent #Skills
Nousresearch
Hermes Agent — The Agent That Grows With You
An open-source agent that grows with you. Install it, give it your messaging accounts, and it becomes a persistent personal agent.
❤1