硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
ai-agent-papers:AI智能体研究资源库。它为研究人员和开发者提供了一个全面的AI智能体论文集合,助力快速了解领域前沿动态。

涵盖多种智能体能力与应用场景;定期更新,紧跟最新研究成果;提供详细分类,方便快速定位感兴趣的内容
#资源参考 #AI #Agent
YouMind 是人人可用的 AI 创作工具。让每一个想创作的人,都有能力从起心动念到开始行动。

今天发布 0.3 版本,增加了类似 Manus 的一键找资料写文档功能,能搜索并保存高质量资料,同时文档可类似 Cursor 一样进行编辑。还可生成好看的配图、生成播客等。

无需邀请码,注册即可用:youmind.ai
需 PC 下访问

你是你的船,YouMind 是你的桨。
#资源参考 #Agent #AI
agent-rules:为AI编程助手打造的实用规则库,助力高效开发

提供标准化的开发流程规则,涵盖代码提交、问题分析、文档生成等;支持多种语言和框架的代码质量检查与优化;全球规则配置,一键提升AI助手能力
#资源参考 #agent
openai-cs-agents-demo:基于OpenAI Agents SDK构建的客户服务Agent演示项目

模块化设计,轻松定制和扩展Agent逻辑;智能路由,精准匹配用户需求到对应Agent;支持多种交互场景,涵盖航班查询、座位变更、取消订单等
#资源参考 #Agent #客服Agent
ai_agents_az:AI Agents A-Z项目,提供了一系列n8n模板,助力你快速构建各种AI驱动的自动化任务。

丰富的模板资源,涵盖从内容创作到社交媒体管理的多种场景;社区支持,加入Skool社区获取更多优质内容;持续更新,每周都有新模板上线
#资源参考 #AI #Agent
AlphaEvolve:由Gemini驱动的算法发现智能编程Agent,开启算法设计新纪元

核心能力:
🔹 设计更快的矩阵乘法算法,超越AlphaTensor
🔹 解决开放数学难题,涵盖分析✍️、几何📐、组合、数论🔂
🔹 优化谷歌数据中心调度、芯片设计及AI训练效率

技术优势:
🔵 结合大型语言模型,整合问题信息与历史解法,创新算法提案
🔵 自动化评估体系,精准量化算法质量与准确性
🔵 采用进化框架,迭代优化并融合多方案优势,持续提升性能

实际应用:
🔧 让谷歌计算生态更高效,节省算力资源,推动硬件与软件协同创新
🔧 加速AI模型训练,提升核心计算内核性能达23%,大幅缩短研发周期
🔧 在复杂数学领域实现75%已知最优解重现,20%超越现有最佳成果

前瞻展望:
AlphaEvolve具备跨领域广泛应用潜力,未来或突破材料科学、药物研发、可持续发展及更多技术商业场景。
#工具 #资源参考 #Agent #框架
Graphiti:实时构建面向AI智能体的知识图谱框架,专为动态环境设计,支持连续增量更新、双时间维度管理及高效混合检索,极大提升AI记忆与推理能力。| #框架 #智能体 #Agent #资源参考

核心亮点:
• 实时整合用户交互、结构化与非结构化数据,动态维护知识图谱
• 支持语义、关键词(BM25)与图遍历混合检索,响应延迟低至亚秒级
• 自定义实体定义,灵活构建适合业务的本体模型
• 双时间模型,精准记录事件发生与数据摄取时间,支持历史时点查询
• 高度可扩展,支持Neo4j、FalkorDB等后端,适合企业级大规模数据环境
• 开源免费,基于Apache 2.0协议,社区活跃,持续迭代优化

应用场景:
• AI助手记忆管理与上下文推理
• 动态企业数据整合与知识管理
• 多模态复杂查询与任务自动化

快速上手:
Python 3.10+,搭配Neo4j或FalkorDB,默认集成OpenAI LLM及嵌入服务,支持Google Gemini、Anthropic、Groq及本地Ollama模型。
#Google #Gemini #AI #Agent

⭐️
Google 推出开源 AI 开发工具「Gemini CLI」

⭐️ 开源页面

Gemini CLI 与目前市面上的 AI 编程工具最大的区别是,它提供了业界最大的免费额度:每分钟 60 次请求,每天 1000 次请求,几乎等于完全免费

它支持处理超过 100 万 token 的代码上下文,也就是说你可以用于分析大型代码库。还支持生成多模态内容、工作流自动化、媒体生成集成、实时搜索、MCP等功能
AI Doc Gen:多智能体驱动的代码库自动文档生成系统,提升代码理解与开发者入门效率。

• 多智能体架构:专门的AI agent负责代码结构、数据流、依赖关系、请求流及API分析,确保文档精准全面。
• 自动文档生成:支持自动创建结构化README,章节可灵活配置,保持文档始终更新且易维护。
• GitLab集成:无缝接入GitLab,支持自动分析与合并请求创建,优化团队协作流程。
• 并发处理:多agent并行执行,加速代码分析与文档生成,适应大型项目需求。
• 多LLM兼容:兼容OpenAI、OpenRouter及本地模型等多种LLM API,灵活选择最佳模型。
• 配置灵活:基于YAML配置文件,支持环境变量覆盖,满足不同项目定制需求。
• 可观测性:内置OpenTelemetry和Langfuse监控,实时追踪分析过程,保障系统稳定性。
• 技术栈前沿:采用Python 3.13与pydantic-ai进行agent编排,结合GitPython和python-gitlab实现仓库操作。

从根本上解决文档“腐烂”问题,推动文档与代码同步进化,实现长期维护价值最大化。适合追求高效、自动化文档管理的开发团队及开源项目。
#资源参考 #Agent #AI
多Agent协同提升代码质量的自动化框架

• 并行运行20+ Claude Code agents,最高支持50个,极大加速大规模代码库的自动化改进
• 三大工作流支持:传统Bug修复、系统化最佳实践落地、多Agent协同复杂开发
• 先进锁机制保障多Agent无冲突作业,自动管理任务分配和状态同步,避免重复和冲突
• 涵盖34种主流技术栈(Next.js、Python、Rust、Go、Java、Flutter等),配置丰富,适配广泛项目
• 实时监控面板直观显示Agent状态、上下文使用率、心跳频率及错误信息,支持tmux多视图操作
• 自动恢复与上下文管理:Agent异常自动重启,自动清理上下文防止状态溢出,支持一键广播清理命令
• 配套24套环境搭建脚本,覆盖从前端、后端到DevOps及数据工程,极大简化开发环境配置
• 细粒度Git集成:支持定制分支、增量提交与详尽HTML运行报告,保证代码变更透明且易追踪
• 灵活JSON配置系统,支持变量替换与动态块大小调整,满足不同项目和团队的个性化需求
• 安全稳健:自动备份与恢复Claude设置,文件锁定防止并发冲突,异常清理确保环境干净

该框架不仅是多Agent任务调度工具,更是面向大规模代码库的智能协同开发平台,充分利用AI并行能力与严格的作业协调机制,解决传统自动化工具难以兼顾的代码冲突与任务重复问题,极大提高代码质量和团队开发效率,具备长期演进和多场景复用价值。

Claude Code Agent Farm | #框架 #资源参考 #Agent
#资源参考 #AI #Agent #ai_agents #genai

您可以探索医疗保健、金融、教育、客户服务等众多行业的大量 AI 代理项目和用例。这些 AI 代理可自动执行医疗诊断、股票交易、个性化辅导、客户支持、产品推荐和供应链优化等任务。这些项目包含开源代码和框架,例如 CrewAI、Autogen、Agno 和 Langgraph,它们可帮助您构建、管理和协作 AI 代理,以执行编码、多代理团队合作、数据分析和工作流自动化等任务。利用这些资源可以节省您的时间、提高效率,并激发您创建满足您需求的 AI 解决方案。

https://github.com/ashishpatel26/500-AI-Agents-Projects
Motia:AI Agents的缺失后台,一站式统一后端框架,整合API、后台任务、事件与智能代理,轻松构建复杂工作流。

• 多语言支持:Python、JavaScript、TypeScript无缝协作,灵活选择最佳工具。
• 插件化Step设计:业务逻辑即Step,支持HTTP请求、事件驱动和定时任务触发。
• 内建全链路观测:自动追踪日志与状态变更,零配置实现端到端可视化调试。
• 事件驱动工作流:步骤间通过事件发布与订阅解耦,简单声明式代码构建多阶段流程。
• 统一状态管理:共享键值存储,实时追踪数据生命周期,提升调试与维护效率。
• 一键部署体验:快速启动项目,内置Workbench UI便于实时开发测试。
• 100%开源,社区活跃,持续迭代支持多种语言和云平台。

Motia解决了碎片化后端带来的部署复杂性和运维难题,是构建稳定、可扩展AI Agent系统的理想选择。
#资源参考 #Agent #AI #后端框架
Just Talk To It - the no-bs Way of Agentic Engineering:简明无废话的Agentic Engineering实战经验分享 | #经验 #资源参考 #AI实战 #Agent经验

基于Agentic Engineering的开发流程已到能自动写几乎100%代码的地步。但很多人还在绕圈子,忙着制造复杂“假象”,反而没真正产出。

这里分享了作者这一年AI辅助开发的心得,直击核心,帮你少走弯路
从零开始构建智能体》从基础理论到实际应用,全面掌握智能体系统的设计与实现

Hello-Agents 是 Datawhale 社区的系统性智能体学习教程。如今 Agent 构建主要分为两派,一派是 Dify,Coze,n8n 这类软件工程类 Agent,其本质是流程驱动的软件开发,LLM 作为数据处理的后端;另一派则是 AI 原生的 Agent,即真正以 AI 驱动的 Agent

本教程旨在带领大家深入理解并构建后者——真正的 AI Native Agent。教程将带领你穿透框架表象,从智能体的核心原理出发,深入其核心架构,理解其经典范式,并最终亲手构建起属于自己的多智能体应用。我们相信,最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点,能够从一名大语言模型的"使用者",蜕变为一名智能体系统的"构建者"。

你将收获什么?
📖 Datawhale 开源免费 完全免费学习本项目所有内容,与社区共同成长
🔍 理解核心原理 深入理解智能体的概念、历史与经典范式
🏗 亲手实现 掌握热门低代码平台和智能体代码框架的使用
🛠 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架
⚙️ 掌握高级技能 一步步实现上下文工程、Memory、协议、评估等系统性技术
🤝 模型训练 掌握 Agentic RL,从 SFT 到 GRPO 的全流程实战训练 LLM
🚀 驱动真实案例 实战开发智能旅行助手、赛博小镇等综合项目
📖 求职面试 学习智能体求职相关面试问题
#资源参考 #Agent开发 #智能体开发 #教程
价值20亿美元的AI Agent秘密:三个Markdown文件如何解决上下文漂移难题

Meta刚以20亿美元收购了Manus。一位开发者深入研究了其核心工作原理,并将关键模式开源分享。

AI Agent面临一个普遍困境:经过大量工具调用后,它们会逐渐迷失目标。上下文膨胀、错误被淹没、任务偏离轨道。

Manus的解决方案出奇简单——仅用三个Markdown文件:

- task_plan.md:用复选框追踪进度
- notes.md:存储研究内容,避免塞满上下文
- deliverable.md:最终交付物

核心机制是:Agent在每次决策前都会重新读取计划文件,确保目标始终停留在注意力窗口内。

这个发现引发了社区热烈讨论,也暴露出一些关键洞见:

关于"这不是什么新东西"的质疑,确实如此。Claude Code本身就会自动创建plan.md文件,Spec-kit、APM等开源工具早已实现类似工作流。但这恰恰验证了这个模式的有效性——当多个独立开发者不约而同地收敛到同一解决方案时,说明它确实解决了真实问题。

关于"写入notes.md不也是在填充上下文吗"的技术追问,这是个精准的观察。写入操作确实会产生token消耗。但关键不在于减少token数量,而在于注意力操控。LLM存在"大海捞针"问题——随着上下文增长,它们会逐渐遗忘早期目标。通过在每次重大决策前重新读取计划文件,目标被强制拉回注意力窗口。

社区提出了更进阶的方案:使用子Agent处理上下文密集型任务。主Agent保持轻量,只负责追踪进度和协调;子Agent在独立上下文中完成繁重工作后汇报结果。这样既保持了主Agent上下文的清洁,又能处理复杂任务。

一位开发者分享了他的实战经验:将Claude视为员工,一次只分配一个任务,每完成一步就提交git,全程人工审核。这是8小时工作日的节奏,不是"设置后就忘"的自动化。

关于工作流设计的最佳实践:保持CLAUDE.md极度精简,只描述核心行为预期;将数据库、API等专项知识拆分到独立文件,仅在相关任务时加载;维护一个愿望清单,让未来功能不干扰当前工作。

有人一针见血地指出:20亿美元买的不是三个Markdown文件,而是一家6个月创造1亿美元收入的公司,以及其虚拟机能力、浏览器自动化和完整Agent平台。这个模式只是其中一块拼图。

这场讨论揭示了一个更深层的趋势:上下文工程正在成为一门独立学科。我们正在见证"Agent工程师"这个新角色的诞生——他们是软件工程师,但具备云服务、API和Agent能力的综合知识。

最实用的一句话总结来自社区:Claude是我的员工,我给它分配任务、检查每个任务、控制每个步骤。不要试图让Claude一次完成所有事情,那是不可能的。

reddit | 原始技能仓库 |Spec-kit |多Agent管理框架APM | Manus上下文工程博客
#资源参考 #Agent #智能体 #AI
在线使用 AI Agent 经常遇到一个难题——让它读懂推特、Reddit、YouTube、小红书等网络内容,不得不面对付费 API、封锁、登录、数据清洗一大堆麻烦。

一个超级实用的开源项目 Agent Reach,能给你的 AI Agent 装上“互联网之眼”:一条命令装好工具,立刻免费读推特、搜 Reddit、看 B站视频字幕、小红书内容,全网覆盖,零 API 费用。

最强大的是,支持的平台多且丰富:Twitter、YouTube、Reddit、GitHub、Bilibili、小红书、抖音、LinkedIn、Boss直聘……还支持 RSS 订阅,覆盖你工作生活学习中的绝大多数线上信息源。

特色功能:

- 一键安装,自动配置依赖,告别复杂折腾;
- 多平台多工具联动,内置网页阅读器、视频字幕提取、语义搜索等强大功能;
- 支持 Cookie 登录,安全隐私更有保障,Cookie 只存本地不外传;
- 持续更新,渠道堵点和封锁随时修复,维护者每天都在用全力支持;
- 可插拔架构,自由替换底层工具,灵活满足个性需求。

支持所有能跑命令行的 AI Agent,如 Claude Code、Cursor、OpenClaw 等。只要一句话“帮我安装 Agent Reach”,几分钟就能给它网眼,让它驰骋于互联网海量信息。
#资源参考 #工具 #AI #Agent #智能体
Hermes Agent:来自 Nous Research,一个开源自主 Agent、服务器驻留、定时任务、可接入多个 IM 平台,而且能持续学习你的项目、习惯和需求。

六个核心能力解析

1. 多平台消息网关
并非简单的 webhook 推送,是双向对话同步:
· 在 Telegram 发起任务,可以在 CLI 继续跟进
· 支持语音消息转录
· 所有平台共享同一个上下文状态
对需要移动办公的开发者很有价值——你可以在通勤时语音交代任务,回到电脑前查看完整结果。

2. Skills 系统
它会自动把解决过的问题写成"技能文档":
解决了一个复杂的 Docker 部署问题
→ 自动生成 SKILL.md
→ 下次遇到类似问题时直接调用
技能文件遵循 agentskills. io 开放标准,可以:
· 搜索已有技能
· 从社区 hub 安装(ClawHub、LobeHub、Claude Code Marketplace)
· 分享给其他用户
这比传统的 prompt 模板或 function calling 更有弹性——它是程序性记忆,会随着使用自动积累。

3. 定时任务(Cron)
内置调度器支持自然语言设定:
"每天早上 8 点给我发昨日代码提交摘要"
"每周五晚上备份数据库"
任务可以输出到任意已连接的消息平台。

4. Subagents 并行
可以派生隔离的 Subagents 处理并行工作流:
· 每个 Subagent 有独立的会话和终端
· 支持 Python RPC 调用工具
· 多步骤 pipeline 可以压缩成单次交互
你可以同时让多个"数字员工"处理不同任务,而主 Agent 只接收最终结果。

5. 沙箱执行环境
提供五种终端后端,安全级别递进:
· Local - 本地执行
· Docker - 容器隔离(只读 root、降权、PID 限制)
· SSH - 远程机器
· Singularity - HPC 场景
· Modal - 云函数执行
这种设计考虑到了不同场景的安全需求——日常任务用 Docker,敏感操作用更严格的隔离。

6. 完整浏览器控制
· 导航、点击、输入、截图
· 结合视觉模型分析页面
· 图像生成、TTS 集成
这让 Agent 可以处理需要人机交互的 Web 任务,比如填写表单、操作后台系统。

技术栈与部署

安装
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

支持的 LLM 提供商
· Nous Portal(OAuth 认证)
· OpenRouter(API Key)
· 自定义端点
Nous Research 本身是模型研发机构,他们主推的 Nous Portal 应该会有优化。

40+ 内置工具
覆盖开发工作的各个维度:
· 文件系统、终端、浏览器
· 网络搜索、视觉分析、图像生成
· 内存管理、任务规划、定时任务
· 代码执行、Subagents、Skills 管理

面向研究者的功能
作为研究机构的产品,Hermes 内置了批量处理与 RL 训练能力:
· Batch Processing - 并行生成数千条 tool-calling 轨迹,自动 checkpoint
· RL Training - 通过 Atropos 集成,支持对 Agent 行为进行强化学习训练
· Trajectory Export - 导出 ShareGPT 格式数据用于微调,支持轨迹压缩控制 token 消耗
#资源参考 #Agent #HermesAgent #Skills
1