硬核开源智库 – Telegram

硬核开源智库

@HardcoreOpenAI

812 subscribers

42 photos

1.12K links

提供硬核学习资源，探索开源力量，驾驭AI未来！本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源，助你站在技术浪潮之巅，实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者，都能在这里找到属于你的宝藏！

Download Telegram

About

Blog

Apps

Platform

硬核开源智库

812 subscribers

硬核开源智库

MASLab：一个为基于LLM的多Agent系统打造的统一且全面的代码库。它能解决多Agent系统开发中代码分散、数据处理不统一的问题，核心价值在于提供一站式开发平台。

集成超过20种LLM基础的多Agent方法；统一数据预处理和评估协议，确保公平对比；研究友好，采用共享的流线型结

GitHub - MASWorks/MASLab

Contribute to MASWorks/MASLab development by creating an account on GitHub.

42 views13:16

硬核开源智库

FileBrowser Quantum：开源的自托管Web文件管理器，功能丰富且高效。

支持多种登录方式，包括OIDC、密码+2FA；实时搜索与更新，文件夹大小显示；丰富的文件预览，如Office和视频文件

GitHub - gtsteffaniak/filebrowser: 📂 Web File Browser

📂 Web File Browser. Contribute to gtsteffaniak/filebrowser development by creating an account on GitHub.

50 views13:17

硬核开源智库

将简单邮箱列表转化为丰富数据集的AI驱动工具。

多Agent系统，分阶段提取数据，准确率更高；支持自定义字段，满足个性化数据需求；实时流式更新，数据处理过程一目了然

fire-enrich | #工具 #资源参考 #Agent

GitHub - firecrawl/fire-enrich: 🔥 AI-powered data enrichment tool that transforms emails into rich datasets with company profiles…

🔥 AI-powered data enrichment tool that transforms emails into rich datasets with company profiles, funding data, tech stacks, and more using Firecrawl and multi-agent AI - firecrawl/fire-enrich

51 views13:17

硬核开源智库

将你的日常浏览器变成一个强大的自动化工具。它能解决浏览器自动化难的问题，让你轻松实现各种网页任务的自动化。

提供隐身模式，避免被网站检测为自动化浏览器；支持通过命令行和浏览器扩展发送指令，操作灵活；可以与操作系统集成，实现复杂任务自动化。

Beachpatrol | #工具 #网站自动化 #资源参考

GitHub - sebastiancarlos/beachpatrol: 🏝️ A CLI Tool to Automate Your Everyday Web Browser.

🏝️ A CLI Tool to Automate Your Everyday Web Browser. - sebastiancarlos/beachpatrol

49 views13:18

硬核开源智库

一款强大的本地化翻译命令行工具，基于plamo-2-translate模型，支持16+种语言互译，轻松集成到脚本和工作流中。

支持多种服务器后端（包括MLX，未来还将支持Ollama和vLLM）；专为macOS与Apple Silicon优化，性能卓越；提供交互模式、管道模式和服务器模式，灵活满足不同需求。

plamo-translate-cli | #命令行 #工具 #资源参考 #翻译

GitHub - pfnet/plamo-translate-cli

Contribute to pfnet/plamo-translate-cli development by creating an account on GitHub.

50 views13:19

硬核开源智库

Awesome-Large-Search-Models：汇聚最新搜索导向型大语言模型（大搜索模型）的研究论文、博客及相关资源。它能为研究人员和开发者提供一站式的学习和研究平台，助力快速了解该领域的前沿动态。

涵盖基于训练和无训练的多种方法；整合丰富多样的数据集资源；提供多个热门框架链接，方便直接使用
#资源参考 #工具 #研究论文

50 views13:20

硬核开源智库

将AI Agent从想法变为生产级产品的开源实战指南

提供从零到生产级的全生命周期覆盖；包含20+可运行的教程，涵盖编排、内存、部署等关键模块；支持多Agent协作与实时安全防护

agents-towards-production | #指南 #资源参考 #AIAgent

GitHub - NirDiamant/agents-towards-production: End-to-end, code-first tutorials for building production-grade GenAI agents. From…

End-to-end, code-first tutorials for building production-grade GenAI agents. From prototype to enterprise deployment. - NirDiamant/agents-towards-production

62 views13:22

硬核开源智库

wenyan-mcp：让AI轻松管理微信公众号排版与发布一键将Markdown文章排版并发布到微信公众号草稿箱。

支持多种主题效果，一键美化文章；自动上传本地或网络图片，操作便捷；提供Docker部署方式，适合服务器环境与AI工具链集成。
#资源参考 #MCP #微信公众号

GitHub - caol64/wenyan-mcp: 文颜 MCP Server 可以让 AI 自动将 Markdown 文章排版后发布至微信公众号。

文颜 MCP Server 可以让 AI 自动将 Markdown 文章排版后发布至微信公众号。. Contribute to caol64/wenyan-mcp development by creating an account on GitHub.

61 views13:24

硬核开源智库

Spy Search：一款专为快速高效搜索设计的Agent框架，旨在超越传统网页搜索Agent。

极速搜索，比传统搜索引擎更快；支持多种API，如OpenAI、Claude等；提供Docker部署，方便开发者快速上手

GitHub - JasonHonKL/spy-search: LLM search engine faster than perplexity!

LLM search engine faster than perplexity! Contribute to JasonHonKL/spy-search development by creating an account on GitHub.

73 views13:25

硬核开源智库

SearchPromptly：一个平台，用户可以在这里发现、创建和分享强大的提示词，以及探索人工智能的创造性应用。
#资源参考 #提示词

Home to the best ideas in AI.

Generate detailed prompts and explore community collections for creative ways to use AI

71 views13:26

硬核开源智库

AgentsMeetRL：一个超实用的开源项目集合，专门整理了基于强化学习训练LLM Agent的开源资源。

涵盖多领域项目，包括数学、搜索、对话等；涉及多种强化学习框架和算法；提供详细的项目信息，方便开发者快速上手

GitHub - thinkwee/AgentsMeetRL: Awesome List for Agentic RL

Awesome List for Agentic RL. Contribute to thinkwee/AgentsMeetRL development by creating an account on GitHub.

72 views13:31

硬核开源智库

graph-rag-agent：基于GraphRAG与DeepSearch构建的智能问答系统，结合多Agent协作与知识图谱增强，助力复杂问题的高效解答。

多Agent协同架构，提升复杂问题处理能力；完整评估系统，提供20+种评估指标；思考过程可视化，展示AI推理轨迹
#资源参考 #AI #RAG

GitHub - 1517005260/graph-rag-agent: 拼好RAG：手搓并融合了GraphRAG、LightRAG、Neo4j-llm-graph-builder进行知识图谱构建以及搜索；整合DeepSearch技术实现私域RAG的推…

拼好RAG：手搓并融合了GraphRAG、LightRAG、Neo4j-llm-graph-builder进行知识图谱构建以及搜索；整合DeepSearch技术实现私域RAG的推理；自制针对GraphRAG的评估框架| Integrate GraphRAG, LightRAG, and Neo4j-llm-graph-builder for knowledge graph construct...

61 views13:32

硬核开源智库

cpdown：一键将网页内容或YouTube字幕复制为干净的Markdown格式。轻松提取网页正文并转换为Markdown，提升内容整理效率。

支持一键复制网页内容和YouTube字幕为Markdown；使用Defuddle或Mozilla Readability提取正文，去除多余HTML元素；显示复制内容的Token数量，适配LLM使用
#资源参考 #一键将网页内容或YouTube字幕复制

GitHub - ysm-dev/cpdown: 📥 cpdown - Copy to clipboard any webpage content/youtube subtitle as clean markdown with one click or…

📥 cpdown - Copy to clipboard any webpage content/youtube subtitle as clean markdown with one click or shortcut - ysm-dev/cpdown

59 views13:39

硬核开源智库

PandaWiki：AI大模型驱动的开源知识库搭建系统，轻松构建智能化文档与问答平台。

支持AI创作、AI问答、AI搜索，提升知识管理效率；强大的富文本编辑能力，兼容多种格式；轻松集成第三方应用，支持网页挂件与聊天机器人
#资源参考 #RAG

GitHub - chaitin/PandaWiki: PandaWiki 是一款 AI 大模型驱动的开源知识库搭建系统，帮助你快速构建智能化的产品文档、技术文档、FAQ、博客系统，借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索等能力。

PandaWiki 是一款 AI 大模型驱动的开源知识库搭建系统，帮助你快速构建智能化的产品文档、技术文档、FAQ、博客系统，借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索等能力。 - chaitin/PandaWiki

53 views13:40

硬核开源智库

Strands Agents Tools：为AI Agent提供强大工具集，轻松构建智能Agent。

提供文件操作、API交互、数学计算等20多种实用工具；支持多Agent协作与共享内存，提升复杂任务处理效率；无缝集成AWS服务，拓展AI应用场景

GitHub - strands-agents/tools: A set of tools that gives agents powerful capabilities.

A set of tools that gives agents powerful capabilities. - strands-agents/tools

59 views13:42

硬核开源智库

强大的网页爬取与数据提取应用，助力高效采集网络信息。

高级爬虫功能，支持深度、速度和目标内容高度定制；多语言搜索，可针对不同国家和地区进行内容采集；提供Python、Node.js、Go等多语言客户端SDK，无缝对接多种开发环境

WaterCrawl | #爬虫 #资源参考

63 views13:43

硬核开源智库

暴躁的教授读论文

⭐️ 项目功能：AI教授

📁 项目简介：一个提高学术论文阅读效率的AI伴侣。通过集成多种功能，如PDF处理、AI翻译、RAG检索、AI问答和语音交互，为学术研究者提供了一站式的论文阅读解决方案。

可以通过该应用导入PDF文件，自动提取和翻译内容，并以中英文对照的方式进行阅读。

🌐 项目地址：点击直达

GitHub - LYiHub/mad-professor-public: An AI companion for reading papers.

An AI companion for reading papers. Contribute to LYiHub/mad-professor-public development by creating an account on GitHub.

54 views13:45

硬核开源智库

IsGPT

⭐️ 网站功能：AI生成内容检测

📁 网站简介：一个检测文本是否由人工智能生成的工具，能够分析各种类型的文本，包括学术论文、商业文档、创意写作、技术文档和日常内容。

只需将文本粘贴到网站上，IsGPT会提供一个检测报告，显示文本中AI生成内容的百分比。可以在201种语言中进行检测和分析。

🔗 网站网址：点击打开

AI Content Detector

Free, fast, and reliable AI content detector

69 views13:47

硬核开源智库

Get Z-Library

⭐️ 网站功能：Zlibrary地址获取

📁 网站简介：Z-Library是一个大型的在线图书馆，被FBI通缉域名经常被封。该网站每天更新最新的可用域名，以确保用户能够顺利访问Z-Library。

还可以通过发送邮件到指定邮箱，快速获取最新的Z-Library官网地址。

🔗 网站网址：点击打开

69 views13:48

硬核开源智库

Gemini 的产品和研发负责人录了个视频

讨论了一下关于关于优秀编码模型的理念以及 Vibe Coding 的影响，以及编程语言的未来

很多见解挺好的，说明 Gemini 的代码能力进步还是有方法的

视频：https://youtu.be/jwbG_m-X-gE?si=u0nz9RxOaUlhW_Ab

总结了一些我觉得重要的内容：

📌 谷歌 Gemini 团队的编码模型训练方法论

🎯 Gemini 早期编程目标及其局限性

1️⃣ 竞技编程（Competitive programming）：尽管像OpenAI等公司在评估模型编程能力方面做了很好的工作（如human eval），但竞技编程的能力并不一定等同于一个强大的团队成员所需要的技能，因此这与开发者最终的需求有所偏差

2️⃣ LMS（Language Model Systems）：这也不是日常开发工作的真实写照

3️⃣ 代码补全（Code completion）：这虽然更具生产力，但其应用空间有限，不足以体现模型现在和未来能够实现的所有功能。

Danny Tarlo认为，前两个目标并不能真正反映开发者的实际工作，而第三个目标则不够宏大。

仅仅关注竞技编程是不够的，因为它无法涵盖软件开发人员日常工作中的更广泛能力需求。竞技编程通常是在一个"非常自给自足的环境中"工作，从零开始构建相对简短的解决方案。然而，软件开发人员日常工作涉及处理大型代码库中的错误报告，这些错误可能分散在"代码库中一百个不同的位置"。因此，模型需要的能力集远大于竞技编程所包含的。

💡 Gemini 编程优化当前关注的"核心要素"：

1️⃣ 数据与方法论：Danny强调，一个优秀的编程模型主要取决于"数据和方法论"，太鸡贼了最重要的内容一笔带过。

2️⃣ 代码库上下文的重要性（Repo Context）：代码库上下文是如此重要。模型不仅要处理代码补全，更要支持"多文件编辑，比只给你几行代码更大的更改"。目标是让模型能够帮助开发者在代码库的上下文中进行需要一小时完成的复杂工作。

Release Notes: Building Gemini's coding capabilities

Connie Fan, Product Lead for Gemini's coding capabilities, and Danny Tarlow, Research Lead for Gemini's coding capabilities, join host Logan Kilpatrick for an in-depth discussion on how the team built one of the world's leading AI coding models. Learn more…

105 views13:54

硬核开源智库

Simba 是一个开源知识管理系统，旨在与任何检索增强生成 (RAG) 系统无缝集成。

借助现代化的 UI 和模块化架构，开发人员可以专注于构建人工智能解决方案，而不必担心知识管理的复杂性。

🧬 https://github.com/GitHamza0206/simba

#tools #资源参考 #RAG

GitHub - GitHamza0206/simba: OpenSource Production ready Customer service with built in Evals and monitoring

OpenSource Production ready Customer service with built in Evals and monitoring - GitHamza0206/simba

130 views14:06