硬核开源智库 – Telegram

硬核开源智库

@HardcoreOpenAI

812 subscribers

42 photos

1.12K links

提供硬核学习资源，探索开源力量，驾驭AI未来！本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源，助你站在技术浪潮之巅，实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者，都能在这里找到属于你的宝藏！

Download Telegram

About

Blog

Apps

Platform

硬核开源智库

812 subscribers

硬核开源智库

用AI自学高深难懂的知识，方法分享

作者一直自信能学会各种知识，曾是国家物理奥赛前十，大学拿过总统奖，创业自学软件和商业运营。但AI出现后，他的学习方式发生了根本变化。

很多人用AI提速学习，比如提炼笔记、翻译文献，但更重要的是，AI让我们有可能攻克那些以前觉得“太难、太耗时”的高阶知识。比如量子力学，顶级教材200小时才能读完，工作繁忙的你没法挤出这么多时间。AI让你有两条路：
1️⃣ 用AI快速扫一堆入门书籍和视频，获得广度（但收益递减）；
2️⃣ 用AI辅助，直接深入阅读权威教材，哪怕没读完，也能获得深度理解。

作者选择了第二条路，示范用AI逐步自学Christopher Bishop的《Pattern Recognition and Machine Learning》前32页，这是一本面向高年级本科和博士新生的经典教材，深度挑战适中。

核心工具组合：
- 教材PDF（能用OCR提取文字、公式、图片）
- AI模型
- 数字白板（作者用自己团队开发的Heptabase）

学习步骤：
1️⃣ 解析PDF，精确控制AI上下文，避免只读片段导致的理解偏差。
2️⃣ 生成学习卡片（章节或小节），可以让AI帮你翻译、总结、提炼定义和引导问题，适合你的学习习惯和难点。
3️⃣ 在白板上并排排布卡片，轻松“横向对比”内容，不用翻页就能联想和串联知识，随时和AI对话，问问题、求例题、检验理解，像随身带个读书导师。
4️⃣ 读完及时用自己的话写笔记，整理成层级清单，强化逻辑结构。
5️⃣ 反复拆解、视觉化笔记，画箭头连接知识点，深化理解，方便整合跨书跨领域的知识。

这套方法让作者能持续保持深度学习流状态，轻松攻克复杂难题。AI不是“代替思考”，而是“激发更深层次思考”，它是作者最棒的老师和思考伙伴。

附录：选书和合法获取PDF技巧
- 先用AI帮你挑选最权威、适合你的教材，反复打磨提问prompt。
- 多途径交叉验证书籍权威度和适读性。
- 利用Project Gutenberg、FreeTechBooks等开放资源，或作者官网获取免费正版教材。
- 书太难？用AI辅助阅读频率作为判定标准，适度挑战最有效。
#资源参考 #学习教程

The Best Way to Use AI for Learning

An effective method of learning complex knowledge with AI.

132 views13:54

硬核开源智库

在线开发搭建 web 应用时，常常要花很多时间写重复的代码，或者在 FastAPI 里集成 HTML 渲染很麻烦。

Air 是由《Two Scoops of Django》作者打造的全新 Python Web 框架，基于 FastAPI、Starlette 和 Pydantic，专注于让你用 Python 优雅快速地写出网页和接口。| #框架

不仅支持高效的 HTML 代码生成（Air Tags），还能无缝混合 Jinja 模板，完美支持 HTMX，内置表单验证，极大提升开发体验。

主要功能：

- 结合 FastAPI，前后端同框开发，接口和网页一站式管理；
- Air Tags：用 Python 类写 HTML，类型安全且易维护；
- 支持 Jinja 模板和 Air Tags 混合渲染，灵活自由；
- 内置 HTMX 支持，轻松实现页面局部刷新和交互；
- Pydantic 驱动的表单验证，保证数据安全准确；
- 轻量，易学，文档详细，适合快速上手和大型项目。

只需 pip install -U air 即可安装，适合想用 Python 快速构建现代 Web 应用的开发者。让你写代码更专注，效率更高，体验更佳

GitHub - feldroy/air: The first web framework designed for AI to write. Built on Python, FastAPI, Pydantic, and HTMX. By the authors…

The first web framework designed for AI to write. Built on Python, FastAPI, Pydantic, and HTMX. By the authors of Two Scoops of Django. - feldroy/air

134 views14:05

硬核开源智库

RapidOCR

⭐️ 项目功能：图像转文本

📁 项目简介：一个开源的光学字符识别（OCR）工具，支持多种编程语言，提供快速、灵活且高效的OCR解决方案，支持中文和英文的识别，并允许用户在离线环境中快速部署。

🌐 项目地址：点击直达

GitHub - RapidAI/RapidOCR: 📄 Awesome OCR multiple programing languages toolkits based on ONNX Runtime, OpenVINO, MNN, PaddlePaddle…

📄 Awesome OCR multiple programing languages toolkits based on ONNX Runtime, OpenVINO, MNN, PaddlePaddle, TensorRT and PyTorch. - RapidAI/RapidOCR

134 views14:06

硬核开源智库

Google AI Edge Gallery

⭐️ 软件功能：离线AI助手

➡️ 支持平台：#Android

📁 软件简介：一款将先进的生成式人工智能（GenAI）模型直接带入用户的手中，支持在Android设备上离线运行。可以在没有互联网连接的情况下，体验各种创意和实用的AI应用场景。

允许轻松切换不同的AI模型，进行图像分析、音频转录、对话交互等多种功能，所有处理均在本地设备上完成

⬇️ 软件下载：点击下载

Releases · google-ai-edge/gallery

A gallery that showcases on-device ML/GenAI use cases and allows people to try and use models locally. - google-ai-edge/gallery

147 views14:07

硬核开源智库

在线零知识证明编程语言太复杂？Lurk来了！

Lurk 是一个基于 Lisp 设计的图灵完备 zk-SNARKs 编程语言，结合了 Scheme 和 Common Lisp 的优点。它能生成简洁高效的零知识证明，支持任意计算的证明，是区块链和隐私计算领域的利器。

- 静态作用域，语法简洁，极易扩展；
- 生成的证明体积小，验证速度快；
- 代码即数据，天然支持内容寻址；
- 目前版本 0.5，持续优化中，性能提升显著。

适合密码学研究者和区块链开发者探索零知识证明编程新可能。

GitHub - lurk-lab/lurk: Lurk is a Turing-complete programming language for zk-SNARKs. It is a statically scoped dialect of Lisp…

Lurk is a Turing-complete programming language for zk-SNARKs. It is a statically scoped dialect of Lisp, influenced by Scheme and Common Lisp. - lurk-lab/lurk

132 views05:25

硬核开源智库

Agentic RAG：AI工程师必知的进阶检索生成框架

简单的RAG（Retrieval-Augmented Generation）系统很少直接用在实际场景。现实中，我们通常会给RAG加上“智能代理”（Agentic）能力，且尽量保持简洁。

没有放之四海皆准的方案，RAG系统必须根据具体业务灵活调整。理解Agentic RAG的关键组成，有助你设计适合自己的方案：

1️⃣ 用户查询分析
- 由基于大模型（LLM）的智能代理分析原始查询，可能重写或拆分成多条查询。
- 判断是否需要额外数据源。

2️⃣ 触发检索
- 若需更多数据，智能代理负责确定应调用哪些数据源，如实时用户数据、内部文档、网络信息等。

3️⃣ 数据整合与重排序
- 用更强的模型对检索结果进行筛选和重排名，大幅缩小信息范围。

4️⃣ 无需额外数据时，直接由LLM生成答案或执行多步动作。

5️⃣ 答案评估与循环优化
- 智能代理评判答案的准确性和相关性。
- 不达标时重新改写查询，重复生成，循环次数有限制。

💡 经验分享：
- 尽量简化流程，很多场景不需全部环节即可满足需求。
- 数据预处理和重排序环节是关键，覆盖90%以上应用。
- Agentic系统远超传统RAG，不只是问答，更能自动执行后续动作，未来会有更多分享，敬请关注！

Agentic RAG的核心在于“智能代理”的灵活决策能力，真正实现从理解用户意图到智能调取数据，再到动态生成和校验答案的全流程闭环。相比传统RAG，Agentic RAG更适合复杂业务场景，尤其是需要自动化执行操作的企业应用。未来AI系统的发展趋势将是“理解+检索+行动”的深度融合，而不仅仅是回答问题。

X (formerly Twitter)

Aurimas Griciūnas (@Aurimas_Gr) on X

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗥𝗔𝗚 and what you need to know about it as an AI Engineer?

Simple naive RAG systems are rarely used in real world applications. We are usually adding some agency to the RAG system - ideally a minimal amount.

There is 𝗻𝗼 𝘀𝗶𝗻𝗴𝗹𝗲 𝗯𝗹𝘂𝗲𝗽𝗿𝗶𝗻𝘁 on how

114 views05:26

硬核开源智库

在线寻找音乐资源总是要翻遍各大平台，下载工具、播放器、歌词插件……太多分散工具使用起来很麻烦。

Music Megathread 是一个超全的音乐资源合集，汇集了免费音乐播放器、多平台下载器、流媒体客户端、歌词工具、音乐识别和管理软件，甚至还有Telegram音乐机器人，帮你轻松玩转音乐世界。

不仅支持 Spotify、YouTube Music、Deezer 等主流平台，还覆盖离线播放器、音频编辑、曲库管理、音效合成等丰富功能，满足各种音乐需求。| #音乐

核心亮点：

- 多平台音乐播放器和下载工具，支持Windows、macOS、Linux、Android、iOS；
- 丰富的 Spotify 和 YouTube Music 客户端及辅助工具，解锁更多功能；
- 在线与离线音乐管理、编辑、歌词同步与显示，一站式解决方案；
- 海量音乐识别与元数据编辑工具，方便整理个人音乐库；
- 全面支持音频录制、合成、转换、编辑，适合音乐制作爱好者；
- 集成多种Telegram音乐机器人，聊天中也能轻松找歌听歌。

适合音乐爱好者、音乐制作人、DJ、音频发烧友，帮你更高效地发现、管理和享受音乐。
#音乐资源 #工具 #资源参考

GitHub - MoonWalker440/Music-Megathread: A Comprehensive List For All Music 🎶 Lovers. It's a treasure trove of music resources…

A Comprehensive List For All Music 🎶 Lovers. It's a treasure trove of music resources to enhance your listening experience and discover new music. - MoonWalker440/Music-Megathread

118 views05:26

硬核开源智库

在线智能问答系统，文档上传、向量检索、模型推理一体化，轻松实现本地RAG入门体验。

Local PDF Chat RAG 是一个开源项目，专为想理解并动手实践检索增强生成（RAG）技术的初学者设计。它结合了PDF处理、FAISS向量检索、多模型集成等核心模块，帮助你从源码层面掌握RAG的底层流程。

主要功能：

- 多PDF文档上传与自动文本切割向量化
- 本地FAISS向量数据库构建与高效语义检索
- 混合BM25关键词检索提升召回率
- 交叉编码器及大模型（支持本地 Ollama 和云端 SiliconFlow）结果重排序
- 支持联网搜索增强回答的时效性（需配置SerpAPI密钥）
- 递归式深度检索，自动生成新查询，提升答复深度
- Gradio交互式Web UI，操作简单直观
- 本地化优先，保护数据隐私

适合科研、开发者和RAG技术爱好者快速上手，理解RAG的全流程细节。
#资源参考 #工具 #RAG

GitHub - weiwill88/Local_Pdf_Chat_RAG: 🧠 纯原生 Python 实现的 RAG 框架 | FAISS + BM25 混合检索 | 支持 Ollama / SiliconFlow | 适合新手入门学习

🧠 纯原生 Python 实现的 RAG 框架 | FAISS + BM25 混合检索 | 支持 Ollama / SiliconFlow | 适合新手入门学习 - weiwill88/Local_Pdf_Chat_RAG

101 views05:27

硬核开源智库

Website Headlines (dotcom)——网站标题灵感收集

网站标题能决定销售成败，这个网站提供丰富的高效标题库，汇聚 SaaS、B2B 和 DTC 品牌的成功案例。每个标题都附有截图，方便用户获取灵感。

理想的标题长度为 6-12 个字，SEO 和社交分享时最好控制在 55 个字符内。避免模糊和冗长的表达，确保标题清晰、有吸引力
#网站标题 #SEO #社交媒体 #资源参考 #工具

Websiteheadlines

Website Headlines (dotcom)

Browse hundreds of the best website headlines and explore creative, real-world examples from SaaS, B2B, and DTC brands to inspire your website marketing copy.

110 views05:29

硬核开源智库

当贝AI

⭐️ 网站功能：AI助手

📁 网站简介：一个集成了多种优质AI大模型的平台，提供了DeepSeek满血版，聚合了全网的AI资源，如DeepSeek-R1 671B、豆包、通义千问和智谱等。

可以在平台上进行各种AI相关的查询和操作，享受免费的服务，且没有使用限制。

🔗 网站网址：点击打开

当贝AI官网,当贝AI

当贝AI，体验DeepSeek满血版，聚合全网优质AI大模型，如DeepSeek-R1 671B、豆包、通义千问、智谱等。当贝AI知识库，深度AI解决方案，极速、高效、免费、无需注册、不限量！

111 views05:30

硬核开源智库

Snippai

⭐️ 软件功能：截图

➡️ 支持平台：#Windows #macOS #Linux

📁 软件简介：一款功能强大的智能截图工具，不仅能够识别图像中的公式和文本，还能分析和描述图像内容。

主要功能包括公式识别、文本提取、表格转换、图像分析、问题解决、代码理解、颜色检测和语言翻译等。

⬇️ 软件下载：点击下载

Releases · xyTom/snippai

Snip Anything Solve Everything. Contribute to xyTom/snippai development by creating an account on GitHub.

114 views05:31

硬核开源智库

Table Detection & Extraction

⭐️ 插件功能：网页表格提取

➡️ 支持平台：#Chrome

📁 插件简介：一款智能表格提取工具，能够快速识别网页上的HTML表格并将其转换为30多种格式，包括CSV、JSON、Excel等。

只需在浏览器中悬停在表格上，即可看到转换图标，点击后即可选择所需的格式进行提取。

⬇️ 插件下载：点击下载

Table Detection & Extraction - Chrome Web Store

Smart table extractor with intelligent table detection for instant webpage table extraction. Convert HTML tables to 30+ formats.

❤1

116 views05:33

硬核开源智库

Sinkto

⭐️ 网站功能：短链接生成

📁 网站简介：一个 URL 短链接生成和链接管理平台，可以创建、管理和跟踪品牌化的短链接，提供先进的分析工具、自定义域名、二维码生成以及团队协作功能。

可以实时监控点击率、地理数据和来源，确保每个链接的有效性和安全性。

🔗 网站网址：点击打开

Free URL Shortener with Analytics & Team Collaboration | Sinkto.Link

Free URL shortener vs Bitly, TinyURL, Rebrandly & Short.io. Save $348/year!

149 views05:42

硬核开源智库

Maivi 是一款跨平台应用，利用现代人工智能技术快速将语音转换为文本，并将文本添加到剪贴板。

它提供录音控制快捷键和实时文本显示功能。

适用于 Linux、macOS 和 Windows 系统。

🧬 https://github.com/MaximeRivest/maivi/

#tools

GitHub - MaximeRivest/maivi: Maivi - My AI Voice Input: Real-time voice-to-text local on cpu better than whisper with hotkey support

Maivi - My AI Voice Input: Real-time voice-to-text local on cpu better than whisper with hotkey support - MaximeRivest/maivi

207 views05:43

硬核开源智库

#文件传输

取文件

在线文件传输工具，不限文件格式，最大支持 10 GB，可选择过期时间和永久有效，上传发送文件后，会给到一个取件码，对方输入即可获取文件，免费使用，无需注册。

https://quwenjian.cc

取文件- 文件快递柜

开箱即用的免费文件快传系统，支持大文件快速传输、无需注册一键分享，安全高效解决个人 / 企业文件互传需求。专业文件快递柜工具，助力文件传输更便捷！

195 views05:44

硬核开源智库

全自动攻击越狱Agent

来自佐治亚理工，UIUC，清华大学等单位的研究者联合发布了一个非常有力的全自动越狱Agent，通过把有害提问分解成下级的，看似无害的提问，来绕过最强的现代商业大模型中防御机制，实现了近乎完美的攻击成功率（96%-98%）。项目主页。根据开源的代码，理论上只要配置各种key，就可以在家攻击越狱各种商业大模型。在论文中，已经被验证可以攻克Gemini系列，GPT-OSS, Claude Haiku 4.5.

🏷 #越狱 #AI安全

cka-agent.github.io

CKA-Agent: The Trojan Knowledge

Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search

192 views00:34

硬核开源智库

开源项目分享：可去除 Gemini 图片右下角可见水印

这是一款一款名为 GeminiWatermarkTool 的命令行开源工具，可离线去除 Gemini 生成图片右下角的可见水印。工具通过反向 Alpha 混合计算，还原被水印覆盖的像素，支持 jpg、png、webp 等常见格式。该工具为由 C++ 编写，无需依赖，并可批量处理目录。作者表示仅针对 Gemini 当前的可见水印，不支持去除隐藏水印。

另有开发者基于此项目开发出纯前端版本，完全在浏览器本地运行，不依赖服务器。项目使用 JavaScript 实现，通过反向 Alpha 混合算法还原原始像素，避免 AI 修补带来的不确定性。

allenk/GeminiWatermarkTool

GitHub - GargantuaX/gemini-watermark-remover: A high-performance, 100% client-side tool for removing Gemini AI watermarks. Built…

A high-performance, 100% client-side tool for removing Gemini AI watermarks. Built with pure JavaScript, it leverages a mathematically precise Reverse Alpha Blending algorithm rather than unpredict...

190 views00:05

硬核开源智库

你是否想让ChatGPT帮你准备求职面试，却不知道怎么提问才能收到最有效的指导？这里有一套实测有效的“高级提示语”框架，帮你系统性提升面试表现！

🎯 框架核心思路：
1️⃣ 角色设定：让ChatGPT扮演资深职业教练，具备10年以上行业经验，专注你所在领域。
2️⃣ 信息收集：先让AI询问关键背景信息，比如公司规模、文化、招聘经理情况、面试阶段等，确保它理解你的具体需求。
3️⃣ 定制方案：基于完整信息，AI设计个性化面试准备计划，包括行为面试题及答案框架、技术或案例题、文化契合度问题。
4️⃣ 模拟面试：逐题问答，AI即时给出结构和内容上的详细反馈，指出优点和改进点，帮助你逐步完善回答。
5️⃣ 亮点挖掘：教你如何结合简历中的关键成就，精准匹配岗位要求，突出自身优势。
6️⃣ 结尾策略：指导你如何调研公司并在面试尾声提出有深度的问题，留下好印象。

✅ 成功关键：
- AI必须先收集所有缺失信息，避免遗漏。
- 问题与反馈紧密结合职位描述和简历内容。
- 反馈具体且可操作，风格专业且积极鼓励。

举个例子，输入：
“我需要帮忙准备一场面试，我会给你职位描述和简历。你需要问我是否还需要了解公司信息、汇报对象等。”

AI优化为：
“你是一位资深职业教练，我正在准备[行业或职位]的面试。请先问我公司名称、规模、文化，招聘经理角色，面试阶段等问题，确保了解全貌。然后帮我制定详细计划，模拟问答反馈，帮我突出简历亮点，最后推荐调研和提问策略。”

📌 想用这套框架？直接试试给ChatGPT发送类似结构的提示，你会发现你的面试准备效率和质量成倍提升！

From the ChatGPTPromptGenius community on Reddit

Explore this post and more from the ChatGPTPromptGenius community

142 views05:42

硬核开源智库

日常工作、学习和创作中，信息海量且杂乱，如何高效整理和利用上下文成为挑战。

MineContext 是一个开源的主动式上下文感知AI助手，通过截屏和内容理解（未来支持多模态多源信息），实时捕获你的数字世界全貌，自动生成日/周总结、待办事项和活动记录，帮助你理清思路，提升效率。

主要功能：

- 自动截屏，持续捕捉你的数字工作环境，轻松收集海量上下文；
- 智能重现相关内容，创作时快速调取关键资料；
- 主动推送洞见和总结，让信息主动找上你；
- 本地存储，隐私安全有保障；
- 支持多API接入，灵活定制，完美贴合你的需求。

适合知识工作者、内容创作者、项目经理等多种角色。无需频繁切换工具，MineContext让你的数字生活更智能、更高效。
#资源参考 #AI #开源

MineContext/README_zh.md at main · volcengine/MineContext

MineContext is your proactive context-aware AI partner（Context-Engineering+ChatGPT Pulse） - volcengine/MineContext

124 views05:46

硬核开源智库

系统架构和扩展从来不是只靠理论就能掌握的事情。

《The Accidental CTO》由Subhash Choudhary亲述他如何从零基础到打造支撑百万店铺的Dukaan系统。

这不是枯燥的教科书，而是充满实战经验和幕后故事的系统设计手册：
- 从MVP快速迭代到大规模分布式流水线
- 复制、分片、缓存、队列的利弊权衡
- 观测性、容错设计和云成本管理的实战要点
- 真实生产环境中遇到的各种挑战与解决方案

无论你是工程师、架构师还是创业者，都能从这本书中学到如何将分布式系统从理论变成可用、可扩展、可维护的“活机器”。
#CTO #实践 #MVP

GitHub - subhashchy/The-Accidental-CTO: How I Scaled from Zero to a Million Store on Dukaan, Without a CS Degree. .. A System…

How I Scaled from Zero to a Million Store on Dukaan, Without a CS Degree. .. A System Design Handbook by Subhash Choudhary - subhashchy/The-Accidental-CTO

97 views05:48

硬核开源智库

系统提示词（system prompts）正逐渐过时 | 推特帖子

通过构建真实世界的智能Agent，我们发现一个反直觉的真理：
拼凑一大堆规则的长prompt，反而会降低模型表现。

举例来说，你先加一条退款政策规则，再加一条语气规范，接着又加一条升级流程……很快，prompt就变成一篇2000字的操作手册。
但大型语言模型（LLM）对此表现极差。

研究也验证了这个现象，称之为“指令诅咒”：
规则越多，模型对单条指令的执行能力反而越差。

更好的方法是——“上下文条件式指导”（contextually conditional guidelines）

不是把所有规则塞进一个大prompt，而是把指令拆成模块，按照当前对话上下文动态加载：

agent.create_guideline(
    condition="客户询问退款",
    action="先检查订单状态，看是否符合退款条件",
    tools=[check_order_status],
)

每条指导包含：
- 条件：何时加载？
- 动作：满足条件时执行什么？

系统后台根据当前对话状态筛选相关规则，只加载真正需要的几条。
这样，模型不用同时处理几十条规则，而只专注当前3-4条，显著提升执行效果。

这种方法叫做“对齐建模（Alignment Modeling）”，通过上下文结构化指导，让Agent更专注、一致且合规。

关键不在于等待更小或更强的模型，而是设计尊重LLM工作原理的架构。

这套思路已在开源框架 Parlant中实现，欢迎尝试
---

额外思考：

- 这其实是“上下文工程”的进阶：给模型正确、精准、及时的信息，而非一股脑堆砌。
- 这种模块化、条件触发的设计，也更便于维护和扩展。
- 与其盲目加规则，不如用工程思维把Agent当成系统来构建，而非仅靠prompt“打鸡血”。
- 长远看，等待更智能的

X (formerly Twitter)

Akshay 🚀 (@akshay_pachaar) on X

System prompts are getting outdated!

Here's a counterintuitive lesson from building real-world Agents:

Writing giant system prompts doesn't improve an Agent's performance; it often makes it worse.

For example, you add a rule about refund policies. Then…

106 views05:49