硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
在线零知识证明编程语言太复杂?Lurk来了!

Lurk 是一个基于 Lisp 设计的图灵完备 zk-SNARKs 编程语言,结合了 Scheme 和 Common Lisp 的优点。它能生成简洁高效的零知识证明,支持任意计算的证明,是区块链和隐私计算领域的利器。

- 静态作用域,语法简洁,极易扩展;
- 生成的证明体积小,验证速度快;
- 代码即数据,天然支持内容寻址;
- 目前版本 0.5,持续优化中,性能提升显著。

适合密码学研究者和区块链开发者探索零知识证明编程新可能。
Agentic RAG:AI工程师必知的进阶检索生成框架

简单的RAG(Retrieval-Augmented Generation)系统很少直接用在实际场景。现实中,我们通常会给RAG加上“智能代理”(Agentic)能力,且尽量保持简洁。

没有放之四海皆准的方案,RAG系统必须根据具体业务灵活调整。理解Agentic RAG的关键组成,有助你设计适合自己的方案:

1️⃣ 用户查询分析
- 由基于大模型(LLM)的智能代理分析原始查询,可能重写或拆分成多条查询。
- 判断是否需要额外数据源。

2️⃣ 触发检索
- 若需更多数据,智能代理负责确定应调用哪些数据源,如实时用户数据、内部文档、网络信息等。

3️⃣ 数据整合与重排序
- 用更强的模型对检索结果进行筛选和重排名,大幅缩小信息范围。

4️⃣ 无需额外数据时,直接由LLM生成答案或执行多步动作。

5️⃣ 答案评估与循环优化
- 智能代理评判答案的准确性和相关性。
- 不达标时重新改写查询,重复生成,循环次数有限制。

💡 经验分享:
- 尽量简化流程,很多场景不需全部环节即可满足需求。
- 数据预处理和重排序环节是关键,覆盖90%以上应用。
- Agentic系统远超传统RAG,不只是问答,更能自动执行后续动作,未来会有更多分享,敬请关注!

Agentic RAG的核心在于“智能代理”的灵活决策能力,真正实现从理解用户意图到智能调取数据,再到动态生成和校验答案的全流程闭环。相比传统RAG,Agentic RAG更适合复杂业务场景,尤其是需要自动化执行操作的企业应用。未来AI系统的发展趋势将是“理解+检索+行动”的深度融合,而不仅仅是回答问题。
在线寻找音乐资源总是要翻遍各大平台,下载工具、播放器、歌词插件……太多分散工具使用起来很麻烦。

Music Megathread 是一个超全的音乐资源合集,汇集了免费音乐播放器、多平台下载器、流媒体客户端、歌词工具、音乐识别和管理软件,甚至还有Telegram音乐机器人,帮你轻松玩转音乐世界。

不仅支持 Spotify、YouTube Music、Deezer 等主流平台,还覆盖离线播放器、音频编辑、曲库管理、音效合成等丰富功能,满足各种音乐需求。| #音乐

核心亮点:

- 多平台音乐播放器和下载工具,支持Windows、macOS、Linux、Android、iOS;
- 丰富的 Spotify 和 YouTube Music 客户端及辅助工具,解锁更多功能;
- 在线与离线音乐管理、编辑、歌词同步与显示,一站式解决方案;
- 海量音乐识别与元数据编辑工具,方便整理个人音乐库;
- 全面支持音频录制、合成、转换、编辑,适合音乐制作爱好者;
- 集成多种Telegram音乐机器人,聊天中也能轻松找歌听歌。

适合音乐爱好者、音乐制作人、DJ、音频发烧友,帮你更高效地发现、管理和享受音乐。
#音乐资源 #工具 #资源参考
在线智能问答系统,文档上传、向量检索、模型推理一体化,轻松实现本地RAG入门体验。

Local PDF Chat RAG 是一个开源项目,专为想理解并动手实践检索增强生成(RAG)技术的初学者设计。它结合了PDF处理、FAISS向量检索、多模型集成等核心模块,帮助你从源码层面掌握RAG的底层流程。

主要功能:

- 多PDF文档上传与自动文本切割向量化
- 本地FAISS向量数据库构建与高效语义检索
- 混合BM25关键词检索提升召回率
- 交叉编码器及大模型(支持本地 Ollama 和云端 SiliconFlow)结果重排序
- 支持联网搜索增强回答的时效性(需配置SerpAPI密钥)
- 递归式深度检索,自动生成新查询,提升答复深度
- Gradio交互式Web UI,操作简单直观
- 本地化优先,保护数据隐私

适合科研、开发者和RAG技术爱好者快速上手,理解RAG的全流程细节。
#资源参考 #工具 #RAG
Website Headlines (dotcom)——网站标题灵感收集

网站标题能决定销售成败,这个网站提供丰富的高效标题库,汇聚 SaaS、B2B 和 DTC 品牌的成功案例。每个标题都附有截图,方便用户获取灵感。

理想的标题长度为 6-12 个字,SEO 和社交分享时最好控制在 55 个字符内。避免模糊和冗长的表达,确保标题清晰、有吸引力
#网站标题 #SEO #社交媒体 #资源参考 #工具
当贝AI

⭐️ 网站功能:AI助手

📁 网站简介:一个集成了多种优质AI大模型的平台,提供了DeepSeek满血版,聚合了全网的AI资源,如DeepSeek-R1 671B、豆包、通义千问和智谱等。

可以在平台上进行各种AI相关的查询和操作,享受免费的服务,且没有使用限制。

🔗 网站网址:点击打开
Snippai

⭐️ 软件功能:截图

➡️ 支持平台:#Windows #macOS #Linux

📁 软件简介:一款功能强大的智能截图工具,不仅能够识别图像中的公式和文本,还能分析和描述图像内容。

主要功能包括公式识别、文本提取、表格转换、图像分析、问题解决、代码理解、颜色检测和语言翻译等。

⬇️ 软件下载:点击下载
Table Detection & Extraction

⭐️ 插件功能:网页表格提取

➡️ 支持平台:#Chrome

📁 插件简介:一款智能表格提取工具,能够快速识别网页上的HTML表格并将其转换为30多种格式,包括CSV、JSON、Excel等。

只需在浏览器中悬停在表格上,即可看到转换图标,点击后即可选择所需的格式进行提取。

⬇️ 插件下载:点击下载
1
Sinkto

⭐️ 网站功能:短链接生成

📁 网站简介:一个 URL 短链接生成和链接管理平台,可以创建、管理和跟踪品牌化的短链接,提供先进的分析工具、自定义域名、二维码生成以及团队协作功能。

可以实时监控点击率、地理数据和来源,确保每个链接的有效性和安全性。

🔗 网站网址:点击打开
Maivi 是一款跨平台应用,利用现代人工智能技术快速将语音转换为文本,并将文本添加到剪贴板。

它提供录音控制快捷键和实时文本显示功能。

适用于 Linux、macOS 和 Windows 系统。

🧬 https://github.com/MaximeRivest/maivi/

#tools
#文件传输

取文件

在线文件传输工具,不限文件格式,最大支持 10 GB,可选择过期时间和永久有效,上传发送文件后,会给到一个取件码,对方输入即可获取文件,免费使用,无需注册。

https://quwenjian.cc
全自动攻击越狱Agent

来自佐治亚理工,UIUC, 清华大学等单位的研究者联合发布了一个非常有力的全自动越狱Agent,通过把有害提问分解成下级的,看似无害的提问,来绕过最强的现代商业大模型中防御机制,实现了近乎完美的攻击成功率(96%-98%)。项目主页。根据开源的代码,理论上只要配置各种key,就可以在家攻击越狱各种商业大模型。在论文中,已经被验证可以攻克Gemini系列,GPT-OSS, Claude Haiku 4.5.

🏷 #越狱 #AI安全
开源项目分享:可去除 Gemini 图片右下角可见水印

这是一款一款名为 GeminiWatermarkTool 的命令行开源工具,可离线去除 Gemini 生成图片右下角的可见水印。工具通过反向 Alpha 混合计算,还原被水印覆盖的像素,支持 jpg、png、webp 等常见格式。该工具为由 C++ 编写,无需依赖,并可批量处理目录。作者表示仅针对 Gemini 当前的可见水印,不支持去除隐藏水印。

另有开发者基于此项目开发出纯前端版本,完全在浏览器本地运行,不依赖服务器。项目使用 JavaScript 实现,通过反向 Alpha 混合算法还原原始像素,避免 AI 修补带来的不确定性。

allenk/GeminiWatermarkTool
你是否想让ChatGPT帮你准备求职面试,却不知道怎么提问才能收到最有效的指导?这里有一套实测有效的“高级提示语”框架,帮你系统性提升面试表现!

🎯 框架核心思路:
1️⃣ 角色设定:让ChatGPT扮演资深职业教练,具备10年以上行业经验,专注你所在领域。
2️⃣ 信息收集:先让AI询问关键背景信息,比如公司规模、文化、招聘经理情况、面试阶段等,确保它理解你的具体需求。
3️⃣ 定制方案:基于完整信息,AI设计个性化面试准备计划,包括行为面试题及答案框架、技术或案例题、文化契合度问题。
4️⃣ 模拟面试:逐题问答,AI即时给出结构和内容上的详细反馈,指出优点和改进点,帮助你逐步完善回答。
5️⃣ 亮点挖掘:教你如何结合简历中的关键成就,精准匹配岗位要求,突出自身优势。
6️⃣ 结尾策略:指导你如何调研公司并在面试尾声提出有深度的问题,留下好印象。

成功关键:
- AI必须先收集所有缺失信息,避免遗漏。
- 问题与反馈紧密结合职位描述和简历内容。
- 反馈具体且可操作,风格专业且积极鼓励。

举个例子,输入:
“我需要帮忙准备一场面试,我会给你职位描述和简历。你需要问我是否还需要了解公司信息、汇报对象等。”

AI优化为:
“你是一位资深职业教练,我正在准备[行业或职位]的面试。请先问我公司名称、规模、文化,招聘经理角色,面试阶段等问题,确保了解全貌。然后帮我制定详细计划,模拟问答反馈,帮我突出简历亮点,最后推荐调研和提问策略。”

📌 想用这套框架?直接试试给ChatGPT发送类似结构的提示,你会发现你的面试准备效率和质量成倍提升!
日常工作、学习和创作中,信息海量且杂乱,如何高效整理和利用上下文成为挑战。

MineContext 是一个开源的主动式上下文感知AI助手,通过截屏和内容理解(未来支持多模态多源信息),实时捕获你的数字世界全貌,自动生成日/周总结、待办事项和活动记录,帮助你理清思路,提升效率。

主要功能:

- 自动截屏,持续捕捉你的数字工作环境,轻松收集海量上下文;
- 智能重现相关内容,创作时快速调取关键资料;
- 主动推送洞见和总结,让信息主动找上你;
- 本地存储,隐私安全有保障;
- 支持多API接入,灵活定制,完美贴合你的需求。

适合知识工作者、内容创作者、项目经理等多种角色。无需频繁切换工具,MineContext让你的数字生活更智能、更高效。
#资源参考 #AI #开源
系统架构和扩展从来不是只靠理论就能掌握的事情。

The Accidental CTO》由Subhash Choudhary亲述他如何从零基础到打造支撑百万店铺的Dukaan系统。

这不是枯燥的教科书,而是充满实战经验和幕后故事的系统设计手册:
- 从MVP快速迭代到大规模分布式流水线
- 复制、分片、缓存、队列的利弊权衡
- 观测性、容错设计和云成本管理的实战要点
- 真实生产环境中遇到的各种挑战与解决方案

无论你是工程师、架构师还是创业者,都能从这本书中学到如何将分布式系统从理论变成可用、可扩展、可维护的“活机器”。
#CTO #实践 #MVP
系统提示词(system prompts)正逐渐过时 | 推特帖子

通过构建真实世界的智能Agent,我们发现一个反直觉的真理:
拼凑一大堆规则的长prompt,反而会降低模型表现。

举例来说,你先加一条退款政策规则,再加一条语气规范,接着又加一条升级流程……很快,prompt就变成一篇2000字的操作手册。
但大型语言模型(LLM)对此表现极差。

研究也验证了这个现象,称之为“指令诅咒”:
规则越多,模型对单条指令的执行能力反而越差。

更好的方法是——“上下文条件式指导”(contextually conditional guidelines)

不是把所有规则塞进一个大prompt,而是把指令拆成模块,按照当前对话上下文动态加载:

agent.create_guideline(
condition="客户询问退款",
action="先检查订单状态,看是否符合退款条件",
tools=[check_order_status],
)


每条指导包含:
- 条件:何时加载?
- 动作:满足条件时执行什么?

系统后台根据当前对话状态筛选相关规则,只加载真正需要的几条。
这样,模型不用同时处理几十条规则,而只专注当前3-4条,显著提升执行效果。

这种方法叫做“对齐建模(Alignment Modeling)”,通过上下文结构化指导,让Agent更专注、一致且合规。

关键不在于等待更小或更强的模型,而是设计尊重LLM工作原理的架构。

这套思路已在开源框架 Parlant中实现,欢迎尝试
---

额外思考:

- 这其实是“上下文工程”的进阶:给模型正确、精准、及时的信息,而非一股脑堆砌。
- 这种模块化、条件触发的设计,也更便于维护和扩展。
- 与其盲目加规则,不如用工程思维把Agent当成系统来构建,而非仅靠prompt“打鸡血”。
- 长远看,等待更智能的
软件开发过程中,AI协作往往遇到代码臃肿、架构漂移和上下文稀释等难题,导致开发效率低下,调试时间超长。

Disciplined AI Software Development 是一套系统化的 AI 协作开发方法论,采用行为约束和多阶段校验机制,有效解决这些问题。

它通过四个阶段实现:

- 【行为配置】:设定AI行为约束和角色人格,保证协作一致性;
- 【协同规划】:生成结构化开发计划,明确范围、依赖和里程碑;
- 【系统实现】:分阶段、模块化编码,每次专注单一组件,控制代码规模;
- 【数据驱动迭代】:结合性能基准数据,指导持续优化,避免主观判断。

此外,方法论还提供项目结构提取工具,支持持续架构合规检测和性能回归监控。

适合希望与AI高效协作、保持代码质量和架构稳定的开发团队和研究者。

主要特性:

- 行为约束+人格模拟,防止AI输出漂移;
- 明确分阶段规划,减少返工和调试时间;
- 代码文件大小控制(≤150行)提升上下文管理;
- 自动化性能基准反馈,基于数据驱动迭代优化;
- 项目快照导出,方便架构合规审计。
EasyOffer》是一个专为LLM学习者量身打造的开源项目,汇集了大厂面经、手写代码实现和常见大模型面试题,助你深入理解底层原理,提升实习与秋招竞争力。

项目特色:

- DeepSeek 系列模型核心结构及关键模块详解
- 多种生成采样方法(Top-p、Top-k、温度采样)手写实现
- 强化学习DPO训练代码简单解析
- 持续更新 LLaMA、Qwen 等热门大模型核心代码
- 面试必备大模型手写代码题及答案

适合大模型初学者和秋招备战者。
#资源参考 #面试准备 #AI #DeepSeek #LLM
深度学习为何有效?——全息原理揭秘 | 相关视频

🔍 深度学习的核心秘密,或许藏在“全息原理”(Holographic Principle)中。这个概念来源于物理学,意味着高维信息可以浓缩于较低维度的结构中,而神经网络正是利用了类似的“张量网络”结构,实现对复杂数据的高效表达与处理。

📊 图示解析:
(a) 标量、向量、矩阵、张量的基本表示,揭示数据从简单到复杂的多维扩展。
(b) 张量的分组,说明如何将复杂结构拆解成更简单的部分,便于计算。
(c) 张量乘积与缩并,揭示神经网络中信息融合与特征抽取的数学本质。
(d) 张量网络示意,展示神经网络层间复杂连接如何通过张量缩并实现高效计算。

💡 深度学习通过张量网络将高维数据映射为紧凑结构,类似全息图将三维信息储存在二维表面。这样的结构不仅节省了计算资源,还提升了泛化能力,解释了为何深度神经网络能在海量数据中捕捉关键特征。

🔗 这为理解深度学习的工作机制提供了新的视角:不是简单的堆叠层级,而是信息的全息编码与解码过程。

——深度学习的力量,正源于对信息结构的“全息”把握。
#资源参考 #深度学习 #全息原理
1
AI工程不断迭代升级,想掌握LLM、RAG和智能代理的实战技巧?

AI Engineering Hub 是一个集深度教程与实战案例于一体的开源项目,覆盖大语言模型、检索增强生成、AI代理等前沿内容。无论你是入门者、开发者还是研究者,都能在这里找到丰富资源,助力项目落地和技能提升。

主要特色:
- 系统讲解大型语言模型(LLM)和检索增强生成(RAG)技术
- 丰富的AI智能代理实战案例,展示真实业务应用
- 详细示例代码,方便快速上手和二次开发
- 免费数据科学电子书赠送,涵盖150+核心课程,订阅即得
#资源参考 #AI Engineering Hub #LLM #RAG #AI前沿内容