硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
Zread

⭐️ 网站功能:AI代码维基平台

📁 网站简介:个专注于深度研究的AI代码维基平台,提供多语言指南、架构见解和社区讨论。

可以在平台上发现和添加私有代码库,查看本周热门代码库,获取反馈,并参与社区互动。

🔗 网站网址:点击打开
HumanifyJS 利用大型语言模型(如 ChatGPT、llama)结合 Babel 等工具,实现 JavaScript 代码的高质量反混淆与还原,保持代码功能完全等价。

• 无需 Python,版本2显著提升代码维护性与用户体验
• 支持三种模式:OpenAI/Gemini 云端精确模式(需 API Key,按代码长度计费)、本地模式(免费但速度和准确度受限)
• 结合 ChatGPT 提供智能变量与函数重命名建议,Babel 插件完成 AST 级别结构还原
• 内置 Webcrack,自动解包 Webpack 打包文件
• 本地模式支持 Mac M 系列芯片 GPU 加速,自动切换 CPU,充分利用硬件性能
• 安装便捷:Node.js 20+ 环境下,全局 npm 安装或 npx 运行即用
• 处理大文件时需注意 ChatGPT token 消耗成本,示例:Bootstrap 压缩包反混淆约 0.5 美元

精准还原被混淆的 JS 代码,助力安全审计、逆向分析与代码维护,降低阅读和理解门槛,提升研发效率。
AI-Crash-Course,助你两周内高效掌握核心进展:

• 创始人Henry Shi,传统软件创始人成功转型AI,汇总必读资源,聚焦实战与前沿
• 系统学习路径:从神经网络基础到大型语言模型(LLM)系列;精选2023-2025年最新Survey综述论文
• 重点论文覆盖基础建模(Transformer、Scaling Laws、RLHF等)、规划推理(AlphaZero、CoT、ReACT、ARC-Prize)及应用(Toolformer、GPT4、Llama3、Gemini1.5)
• 强调最新突破:无监督强化学习DeepSeek、无需奖励模型的DPO、人类水平评估LLM-as-Judge等
• 丰富辅助资源:顶级视频讲座(3Blue1Brown、Andrej Karpathy)、前沿课程(Full Stack Deep Learning)、详尽提示工程指南
• 跨领域视角:视觉Transformer、扩散模型Latent Diffusion,拓展非LLM AI知识边界
• 结构化阅读清单兼具理论深度与实践指导,帮助从业者快速定位重点,直击AI技术发展关键节点
#资源参考 #AI课程 #AI资源
新书《Agentic Design Patterns》由谷歌专家 Antonio Gulli 编写,深入探讨现代 AI agent 设计的实用范式与架构,打破传统 LLM 局限,推动智能体演进。| #电子书

• 系统化总结 AI agent 设计模式,涵盖决策、执行、环境交互及多 agent 协作。
• 聚焦 agent 的自主性与适应能力,提升模型的动态响应和任务完成效率。
• 案例驱动,结合前沿研究与实践,帮助开发者构建可扩展、高效的智能系统。
• 兼顾理论深度与工程实用,适合 AI 研发者、架构师及高级研究人员长期参考。
• 体现智能体从单纯语言模型向具备代理能力系统的转变,超越传统学术范式。

这本书极具前瞻性,适合想掌握 AI agent 最新设计策略的专业人士。
Get Jobs【工作无忧】 :覆盖主流招聘平台的自动投递利器,助力程序员精准高效求职:

• 支持Boss、前程无忧、猎聘、拉勾、智联招聘五大平台,自动投递简历,省时省力
• AI智能匹配岗位,自动生成个性化打招呼语(Boss专属),提升HR回复率📈
• 支持Boss直聘发送图片简历,主动出击无需等待HR索要,显著增加曝光率📷
• 定时投递功能,自动重复投递,保障每天高频覆盖,不错过任何机会
• 智能过滤不活跃HR、猎头岗位及不符合期望薪资岗位,精准投递,减少无效劳动
• 企业微信实时推送投递进度,动态掌控应聘情况,及时调整策略
• 自动维护黑名单,避免重复投递低效企业,优化投递质量和效率
• 配置灵活,集中管理筛选条件,支持超长Cookie登录,减少重复扫码操作
• 开源免费,欢迎参与贡献,加入开发组享免费Intelli编辑器全家桶资源
• 适合在复杂招聘环境中主动出击的求职者,推荐配合手机App使用Boss投递,避免封号风险
1
Prompt Tools:一款强大的桌面应用程序,旨在彻底简化你的 Prompt 管理工作流程。它基于 Tauri 框架构建,为你提供快速、安全和跨平台的极致体验

📌 专注于提示词管理,彻底解决 Prompt 散落各处、查找困难、分类混乱、跨设备同步难题。
💻 跨平台设计,现支持 macOS (Apple Silicon),未来将覆盖 Windows 和 Linux,原生体验流畅自然。
⚡️ 轻量高效,基于 Rust + Tauri 构建,启动迅速,资源占用低,彻底告别卡顿。
🔐 本地优先,数据安全私密,所有信息存储在本地,避免云端泄露风险,掌控完全由你。
✍️ 功能全面:支持创建、编辑、搜索和组织提示词,搭建属于你的 Prompt 知识库。
🧰 开源免费,技术栈现代(TypeScript, React, Rust, SQLite),支持开发者自由定制与二次开发。
Dataset Viewer:由 AI Agent 全自动打造的现代高性能数据集浏览器

⚡️ 支持 100GB+ 大文件秒开,虚拟渲染确保流畅体验
🔍 毫秒级实时搜索,支持高亮,轻松定位海量数据
📦 无需解压即可预览 ZIP/TAR 等压缩包,极大提升效率
🌐 多协议支持:WebDAV、SSH/SFTP、SMB/CIFS、S3、本地及 HuggingFace Hub
🗂 支持多格式文件:Parquet、Excel、CSV、JSON、代码文件(Python、Java、C++等)
🎨 现代响应式界面,支持暗黑/明亮主题及多语言切换
📄 文档支持:Markdown 预览,Word、PowerPoint、PDF(可搜索)
📊 数据交互:CSV/Excel 过滤排序,结构化 JSON 折叠高亮展示
💻 代码高亮,支持大文件,提升开发与数据分析效率
🌐 远程连接管理简单,方便跨平台数据访问与分析
🤖 100% AI 生成代码,基于 Tauri(Rust)+ React,原生性能保障
🧠 智能内存管理,分块加载与虚拟滚动,百万级行数据轻松应对
• 适合数据科学家、日志分析师、归档管理及性能敏感场景使用

深度利用流式传输及智能加载,重塑大数据集浏览体验。
AI项目实战代码库,覆盖从Agentic AI、多智能体协作,到机器学习管道与大模型应用的全流程实现:

• 详尽Agent构建教程:基于Biopython的生物信息AI Agent、Microsoft Agent-Lightning轻量级开发、LangGraph多轮对话研究Agent、Gemini驱动的分层推理与任务规划Agent等,涵盖短期记忆与向量长时记忆融合技术。
• 多智能体系统实战:OpenAI Agents多Agent协作、基于Microsoft AutoGen和Gemini API的多轮对话框架、Google ADK扩展的可扩展多Agent系统,以及Agent Communication Protocol (ACP)的天气Agent示例。
• 机器学习与数据处理管线:MLE-Agent与Ollama本地端到端管线构建,TPOT自动化机器学习,Polars高性能金融分析,Presidio文本PII检测,Daytona安全代码执行工作流,及合成数据生成技术全覆盖。
• LLM及高级AI工具集成:GPT-5能力解读,LangChain、LangGraph、Claude、Hugging Face模型的深度结合,Mistral Agents API的标准JSON Schema函数调用,多工具动态选择与实时推理。
• 企业级生产部署:支持监控、编排与扩展的定制Agent,安全Python执行环境,基于Streamlit的多工具交互界面,Jina Search多模态检索,及自动化报告生成系统。
• MCP(Model Context Protocol)详解与实操:OAuth 2.1集成、FastMCP自定义协议实现、Google Gemini 2.0功能调用工作流、Vizro仪表盘构建,全面提升模型上下文管理与工具链协同效率。

此项目不仅提供丰富的代码示例和Notebook,还聚合了最新AI技术的应用落地路径,适合开发者、研究者和工程师深入学习和快速迭代。
#资源参考 #AI项目实战代码
OpenCourseCatalog

⭐️ 网站功能:公开课程目录

📁 网站简介:一个集中化的公开课程目录,主要聚焦于来自Bilibili平台的教育资源。都是作者从YouTube搬运的。

整理和归类来自YouTube等国外平台的公开课程视频,以便于国内用户能够方便地访问和学习。这些课程涵盖了多个学科,包括数学、物理、计算机科学等,用户可以通过该目录轻松找到所需的学习资源。

🔗 网站网址:点击打开
#资源参考 #学习资源 #视频教程
API大全

⭐️ 网站功能:API收集

📁 网站简介:一个全面的API接口导航平台,为开发者提供丰富的API资源和信息。可以通过该网站轻松查找和访问各种API接口,包括工信部、百度、搜狗、必应等知名平台的API。还有绘画、数据处理、AI应用等多个领域。

🔗 网站网址:点击打开
#资源参考 #API大全 #API接口导航平台 #工具
WeChatMassTool

⭐️ 项目功能:微信群发消息

📁 项目简介:一款开源的微信群发消息的开源项目。支持导入好友标签名单、导出运行结果,并且通过调用Windows API实现快速发送消息的功能。

可以在Windows系统上使用该工具,无需安装,直接下载编译好的exe程序即可使用。

🌐 项目地址:点击直达
Agent OS:让 AI 代码代理从“迷茫实习生”变身高效开发者

• 通过结构化工作流,精准捕捉项目规范、技术栈及代码库细节,确保 AI 代理首次提交高质量代码,避免多次返工
• 兼容 Claude Code、Cursor 等多种 AI 编程工具,无论新项目还是既有代码库均可适用
• 适配所有编程语言和框架,支持从大功能开发到小规模修复的多样任务
• 由 Builder Methods 创始人 Brian Casel 设计,专注于帮助专业开发者和团队高效利用 AI
• 提供详尽文档、安装指南及最佳实践,助力持续优化 AI 辅助开发流程
• 开源 MIT 许可,社区活跃,已获 1.4k+ 星标关注与 290+ 分支贡献

Agent OS 重新定义了 AI 助力的软件开发效率,将规范与执行无缝结合,是未来软件团队不可或缺的生产力工具。
Reddit 链接加上 `/.json`,即可无需登录自动抓取完整讨论串及所有回复,直接获取深度嵌套的原始数据和元信息,配合 LLM 深度分析,挖掘细分社区的巨大商业价值。| @TheAhmadOsman

• 完全公开、免 API 限制,简单模拟浏览器请求头即可自动化采集
• 支持多层回复树结构,数据细节丰富,适合情感分析、趋势预测、内容策划等多种应用
• 结合 Notion AI 等工具,实现子版块最佳发帖时间、标题优化等策略自动化
• 适合做细分领域的商业情报、市场调研、内容变现,挖掘垂直流量红利
• 需注意抓取频率,避免速率限制;社区用户群体特殊,需精准定位目标市场
• 公开数据虽多,关键在于如何从“海量噪声”中提炼出用户愿意为之买单的洞察

这是一条低门槛、高价值的数据入口,真正能变现的不是数据本身,而是数据背后的精准洞见和落地执行方案。
代码质量提升的关键步骤:完成目标后,主动要求清理、精简并详细文档化。
这不只是“让代码跑起来”,而是打造可维护、易扩展的高质量代码库。

• 先完成功能,再用 AI 或手动剔除冗余、重复结构,合并逻辑,确保简洁。
• 使用命令行工具拉取 PR,逐文件审查差异,做“理智检查”剔除死代码。
• 视代码如盆景,定期“修剪”保持结构稳定和清晰。
• 让 AI 反复复盘代码,扮演苛刻审查者,主动找出隐患和技术债务。
• 编写启动与收尾脚本,自动跟踪任务状态,避免重复请求。
• 早期文档化,帮助 AI 更好理解代码,提升后续重构效率。
• 在 Git 提交前先备份版本,避免清理导致功能丢失。
• 结合多角色审查,从架构、安全、性能等多角度评估代码。
• 让 AI 解释设计权衡,防止未来技术债累积。
• “做完了别急着收工”,持续记录变更日志和规范,保持长期规范。

这套流程让“写代码”转变为“管理代码”,既提升效率,也保障代码生命力。长期坚持,代码库质量和团队协作水平都会显著跃升。
#资源参考 #工具 #方法论 #代码管理
MaxKB:打造企业级智能体的开源利器,集成最新RAG技术与多模态交互,助力复杂业务场景智能升级。

• RAG Pipeline支持文档上传与自动爬取,自动分割与向量化极大降低大模型幻觉,提升问答准确率。
• 强大的Agentic Workflow引擎搭配丰富函数库和MCP工具,灵活编排AI流程,适配多样复杂业务需求。
• 无需编码即可快速无缝集成至现有系统,快速赋能智能客服、知识库、学研和教育场景,提升用户体验。
• 模型无关设计,兼容DeepSeek、Llama、Qwen等私有模型和OpenAI、Claude、Gemini等公有模型,灵活选型。
• 原生支持文本、图片、音频、视频多模态输入输出,拓展智能体交互边界。
• 基于Vue.js、Python/Django和LangChain技术栈,稳定高效,数据存储采用PostgreSQL+pgvector保障性能。

MaxKB让企业智能体建设不再受限于复杂开发,快速实现业务智能化转型的同时,降低风险和成本。
#资源参考 #RAG #企业RAG
TTS WebUI:(github)集成多款主流语音合成与音频生成模型的开源Web界面,兼容Gradio与React,适合深度定制与高效开发。

• 支持超多扩展:包括ACE-Step、Kimi Audio、Piper TTS、GPT-SoVITS、CosyVoice、XTTSv2、DIA、Kokoro、OpenVoice、ParlerTTS、Stable Audio、MMS、StyleTTS2、MAGNet、AudioGen、MusicGen、Tortoise、RVC、Vocos、Demucs、SeamlessM4T、Bark等,涵盖文本转语音、音乐生成、音频转换与降噪等多维度能力。
• 一体化体验:Gradio 后端搭配 React UI,支持本地启动与Docker部署,自动管理模型下载与更新,兼顾易用性与扩展性。
• 兼容OpenAI API,支持Whisper转录,方便与Silly Tavern等客户端集成,实现多场景文本、语音交互。
• 持续迭代:快速支持Python新版,优化Chatterbox音频对话速度,提升界面交互体验,支持多种硬件环境(GPU/CPU),并提供丰富教程与安装指南。
• 体量灵活:基础安装约10.7GB,模型按需加载,支持多模型并行但兼容性需留意,适合研究、开发与创意项目。
• 开源MIT许可,注重伦理合规,明确禁止恶意用途,鼓励创新与共享。

技术集成的复杂性与多模型生态的无缝融合,体现了跨领域音频AI开发的未来趋势。对音频生成和合成有高要求的开发者与研究者,值得长期关注与使用。
MCP Prompts Server:专为 LLM 交互设计的高扩展性提示管理平台,基于 Model Context Protocol (MCP) 构建,助力 AI 助理和开发者高效管理与复用提示模板。

• 双模式支持:传统 REST API 的 HTTP 模式 + 专为 AI 设计的 MCP 模式,灵活适配多种应用场景
• 丰富工具集(7款):新增、查询、筛选、更新、删除提示,模板变量应用,统计数据获取,全面覆盖提示生命周期管理
• 预置高效模板:代码审查、文档写作、缺陷分析、架构评审、测试用例生成,开箱即用提升生产力
• 完整版本控制与标签系统:支持多版本跟踪及标签分类,保障提示管理规范化与高效检索
• 强类型 TypeScript 支持,Docker 容器即装即用,方便集成部署与开发调试
• 深度集成 Cursor AI 助手,支持自然语言指令管理提示,提升交互效率
• 采用六边形架构设计,核心业务与基础设施分离,保证系统灵活可维护
• 开源社区活跃,持续更新迭代,生产环境级稳定运行(版本3.0.8)

长期来看,MCP Prompts 不仅优化了提示管理流程,更通过结构化模板和版本治理,为复杂 LLM 项目提供坚实底座,显著降低开发与维护成本。
Qwen3-ASR-Toolkit:突破语音识别时长限制的高效Python工具,专为长音频/视频转录打造。| #工具

• 智能分段:基于VAD检测自然静音点,避免断句,完美拆分超3分钟长音频,支持任意长度文件。
• 高并发加速:多线程并行调用Qwen-ASR API,极大缩短长音频转录时间。
• 自动降噪优化:识别并剔除ASR产生的幻觉与重复内容,输出更准确清晰的文本。
• 全格式兼容:依赖FFmpeg支持mp4、mov、mkv、mp3、wav、m4a等几乎所有主流音视频格式。
• 一键安装使用:PyPI一条命令安装,命令行简洁,0门槛快速上手。
• 自动重采样:任意采样率音频自动转换为API要求的16kHz单声道,无需额外预处理。
• 丰富参数调控:支持并发线程数、上下文提示、静默模式等多样配置,满足专业需求。

适用于长时间讲座、会议记录、播客转写等场景,实现高效精准转录的同时保证文本质量和使用便捷性。助力开发者和内容创作者打破传统语音识别限制,提升工作效率与内容价值。
项目分享:📻 Tubenote:基于 Gemini 的免费 YouTube 视频总结插件

🔗Web

一个 YouTube 总结插件,通过 Google Gemini AI 为任何 YouTube 视频生成即时、全面的智能摘要。只要你有 Gemini 账号,完全免费,无需 API 密钥。

💡 核心功能

自定义提示词,控制摘要风格和详细程度。
智能时间戳,直接跳转到视频相关部分。
无缝跳转到 Gemini,深入探讨视频主题。