硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
VSAG:面向大规模向量集的高效相似度搜索索引库,突破内存限制,简化参数调优,助力精确快速检索。

• 支持超大规模向量集合,适配内存外数据,解决传统向量库内存瓶颈。
• 采用领先算法,QPS性能较Glass提升100%,较HNSWLIB提升300%(基于ann-benchmark,GIST数据集,90%召回率)。
• C++核心实现,提供Python封装pyvsag,便于集成与二次开发。
• 自动参数生成机制,无需深入算法原理即可高效部署。
• 多场景验证,OceanBase、TuGraph、GreptimeDB等多个顶级分布式系统采用。
• 持续迭代,2025年路线图包含稀疏向量搜索、ARM与GPU加速、图结构压缩等关键特性。
• 开源社区驱动,欢迎贡献代码与反馈,促进矢量数据库生态发展。

VSAG从算法优化到工程实现均体现出对大规模、高性能相似度搜索的深刻理解,提供了行业领先的解决方案与可持续进化路径,适合长期技术布局与创新探索。
Streamlit PDF Viewer:专为Streamlit应用设计的高效PDF可视化和增强组件,助力结构化数据展示与交互体验升级。

• 基于pdf.js,支持PDF文件直观展示,文本层覆盖实现复制粘贴
• 支持页面级渲染与滚动,快速定位指定页码或注释
• 注释高亮显示,支持多种边框样式及颜色,自定义点击回调函数
• 多重缩放控制,灵活调整视图比例,容器内居中/左/右对齐自由配置
• 可选分页分隔线,提升多页文档视觉分辨率
• 兼容Firefox和Chrome,针对复杂PDF支持动态加载及交互
• 开源Apache-2.0许可,持续迭代中,适合科研、文档分析与数据标注场景

通过对PDF的文本与注释分层渲染,实现了交互性与信息可复制性的平衡,促进面向结构化数据的深度挖掘和应用开发。

入门简单,pip install即可集成,适用范围广泛,具备长期工程实践参考价值。
Claude Code Subagents Collection:专为开发者打造的 44 个生产级 AI 子代理,覆盖从架构设计到运维优化、语言专家、数据分析及业务营销的全链路支持。

🏗 架构与开发:backend-architect 设计 API,frontend-developer 构建响应式界面,mobile-developer 支持 React Native/Flutter,graphql-architect 设计 GraphQL 架构。
🔧 编程语言专家:python-pro、golang-pro、rust-pro、javascript-pro 等,提供领域内高质量代码生成与优化。
🛠 运维与基础设施:devops-troubleshooter 定位线上问题,cloud-architect 优化云架构,terraform-specialist 管理 IaC,incident-responder 快速响应故障。
🧪 质量与安全:code-reviewer 代码审查,security-auditor 漏洞扫描,test-automator 自动化测试,performance-engineer 性能调优。
📊 数据与 AI:data-scientist 数据分析,mlops-engineer 管理 ML 流水线,ai-engineer 构建 LLM 应用,prompt-engineer 优化提示词。
💼 业务与营销:business-analyst 量化分析,content-marketer 产出 SEO 内容,sales-automator 自动化销售流程,customer-support 提升客户体验。
• 多代理协作:支持复杂工作流自动编排,如功能开发、性能优化、生产故障响应,实现高效无缝协作。
• 使用方式:自动根据任务上下文调用,或显式指定子代理,灵活匹配场景需求。支持 ~/.claude/agents/ 目录一键部署。
• 方法论洞察:通过专业分工与自动化协同,最大化 AI 子代理效能,解放开发者生产力,推动端到端智能开发闭环。
Ragflow-Plus:基于 Ragflow 的二次开发,专注解决实际应用痛点,提升知识库管理与文档交互效率。

• 全新后台管理系统:支持用户、团队、配置、文件与知识库统一管理,提升运维便捷度
• 权限回收机制:前端权限收缩,简化操作界面,保障安全与易用并重
• 解析能力升级:引入 MinerU 替代 DeepDoc,增强文本与图片解析效果,实现图文结合输出
• 文档撰写模式革新:全新交互体验,优化内容创作流程,适合多场景知识沉淀
• 开箱即用:提供 Docker 快速部署方案,配套视频教程与详细文档支持
• 开源透明:遵循 AGPLv3 许可证,支持商业使用,保障软件自由与合规
• 社群活跃:官方社群讨论技术与使用,支持持续贡献与共建

Ragflow-Plus 深耕知识管理本质,结合技术迭代与用户需求,助力打造高效、灵活的智能文档与问答平台。
#资源参考 #RAG
AI Doc Gen:多智能体驱动的代码库自动文档生成系统,提升代码理解与开发者入门效率。

• 多智能体架构:专门的AI agent负责代码结构、数据流、依赖关系、请求流及API分析,确保文档精准全面。
• 自动文档生成:支持自动创建结构化README,章节可灵活配置,保持文档始终更新且易维护。
• GitLab集成:无缝接入GitLab,支持自动分析与合并请求创建,优化团队协作流程。
• 并发处理:多agent并行执行,加速代码分析与文档生成,适应大型项目需求。
• 多LLM兼容:兼容OpenAI、OpenRouter及本地模型等多种LLM API,灵活选择最佳模型。
• 配置灵活:基于YAML配置文件,支持环境变量覆盖,满足不同项目定制需求。
• 可观测性:内置OpenTelemetry和Langfuse监控,实时追踪分析过程,保障系统稳定性。
• 技术栈前沿:采用Python 3.13与pydantic-ai进行agent编排,结合GitPython和python-gitlab实现仓库操作。

从根本上解决文档“腐烂”问题,推动文档与代码同步进化,实现长期维护价值最大化。适合追求高效、自动化文档管理的开发团队及开源项目。
#资源参考 #Agent #AI
多Agent协同提升代码质量的自动化框架

• 并行运行20+ Claude Code agents,最高支持50个,极大加速大规模代码库的自动化改进
• 三大工作流支持:传统Bug修复、系统化最佳实践落地、多Agent协同复杂开发
• 先进锁机制保障多Agent无冲突作业,自动管理任务分配和状态同步,避免重复和冲突
• 涵盖34种主流技术栈(Next.js、Python、Rust、Go、Java、Flutter等),配置丰富,适配广泛项目
• 实时监控面板直观显示Agent状态、上下文使用率、心跳频率及错误信息,支持tmux多视图操作
• 自动恢复与上下文管理:Agent异常自动重启,自动清理上下文防止状态溢出,支持一键广播清理命令
• 配套24套环境搭建脚本,覆盖从前端、后端到DevOps及数据工程,极大简化开发环境配置
• 细粒度Git集成:支持定制分支、增量提交与详尽HTML运行报告,保证代码变更透明且易追踪
• 灵活JSON配置系统,支持变量替换与动态块大小调整,满足不同项目和团队的个性化需求
• 安全稳健:自动备份与恢复Claude设置,文件锁定防止并发冲突,异常清理确保环境干净

该框架不仅是多Agent任务调度工具,更是面向大规模代码库的智能协同开发平台,充分利用AI并行能力与严格的作业协调机制,解决传统自动化工具难以兼顾的代码冲突与任务重复问题,极大提高代码质量和团队开发效率,具备长期演进和多场景复用价值。

Claude Code Agent Farm | #框架 #资源参考 #Agent
Wan2.2:开源且领先的大规模视频生成模型,推动视频AIGC进入新阶段

• 引入Mixture-of-Experts (MoE)架构,采用双专家设计分阶段处理噪声,实现27B参数容量下14B推理成本,显著提升生成质量与收敛速度。
• 融入电影级美学数据,细化灯光、构图、色调等多维标签,实现更精准且可控的风格化视频生成。
• 训练数据大幅扩容,图像+65.6% 视频+83.2%,全面增强模型对复杂运动、语义和美学的泛化能力,性能领先业内开源及闭源竞品。
• 发布高压缩TI2V-5B模型,结合Wan2.2-VAE实现64倍压缩率,支持720P@24fps文本/图像到视频生成,能在消费级GPU(如RTX 4090)高效运行,兼顾工业与学术需求。
• 支持多GPU推理(FSDP+DeepSpeed Ulysses),并已集成至ComfyUI、Diffusers生态,方便快速部署与二次开发。
• 丰富的扩展方案:文本、图像及文本-图像混合输入,多样prompt扩展方法(Dashscope API、本地Qwen模型)提升细节表现。
• 完整开源,Apache 2.0授权,兼顾自由使用与合规责任,助力科研与产业创新。

通过MoE架构巧妙平衡模型容量与推理效率,是提升大规模视频生成质量的关键路径;高压缩VAE设计结合先进的训练范式,推动高清视频生成从实验室走向实用化;数据与美学标签的精细打磨,确保生成内容具备更强的表达力与艺术感。
1
Qwen Code:面向开发者的命令行 AI 编程代理,基于 Google Gemini CLI 优化,专为 Qwen3-Coder 模型设计。

• 支持超大代码库理解与编辑,突破传统上下文窗口限制
• 自动化代码工作流管理,涵盖 PR 处理、复杂 rebase 等操作
• 定制解析器深度适配 Qwen-Coder,提升解析效率和准确度
• 简易安装与配置,支持 Node.js 20+,本地或源码安装均可
• API 访问灵活,含内地阿里云 bailian 平台及国际版多渠道接入
• 提供每日 2000 次免费 ModelScope API 调用,中国用户福利明显
• 适用场景丰富:代码理解、重构优化、文档生成及单元测试编写
• 开源社区活跃,6.1k+ star,持续迭代提升开发体验与性能

Qwen Code 是提升代码智能解析与自动化能力的桥梁,助力开发者高效驾驭复杂项目结构,推动软件开发进入新范式。
#资源参考 #AICode #Code
安卓应用 HTTPS 抓包的自动利器——apk-mitm,极大简化了逆向与安全分析流程:

• 一键自动化流程:通过 Apktool 解码 APK,替换 Network Security Configuration,禁用多种证书绑定机制,重新编码并签名,无需手动干预
• 支持 APK 与 Android App Bundle(*.xapk、*.apks)格式,适配更多应用分发形式
• 无需 Root 权限,降低测试门槛,适合安全研究、渗透测试及逆向工程初学者
• 兼容主流代理工具(Charles、mitmproxy)轻松捕获 HTTPS 流量,助力深度协议分析与漏洞挖掘
• 解决 Android 7+ 及以上版本证书绑定阻碍,提供 --certificate 自定义证书注入,兼容特殊设备(如 Android TV)
• 提供 --wait 选项支持手动微调,结合 APKLab 工具链,实现高效迭代逆向调试
• 局限提醒:对基于本地二进制的证书绑定(如 Flutter)支持有限,推荐结合 Frida 动态 Hook 方案以应对复杂场景
• MIT 开源协议,便于二次开发与集成

深入理解 APK 结构与安全机制,掌握动态与静态双重绕过思路,打造长期可复用的移动安全分析方法论。
DataTool

⭐️ 软件功能:视频下载

➡️ 支持平台:#Windows #macOS #Web

➡️ 支持插件:#Chrome #Edge #Firefox

📁 软件简介:一款强大的在线视频下载工具,支持从多种社交媒体平台(如 TikTok、YouTube、Instagram、Facebook 等)下载视频和图片。

可以方便地将所需的内容直接保存到设备上,且下载过程快速高效。提供无水印下载功能,并支持多种视频质量选项(如 4K、1080P),同时还允许批量处理。

⬇️ 软件下载:点击下载
trendingrepos

⭐️ 网站功能:GitHub 趋势

📁 网站简介:一个用于探索GitHub上最受欢迎的代码库的工具,可以根据选择的时间段查看这些代码库的星标变化情况。

通过自定义的数据加载器从GitHub API每小时获取数据,并使用TimescaleDB进行存储和处理。

🔗 网站网址:点击打开

🔗 开源地址:点击访问
#资源参考 #GitHub
美国科罗拉多大学出品的PhET平台,集合物理、化学、生物、地球科学及数学的高质量互动仿真工具,是理科学习和教学的强大助力。

• 免费在线访问,无需安装,支持多语言界面,覆盖全球用户。
• 丰富的仿真类型:从经典力学、电磁学,到化学反应、生物过程及地理现象,全面支持跨学科教学与自学。
• 交互式设计,操作直观,帮助用户深刻理解抽象概念和复杂原理。
• 教师资源丰富,含教学活动建议及课程集成方案,提升课堂体验与效果。
• 移动端和桌面端兼容,支持离线使用,方便随时随地学习和演示。
• 持续更新与优化,基于教育研究和用户反馈,确保内容科学性与实用性。
理科教育者与学习者的必备工具,助力构建扎实的科学素养和探究能力。
AI-Researcher:革新科研自动化的全流程智能平台

• 支持两种用户输入模式:详述研究想法(Level 1),或基于参考文献生成创新方案(Level 2),满足不同研究起点需求。
• 完整覆盖文献搜集、筛选、创新构思、算法设计、实验验证及论文撰写,助力科研人员实现端到端自动化。
• 多智能体LLM容器化架构,3小时内产出代码库、GUI界面及Docker环境,极大提升科研效率。
• 公开基准测试涵盖计算机视觉、自然语言处理、数据挖掘与信息检索四大领域,创新度达81%,F1分数0.92,表现媲美人类学术论文。
• 开放源码及详细文档,方便研究者快速部署与深度定制,推动科研自动化广泛应用。

AI-Researcher不仅加速科研流程,更通过多环节智能协同,推动科学发现范式转型,降低领域门槛,释放研究者创新潜力。
go2rtc:全平台零依赖摄像头终极流媒体解决方案,集成 RTSP、RTMP、WebRTC、HomeKit、FFmpeg 等多协议,支持多源多协议智能协同,极低延迟,解锁摄像头全新玩法。

• 支持 Windows/macOS/Linux/ARM 系统,无需额外配置,开箱即用。
• 多协议接入:RTSP、RTMP、HTTP-FLV、MJPEG、HLS、MSE、MP4、WebRTC、HomeKit 摄像头等,涵盖主流及专业流媒体格式。
• 灵活多源管理:支持多摄像头、多协议混合接入,自动匹配客户端支持的编码,实现多源两路音视频协商。
• 高度兼容:兼容主流智能家居平台(Home Assistant 等),支持插件形式集成与独立部署。
• 先进转码能力:内置 FFmpeg 支持硬件加速转码,动态处理不兼容编码,保障流畅播放体验。
• 双向音频支持:RTSP/ONVIF、Tapo、Hikvision、Roborock 等品牌摄像头实现浏览器端双向语音交互。
• 安全与访问控制:API 可限制访问,支持本地与远程安全访问(ngrok、TURN、STUN)。
• 创新应用场景:浏览器即IP摄像头、WebTorrent流分享、流媒体发布至YouTube/Telegram等。
• 业界首创:全球首个支持 HomeKit 摄像头流媒体代理与转发,无需苹果设备也能使用。
• 丰富开发接口:HTTP API、模块化设计,方便二次开发与自定义界面。

go2rtc 通过多协议融合与智能协商,解决了不同设备和客户端生态间的壁垒,真正实现“摄像头即服务”的理念。零配置、零依赖的设计极大降低了运维门槛,适合长期稳定运行和复杂多样的智能家居及监控场景。其持续活跃的开源社区也保障了创新与安全的稳步推进。
官方 PyTorch 初学者系列,全面覆盖深度学习入门

• 从基础张量操作、自动微分(autograd)讲起,逐步深入模型构建与训练。
• 8 个详尽教程,系统梳理 PyTorch 全流程,适合零基础友好入门。
• 包含生产环境部署实战,帮助理解理论与应用无缝衔接。
• 教学风格清晰,注重方法论提炼,助力长期掌握 PyTorch 核心技术。
• 课程内容紧贴行业实战,提升开发效率与模型实用性。

PyTorch Beginner Series | #教程
网页元素转图片新选择:snapDOM,速度快、精度高,实测验证优于 html2canvas。

• 支持完整 DOM 捕获,包括 shadow DOM 和伪元素(::before、::after)
• 保留样式、字体、背景图,支持 Font Awesome、Material Icons 等图标字体内嵌
• 输出多格式:SVG、PNG、JPG、WebP、Canvas,且无需额外依赖,基于标准 Web API
• 体积轻巧,性能优越,实测比 html2canvas 快 2~150 倍,尤其是大尺寸复杂元素截图
• 提供丰富 API 支持缩放、压缩、排除元素、自定义过滤、CORS 图片代理等高级功能
• 支持资源预加载,确保大规模复杂页面截图稳定高效
• 未来将支持插件系统、模块化架构及自动字体预加载,方便扩展与优化

推荐给需要高性能网页截图、生成可缩放矢量图和精美栅格图的前端开发者和设计师。
MongoDB MCP Server:MongoDB 最新开源 MCP Server 正式发布,开启人人都是数据库工程师的新纪元:

• 支持通过自然语言与 MongoDB 交互,免去手写复杂查询语法
• 兼容 MongoDB Atlas、Community Edition 和 Enterprise Advanced
• 让 AI 工具如 Claude、Cursor、GitHub Copilot 等直接对接数据库,实现智能代理查询
• 典型操作示例:“展示最活跃用户”,“创建只读数据库用户”,“查看订单集合的 schema”
• 提升非技术人员数据探索能力,支持生产级查询生成
• 性能方面,MCP 调用比直连 API 多 2-3 秒延迟,适合探索性分析但非实时场景
• 100% 开源,助力数据库访问民主化
• 安全性需重点关注,合理权限管理是防止数据泄露的关键
Cogito v2 发布:四款混合推理大模型(70B、109B MoE、405B、671B MoE)开放授权,代表全球顶尖水平。

• 创新迭代自我提升范式(Iterated Distillation & Amplification,IDA),模型通过内化推理过程,实现智能“直觉”提升,推理链长度比DeepSeek R1缩短60%。
• 最大的671B MoE模型性能媲美甚至超越DeepSeek v3/R1,逼近闭源前沿模型如o3和Claude 4 Opus。
• 训练成本低于350万美元,展示高效可扩展的超级智能构建路径。
• 模型支持直接回答和自我反思推理两种模式,适配多样应用场景。
• 可通过Huggingface下载,或在Together AI、Baseten、RunPod等API平台使用,本地运行支持Unsloth。
• 未来将继续迭代自我提升,发布更强模型,全部开源共享。

Cogito在推理时不再单纯靠“搜索更多”,而是通过迭代策略改进,将推理经验蒸馏回模型参数,增强模型的智能先验,类似AlphaGo的策略迭代思路,开创自然语言处理领域的全新自我优化范例。

详文 | API接入 | 开源地址
机器学习和深度学习入门必读书单,涵盖数学、信息论、概率图模型等核心领域,助力构建扎实理论基础与实践视野:

• 《Graphical Models, Exponential Families, and Variational Inference》——概率图模型与变分推断,理解复杂结构化数据的关键工具
• 《Elements of Information Theory》——信息论经典教材,掌握信息度量与编码基础
• 《Machine Learning: A Probabilistic Perspective》——系统讲解概率视角下的机器学习方法,数学严谨且应用丰富
• 《Information Theory, Inference, and Learning Algorithms》(David J.C. Mackay)——极具启发性的教学风格,结合概率与信息论,配有YouTube授课视频,适合深入理解
• 《Learning Deep Architectures for AI》(Yoshua Bengio)——深度学习开山之作,适合数学背景学生开拓视野
• 辅助推荐:《Probabilistic Graphical Models》(Daphne Koller & Nir Friedman)、《Fundamentals of Statistical Signal Processing》(Steven M. Kay)等,强化概率统计与信号处理基础
• 经典参考:《Operations Research》(Wayne L. Winston)及图论、关系理论等数学基础书籍,拓展理论边界


深度理解这些书籍背后的方法论,帮助你系统构建机器学习与深度学习的知识体系,促进跨领域融合与创新。新手可结合相关学位论文和开源软件项目(如DynaMax)提升实践能力。
#资源参考 #学习资源 #机器学习 #深度学习 #电子书籍
QuarkPanTool

软件功能:夸克网盘文件批量转存

➡️ 支持平台:#Windows

📁 软件简介:一款开源的快速批量转存、分享和下载夸克网盘文件的工具。可以通过该工具轻松将多个分享链接中的文件转存到自己的网盘,或者批量生成分享链接,能够绕过文件大小限制,方便下载大文件而无需VIP权限。

⬇️ 软件下载:点击下载
#资源参考 #工具 #夸克网盘文件