硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
AI-Researcher:革新科研自动化的全流程智能平台

• 支持两种用户输入模式:详述研究想法(Level 1),或基于参考文献生成创新方案(Level 2),满足不同研究起点需求。
• 完整覆盖文献搜集、筛选、创新构思、算法设计、实验验证及论文撰写,助力科研人员实现端到端自动化。
• 多智能体LLM容器化架构,3小时内产出代码库、GUI界面及Docker环境,极大提升科研效率。
• 公开基准测试涵盖计算机视觉、自然语言处理、数据挖掘与信息检索四大领域,创新度达81%,F1分数0.92,表现媲美人类学术论文。
• 开放源码及详细文档,方便研究者快速部署与深度定制,推动科研自动化广泛应用。

AI-Researcher不仅加速科研流程,更通过多环节智能协同,推动科学发现范式转型,降低领域门槛,释放研究者创新潜力。
go2rtc:全平台零依赖摄像头终极流媒体解决方案,集成 RTSP、RTMP、WebRTC、HomeKit、FFmpeg 等多协议,支持多源多协议智能协同,极低延迟,解锁摄像头全新玩法。

• 支持 Windows/macOS/Linux/ARM 系统,无需额外配置,开箱即用。
• 多协议接入:RTSP、RTMP、HTTP-FLV、MJPEG、HLS、MSE、MP4、WebRTC、HomeKit 摄像头等,涵盖主流及专业流媒体格式。
• 灵活多源管理:支持多摄像头、多协议混合接入,自动匹配客户端支持的编码,实现多源两路音视频协商。
• 高度兼容:兼容主流智能家居平台(Home Assistant 等),支持插件形式集成与独立部署。
• 先进转码能力:内置 FFmpeg 支持硬件加速转码,动态处理不兼容编码,保障流畅播放体验。
• 双向音频支持:RTSP/ONVIF、Tapo、Hikvision、Roborock 等品牌摄像头实现浏览器端双向语音交互。
• 安全与访问控制:API 可限制访问,支持本地与远程安全访问(ngrok、TURN、STUN)。
• 创新应用场景:浏览器即IP摄像头、WebTorrent流分享、流媒体发布至YouTube/Telegram等。
• 业界首创:全球首个支持 HomeKit 摄像头流媒体代理与转发,无需苹果设备也能使用。
• 丰富开发接口:HTTP API、模块化设计,方便二次开发与自定义界面。

go2rtc 通过多协议融合与智能协商,解决了不同设备和客户端生态间的壁垒,真正实现“摄像头即服务”的理念。零配置、零依赖的设计极大降低了运维门槛,适合长期稳定运行和复杂多样的智能家居及监控场景。其持续活跃的开源社区也保障了创新与安全的稳步推进。
官方 PyTorch 初学者系列,全面覆盖深度学习入门

• 从基础张量操作、自动微分(autograd)讲起,逐步深入模型构建与训练。
• 8 个详尽教程,系统梳理 PyTorch 全流程,适合零基础友好入门。
• 包含生产环境部署实战,帮助理解理论与应用无缝衔接。
• 教学风格清晰,注重方法论提炼,助力长期掌握 PyTorch 核心技术。
• 课程内容紧贴行业实战,提升开发效率与模型实用性。

PyTorch Beginner Series | #教程
网页元素转图片新选择:snapDOM,速度快、精度高,实测验证优于 html2canvas。

• 支持完整 DOM 捕获,包括 shadow DOM 和伪元素(::before、::after)
• 保留样式、字体、背景图,支持 Font Awesome、Material Icons 等图标字体内嵌
• 输出多格式:SVG、PNG、JPG、WebP、Canvas,且无需额外依赖,基于标准 Web API
• 体积轻巧,性能优越,实测比 html2canvas 快 2~150 倍,尤其是大尺寸复杂元素截图
• 提供丰富 API 支持缩放、压缩、排除元素、自定义过滤、CORS 图片代理等高级功能
• 支持资源预加载,确保大规模复杂页面截图稳定高效
• 未来将支持插件系统、模块化架构及自动字体预加载,方便扩展与优化

推荐给需要高性能网页截图、生成可缩放矢量图和精美栅格图的前端开发者和设计师。
MongoDB MCP Server:MongoDB 最新开源 MCP Server 正式发布,开启人人都是数据库工程师的新纪元:

• 支持通过自然语言与 MongoDB 交互,免去手写复杂查询语法
• 兼容 MongoDB Atlas、Community Edition 和 Enterprise Advanced
• 让 AI 工具如 Claude、Cursor、GitHub Copilot 等直接对接数据库,实现智能代理查询
• 典型操作示例:“展示最活跃用户”,“创建只读数据库用户”,“查看订单集合的 schema”
• 提升非技术人员数据探索能力,支持生产级查询生成
• 性能方面,MCP 调用比直连 API 多 2-3 秒延迟,适合探索性分析但非实时场景
• 100% 开源,助力数据库访问民主化
• 安全性需重点关注,合理权限管理是防止数据泄露的关键
Cogito v2 发布:四款混合推理大模型(70B、109B MoE、405B、671B MoE)开放授权,代表全球顶尖水平。

• 创新迭代自我提升范式(Iterated Distillation & Amplification,IDA),模型通过内化推理过程,实现智能“直觉”提升,推理链长度比DeepSeek R1缩短60%。
• 最大的671B MoE模型性能媲美甚至超越DeepSeek v3/R1,逼近闭源前沿模型如o3和Claude 4 Opus。
• 训练成本低于350万美元,展示高效可扩展的超级智能构建路径。
• 模型支持直接回答和自我反思推理两种模式,适配多样应用场景。
• 可通过Huggingface下载,或在Together AI、Baseten、RunPod等API平台使用,本地运行支持Unsloth。
• 未来将继续迭代自我提升,发布更强模型,全部开源共享。

Cogito在推理时不再单纯靠“搜索更多”,而是通过迭代策略改进,将推理经验蒸馏回模型参数,增强模型的智能先验,类似AlphaGo的策略迭代思路,开创自然语言处理领域的全新自我优化范例。

详文 | API接入 | 开源地址
机器学习和深度学习入门必读书单,涵盖数学、信息论、概率图模型等核心领域,助力构建扎实理论基础与实践视野:

• 《Graphical Models, Exponential Families, and Variational Inference》——概率图模型与变分推断,理解复杂结构化数据的关键工具
• 《Elements of Information Theory》——信息论经典教材,掌握信息度量与编码基础
• 《Machine Learning: A Probabilistic Perspective》——系统讲解概率视角下的机器学习方法,数学严谨且应用丰富
• 《Information Theory, Inference, and Learning Algorithms》(David J.C. Mackay)——极具启发性的教学风格,结合概率与信息论,配有YouTube授课视频,适合深入理解
• 《Learning Deep Architectures for AI》(Yoshua Bengio)——深度学习开山之作,适合数学背景学生开拓视野
• 辅助推荐:《Probabilistic Graphical Models》(Daphne Koller & Nir Friedman)、《Fundamentals of Statistical Signal Processing》(Steven M. Kay)等,强化概率统计与信号处理基础
• 经典参考:《Operations Research》(Wayne L. Winston)及图论、关系理论等数学基础书籍,拓展理论边界


深度理解这些书籍背后的方法论,帮助你系统构建机器学习与深度学习的知识体系,促进跨领域融合与创新。新手可结合相关学位论文和开源软件项目(如DynaMax)提升实践能力。
#资源参考 #学习资源 #机器学习 #深度学习 #电子书籍
QuarkPanTool

软件功能:夸克网盘文件批量转存

➡️ 支持平台:#Windows

📁 软件简介:一款开源的快速批量转存、分享和下载夸克网盘文件的工具。可以通过该工具轻松将多个分享链接中的文件转存到自己的网盘,或者批量生成分享链接,能够绕过文件大小限制,方便下载大文件而无需VIP权限。

⬇️ 软件下载:点击下载
#资源参考 #工具 #夸克网盘文件
N资源书吧

⭐️ 网站功能:书籍下载

📁 网站简介:一个综合性的电子书资源平台,提供丰富的电子书下载和在线阅读服务。可以在网站上找到各类书籍,包括小说、心理学、经济管理、生活类、外语学习等多个领域的电子书。

🔗 网站网址:点击打开
#资源参考 #电子书籍
AgenticSeek

⭐️ 项目功能:AI助手

📁 项目简介:一个完全本地化的人工智能助手,提供一个无需依赖云服务的自主代理。可以独立浏览网页、编写代码和规划任务,所有数据均保存在用户的设备上。

主要特点包括智能网页浏览、自动编码助手、复杂任务的规划与执行,以及语音交互功能。

🌐 项目地址:点击直达

🌐 网站网址:点击访问
SD Video Downloader

⭐️ 网站功能:视频下载

📁 网站简介:一个在线视频下载工具,可以通过该平台免费下载抖音、快手、小红书视频,并且支持去水印下载。只需复制视频链接,粘贴到网站上,点击下载按钮即可。

🔗 网站网址:点击打开
#资源参考 #视频下载 #去水印视频
Cap 是一款轻量级的现代开源CAPTCHA替代方案,使用 SHA-256 工作量证明。

主要特点包括自托管功能和使用 CSS 变量进行高度定制。

用户界面友好,机器人任务具有挑战性,这使其成为一种有效的解决方案。

支持 Docker 模式,简单的 JS API 可以使其在需要时隐藏运行。

🧬 https://github.com/tiagorangel1/cap

#tools
#资源参考 #AI #Agent #ai_agents #genai

您可以探索医疗保健、金融、教育、客户服务等众多行业的大量 AI 代理项目和用例。这些 AI 代理可自动执行医疗诊断、股票交易、个性化辅导、客户支持、产品推荐和供应链优化等任务。这些项目包含开源代码和框架,例如 CrewAI、Autogen、Agno 和 Langgraph,它们可帮助您构建、管理和协作 AI 代理,以执行编码、多代理团队合作、数据分析和工作流自动化等任务。利用这些资源可以节省您的时间、提高效率,并激发您创建满足您需求的 AI 解决方案。

https://github.com/ashishpatel26/500-AI-Agents-Projects
智谱新一代的旗舰模型 GLM-4.5

GLM-4.5 在12个具有代表性的榜单中都拿到了不错的成绩,平均分排行中拿到世界第三,开源界第一。

GLM-4.5 模型特色:

- 综合评分:全球模型第三,国产第一,开源第一
- 在推理、代码、智能体综合能力达到开源模型 SOTA 水平
- 模型参数 355B,激活参数 32B,同等规模最佳性能
- 低成本、高速度,模型开源,推理速度极快,且 API 价格非常平民,输入 0.8元/百万 tokens,输出 2元/百万 token

配合这次模型发布的,还有一个叫「全栈开发」的 Agent,这个 Agent 可以最大程度发挥模型的代码能力。

这是我用它克隆抖音,来看一下整体的开发能力:

这个开放性的测试,可以检测 Agent 距离真实的抖音界面的差距有多大。
全栈开发 Agent 表现不错,抖音视频的播放、上下滑动、点赞、分享都做到了。
不足之处是评论不能提交。

如何使用:

直接使用:http://z.ai
API 调用 http://bigmodel.cn
模型还兼容 Claude Code 框架,可以修改参数使用。

Github 仓库:
https://github.com/zai-org/GLM-4.5

模型仓库:
HuggingFace: https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
#ai创造营#

Edge 浏览器直接深度融合 Copliot 变成了 AI 浏览器!

支持直接在首页提问,还支持针对特定页面提问,后面还会加上帮你操作页面的 Agent 能力

而且我发现 Copliot 的图片生成居然是 4o!可以疯狂白嫖了朋友们

访问下面👇链接开启:microsoft.com/en-us/edge/ai-powered/copilot-mode
Bright Side of Mathematics:这是个要花钱的教程,专注深入讲解数学精髓的优质YouTube频道,适合想攻克难点的学习者。

• 内容覆盖矩阵分解(如LU分解)、微积分、代数等核心数学知识,讲解细致且富有趣味性。
• 适合大学生及自学者,帮助理解复杂概念,提升数学思维能力。
• 讲师风格亲切,教学条理清晰,获得众多学员和教授推荐。
• 通过系统性内容构建,打造扎实数学基础,适合长期学习参考。
Mathematical Foundations of Reinforcement Learning

开源教材,帮你打通学习瓶颈,系统掌握强化学习

• 从数学视角出发,深入剖析强化学习基本概念(状态、动作、策略)与核心算法(MC、TD、Q-learning等)
• 精心设计的网格世界示例,助力理解抽象理论,剥离算法核心,避免繁杂干扰
• 50+集中英双语视频课程同步讲解,理论与实践无缝衔接,学习路径清晰连贯
• 数学难度适中且讲解友好,附带概率论和线性代数基础补充,降低学习门槛
• 多语言代码实现(Python、R、C++),支持自主实践与算法开发
• 章节逻辑严谨,前后呼应,帮助构建系统性强化学习知识框架

适合有一定数学基础、渴望深刻理解强化学习原理的本科生、研究生及AI研究者。结合书籍与视频,可高效掌握强化学习本质与方法论。
#资源参考 #强化学习
Motia:AI Agents的缺失后台,一站式统一后端框架,整合API、后台任务、事件与智能代理,轻松构建复杂工作流。

• 多语言支持:Python、JavaScript、TypeScript无缝协作,灵活选择最佳工具。
• 插件化Step设计:业务逻辑即Step,支持HTTP请求、事件驱动和定时任务触发。
• 内建全链路观测:自动追踪日志与状态变更,零配置实现端到端可视化调试。
• 事件驱动工作流:步骤间通过事件发布与订阅解耦,简单声明式代码构建多阶段流程。
• 统一状态管理:共享键值存储,实时追踪数据生命周期,提升调试与维护效率。
• 一键部署体验:快速启动项目,内置Workbench UI便于实时开发测试。
• 100%开源,社区活跃,持续迭代支持多种语言和云平台。

Motia解决了碎片化后端带来的部署复杂性和运维难题,是构建稳定、可扩展AI Agent系统的理想选择。
#资源参考 #Agent #AI #后端框架
高效阅读论文的 Obsidian 标签布局实战指南:推特贴文 | #指南 #论文

• 左上角设为 Source note,方便快速定位原始笔记。
• 左下角启用 Excalibrain,助力知识网络可视化。
• 中央固定 PDF++,实现论文 PDF 的无缝浏览和标注。
• 右侧配置 NotebookLM,实时向 AI 提问,快速解决疑难。
• 英文论文先用 Readable 翻译,再通过 PDF++ 展示,提升理解效率。
• 全文导入 NotebookLM,确保所有疑问即时获得专业解答。

该方法完美融合笔记管理、知识图谱和 AI 辅助,极大提升论文阅读与研究效率。
独立开发穷鬼套餐(Web实践篇),帮你用最低成本开启盈利项目:

• 推荐框架:Next.js 14/15,兼顾生态活跃度与AI代码质量,支持SSR/SSG/ISR满足多场景需求。
• 核心技术选型:Drizzle ORM(轻量高性能)、Better Auth(多鉴权方式)、Stripe+Creem支付、React Email+Resend邮件服务、Cloudflare R2对象存储、Fumadocs文档系统、Tailwind CSS+Shadcn/UI等现代UI库。
• 成本敏感的三大部署方案:
1. 云平台免费额度(Vercel、Supabase、Neon、Railway等),0成本起步,适合启动期,缺点是超额成本高,部分平台限制商业使用。
2. 全面利用Cloudflare(Workers、D1、KV、R2),$5/月起,适合高流量、技术熟练用户,全球CDN无流量费,国内访问速度相对较慢。
3. 自托管(VPS/VM),自由度最高,成本最低,但需自主管理运维、安全、备份和扩容。
• 其他必备成本:合理选域名(推荐Cloudflare Domains)、邮件服务(Resend或自托管Unsend)、成熟支付平台(Stripe更稳,Creem适合初期无需开公司)。
• 独立开发核心理念:避免过度折腾技术和平台,聚焦快速迭代产品和市场,合理规划成本与盈利模式。
• NextDevKit项目助力快速搭建全栈Next.js项目,支持多平台一键部署,内置支付和管理后台,助力独立开发者降本增效
#资源参考 #开发