硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
Open-dLLM:首个全开源扩散式大语言模型全栈项目,覆盖预训练、评测、推理与权重发布,刷新了扩散 LLM 的开放透明度标准。

• 集成 Open-dCoder 代码生成模型,参数仅0.5B,却在代码补全和填充任务上超越多款7-8B级别扩散模型。
• 全流程开源:从原始数据、训练代码、评测脚本到推理代码及模型权重一应俱全,确保结果可复现。
• 评测覆盖 HumanEval、MBPP、Infilling 等多维度代码生成与填充指标,Open-dCoder代码填充准确率高达77.4%。
• 采用 Masked Diffusion Model (MDM) 训练目标,创新地通过不同比例掩码实现代码片段重建,提升模型生成质量。
• 预训练基于 Hugging Face 发布的 FineCode 高质量代码数据集,且继承 Qwen2.5-Coder 转扩散架构,兼顾效率与性能。
• 配套详尽安装与推理示例,支持 CUDA 12.3、FlashAttention 等最新硬件加速技术,方便快速上手。
• 对比目前主流扩散 LLM(LLaDA、Dream等)仅开放推理+权重,Open-dLLM全面开放训练与评估,真正做到透明与可控。
WPunion

⭐️ 插件功能:WordPress基础插件

➡️ 支持平台:#Wordpress

📁 插件简介:一款功能强大的WordPress基础插件,集成了多种实用功能,包括网站优化、安全增强、SEO支持、对象缓存、邮件推送等。

主要功能包括:优化注册登录功能、统计文章浏览量、提供简单的SEO工具、SMTP邮件发送设置及日志记录、内容隐藏功能、对象缓存支持等。

⬇️ 插件下载:点击下载
YouTube Downloader

⭐️ 机器人功能:视频下载

📁 机器人简介:一个可以下载YouTube视频或音频的telegram机器人。将视频链接发送给机器人,加入指定群组,即可获取视频文件。

机器人发的信息看不懂没关系,加入群组发视频链接就行了。

🆔 机器人ID:@YouTubeDLx_bot
Grabcube

⭐️ 软件功能:视频下载

➡️ 支持平台:#Windows #macOS

📁 软件简介:一款功能强大的音视频下载与 AI 转录翻译工具,可以轻松从 YouTube、Bilibili、Facebook、Twitter 等超过 1000 个平台下载视频和音频,同时支持将语音转换为文本、翻译字幕并进行双语播放。

⬇️ 软件下载:点击下载
#资源参考 #工具 #音视频下载 #AI转录翻译工具
Anon Story Viewer

⭐️ 网站功能:Facebook Story下载

📁 网站简介:一个免费的用于匿名浏览和下载 Facebook 故story的工具。只需复制所需故事的链接并粘贴到该网站的输入框中,即可快速查看内容。

支持批量下载,可以一次性下载多个故事,确保高质量的图像和视频保存到设备中。

🔗 网站网址:点击打开
Zread

⭐️ 网站功能:AI代码维基平台

📁 网站简介:个专注于深度研究的AI代码维基平台,提供多语言指南、架构见解和社区讨论。

可以在平台上发现和添加私有代码库,查看本周热门代码库,获取反馈,并参与社区互动。

🔗 网站网址:点击打开
HumanifyJS 利用大型语言模型(如 ChatGPT、llama)结合 Babel 等工具,实现 JavaScript 代码的高质量反混淆与还原,保持代码功能完全等价。

• 无需 Python,版本2显著提升代码维护性与用户体验
• 支持三种模式:OpenAI/Gemini 云端精确模式(需 API Key,按代码长度计费)、本地模式(免费但速度和准确度受限)
• 结合 ChatGPT 提供智能变量与函数重命名建议,Babel 插件完成 AST 级别结构还原
• 内置 Webcrack,自动解包 Webpack 打包文件
• 本地模式支持 Mac M 系列芯片 GPU 加速,自动切换 CPU,充分利用硬件性能
• 安装便捷:Node.js 20+ 环境下,全局 npm 安装或 npx 运行即用
• 处理大文件时需注意 ChatGPT token 消耗成本,示例:Bootstrap 压缩包反混淆约 0.5 美元

精准还原被混淆的 JS 代码,助力安全审计、逆向分析与代码维护,降低阅读和理解门槛,提升研发效率。
AI-Crash-Course,助你两周内高效掌握核心进展:

• 创始人Henry Shi,传统软件创始人成功转型AI,汇总必读资源,聚焦实战与前沿
• 系统学习路径:从神经网络基础到大型语言模型(LLM)系列;精选2023-2025年最新Survey综述论文
• 重点论文覆盖基础建模(Transformer、Scaling Laws、RLHF等)、规划推理(AlphaZero、CoT、ReACT、ARC-Prize)及应用(Toolformer、GPT4、Llama3、Gemini1.5)
• 强调最新突破:无监督强化学习DeepSeek、无需奖励模型的DPO、人类水平评估LLM-as-Judge等
• 丰富辅助资源:顶级视频讲座(3Blue1Brown、Andrej Karpathy)、前沿课程(Full Stack Deep Learning)、详尽提示工程指南
• 跨领域视角:视觉Transformer、扩散模型Latent Diffusion,拓展非LLM AI知识边界
• 结构化阅读清单兼具理论深度与实践指导,帮助从业者快速定位重点,直击AI技术发展关键节点
#资源参考 #AI课程 #AI资源
新书《Agentic Design Patterns》由谷歌专家 Antonio Gulli 编写,深入探讨现代 AI agent 设计的实用范式与架构,打破传统 LLM 局限,推动智能体演进。| #电子书

• 系统化总结 AI agent 设计模式,涵盖决策、执行、环境交互及多 agent 协作。
• 聚焦 agent 的自主性与适应能力,提升模型的动态响应和任务完成效率。
• 案例驱动,结合前沿研究与实践,帮助开发者构建可扩展、高效的智能系统。
• 兼顾理论深度与工程实用,适合 AI 研发者、架构师及高级研究人员长期参考。
• 体现智能体从单纯语言模型向具备代理能力系统的转变,超越传统学术范式。

这本书极具前瞻性,适合想掌握 AI agent 最新设计策略的专业人士。
Get Jobs【工作无忧】 :覆盖主流招聘平台的自动投递利器,助力程序员精准高效求职:

• 支持Boss、前程无忧、猎聘、拉勾、智联招聘五大平台,自动投递简历,省时省力
• AI智能匹配岗位,自动生成个性化打招呼语(Boss专属),提升HR回复率📈
• 支持Boss直聘发送图片简历,主动出击无需等待HR索要,显著增加曝光率📷
• 定时投递功能,自动重复投递,保障每天高频覆盖,不错过任何机会
• 智能过滤不活跃HR、猎头岗位及不符合期望薪资岗位,精准投递,减少无效劳动
• 企业微信实时推送投递进度,动态掌控应聘情况,及时调整策略
• 自动维护黑名单,避免重复投递低效企业,优化投递质量和效率
• 配置灵活,集中管理筛选条件,支持超长Cookie登录,减少重复扫码操作
• 开源免费,欢迎参与贡献,加入开发组享免费Intelli编辑器全家桶资源
• 适合在复杂招聘环境中主动出击的求职者,推荐配合手机App使用Boss投递,避免封号风险
1
Prompt Tools:一款强大的桌面应用程序,旨在彻底简化你的 Prompt 管理工作流程。它基于 Tauri 框架构建,为你提供快速、安全和跨平台的极致体验

📌 专注于提示词管理,彻底解决 Prompt 散落各处、查找困难、分类混乱、跨设备同步难题。
💻 跨平台设计,现支持 macOS (Apple Silicon),未来将覆盖 Windows 和 Linux,原生体验流畅自然。
⚡️ 轻量高效,基于 Rust + Tauri 构建,启动迅速,资源占用低,彻底告别卡顿。
🔐 本地优先,数据安全私密,所有信息存储在本地,避免云端泄露风险,掌控完全由你。
✍️ 功能全面:支持创建、编辑、搜索和组织提示词,搭建属于你的 Prompt 知识库。
🧰 开源免费,技术栈现代(TypeScript, React, Rust, SQLite),支持开发者自由定制与二次开发。
Dataset Viewer:由 AI Agent 全自动打造的现代高性能数据集浏览器

⚡️ 支持 100GB+ 大文件秒开,虚拟渲染确保流畅体验
🔍 毫秒级实时搜索,支持高亮,轻松定位海量数据
📦 无需解压即可预览 ZIP/TAR 等压缩包,极大提升效率
🌐 多协议支持:WebDAV、SSH/SFTP、SMB/CIFS、S3、本地及 HuggingFace Hub
🗂 支持多格式文件:Parquet、Excel、CSV、JSON、代码文件(Python、Java、C++等)
🎨 现代响应式界面,支持暗黑/明亮主题及多语言切换
📄 文档支持:Markdown 预览,Word、PowerPoint、PDF(可搜索)
📊 数据交互:CSV/Excel 过滤排序,结构化 JSON 折叠高亮展示
💻 代码高亮,支持大文件,提升开发与数据分析效率
🌐 远程连接管理简单,方便跨平台数据访问与分析
🤖 100% AI 生成代码,基于 Tauri(Rust)+ React,原生性能保障
🧠 智能内存管理,分块加载与虚拟滚动,百万级行数据轻松应对
• 适合数据科学家、日志分析师、归档管理及性能敏感场景使用

深度利用流式传输及智能加载,重塑大数据集浏览体验。
AI项目实战代码库,覆盖从Agentic AI、多智能体协作,到机器学习管道与大模型应用的全流程实现:

• 详尽Agent构建教程:基于Biopython的生物信息AI Agent、Microsoft Agent-Lightning轻量级开发、LangGraph多轮对话研究Agent、Gemini驱动的分层推理与任务规划Agent等,涵盖短期记忆与向量长时记忆融合技术。
• 多智能体系统实战:OpenAI Agents多Agent协作、基于Microsoft AutoGen和Gemini API的多轮对话框架、Google ADK扩展的可扩展多Agent系统,以及Agent Communication Protocol (ACP)的天气Agent示例。
• 机器学习与数据处理管线:MLE-Agent与Ollama本地端到端管线构建,TPOT自动化机器学习,Polars高性能金融分析,Presidio文本PII检测,Daytona安全代码执行工作流,及合成数据生成技术全覆盖。
• LLM及高级AI工具集成:GPT-5能力解读,LangChain、LangGraph、Claude、Hugging Face模型的深度结合,Mistral Agents API的标准JSON Schema函数调用,多工具动态选择与实时推理。
• 企业级生产部署:支持监控、编排与扩展的定制Agent,安全Python执行环境,基于Streamlit的多工具交互界面,Jina Search多模态检索,及自动化报告生成系统。
• MCP(Model Context Protocol)详解与实操:OAuth 2.1集成、FastMCP自定义协议实现、Google Gemini 2.0功能调用工作流、Vizro仪表盘构建,全面提升模型上下文管理与工具链协同效率。

此项目不仅提供丰富的代码示例和Notebook,还聚合了最新AI技术的应用落地路径,适合开发者、研究者和工程师深入学习和快速迭代。
#资源参考 #AI项目实战代码
OpenCourseCatalog

⭐️ 网站功能:公开课程目录

📁 网站简介:一个集中化的公开课程目录,主要聚焦于来自Bilibili平台的教育资源。都是作者从YouTube搬运的。

整理和归类来自YouTube等国外平台的公开课程视频,以便于国内用户能够方便地访问和学习。这些课程涵盖了多个学科,包括数学、物理、计算机科学等,用户可以通过该目录轻松找到所需的学习资源。

🔗 网站网址:点击打开
#资源参考 #学习资源 #视频教程
API大全

⭐️ 网站功能:API收集

📁 网站简介:一个全面的API接口导航平台,为开发者提供丰富的API资源和信息。可以通过该网站轻松查找和访问各种API接口,包括工信部、百度、搜狗、必应等知名平台的API。还有绘画、数据处理、AI应用等多个领域。

🔗 网站网址:点击打开
#资源参考 #API大全 #API接口导航平台 #工具
WeChatMassTool

⭐️ 项目功能:微信群发消息

📁 项目简介:一款开源的微信群发消息的开源项目。支持导入好友标签名单、导出运行结果,并且通过调用Windows API实现快速发送消息的功能。

可以在Windows系统上使用该工具,无需安装,直接下载编译好的exe程序即可使用。

🌐 项目地址:点击直达
Agent OS:让 AI 代码代理从“迷茫实习生”变身高效开发者

• 通过结构化工作流,精准捕捉项目规范、技术栈及代码库细节,确保 AI 代理首次提交高质量代码,避免多次返工
• 兼容 Claude Code、Cursor 等多种 AI 编程工具,无论新项目还是既有代码库均可适用
• 适配所有编程语言和框架,支持从大功能开发到小规模修复的多样任务
• 由 Builder Methods 创始人 Brian Casel 设计,专注于帮助专业开发者和团队高效利用 AI
• 提供详尽文档、安装指南及最佳实践,助力持续优化 AI 辅助开发流程
• 开源 MIT 许可,社区活跃,已获 1.4k+ 星标关注与 290+ 分支贡献

Agent OS 重新定义了 AI 助力的软件开发效率,将规范与执行无缝结合,是未来软件团队不可或缺的生产力工具。
Reddit 链接加上 `/.json`,即可无需登录自动抓取完整讨论串及所有回复,直接获取深度嵌套的原始数据和元信息,配合 LLM 深度分析,挖掘细分社区的巨大商业价值。| @TheAhmadOsman

• 完全公开、免 API 限制,简单模拟浏览器请求头即可自动化采集
• 支持多层回复树结构,数据细节丰富,适合情感分析、趋势预测、内容策划等多种应用
• 结合 Notion AI 等工具,实现子版块最佳发帖时间、标题优化等策略自动化
• 适合做细分领域的商业情报、市场调研、内容变现,挖掘垂直流量红利
• 需注意抓取频率,避免速率限制;社区用户群体特殊,需精准定位目标市场
• 公开数据虽多,关键在于如何从“海量噪声”中提炼出用户愿意为之买单的洞察

这是一条低门槛、高价值的数据入口,真正能变现的不是数据本身,而是数据背后的精准洞见和落地执行方案。