硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
一、AI 编程省钱之道
AI编程省钱之道的核心在于最大化利用免费或低成本的AI模型和工具,并优化AI交互方式,以节省令牌消耗和提高效率

1、免费 AI 模型自助餐 —— 网页AI聊天界面
充分利用各种免费的AI聊天界面进行规划和咨询。

首先,打开浏览器,加载多个标签页,分别指向强大AI模型的免费版本,以便获得多种视角和能力。常用的免费AI模型和平台包括:

z.ai :网页版免费使用GLM 4.5,性能堪比Claude 4,主打编程和智能化。

Kimi.comKimi K2,类似Claude或Opus的模型,网页版免费使用。和GLM4.5方向类似。

chat.qwen.ai 上的 Qwen3 Coder 及其他新模型。

OpenAI Playground:通过设置账户数据共享(允许OpenAI使用数据进行模型训练),可获得大量免费令牌。

Google AI Studio:Gemini 2.5 Pro/Flash通常免费且不限使用。Gemini 2.5 Pro在调试、规划和解决多种问题方面表现出色。里面有个 Build apps with Gemini 主要使用LLM擅长的React和TypeScript,用来进行项目初始化挺不错。

Poe.com:提供高级模型如Claude 4或GPT-5的免费每日积分。

OpenRouter:提供一些免费模型,也支持付费使用。

ChatGPT:免费版本少量GPT-5可用。

Microsoft Copilot :免费的GPT-5模型。

GitHub Copilot :免费的GPT-4.1、4o模型,少量额度高级模型如GPT-5、Claude 3.7/4。

Perplexity AI:特别擅长研究密集型问题。

Deepseek:v3和r1版本在其网页界面免费,但需注意上下文限制。Deepseek R1 0528是具有增强推理能力的超智能模型。

Grok.com:少量免费gork4且通常无审查限制,适合通用使用、深度研究和图像编辑。

Phind:免费,尝试展示流程图/图表可视化。

lmarena.ai:LLM竞技场,提供免费访问GPT-5、Claude Opus 4、Sonnet 4等。

Claude.ai:免费但有时使用受限。

2、更智能、更经济的AI编程代理工具
在网络聊天界面直接使用 AI 通常比通过 IDE 或 AI编程代理(如 Cline,Cursor,Trae,Copilot等)更擅长解决问题和提出解决方案,但是如果用于AI编程,那么AI Agent将更专注于上下文工程和工具的调用,更适合编码和程序开发。


AI 模型在接收的文本越少时通常越聪明。复杂的输入,例如AI代理工具的长篇指令或与问题无关的大量上下文,会消耗模型的更多”智能“,导致其解决实际问题的能力下降。



超长上下文AI模型 (2025年8月):

模型 (Model)
开发者 (Developer)
最大上下文窗口 (Max Context Window)
特点(Features)

Gemini 2.5 Pro
Google
100万 (1M) Tokens
上下文窗口最大,擅长复杂调试和架构规划,综合能力强

Qwen3
Alibaba (阿里云)
25.6万 (原生 256k) / 100万 (扩展 1M)
强大、可靠且成本效益高,编码能力出色

GPT-5
OpenAI
40万 (400k) Tokens
OAI最新模型,综合能力强,性价比高

Claude 4
Anthropic
20万 (200k) Tokens
编程和智能化能力最强,价格贵

Kimi k2
Moonshot AI (月之暗面)
20万 (200k) Tokens
最接近Claude,编码能力强

AI编程代理工具

​ IDE: Cursor、Trae、Windsurf、Zed、Kiro

​ 插件: Cline( Roo Code, Kilo Code )、Augment、Copilot

​ CLI: Claude Code、Gemini CLI、Qwen Code

基于GUI的IDE(如VSCode),即使是AI原生的,在自动化和可脚本化方面也存在固有限制。而命令行是自动化、脚本编写和复杂工具链的原生环境。通过创建CLI代理,拥有最大的可脚本化性和与基于shell的工作流的集成,AI公司为开发者提供了一个可以被直接集成到这些自动化工作流中的“强大工具”。这些工具的核心功能围绕着代理式推理、工具使用和复杂的多文件编辑。这些工具的架构通常也为其他产品奠定了基础。

AI 编程代理工具主要特点

类别 (Category)
工具名称 (Tool)
主要特点

AI 原生 IDE
Cursor
AI优先的VS Code分支,可以帮助代码生成、编辑和调试。深度集成AI,擅长代码库问答、自动重构和“从零生成”代码块。

Zed
Atom 联合创始人打造的高性能、多玩家协作的开源代码编辑器,用Rust编写,内置了AI功能,性能优秀、界面整洁。在macOS/Linux系统推出,Windows可自己编译。

Kiro
AWS出品的一款文档优先的AI代理IDE,基于“规范驱动开发”(Spec-Driven Development, SDD),AI根据需求文档自动规划并执行编码任务,适合需要前期设计的复杂项目。

Windsurf
Windsurf是一个“代理式IDE”,旨在通过在人类和其AI代理“Cascade”之间创建无缝的协作体验,让开发者保持在“心流状态” 。

Trae
SOLO模式将AI定位为一个自主的“上下文工程师”,能够“直接交付”生产就绪的代码。

IDE 插件(Agent Plugins)
GitHub Copilot
由GitHub和OpenAI开发,提供强大的代码自动补全、函数生成和解释功能。集成Agent模式和各种工具调用功能。

Augment
专注于代码搜索和上下文感知的AI插件,提供超强的仓库检索,能根据你的代码库提供精准提示和自动化编码。

Kilo Code( Cline、Roo Code )
拥有Cline的易用性和Roo先进的上下文处理能力 ,通过简单界面来提供多模式功能(架构师、编码员、调试员),可自定义代理模式。编程任务高度自动化,支持多种模型自定义和MCP工具。内置提示词将一个命令拆分为具体小任务,高效进行编码。

命令行工具(CLI)
Gemini CLI
Google官方提供的开源AI编码命令行工具,允许开发者直接与Gemini模型交互,内置各种工具,通过高级代码理解、自动化任务和智能辅助来增强您的开发工作流。

Claude Code
Anthropic的Claude模型CLI工具,能够深度理解代码,高度智能化,可以直接编辑文件、运行命令和创建提交。通过简单的自然语言请求高度自动化地处理重复或复杂的任务。支持子代理并行,可以专注于单一任务,提高效率。

Qwen Code
阿里巴巴通义千问系列模型的AI编码命令行工具,为开发者提供强大的代码生成能力。改编自 Gemini CLI,并针对 Qwen3-Coder 模型进行了专门优化。可添加自定义OpenAI格式的模型API。

AI Agent网站,快速构建全栈项目:

JulesBoltv0Trickle 每天都有免费额度构建全栈的项目。...

View original post
#人声分离 #降噪 #音频

Voicss

人声分离工具,可将音频中的人声和背景音乐进行分离,并可单独下载,支持 MP3、WAV、M4A、FLAC 等格式,亲测效果非常不错,可以用来制作伴奏或者其他音频创作,另还有音频降噪功能,完全免费,无需注册。

https://www.voicss.com
#字体 #SVG #开源

Google Font to SVG Path Converter

文字转 SVG 矢量图工具,内置 Google Fonts 字体,也可以上传本地字体,可自定义字号、描边、填充、大小、动画、笔画粗细等参数,实时预览生成效果,支持一键复制代码,以及下载 SVG/DXF 文件,完全免费,无需注册。

这也算小众工具了,做文字 LOGO 或者激光刻字可能会用到……

🌐 演示地址 🐙 项目地址
#markdown #格式转换

MarkdownDown

网页一键变 Markdown 工具,可将任意网页内容一键清理为干净的 Markdown 文本,并自动下载图片、打包为 ZIP 文件,还可选用 GPT-3/4 对 Markdown 进行进一步整理(例如摘要、去除链接、重排格式等),同时支持输出干净的 HTML 版本,完全免费,无需注册。

https://markdowndown.vercel.app
Goose 是一个开源的、可扩展的人工智能代理,旨在实现工程任务的自动化和透明化。

Goose 可在本地运行,也可通过添加自己的 LLM 和集成外部服务器或应用程序接口进行定制,使其能够独立处理调试和部署等任务。

🧬 https://github.com/block/goose

网站: https://block.github.io/goose/

#AI #tools
Docker MCP Gateway:连接 AI 与外部数据的安全桥梁

• 基于 Docker 容器的 MCP 服务器管理,实现隔离运行与高效部署
• 统一网关接口,简化多客户端(VS Code、Cursor、Claude Desktop 等)接入,确保配置一致性
• 集成 Docker Desktop 秘钥管理,杜绝环境变量泄露,保障 API 密钥和凭证安全
• 支持 OAuth 认证流程,轻松接入需授权服务
• 动态发现和配置 MCP 工具、资源及提示,提升开发灵活性与扩展性
• 内置日志与调用追踪,方便监控和调试
• 兼容 Docker Desktop MCP Toolkit,独立 CLI 插件模式灵活使用
• 通过配置文件集中管理服务器目录、工具和策略,提升长期维护效率

为 AI 应用搭建稳定、可控的数据接入层,助力生产环境快速集成与安全管理。
Laravel Boost 打造 Laravel 专属的 AI 辅助开发新体验,助力本地开发智能提效。

• 基于 MCP 服务器架构,集成 15+ 专用工具,支持深度上下文感知,提升 AI 生成代码质量
• 内置强大文档 API,涵盖 17,000+ Laravel 相关知识点,利用语义搜索实现精准检索
• 支持多种 AI 代理接入(如 Cursor、Claude Code 等),灵活融入现有工作流
• 提供丰富的 MCP 工具:应用信息读取、浏览器日志、数据库查询与架构解析、路由与环境变量检查、日志读取、代码执行等
• 包含针对 Laravel 及生态多款主流包(Livewire、Filament、Inertia、Pest、TailwindCSS 等)的 AI 指南,确保代码与框架高度契合
• 支持自定义 AI 指南,通过简单的 blade 模板扩展,灵活适配项目需求
• 开源 MIT 许可,持续迭代中,适合追求高效智能开发的 Laravel 开发者

安装命令:
composer require laravel/boost --dev  
php artisan boost:install
Kronos:首个开源金融市场K线语言基础模型,专为复杂、高噪声的金融时序数据设计

• 训练数据涵盖45+全球交易所,支持OHLCV多维连续数据的分层离散化tokenizer,结合大规模自回归Transformer,实现统一量化任务建模
• 多规格预训练模型覆盖4.1M至102M参数,满足不同算力与应用场景需求,均可从Hugging Face Hub获取
• 通过KronosPredictor简化预测流程,自动处理数据预处理、归一化和反归一化,支持512长度上下文,方便快速生成多路径概率预测
• 在线演示实时展示BTC/USDT未来24小时走势预测,助力量化策略验证与研究
• 提供完整示例代码,涵盖含或不含成交量的K线预测,便于快速上手与二次开发
• MIT开源协议,科研及实务应用均可自由使用,欢迎引用论文
Deep Agents UI 是 LangChain 生态中专为 Deep Agents 设计的定制化界面,帮助开发者高效管理和交互多任务 AI 代理。

• 兼容 Deep Agents 包,支持处理多种复杂任务,提升 AI 代理的实用性和灵活度
• 本地和生产环境均可快速部署,支持自定义环境变量配置(部署地址、Agent ID、LangSmith API Key)
• 简单三步启动流程:配置 .env.local → 安装依赖 → 启动服务(npm install & npm run dev)
• 轻量 MIT 开源协议,社区活跃,已有 700+ star,便于二次开发和扩展
• 直观 UI 设计,结合视频教程,降低学习门槛,方便理解和使用
• 适用场景广泛,适合需要深度任务处理和多代理协作的应用环境

这套工具不仅优化了 AI 代理的可操作性,更为长期构建复杂智能系统提供了稳定基础。理解并灵活应用此 UI 能显著提升 AI 代理管理效率和用户体验。
TrackerLab:集成IsaacLab与多模态全身控制的模块化框架,专为复杂人形机器人动作设计打造。 | #框架

🦿 完全集成IsaacLab,采用管理器架构简化运动追踪与控制
🔁 支持SMPL/AMASS/FBX动作数据的全链路重定向,包含T姿态对齐、滤波与插值
🎮 多种控制模式自由切换,包括外骨骼姿态控制、PHC等,指令管理灵活高效
🔀 基于有限状态机(FSM)的技能图设计,支持手动触发、规划器和摇杆操作
⚙️ 支持Unitree H1等真实机器人,代码清晰、易扩展,方便集成新动作与控制策略
📂 自带定制Gym环境,可直接用于IsaacLab训练脚本,快速上手多任务训练与播放
📚 提供中英文教程、完整数据集准备指南,零依赖独立安装,快速部署体验
💼 开源MIT许可,欢迎研究者与开发者合作共建,推动人形机器人智能运动前沿
Awesome AI Apps:一站式 AI 应用开发资源库,涵盖 RAG、agents、工作流等多种前沿实践,助力打造高效智能系统:

• 汇集 Google ADK、OpenAI Agents SDK、LangChain、LlamaIndex、Agno、CrewAI、AWS Strands 等主流 AI Agent 框架
• 多层级示例覆盖:从快速入门 Starter Agents(邮件助手、任务管理、天气机器人)到实用 Simple Agents(财经监控、日程助手、数据库对话)
• MCP(Model Context Protocol)方案示例:文档语义检索、GitHub 代码库分析、知识问答多场景应用
• RAG(检索增强生成)案例丰富,支持多文档对话、简历优化、PDF 分析、OCR 处理等
• 复杂端到端流程示范:多阶段深度研究、社交媒体及招聘分析、AI 趋势挖掘、会议演讲稿自动生成、金融数据预测服务
• 完整开发环境准备与安装说明,项目均含详细文档,适合不同水平开发者快速上手
• 社区开放贡献,持续更新,MIT 开源协议保障自由使用与改造

持续探索 AI Agent 与 LLM 驱动应用的多样可能,打造可复用、可扩展的智能系统架构,推动 AI 实践落地与创新。
#资源参考 #AIAgent #LLM #AI开发资源库
高效阅读学术论文的实用流程分享

• 利用 Obsidian 结合 pdf++ 插件与 Excalidraw,实现 PDF 注释与可视化思维导图无缝集成,极大提升笔记的结构化和直观性。
• 通过论文中的引用链条决定后续阅读重点,构建知识网络而非盲目阅读,节省时间聚焦核心文献。
• 主要借助 Google Scholar 和 arXiv 等学术搜索引擎精准定位相关论文,确保信息权威且及时。
• 关注专业信息源如 bycloud、yannic 频道,获取最新、高质量的研究动态,避免信息滞后。
• 保持社交平台(X 和 LinkedIn)时间线整洁,利用平台算法推荐发现有价值论文,结合多渠道信息源实现全面覆盖。
• 通过系统化工具与渠道整合,打造个性化的科研知识管理体系,优化学习路径和研究效率。
👍1
腾讯最新发布的Yan模型,开启了无需游戏引擎的1080p 60fps实时AI视频生成新时代,延时仅0.11秒,支持无限视频长度。它基于约150天的游戏视频训练,实现高保真互动视频环境仿真,包含三个核心模块:

• Yan-Sim:实现帧级交互模拟,采用基于扩散模型的因果架构,结合高压缩VAE、DDIM采样优化与模型剪枝量化,确保1080p、60fps的实时性能。
• Yan-Gen:多模态扩散Transformer,融合文本、图像及动作控制,适配从封闭游戏到开放世界的多样场景,支持文本和图像导向的互动视频生成。
• Yan-Edit:多粒度实时编辑,结合结构(交互对象增减)与风格(颜色、纹理变换)编辑,利用深度图作为中间状态连接模拟与渲染模块,实现灵活可控的视频内容调整。

尽管Yan在技术规格上领先,但在视觉真实感和连贯性上仍略逊于Google Genie 3。后者具备更广泛的多模态能力和全球化训练数据,在多项公开基准测试中表现出色。Yan则更聚焦中文语境及合规应用。

这标志着AI游戏世界生成从传统引擎架构向纯AI推理时代的转变,未来有望彻底颠覆游戏开发与虚拟现实体验。当前主要挑战仍在于内容连贯性、对象持久性及成本效率,期待后续技术迭代进一步完善。
构建智能AI代理的新范式:基于MCP与OpenAI gpt-oss的实用指南

• 使用MCP打造标准化工具接口,简化AI代理与外部工具的交互,提升代理能力与扩展性。
• 结合OpenAI最新gpt-oss-120B大模型,作为强大LLM骨干,实现更精准且多功能的智能响应。
• Hugging Face轻量级客户端支持TypeScript(@huggingface/tiny-agents)和Python(huggingface_hub[mcp]),入门简便,跨语言体验无缝衔接。
• 本地浏览器代理示例:通过Playwright MCP服务器,代理可自主浏览互联网,进行信息检索与任务执行,具备实战应用价值。
• 灵活定义agent.json配置,支持自定义模型、工具、输入参数及系统提示,确保代理行为可控且高效。
• 轻松接入Hugging Face MCP服务器,访问数千AI空间,实现代理与多样AI服务的深度融合。
• 运行方式统一,Python与JavaScript客户端均支持“一行命令”快速启动,适合开发测试与生产部署。
• 设计理念强调代理需深度规划调用逻辑,反思执行结果,避免盲目调用与猜测,确保解决方案的准确性与完整性。

这套方案不仅降低了构建复杂AI代理的门槛,也为长期构建智能、多工具协同的AI系统奠定了基础。未来AI代理将不再孤立,而是通过MCP无缝连接多样能力,真正实现智能助理的多场景落地。
自学计算机科学,推荐从这九大核心科目入手,结合经典教材和优质视频课程,系统掌握基础知识,奠定扎实的技术根基 | #计算机科学

• 编程:《计算机程序的构造和解释》(SICP),配合 Brian Harvey 的 Berkeley CS 61A 课程,深入理解递归等核心概念,告别“似懂非懂”。

• 计算机系统结构:推荐《深入理解计算机系统》(CS:APP),辅以 Berkeley CS 61C,帮助你构建从硬件到软件的完整认知;入门者也可选《计算机系统要素》(Nand2Tetris),通过项目实操理解计算机内部协作机制。

• 算法与数据结构:《算法设计手册》是实用主义者的首选,Steven Skiena 的视频课程生动易懂;搭配 Leetcode 练习,提升实际问题解决能力。

• 数学基础:计算机科学离不开离散数学,首选 Lovász 的课程笔记及 MIT 的《计算机科学中的数学》视频课程,线性代数则推荐“Essence of Linear Algebra”系列和 Gilbert Strang 教授的经典教材。

• 操作系统:《操作系统导论》(OSTEP)免费且结构清晰,适合自学;后续可深入阅读 Unix、FreeBSD、Mac OS X 内核设计等专业书籍,实践可选 MIT 的 xv6 小型操作系统代码。

• 计算机网络:推荐《计算机网络:自顶向下方法》和 Stanford CS 144 课程,注重项目实操,理解网络协议和架构。

• 数据库:先看 Berkeley CS 186 课程录像,辅以“数据库红书”论文集,强化理论基础。推荐《数据库管理系统:原理与设计》作为入门教材,进一步可读 Jim Gray 的经典著作。实践建议自行实现简单关系数据库,理解底层机制。

• 编程语言与编译器:Bob Nystrom 的《Crafting Interpreters》活泼且系统,适合初学;经典“龙书”《编译原理》则适合有导师指导的深入学习。EdX 上 Alex Aiken 的课程是极佳配套资源。

• 分布式系统:Martin Kleppmann 的《数据密集型应用系统设计》为实用导向佳作,MIT 6.824 课程视频免费开放。建议结合阅读经典论文和参与社区(如 Papers We Love)加深理解。

如果时间有限,重点推荐《深入理解计算机系统》和《数据密集型应用系统设计》两本书,投入回报极高,特别适合自学工程师。

学习计算机科学,助你成为能够驾驭底层原理、解决复杂问题的工程师,而非仅会使用工具的“跟风者”。掌握基础,职业成长自然水到渠成。
Cognito AI Search

⭐️ 项目功能:AI搜索引擎

📁 项目简介:一个强大的搜索工具,结合了本地AI助手和私有网络搜索引擎,可以在自己的硬件上运行AI助手,确保所有数据都保留在本地,避免了第三方的跟踪和数据收集。

支持多种AI模型的集成,可以根据自己的需求进行定制,确保搜索和交互的私密性和安全性。

🌐 项目地址:点击直达
aTrain

⭐️ 项目功能:语音转录

📁 项目简介:一个用于离线转录语音录音的图形用户界面工具,支持说话人分离,利用最先进的机器学习模型进行处理。

能够快速、准确地转录多种语言的语音,确保数据隐私,因为所有处理都在用户的设备上进行,不会将数据上传至互联网。

🌐 项目地址:点击直达
天天动漫

⭐️ 网站功能:在线动漫

📁 网站简介:一个提供各种类型动漫在线观看的平台,包括中国动漫、日本动漫、欧美动漫和里番动漫等。可以在网站上找到最新更新的动漫集数和热门动漫推荐,网站内容包含18+的成人动漫。

🔗 网站网址:点击打开
AIGC剧情短剧导演大师流量课 (视频)

百度网盘:https://pan.baidu.com/s/1JY4Y5ntx7A0FW6eEGpMPZw?pwd=6666 提取码:6666
夸克网盘:https://pan.quark.cn/s/09c8033c19f4
2025版 高途母题大招宝典(物理高考)
百度链接: https://pan.baidu.com/s/14AoKnZbqIadmWaM8Rg9rYw 提取码: n4mt
夸克链接:https://pan.quark.cn/s/c16990bf62ee
2025版 高途母题大招宝典(生物高考)
百度链接: https://pan.baidu.com/s/1RU8rT_PmUt7ZMhpmyHateA?pwd=83ug 提取码: 83ug
夸克链接:https://pan.quark.cn/s/ccd01ffbc5ca
2025版 高途母题大招宝典(化学高考)
百度链接: https://pan.baidu.com/s/1OM6kuq5912npti01taLmhA?pwd=afqn 提取码: afqn
夸克链接:https://pan.quark.cn/s/d7e78c3ad2bf
2025版 高途母题大招宝典(数学高考)
百度链接: https://pan.baidu.com/s/1HD5wo3d4b9uuSItqb4s-yg 提取码: qev9
夸克链接:https://pan.quark.cn/s/e851d97e4292
2025版 高途母题大招宝典(英语高考)
百度链接: https://pan.baidu.com/s/1rU3FwSqPDM1n9hWjBuu9Pg 提取码: rmqw
夸克链接:https://pan.quark.cn/s/6c1e4b34c003
数据恢复R-Studio v9.5.191510便携版

R-Studio是一款强悍的驱动级数据恢复软件,采用独特的数据恢复技术,支持对NTFS、ReFS、FAT/exFAT、Ext2FS/Ext3/Ext4、UFS、HFS等分区文件系统恢复数据,支持对已损坏或删除的分区、加密文件、数据流进行数据恢复,支持硬盘分区创建镜像文件.rdr、RAID磁盘阵列,该软件最大的特色在于可以自动识别 RAID 参数修复损坏的磁盘阵列,在数据恢复效率和质量上非常出众。此外,R-Studio Network 版本支持远程链接到计算机磁盘恢复数据、S.M.A.R.T. 属性监视、文本/十六进制编辑、大量参数设置等功能。

https://xiaodao.lanzoui.com/b0dprp6pc