硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
#开源 #抓包 #工具

🔗 ProxyPin - 开源免费抓包工具

您可以使用它来拦截、检查和重写 HTTP(S) 流量,支持手机扫码连接、域名过滤、搜索、请求重写等功能

支持Windows、Mac、Android、IOS、Linux 全平台系统
#AI #阅读 #开源 #工具

📰 Revornix - 一款开源的 AI 资讯管理工具

Revornix 可一站式收集资讯包括新闻、博客、论坛等,收集之后将基于 AI 转化为 Markdown,并使用 Milvus 向量数据库存储

它不仅是一个信息阅读和存储工具,更是一个集成了智能推荐和个性化筛选功能的阅读系统,让人们能更加专注阅读有用的信息
EDUMAIL

⭐️ 网站功能:教育邮箱

📁 网站简介:一个提供免费的教育邮箱的网站。可以用于访问各种在线学习资源、软件折扣和学术数据库。

🔗 网站网址:点击打开
刘飞·怎样用AI绘画

描述:这门课不要求你有绘画基础更不需要你了解美术史、设计史。因为对于AI绘图来说,目前最主流的交互方式就是自然语言,你只要懂得如何输入文字,就可以轻松掌握AI绘画

链接:https://www.alipan.com/s/jHJa4s67Xax

📁 大小:NG
🏷 标签:#学习 #知识 #课程 #资源 #刘飞·怎样用AI绘画 #ali
非正式会谈 第九季(2025) 更新至0725期

描述:B站口碑常青树综艺IP。颜值与才华兼具的跨文化交流脱口秀。国内市场上唯一一档各国青年用同一种语言畅聊时下热议话
题的节目。新一季将以棚内谈话、外景拍摄及专题特辑的多维方式打开野生外国人内容。◆《非正式会谈》全新篇章,更多
Z世代话题,更多国内外青年观点交流与碰撞。

链接:https://www.alipan.com/s/wvCefY4jJBj

📁 大小:X
🏷 标签:#真人秀 #非正式会谈 #第九季 #ali
幽络源

⭐️ 网站功能:源码下载

📁 网站简介:一个提供免费源码下载的网站。可以在该网站上找到各类编程语言的源码分享,包括Java、Python等,同时也有丰富的技术教程,涵盖逆向工程、全栈开发等领域。

🔗 网站网址:点击打开
腾讯云 CDN EdgeOne 现在无需兑换码即可获得免费套餐

无论用户此前是否有免费套餐,都可以通过分享测速结果再获得两个免费套餐。

完成测速后,点击 X 和 Facebook 图标即可快速分享 —— 每成功分享到一个平台,回到现在的活动页即可获得一个免费套餐,每个平台仅可获得一次,重复分享不再额外获得。套餐将直接下发至账户,无需使用兑换码,可在 EdgeOne 控制台的"计费管理" > "套餐管理"下查看免费套餐。

活动地址:https://edgeone.ai/zh/get-free-plan

腾讯云于6月中旬推出了有限名额的内测活动,当时仅有少数人获得了兑换码。

[消息等级 Level C2 · 简要]
阿里发布的 WebAgent 系列,打造面向信息检索的多智能体生态,推动下一代自主信息寻求技术革新 | link

核心产品:WebWalker(ACL 2025 论文)、WebDancer、WebSailor、WebShaper,覆盖从基准测试到复杂推理的全链路能力
• WebShaper:基于信息寻求任务形式化,提出数据合成新方法,刷新 GAIA(60.19)与 WebWalkerQA(52.50)等多个基准最高成绩
• WebSailor:创新后训练策略与强化学习(DUPO),突破超复杂信息检索任务,性能接近商业顶尖系统
• WebDancer:采用 ReAct 框架,构建原生自主搜索推理模型,融合轨迹级监督与强化学习,实现高效冷启动与泛化能力
• WebWalker:为大语言模型设计的 Web 遍历基准和多智能体框架,助力评测与提升网络信息寻求能力
• 生态配套:多阶段训练范式、丰富演示视频、多平台一键部署(含阿里云 FunctionAI),支持快速上手和深度研究
• 长期价值:系统化构建信息寻求代理模型,强调任务形式化与代理智能的内在结合,具备跨任务泛化和行业应用潜力
生成同步字幕的高质量有声书,支持 EPUB、PDF 及纯文本一键转换。

• 支持多平台(Windows、Mac、Linux)安装,自动配置 Python 和 CUDA,兼容主流 GPU(NVIDIA,Linux 下部分支持 AMD)。
• 采用 Kokoro-82M 语音合成模型,音质自然,支持美式、英式、中文等多语种,具备自定义混音调节功能。
• 内置字幕生成,支持按句子、词数分割,输出多种音频格式(MP3、WAV、FLAC、OPUS、M4B含章节)。
• 支持章节标记与元数据编辑,方便分章节保存与管理,批量队列处理提升工作效率。
• 提供命令行与 GUI 双模式,Docker 容器化部署,适合内容创作者、播客、短视频配音等多场景应用。
• 丰富配置选项:语速调节、个性化声音预听、字幕格式选择、缓存管理、主题切换(含暗黑模式规划)。
• 社区活跃,开源 MIT 授权,支持贡献代码,持续迭代功能,致力于打造高效便捷的有声内容生成工具。

从文本到音频的本质是“内容表达的多模态转换”,Abogen通过精准时间戳同步字幕,解决了传统 TTS 缺乏视觉辅助的问题,极大提升了听觉与视觉的结合体验,赋能内容消费和创作的双重升级。

abogen | #生成器
企业级 AI 编程助手 MonkeyCode,聚焦研发效率与代码安全的深度融合:

• 私有化离线部署,保障代码隐私,彻底避免代码外泄风险
• 兼容第三方及本地大模型,灵活适配多场景 AI 能力扩展
• 企业级管理面板,支持 AI 编程行为的严格审计与管控,提升团队协作安全性
• 内置代码安全扫描引擎,自动发现 AI 生成代码中的潜在安全漏洞,守护代码质量
• 智能代码补全与自然语言编程,理解上下文精准补全,助力快速开发与自动化文档生成
• 基于 Roo Code 插件优化,极致用户体验,轻松集成 VS Code 开发环境

MonkeyCode 将 AI 编程助手从单一工具升级为全方位的研发管理平台,深刻洞察企业级研发的隐私、效率与安全痛点,打造长远可持续的智能研发生态。
#资源参考 #工具 #AI编程助手
DeepCode:开源多智能体代码生成平台,助力科研与开发效率革新

• 论文到代码(Paper2Code):自动解析复杂算法,快速生成高质量生产级实现,极大缩短科研复现周期
• 文本到前端(Text2Web):自然语言描述自动转化为美观响应式网页界面,支持拖拽操作,适用多层次用户
• 文本到后端(Text2Backend):根据需求文本一键生成高性能后端服务,涵盖数据库、API及扩展组件
• 多代理架构:智能调度意图理解、文档解析、代码规划与生成,动态适配不同任务复杂度,实现端到端自动化
• 深度代码理解与检索(CodeRAG):跨代码库语义分析与依赖图构建,自动推荐最佳实现方案和依赖库
• 质量保障自动化:集成静态分析、单元测试生成、文档合成,确保代码可靠性和维护性
• 丰富接口支持:提供CLI与现代Web界面,支持实时代码流、调试及CI/CD集成,满足专业开发需求
• 快速上手:pip安装+配置,支持Windows及多平台,内置Brave与Bocha搜索服务,方便代码和文档检索

DeepCode以多智能体系统为核心,将复杂学术内容和自然语言无缝转化为高质量代码,跳脱传统重复劳动瓶颈,推动研究与开发从“实现”到“创新”的质变。长期来看,平台的架构与自动化能力代表了未来软件开发的主流趋势。
HuggingFace 推出9门全免费开源AI课程,涵盖大模型、智能代理、视觉、3D、音频、游戏等前沿领域,助力从入门到进阶的系统化学习。

• LLM课程:快速掌握大语言模型训练、微调与部署,适合文本处理与聊天机器人开发者。
• Agent课程:基于LangChain+HF构建多步推理AI代理,面向智能工具开发者。
• 深度强化学习:训练智能体自主决策,适合游戏开发、机器人和前沿研究者。
• 计算机视觉:目标检测、分割、分类全覆盖,服务图像领域创业者和研究人员。
• 音频课程:声音信号处理,语音识别与合成应用,面向音频AI工程师。
• 游戏机器学习:NPC行为与程序生成,打造更智能的游戏世界。
• 3D机器学习:点云与网格数据处理,助力AR/VR和机器人领域创新。
• 扩散模型:揭秘DALL·E和Stable Diffusion图像生成技术,适合创意与研究。
• 开源AI实战:丰富笔记本合集,实操代码示范,适用所有AI爱好者。
#资源参考 #AI #教程 #免费AI课程
1
PentAGI:面向信息安全的全自动AI渗透测试系统,集成多智能体与专业工具,打造高效且可控的安全自动化平台。

🛡 完全隔离的Docker沙箱环境,保障操作安全无干扰
🤖 AI驱动的自主智能体,自动规划与执行渗透测试流程
🔧 内置20+安全利器,如nmap、metasploit、sqlmap等,覆盖多维攻击面
🧠 智能记忆管理,长效存储测试结果与成功策略,持续优化测试效率
🌐 多渠道信息收集,支持网页爬虫及多种搜索引擎API(Google、DuckDuckGo等)
👥 多智能体协作,分工明确涵盖研究、开发与基础设施
📊 实时监控与日志集成Grafana/Prometheus,确保系统透明可控
📝 自动生成详尽漏洞报告,附带利用指导,助力风险评估与修复
⚙️ 支持REST/GraphQL API,轻松集成企业安全生态
🏗 微服务架构,支持横向扩展,满足生产环境高可用需求
🔑 灵活认证与多LLM提供商支持(OpenAI、Anthropic等),可自定义部署
🚀 一键Docker Compose快速部署,适用多平台环境
🧪 丰富测试工具(ctester、ftester、etester)保障AI代理性能与功能精准
🏠 完全自托管,数据自主可控,符合安全合规要求

PentAGI不仅是工具,更是一套完整的安全测试方法论:
- 通过智能分工提升渗透效率,降低人为误差
- 持续记忆与知识积累,打造动态适应的安全防线
- 结合多模态信息采集,实现全面威胁洞察
- 开放架构与高扩展性,适配未来安全技术演进
#资源参考 #工具
MatterViz:面向材料科学的交互式可视化工具箱,助力周期表、3D晶体结构及分子动态的深入理解。

• 多维交互:周期表热力图、3D晶体结构、原子模型、核结构、散点图与直方图,涵盖材料科学核心数据表现形式
• VSCode 扩展:支持 CIF、POSCAR、XYZ、TRAJ、HDF5 等多种文件格式,右键菜单及快捷键一键渲染,方便集成研发流程
• 开发中但功能完善,适合科研人员和开发者探索材料属性的内在规律与周期性特征
• 基于现代前端技术栈(Svelte、three.js、d3),兼顾性能与交互体验,具备良好扩展性与社区潜力
• 深层认知:结合元素性质周期性与动态轨迹,助力材料科学从数据到本质的量化与可视化分析

长期价值在于为材料科学研究提供一套可视化方法论框架,提升科研效率和跨学科协作能力。适合关注材料设计、计算化学与数据可视化的专业人士。
unfake.js:专注于 AI 生成图像的精修与矢量化,打造像素级完美视觉资产

• 双核心模式:
- 像素艺术处理器:智能检测像素尺寸,内容感知降采样,网格对齐及色彩量化,消除 AI 生成图像常见的色彩溢出和锯齿。
- 图像矢量化器:基于 imagetracer.js + OpenCV.js,支持降噪预处理、智能调色和细致跟踪,输出高品质 SVG 矢量文件。

• 浏览器工具支持:
- 即时调节参数,拖拽/粘贴导入,前后对比一目了然。
- 调色板编辑与替换,放大镜检视细节,最终成果可下载或复制。

• 项目技术栈:OpenCV.js、image-q色彩量化、UPNG.js快速 PNG 编解码、Tweakpane 交互界面。
• 适用场景:AI 艺术作品修复、像素艺术净化、图像资产矢量化转换,助力创作者与开发者优化图像质量和可用性。

通过智能算法识别图像本质像素结构,结合多元化降采样与矢量化技术,实现 AI 生成作品的视觉纯净与灵活扩展,提升数字艺术的后期处理效率与质量标准。
#资源参考 #AI #AI图像
NVIDIA AI Blueprint:大规模视频搜索与摘要的行业级解决方案

• 支持海量实时及存档视频的智能摄取与结构化分析,助力快速决策与运营优化
• 结合视觉语言模型(Cosmos Nemotron VLM)、大型语言模型(Llama Nemotron LLM)及NVIDIA NIM微服务,实现精准视频摘要和交互式问答
• 采用Context-Aware RAG模块,融合向量库与图数据库,增强多跳推理、时序理解及异常检测能力
• 灵活部署:支持单GPU、局部多GPU及完全远程架构,满足从开发到生产的多种场景需求
• 面向视频分析师与AI开发者,提供一键部署、丰富配置及高度可定制化的流水线和微服务
• 完善文档覆盖API授权、硬件需求、快速上手指南及安全漏洞说明,保障稳定可靠运行
• 典型应用涵盖智能空间监控、仓储自动化及标准作业流程验证,赋能行业数字化转型

视频智能分析已进入多模态融合与上下文增强的新阶段,NVIDIA蓝图提供了系统化路径,降低复杂度,提升效率,释放视频数据的最大价值。
Docling Parse:专注于从程序化 PDF 中高效提取文本、路径及位图资源的轻量级工具包。

• 支持字符、单词及行级别文本坐标输出,精准定位文本内容,方便深度版面分析与可视化
• 同时提取路径和位图图像,满足复杂文档结构解析需求
• 内置可交互式可视化脚本,便于快速验证与展示解析效果
• 性能显著提升,最新版本解析速度较初版快 5-10 倍,适合大规模文档处理
• Python 包即装即用,支持命令行和编程接口,灵活集成到多种工作流
• 完全开源,MIT 许可,社区活跃,持续更新与优化,便于二次开发和创新
• 适合科研、文档数字化、信息抽取等多场景应用,助力文档数据智能化转型

基于程序化 PDF 结构,精细提取多层级文本单元与图形元素,融合性能优化与可视化,推动 PDF 内容的结构化理解与应用扩展。
#资源参考 #工具 #AI #PDF提取文本图像
ytt-mcp:YouTube 字幕抓取 MCP 服务器,实现视频内容高效提取与智能摘要:

• 基于 MCP(Multi-Channel Protocol)架构,专注于获取 YouTube 视频的字幕文本,支持快速调用与解析。
• 兼容 Claude Desktop 配置,按步骤简单集成,通过修改 claude-desktop-config.json 即可无缝接入。
• 通过 Raycast MCP 扩展轻松安装,支持命令行调用及 AI 指令,自动抓取剪贴板中视频链接字幕并生成结构化总结。
• 摘要输出遵循严格格式,提取作者视角与主题分段,确保信息精准且无额外臆断,便于深度内容理解与后续分析。
• 适合开发者、内容分析师及研究人员,用于视频内容挖掘、主题归纳及智能信息处理,提升工作效率与数据洞察力。
• 开源 MIT 许可,代码托管于 GitHub,便于二次开发与社区协作,持续优化字幕抓取与处理逻辑。
#资源参考 #MCP #YouTube字幕
InternNav:InternRobotics推出的通用导航基础模型开源平台,面向机器人导航系统的模块化研究与应用。

• 全导航系统模块化支持,涵盖视觉-语言导航(VLN-CE)、视觉导航(VN)及连续轨迹规划,便于定制与深度探索。
• 兼容主流仿真平台Habitat与Isaac Sim,满足多样训练评估需求,提升模型泛化能力。
• 集成6大数据集、10+主流基线及InternData-N1高质量导航数据(3k+场景,83万VLN数据),支持全景式对比与性能提升。
• 引入首个双系统导航基础模型InternVLA-N1,实现领先基准测试成绩与现实环境零样本泛化。
• 持续更新,2025年7月发布v0.1.0版本,开启IROS 2025大赛挑战,推动社区协作创新。
• MIT开源协议,欢迎贡献代码、数据及反馈,构建开放生态,促进导航AI长期发展。