硬核开源智库

Dedoc：自动解析文档并统一格式的开源库。

支持多种文档格式（PDF、DOCX、HTML、扫描文档等）；自动提取文档的逻辑结构和表格；提供REST API，方便集成到现有系统

GitHub - ispras/dedoc: Dedoc is a library (service) for automate documents parsing and bringing to a uniform format. It automatically…

Dedoc is a library (service) for automate documents parsing and bringing to a uniform format. It automatically extracts content, logical structure, tables, and meta information from textual electro...

56 views07:07

硬核开源智库

typed-ffmpeg：为Python开发者提供现代、易用的FFmpeg封装库，让复杂的视频处理变得简单高效。

零依赖，仅用Python标准库，确保最大兼容性；支持304次提交，涵盖大多数FFmpeg滤镜，IDE自动补全无压力；提供JSON序列化和图形化滤镜图，方便调试和分享

GitHub

GitHub - livingbio/typed-ffmpeg: Python FFmpeg wrappers support filters with typing and docs

Python FFmpeg wrappers support filters with typing and docs - livingbio/typed-ffmpeg

54 views07:08

硬核开源智库

OpenAI Academy

⭐️ 网站功能：AI 教程

📁 网站简介：一款AI教程平台，提供了丰富的学习资源，包括在线课程、研讨会和社区活动。

可以通过与OpenAI专家和行业领袖的互动，了解最新的AI技术和行业趋势，从而在快速发展的AI时代中保持竞争力。

🔗 网站网址：点击打开
#资源参考 #AI教程 #在线课程

OpenAI Academy

Unlock the new opportunities of the AI era by equipping yourself with the knowledge and skills to harness artificial intelligence effectively.

64 views07:08

硬核开源智库

Autotable

⭐️ 项目功能：Excel自动填写

📁 项目简介：一个基于大语言模型的自动化智能表格生成应用，通过用户自定义的“知识库”文件，利用大语言模型分析表格结构，生成字段与单元格位置的映射，从而实现自动填写。

可以选择本地Ollama调用或符合OpenAI协议的API进行操作，极大地提高了表格处理的灵活性和效率。

🌐 项目地址：点击直达

GitHub

GitHub - Dukeway/Autotable: An Automated Smart Table Generation Application Based on Large Language Models

An Automated Smart Table Generation Application Based on Large Language Models - Dukeway/Autotable

59 views07:09

硬核开源智库

AI Agents for Beginners

⭐️ 网站功能：AI课程

📁 网站简介：一个针对初学者的AI代理课程，包含11节课程，每节课都围绕独立主题展开，学习者可以根据自己的兴趣选择任意一节开始学习。

课程内容涵盖了AI代理的基本概念、设计模式、工具使用等，适合对生成式AI和AI代理感兴趣的初学者。

🔗 网站网址：点击打开
#资源参考 #AI教程 #Agent课程

GitHub

ai-agents-for-beginners/translations/zh/README.md at main · microsoft/ai-agents-for-beginners

12 Lessons to Get Started Building AI Agents. Contribute to microsoft/ai-agents-for-beginners development by creating an account on GitHub.

65 views07:11

硬核开源智库

RSSPod

⭐️ 网站功能：播客客户端

📁 网站简介：一个基于Web的播客客户端，支持多种播客来源，可以随时随地收听各种类型的播客节目。

可以根据自身的兴趣，手动添加喜欢的播客RSS Feed，系统会自动抓取并更新节目内容。

🔗 网站网址：点击打开

rsspod.pro

RSSPod - 基于 Web 的泛用型播客客户端

轻松订阅、收听和管理您喜爱的播客内容。支持多种播客来源，随时随地收听。

73 views07:11

硬核开源智库

#Bilibili #下载 #开源

哔哩下载姬 DownKyi

B 站视频下载工具，支持批量下载视频、番剧、电影、课程等内容，输出为 MP4 格式，支持 8K、HDR、杜比视界和杜比全景声，内置工具箱提供音视频分离、去水印、弹幕下载与样式设置、字幕与封面提取、断点续传、AV/BV 号互转等功能，支持二维码登录和用户收藏夹、订阅、稍后再看、历史记录的下载，免费开源。

🐙 项目地址

GitHub

GitHub - leiurayer/downkyi: 哔哩下载姬downkyi，哔哩哔哩网站视频下载工具，支持批量下载，支持8K、HDR、杜比视界，提供工具箱（音视频提取、去水印等）。

哔哩下载姬downkyi，哔哩哔哩网站视频下载工具，支持批量下载，支持8K、HDR、杜比视界，提供工具箱（音视频提取、去水印等）。 - leiurayer/downkyi

66 views07:21

硬核开源智库

#TV #直播 #开源

HTV

电视直播软件，内置央视、卫视和本地台直播源，自动按省级地区分类显示频道列表，港澳台及部分地区默认使用北京 IPTV 源，支持播放 RTP 等多种流媒体协议，每日自动更新直播源，也可自定义直播源，兼容 Android 4.4 及以上系统，免费开源。

https://github.com/HTWMedia/HTV

GitHub

GitHub - HTWMedia/HTV: A live media player app（电视直播软件）

A live media player app（电视直播软件）. Contribute to HTWMedia/HTV development by creating an account on GitHub.

72 views07:22

硬核开源智库

#条形码 #开源

Barcode Generator

在线条码生成工具，支持多种一维和二维条码格式，包括 Code128、EAN-13、UPC-A、QR Code、Data Matrix、PDF417 等，可通过输入框批量生成条码，每行对应一个条码内容，并可自定义显示文本、长度、高度和间距等参数，可下载为 PNG、JPG、GIF 或 SVG 格式，完全免费，无需注册。

这个比较小众了，图书馆和库存管理可能会用到。

https://barcode-maker.com/zh

Barcode-Maker

免费在线条形码生成器 - Barcode-Maker.com

免费条码生成器是一个在线工具，可以让用户轻松创建各种格式的条码和二维码。它支持多种编码类型，并允许用户实时批量生成条码，完全免费使用。

79 views07:22

硬核开源智库

#插件 #Google #学术 #开源

Google Scholar Assistant

谷歌学术增强插件，支持论文信息提取、中科院分区识别、JCR分区查询、期刊分类管理、导出/导入、摘要批量获取、引用格式导出、高级过滤等功能，安装后访问 Google Scholar 搜索页面，即可使用各项功能。

这个需要本地安装，没有上架扩展商店。

🐙 项目地址

GitHub

GitHub - goku-xmu/google-scholar-assistant: A browser plugin designed to increase Google Scholar.

A browser plugin designed to increase Google Scholar. - goku-xmu/google-scholar-assistant

91 views07:23

硬核开源智库

#学术 #期刊 #搜索

DOAJ

全球期刊搜索平台，涵盖全球各学科的开放获取、同行评审期刊，支持多语言和多国家的出版物，可按标题、ISSN、主题、出版国家等条件搜索，现已收录超过 21,000 种期刊和 1,100 万篇文章，所有数据均可免费下载，无需注册登陆。

https://doaj.org

doaj.org

Directory of Open Access Journals – DOAJ

DOAJ is a unique and extensive index of diverse open access journals from around the world, driven by a growing community, committed to ensuring quality content is freely available online for everyone.

101 views07:24

硬核开源智库

#字体

Font Squirrel

免费商用字体网站，所有字体均经过人工筛选，确保可用于商业项目，可按最新添加、最受欢迎、语言和标签等筛选浏览，支持将字体转换为适用于网页的格式，如 TTF、EOT、WOFF、WOFF2 和 SVG，便于网页嵌入使用，免费下载，无需注册。

这个覆盖的都是国外字体，中文字体几乎没有。

https://www.fontsquirrel.com

102 views07:27

硬核开源智库

#AI #抠图

BgSub

AI 图像背景处理工具，支持去除背景和替换背景，可将背景替换为纯色、渐变或自定义图像，支持一键智能调色，可调整尺寸、位置和镜像，内置多种艺术滤镜，完全浏览器本地运行，免费无广告，无需注册。

功能还是挺强的，对于复杂的背景仍然是有瑕疵，但胜在方便。

https://zh.bgsub.com

消除或者替换图像背景，无需上传图像 - BgSub

在5秒内消除或者替换图像背景，智能调整颜色，所有操作都在浏览器完成，无需上传图像 - BgSub

94 views07:28

硬核开源智库

#小红书 #开源

XHS Web

小红书内容管理工具，提供图文、视频、评论的浏览与导出功能，可通过本地数据持久化功能，保存浏览记录，支持完整的代理设置功能，可根据需要添加或修改代理地址，系统会自动轮换使用，免费开源，需要小红书 cookie 登陆。

🌐 体验地址 🐙 项目地址

GitHub

GitHub - xiaoxiunique/xhs: 一个基于 Nuxt.js 3 开发的小红书工具网站，提供图文，视频，评论浏览与导出

一个基于 Nuxt.js 3 开发的小红书工具网站，提供图文，视频，评论浏览与导出. Contribute to xiaoxiunique/xhs development by creating an account on GitHub.

114 views07:29

硬核开源智库

#PPT #开源

Video2PPT

视频转 PPT 工具，可将本地视频、在线视频链接或实时录屏转换为 PPT 演示文稿，支持自动识别视频中的文字、图表和重点内容，支持边播放边提取，所有处理均在本地完成，免费开源，无需注册。

🌐体验地址 🐙项目地址

Video2PPT

Free AI Video to Editable PowerPoint & Slides Converter

Convert video to editable PowerPoint & PDF. No sign-up. AI-powered slides extraction from YouTube, MP4 & Screen Recording. Ideal for webinars & courses.

❤1

112 views07:29

硬核开源智库

#视频 #解析 #下载

Best Video

在线视频解析下载工具，适用于 B 站、抖音、YouTube、小红书、微博等主流平台，输入链接解析即可下载，默认下载原视频画质，免费使用，无需注册。

这种工具还是不少的，随便用哪个都行。

https://www.bestvideow.com

Bestvideow

免费视频解析下载_抖音，B站(哔哩哔哩)视频解析下载工具 - Best Video下载器

Best Video下载器是一款功能强大且免费的视频解析下载工具，支持全球100+热门视频平台视频高清无水印下载，包括哔哩哔哩、抖音、快手、微博、小红书、TikTok、YouTube等。Best Video下载器无需注册，操作简单，下载速度快，是视频下载搬运的理想选择。

125 views07:30

硬核开源智库

AdamCad 是一个神经网络，可根据自然语言文本生成 CAD 模型。

主要特点是其结果可以直接发送打印。

🧬 https://www.adamcad.com/

#AI #tools

136 views07:30

硬核开源智库

一位专业工程师分享了其使用 Cursor AI 编码工具在几周内完成其副业项目90%代码的7条核心技巧 | 原文地址

1. 自顶向下提示 (Prompt down the stack)：在开发新功能时，从宏观概念和用户目标开始向LLM提问，然后逐步深入到数据模型、API端点、业务逻辑，最后是UI组件和用户交互。这样能让LLM理解完整的上下文，从而做出更符合整体架构的实现决策。
2. 编写测试 (Write tests)：先编写全面的测试用例是指导LLM的有效方式。通过让LLM修复未通过的测试，而非用文字描述复杂需求，可以更确信生成的代码能按预期工作并符合规范。
3. 规则 (Rules)：创建一个实用的规则文件，涵盖所用语言/框架的重要方面，如代码整洁性、库使用、命名约定、测试方法和架构模式，并包含真实示例而非抽象理论，同时指明工具版本和代码库特有的模式。规则应保持简洁。
4. 使用工作区 (Use workspaces)：将前端和后端代码置于同一 Cursor 工作区，使LLM能够同时理解整个技术栈，从而可以追踪API调用、发现不一致性并协调跨端更改，无需开发者反复解释。
5. MCP (Multi-Cursor Protocol/Provider) 服务器：合理使用，勿滥用 (MCP, use but don't abuse)：MCP服务器通过连接实时外部数据和工具（如最新的文档、任务管理器、GitHub、数据库等）来增强Cursor的功能，使其能获取真实数据并执行代码编写之外的操作。
6. 混合模型 (Mix up models)：根据任务类型选择不同模型，例如使用 Claude 4 进行功能规划和架构决策，使用 Gemini 2.5 Pro 进行需要快速代码生成和巨大上下文窗口的实际编码，对特别复杂的问题则使用 o3。
7. 坚持最佳软件工程实践 (Maintain best SWE practices)：在使用LLM时，仍需遵循经典的软件工程原则，如将问题分解为小块、保持关注点分离和设计模块化组件。LLM在处理定义明确的单一问题时表现更佳。

LLM和Cursor是使编码更轻松、更有趣的工具，能减少职业倦怠并提高交付效率。应采用迭代的构建方法，不要期望Cursor能一次性完美解决所有问题，提倡“欲速则不达”（Go slow to go fast）的理念。
#资源参考 #AI #Cursor

7 tips from a professional engineer who used Cursor to write 90% of the code in my ~$1.5k MRR side project : r/cursor

599 votes, 82 comments. 97K subscribers in the cursor community. The AI Code Editor - cursor.com

95 views14:05

硬核开源智库

如何通过编写大约 400 行 Go 语言代码，实现一个基本的智能体，该智能体能够与人交互、使用工具和编辑代码。| 原文地址

只需Go语言和Anthropic API，简单易上手；Agent能读取、编辑文件，还能运行命令；完全开源，可扩展性强
#Agent #智能体 #资源参考

Ampcode

How to Build an Agent

Building a fully functional, code-editing agent in less than 400 lines.

81 views14:06

硬核开源智库

AlphaEvolve：一个基于 Gemini 的编程Agent，用于设计复杂的算法。它通过结合大型语言模型（LLMs）的创造性问题解决能力和自动化评估器，提升了算法的效率。AlphaEvolve 已经在 Google 数据中心、芯片设计和 AI 训练中得到了广泛的应用，提高了效率，并在某些领域取得了新的进展。

提升谷歌数据中心效率，平均回收0.7%的全球计算资源；在矩阵乘法算法中实现23%的速度提升；在数学难题上取得突破，如改进Strassen算法，减少标量乘法次数
#资源参考 #Agent

Google DeepMind

AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms

New AI agent evolves algorithms for math and practical applications in computing by combining the creativity of large language models with automated evaluators

83 views14:06

硬核开源智库

Gemini Fullstack LangGraph Quickstart：用Gemini 2.5和LangGraph打造全栈智能Agent，让复杂问题一键解决。

动态生成搜索词，精准定位信息；反思式搜索，最多迭代优化5次；自动引用来源，答案更有说服力

GitHub

GitHub - google-gemini/gemini-fullstack-langgraph-quickstart: Get started with building Fullstack Agents using Gemini 2.5 and LangGraph

Get started with building Fullstack Agents using Gemini 2.5 and LangGraph - google-gemini/gemini-fullstack-langgraph-quickstart

85 views14:07

About

Blog

Apps

Platform