硬核开源智库
753 subscribers
39 photos
1.01K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
typed-ffmpeg:为Python开发者提供现代、易用的FFmpeg封装库,让复杂的视频处理变得简单高效。

零依赖,仅用Python标准库,确保最大兼容性;支持304次提交,涵盖大多数FFmpeg滤镜,IDE自动补全无压力;提供JSON序列化和图形化滤镜图,方便调试和分享
OpenAI Academy

⭐️ 网站功能:AI 教程

📁 网站简介:一款AI教程平台,提供了丰富的学习资源,包括在线课程、研讨会和社区活动。

可以通过与OpenAI专家和行业领袖的互动,了解最新的AI技术和行业趋势,从而在快速发展的AI时代中保持竞争力。

🔗 网站网址:点击打开
#资源参考 #AI教程 #在线课程
Autotable

⭐️ 项目功能:Excel自动填写

📁 项目简介:一个基于大语言模型的自动化智能表格生成应用,通过用户自定义的“知识库”文件,利用大语言模型分析表格结构,生成字段与单元格位置的映射,从而实现自动填写。

可以选择本地Ollama调用或符合OpenAI协议的API进行操作,极大地提高了表格处理的灵活性和效率。

🌐 项目地址:点击直达
AI Agents for Beginners

⭐️ 网站功能:AI课程

📁 网站简介:一个针对初学者的AI代理课程,包含11节课程,每节课都围绕独立主题展开,学习者可以根据自己的兴趣选择任意一节开始学习。

课程内容涵盖了AI代理的基本概念、设计模式、工具使用等,适合对生成式AI和AI代理感兴趣的初学者。

🔗 网站网址:点击打开
#资源参考 #AI教程 #Agent课程
RSSPod

⭐️ 网站功能:播客客户端

📁 网站简介:一个基于Web的播客客户端,支持多种播客来源,可以随时随地收听各种类型的播客节目。

可以根据自身的兴趣,手动添加喜欢的播客RSS Feed,系统会自动抓取并更新节目内容。

🔗 网站网址:点击打开
#Bilibili #下载 #开源

哔哩下载姬 DownKyi

B 站视频下载工具,支持批量下载视频、番剧、电影、课程等内容,输出为 MP4 格式,支持 8K、HDR、杜比视界和杜比全景声,内置工具箱提供音视频分离、去水印、弹幕下载与样式设置、字幕与封面提取、断点续传、AV/BV 号互转等功能,支持二维码登录和用户收藏夹、订阅、稍后再看、历史记录的下载,免费开源。

🐙 项目地址
#TV #直播 #开源

HTV

电视直播软件,内置央视、卫视和本地台直播源,自动按省级地区分类显示频道列表,港澳台及部分地区默认使用北京 IPTV 源,支持播放 RTP 等多种流媒体协议,每日自动更新直播源,也可自定义直播源,兼容 Android 4.4 及以上系统,免费开源。

https://github.com/HTWMedia/HTV
#条形码 #开源

Barcode Generator

在线条码生成工具,支持多种一维和二维条码格式,包括 Code128、EAN-13、UPC-A、QR Code、Data Matrix、PDF417 等,可通过输入框批量生成条码,每行对应一个条码内容,并可自定义显示文本、长度、高度和间距等参数,可下载为 PNG、JPG、GIF 或 SVG 格式,完全免费,无需注册。

这个比较小众了,图书馆和库存管理可能会用到。

https://barcode-maker.com/zh
#插件 #Google #学术 #开源

Google Scholar Assistant

谷歌学术增强插件,支持论文信息提取、中科院分区识别、JCR分区查询、期刊分类管理、导出/导入、摘要批量获取、引用格式导出、高级过滤等功能,安装后访问 Google Scholar 搜索页面,即可使用各项功能。

这个需要本地安装,没有上架扩展商店。

🐙 项目地址
#学术 #期刊 #搜索

DOAJ

全球期刊搜索平台,涵盖全球各学科的开放获取、同行评审期刊,支持多语言和多国家的出版物,可按标题、ISSN、主题、出版国家等条件搜索,现已收录超过 21,000 种期刊和 1,100 万篇文章,所有数据均可免费下载,无需注册登陆。

https://doaj.org
#字体

Font Squirrel

免费商用字体网站,所有字体均经过人工筛选,确保可用于商业项目,可按最新添加、最受欢迎、语言和标签等筛选浏览,支持将字体转换为适用于网页的格式,如 TTF、EOT、WOFF、WOFF2 和 SVG,便于网页嵌入使用,免费下载,无需注册。

这个覆盖的都是国外字体,中文字体几乎没有。

https://www.fontsquirrel.com
#AI #抠图

BgSub

AI 图像背景处理工具,支持去除背景和替换背景,可将背景替换为纯色、渐变或自定义图像,支持一键智能调色,可调整尺寸、位置和镜像,内置多种艺术滤镜,完全浏览器本地运行,免费无广告,无需注册。

功能还是挺强的,对于复杂的背景仍然是有瑕疵,但胜在方便。

https://zh.bgsub.com
#小红书 #开源

XHS Web

小红书内容管理工具,提供图文、视频、评论的浏览与导出功能,可通过本地数据持久化功能,保存浏览记录,支持完整的代理设置功能,可根据需要添加或修改代理地址,系统会自动轮换使用,免费开源,需要小红书 cookie 登陆。

🌐 体验地址 🐙 项目地址
#PPT #开源

Video2PPT

视频转 PPT 工具,可将本地视频、在线视频链接或实时录屏转换为 PPT 演示文稿,支持自动识别视频中的文字、图表和重点内容,支持边播放边提取,所有处理均在本地完成,免费开源,无需注册。

🌐体验地址 🐙项目地址
1
AdamCad 是一个神经网络,可根据自然语言文本生成 CAD 模型。

主要特点是其结果可以直接发送打印。

🧬 https://www.adamcad.com/

#AI #tools
一位专业工程师分享了其使用 Cursor AI 编码工具在几周内完成其副业项目90%代码的7条核心技巧 | 原文地址

1. 自顶向下提示 (Prompt down the stack):在开发新功能时,从宏观概念和用户目标开始向LLM提问,然后逐步深入到数据模型、API端点、业务逻辑,最后是UI组件和用户交互。这样能让LLM理解完整的上下文,从而做出更符合整体架构的实现决策。
2. 编写测试 (Write tests):先编写全面的测试用例是指导LLM的有效方式。通过让LLM修复未通过的测试,而非用文字描述复杂需求,可以更确信生成的代码能按预期工作并符合规范。
3. 规则 (Rules):创建一个实用的规则文件,涵盖所用语言/框架的重要方面,如代码整洁性、库使用、命名约定、测试方法和架构模式,并包含真实示例而非抽象理论,同时指明工具版本和代码库特有的模式。规则应保持简洁。
4. 使用工作区 (Use workspaces):将前端和后端代码置于同一 Cursor 工作区,使LLM能够同时理解整个技术栈,从而可以追踪API调用、发现不一致性并协调跨端更改,无需开发者反复解释。
5. MCP (Multi-Cursor Protocol/Provider) 服务器:合理使用,勿滥用 (MCP, use but don't abuse):MCP服务器通过连接实时外部数据和工具(如最新的文档、任务管理器、GitHub、数据库等)来增强Cursor的功能,使其能获取真实数据并执行代码编写之外的操作。
6. 混合模型 (Mix up models):根据任务类型选择不同模型,例如使用 Claude 4 进行功能规划和架构决策,使用 Gemini 2.5 Pro 进行需要快速代码生成和巨大上下文窗口的实际编码,对特别复杂的问题则使用 o3。
7. 坚持最佳软件工程实践 (Maintain best SWE practices):在使用LLM时,仍需遵循经典的软件工程原则,如将问题分解为小块、保持关注点分离和设计模块化组件。LLM在处理定义明确的单一问题时表现更佳。

LLM和Cursor是使编码更轻松、更有趣的工具,能减少职业倦怠并提高交付效率。应采用迭代的构建方法,不要期望Cursor能一次性完美解决所有问题,提倡“欲速则不达”(Go slow to go fast)的理念。
#资源参考 #AI #Cursor
如何通过编写大约 400 行 Go 语言代码,实现一个基本的智能体,该智能体能够与人交互、使用工具和编辑代码。| 原文地址

只需Go语言和Anthropic API,简单易上手;Agent能读取、编辑文件,还能运行命令;完全开源,可扩展性强
#Agent #智能体 #资源参考
AlphaEvolve:一个基于 Gemini 的编程Agent,用于设计复杂的算法。它通过结合大型语言模型(LLMs)的创造性问题解决能力和自动化评估器,提升了算法的效率。AlphaEvolve 已经在 Google 数据中心、芯片设计和 AI 训练中得到了广泛的应用,提高了效率,并在某些领域取得了新的进展。

提升谷歌数据中心效率,平均回收0.7%的全球计算资源;在矩阵乘法算法中实现23%的速度提升;在数学难题上取得突破,如改进Strassen算法,减少标量乘法次数
#资源参考 #Agent
Gemini Fullstack LangGraph Quickstart:用Gemini 2.5和LangGraph打造全栈智能Agent,让复杂问题一键解决。

动态生成搜索词,精准定位信息;反思式搜索,最多迭代优化5次;自动引用来源,答案更有说服力