硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
wenyan-mcp:让AI轻松管理微信公众号排版与发布一键将Markdown文章排版并发布到微信公众号草稿箱。

支持多种主题效果,一键美化文章;自动上传本地或网络图片,操作便捷;提供Docker部署方式,适合服务器环境与AI工具链集成。
#资源参考 #MCP #微信公众号
Spy Search:一款专为快速高效搜索设计的Agent框架,旨在超越传统网页搜索Agent。

极速搜索,比传统搜索引擎更快;支持多种API,如OpenAI、Claude等;提供Docker部署,方便开发者快速上手
SearchPromptly:一个平台,用户可以在这里发现、创建和分享强大的提示词,以及探索人工智能的创造性应用。
#资源参考 #提示词
AgentsMeetRL:一个超实用的开源项目集合,专门整理了基于强化学习训练LLM Agent的开源资源。

涵盖多领域项目,包括数学、搜索、对话等;涉及多种强化学习框架和算法;提供详细的项目信息,方便开发者快速上手
cpdown:一键将网页内容或YouTube字幕复制为干净的Markdown格式。轻松提取网页正文并转换为Markdown,提升内容整理效率。

支持一键复制网页内容和YouTube字幕为Markdown;使用Defuddle或Mozilla Readability提取正文,去除多余HTML元素;显示复制内容的Token数量,适配LLM使用
#资源参考 #一键将网页内容或YouTube字幕复制
Strands Agents Tools:为AI Agent提供强大工具集,轻松构建智能Agent。

提供文件操作、API交互、数学计算等20多种实用工具;支持多Agent协作与共享内存,提升复杂任务处理效率;无缝集成AWS服务,拓展AI应用场景
强大的网页爬取与数据提取应用,助力高效采集网络信息。

高级爬虫功能,支持深度、速度和目标内容高度定制;多语言搜索,可针对不同国家和地区进行内容采集;提供Python、Node.js、Go等多语言客户端SDK,无缝对接多种开发环境

WaterCrawl | #爬虫 #资源参考
暴躁的教授读论文

⭐️ 项目功能:AI教授

📁 项目简介:一个提高学术论文阅读效率的AI伴侣。通过集成多种功能,如PDF处理、AI翻译、RAG检索、AI问答和语音交互,为学术研究者提供了一站式的论文阅读解决方案。

可以通过该应用导入PDF文件,自动提取和翻译内容,并以中英文对照的方式进行阅读。

🌐 项目地址:点击直达
IsGPT

⭐️ 网站功能:AI生成内容检测

📁 网站简介:一个检测文本是否由人工智能生成的工具,能够分析各种类型的文本,包括学术论文、商业文档、创意写作、技术文档和日常内容。

只需将文本粘贴到网站上,IsGPT会提供一个检测报告,显示文本中AI生成内容的百分比。可以在201种语言中进行检测和分析。

🔗 网站网址:点击打开
Get Z-Library

⭐️ 网站功能:Zlibrary地址获取

📁 网站简介:Z-Library是一个大型的在线图书馆,被FBI通缉域名经常被封。该网站每天更新最新的可用域名,以确保用户能够顺利访问Z-Library。

还可以通过发送邮件到指定邮箱,快速获取最新的Z-Library官网地址。

🔗 网站网址:点击打开
Gemini 的产品和研发负责人录了个视频

讨论了一下关于关于优秀编码模型的理念以及 Vibe Coding 的影响,以及编程语言的未来

很多见解挺好的,说明 Gemini 的代码能力进步还是有方法的

视频:https://youtu.be/jwbG_m-X-gE?si=u0nz9RxOaUlhW_Ab

总结了一些我觉得重要的内容:

📌 谷歌 Gemini 团队的编码模型训练方法论

🎯 Gemini 早期编程目标及其局限性

1️⃣ 竞技编程(Competitive programming):尽管像OpenAI等公司在评估模型编程能力方面做了很好的工作(如human eval),但竞技编程的能力并不一定等同于一个强大的团队成员所需要的技能,因此这与开发者最终的需求有所偏差

2️⃣ LMS(Language Model Systems):这也不是日常开发工作的真实写照

3️⃣ 代码补全(Code completion):这虽然更具生产力,但其应用空间有限,不足以体现模型现在和未来能够实现的所有功能。

Danny Tarlo认为,前两个目标并不能真正反映开发者的实际工作,而第三个目标则不够宏大。

仅仅关注竞技编程是不够的,因为它无法涵盖软件开发人员日常工作中的更广泛能力需求。竞技编程通常是在一个"非常自给自足的环境中"工作,从零开始构建相对简短的解决方案。然而,软件开发人员日常工作涉及处理大型代码库中的错误报告,这些错误可能分散在"代码库中一百个不同的位置"。因此,模型需要的能力集远大于竞技编程所包含的。

💡 Gemini 编程优化当前关注的"核心要素":

1️⃣ 数据与方法论:Danny强调,一个优秀的编程模型主要取决于"数据和方法论",太鸡贼了最重要的内容一笔带过。

2️⃣ 代码库上下文的重要性(Repo Context):代码库上下文是如此重要。模型不仅要处理代码补全,更要支持"多文件编辑,比只给你几行代码更大的更改"。目标是让模型能够帮助开发者在代码库的上下文中进行需要一小时完成的复杂工作。
Simba 是一个开源知识管理系统,旨在与任何检索增强生成 (RAG) 系统无缝集成。

借助现代化的 UI 和模块化架构,开发人员可以专注于构建人工智能解决方案,而不必担心知识管理的复杂性。

🧬 https://github.com/GitHamza0206/simba

#tools #资源参考 #RAG
开源项目 - MedicNex-File2MD 支持123种文件格式转换为Markdown

MedicNex File2MD 是一个基于 FastAPI 开发的微服务,支持将多达123种文件格式(涵盖文档、音频、视频、图片、代码等)统一转换为便于大模型理解的 Markdown 代码块格式。系统集成 PaddleOCR 和 AI 视觉识别,支持并发图片与音频处理,提升处理速度 2-10 倍。支持 Docker 容器化部署与 API Key 鉴权,适用于批量文件转换与异步队列处理。更新版本新增音视频转录、SRT字幕生成及 Apple iWork 套件支持。

GitHub - medicnex-file2md
频道推荐:高考志愿填报参考,用过的都说好

机器人会参考历届的录取分数,还有其他的相关,给你推荐合适的多种填报方案。可以算作参考,有些实用性的。输入个人分数及相关志愿倾向就可以生成结果。

还可以查询各省历届大学的录取分数线、专业强校等高考数据。

入口:夸克高考
Tersa:一个可视化的AI工作流构建平台。通过拖拽节点、连接和运行,轻松搭建自己的AI工作流。

支持多种行业领先的AI模型;多媒体处理能力,涵盖图像、文本、音频和视频;自动保存并安全存储在云端
#资源参考 #工作流
code-graph-rag:基于图的Python代码库检索增强生成系统,让代码查询像聊天一样简单

利用Memgraph存储代码结构,实现高效图查询;集成Google Gemini,将自然语言问题转化为Cypher查询;支持代码片段检索,直接定位关键代码
MemoryMesh:为AI打造的知识图谱服务器,专为文本角色扮演游戏和互动故事设计。它能帮助AI在对话中保持一致、结构化的记忆,让交互更丰富、更动态。

提供11个预建的文本RPG模式,快速搭建游戏框架;动态生成工具,根据数据结构自动创建添加、更新、删除数据的工具;直观的Schema设计,通过字段、枚举类型和关系定义引导AI生成和连接节点
1
Awesome-video-super-resolution-diffusion:视频超分辨率领域的资源库。它为研究者和开发者提供了一站式的视频超分辨率(VSR)资源,涵盖论文、开源代码和数据集。

收集了2024-2025年最新的VSR研究成果;提供多个高质量数据集,如OpenVid-1M(100万视频对)和WebVid-2M(250万文本-视频对);一站式资源,方便查找和使用。
Claudia:为Claude Code打造的强大GUI应用与工具包。它能让你更直观地管理Claude Code项目和会话,创建定制Agent,提升AI辅助开发效率。

通过可视化界面管理项目和会话,轻松追溯历史;支持创建定制Agent,满足不同任务需求;提供高级沙箱功能,确保Agent运行安全