硬核开源智库 – Telegram

硬核开源智库

@HardcoreOpenAI

753 subscribers

39 photos

1.01K links

提供硬核学习资源，探索开源力量，驾驭AI未来！本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源，助你站在技术浪潮之巅，实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者，都能在这里找到属于你的宝藏！

Download Telegram

About

Blog

Apps

Platform

硬核开源智库

753 subscribers

硬核开源智库

一位专业工程师分享了其使用 Cursor AI 编码工具在几周内完成其副业项目90%代码的7条核心技巧 | 原文地址

1. 自顶向下提示 (Prompt down the stack)：在开发新功能时，从宏观概念和用户目标开始向LLM提问，然后逐步深入到数据模型、API端点、业务逻辑，最后是UI组件和用户交互。这样能让LLM理解完整的上下文，从而做出更符合整体架构的实现决策。
2. 编写测试 (Write tests)：先编写全面的测试用例是指导LLM的有效方式。通过让LLM修复未通过的测试，而非用文字描述复杂需求，可以更确信生成的代码能按预期工作并符合规范。
3. 规则 (Rules)：创建一个实用的规则文件，涵盖所用语言/框架的重要方面，如代码整洁性、库使用、命名约定、测试方法和架构模式，并包含真实示例而非抽象理论，同时指明工具版本和代码库特有的模式。规则应保持简洁。
4. 使用工作区 (Use workspaces)：将前端和后端代码置于同一 Cursor 工作区，使LLM能够同时理解整个技术栈，从而可以追踪API调用、发现不一致性并协调跨端更改，无需开发者反复解释。
5. MCP (Multi-Cursor Protocol/Provider) 服务器：合理使用，勿滥用 (MCP, use but don't abuse)：MCP服务器通过连接实时外部数据和工具（如最新的文档、任务管理器、GitHub、数据库等）来增强Cursor的功能，使其能获取真实数据并执行代码编写之外的操作。
6. 混合模型 (Mix up models)：根据任务类型选择不同模型，例如使用 Claude 4 进行功能规划和架构决策，使用 Gemini 2.5 Pro 进行需要快速代码生成和巨大上下文窗口的实际编码，对特别复杂的问题则使用 o3。
7. 坚持最佳软件工程实践 (Maintain best SWE practices)：在使用LLM时，仍需遵循经典的软件工程原则，如将问题分解为小块、保持关注点分离和设计模块化组件。LLM在处理定义明确的单一问题时表现更佳。

LLM和Cursor是使编码更轻松、更有趣的工具，能减少职业倦怠并提高交付效率。应采用迭代的构建方法，不要期望Cursor能一次性完美解决所有问题，提倡“欲速则不达”（Go slow to go fast）的理念。
#资源参考 #AI #Cursor

7 tips from a professional engineer who used Cursor to write 90% of the code in my ~$1.5k MRR side project : r/cursor

599 votes, 82 comments. 97K subscribers in the cursor community. The AI Code Editor - cursor.com

95 views14:05

硬核开源智库

如何通过编写大约 400 行 Go 语言代码，实现一个基本的智能体，该智能体能够与人交互、使用工具和编辑代码。| 原文地址

只需Go语言和Anthropic API，简单易上手；Agent能读取、编辑文件，还能运行命令；完全开源，可扩展性强
#Agent #智能体 #资源参考

How to Build an Agent

Building a fully functional, code-editing agent in less than 400 lines.

81 views14:06

硬核开源智库

AlphaEvolve：一个基于 Gemini 的编程Agent，用于设计复杂的算法。它通过结合大型语言模型（LLMs）的创造性问题解决能力和自动化评估器，提升了算法的效率。AlphaEvolve 已经在 Google 数据中心、芯片设计和 AI 训练中得到了广泛的应用，提高了效率，并在某些领域取得了新的进展。

提升谷歌数据中心效率，平均回收0.7%的全球计算资源；在矩阵乘法算法中实现23%的速度提升；在数学难题上取得突破，如改进Strassen算法，减少标量乘法次数
#资源参考 #Agent

Google DeepMind

AlphaEvolve: A Gemini-powered coding agent for designing advanced algorithms

New AI agent evolves algorithms for math and practical applications in computing by combining the creativity of large language models with automated evaluators

83 views14:06

硬核开源智库

Gemini Fullstack LangGraph Quickstart：用Gemini 2.5和LangGraph打造全栈智能Agent，让复杂问题一键解决。

动态生成搜索词，精准定位信息；反思式搜索，最多迭代优化5次；自动引用来源，答案更有说服力

GitHub - google-gemini/gemini-fullstack-langgraph-quickstart: Get started with building Fullstack Agents using Gemini 2.5 and LangGraph

Get started with building Fullstack Agents using Gemini 2.5 and LangGraph - google-gemini/gemini-fullstack-langgraph-quickstart

85 views14:07

硬核开源智库

Hugging Face MCP Course：免费的在线课程，旨在帮助从初学者到专业人士深入理解并应用模型上下文协议（MCP）。核心价值在于通过理论学习和实践操作，帮助你掌握如何利用MCP构建能够利用外部数据和工具的AI应用。

课程内容丰富，涵盖从基础概念到实际应用；提供预配置的开发环境，方便快速上手；完成课程可获得认证证书
#资源参考 #MCP #免费课程 #AI课程

Welcome to the 🤗 Model Context Protocol (MCP) Course - Hugging Face MCP Course

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

93 views14:08

硬核开源智库

Awesome Generative AI Data Scientist：助力成为生成式AI数据科学家的资源库。

汇集100+优质资源，涵盖从基础到进阶的全方位学习材料；专注于LLMs（大型语言模型）的应用与部署，提供实战指南；涵盖Python和R语言资源，满足不同开发者需求

GitHub - business-science/awesome-generative-ai-data-scientist: A curated list of 100+ resources for building and deploying generative…

A curated list of 100+ resources for building and deploying generative AI specifically focusing on helping you become a Generative AI Data Scientist with LLMs - business-science/awesome-generative-...

78 views14:09

硬核开源智库

Memvid：用视频存储文本，秒速检索，无需数据库

存储效率惊人，10倍压缩传统数据库；检索速度飞快，亿级文本秒级响应；离线也能用，生成视频后无需联网

GitHub - memvid/memvid: Memory layer for AI Agents. Replace complex RAG pipelines with a serverless, single-file memory layer.…

Memory layer for AI Agents. Replace complex RAG pipelines with a serverless, single-file memory layer. Give your agents instant retrieval and long-term memory. - memvid/memvid

66 views14:09

硬核开源智库

Happy-LLM：从零开始的大语言模型原理与实践教程，带你深入探索LLM的世界。| #教程

系统性教程，从NLP基础到LLaMA2实现；动手实践，涵盖预训练到微调全流程；结合前沿技术，如RAG和Agent
#资源参考 #AI #LLM #免费教程 #AI教程

GitHub - datawhalechina/happy-llm: 📚 从零开始的大语言模型原理与实践教程

📚 从零开始的大语言模型原理与实践教程. Contribute to datawhalechina/happy-llm development by creating an account on GitHub.

68 views14:10

硬核开源智库

Awesome Prompt Injection：专注于机器学习模型中的提示注入漏洞研究。| #机器学习

提供丰富的资源，涵盖文章、教程、研究论文和工具；汇集了21次提交记录，展示了社区的活跃参与；包含CTF挑战，模拟真实场景，提升实战能力

GitHub - Joe-B-Security/awesome-prompt-injection: Learn about a type of vulnerability that specifically targets machine learning…

Learn about a type of vulnerability that specifically targets machine learning models - Joe-B-Security/awesome-prompt-injection

73 views14:10

硬核开源智库

将无结构文本转化为知识图谱的AI工具。

自动提取文本中的实体和关系，生成知识图谱；支持多种LLM模型，灵活适配不同需求；生成交互式可视化图谱，直观呈现知识关联

AI Powered Knowledge Graph Generator| #工具 #知识图谱 #资源参考

GitHub - robert-mcdermott/ai-knowledge-graph: AI Powered Knowledge Graph Generator

AI Powered Knowledge Graph Generator. Contribute to robert-mcdermott/ai-knowledge-graph development by creating an account on GitHub.

78 views14:11

硬核开源智库

为科学研究提供强大的音频数据处理工具。

支持大规模音频数据处理，轻松应对海量音频文件；精准识别6512种鸟类声音，识别准确率高；提供跨平台支持，兼容Linux、Windows和macOS

BirdNET-Analyzer | #工具

GitHub - birdnet-team/BirdNET-Analyzer: BirdNET analyzer for scientific audio data processing.

BirdNET analyzer for scientific audio data processing. - birdnet-team/BirdNET-Analyzer

85 views14:11

硬核开源智库

china-ranking

⭐️ 网站功能：中国区 GitHub 用户排行
榜

📁 网站简介：一个展示中国区GitHub用户排行榜的网站，可以根据关注者数量对开发者进行排序和查看。

🔗 网站网址：点击打开

china-ranking.32k.site

中国区 GitHub 用户排行榜 - 开发者

中国区 GitHub 用户排行榜，按照 Followers 数量排序，展示中国优秀开发者

90 views14:12

硬核开源智库

完全免费！ 4000赞！Anthropic 发布了提示词工程的免费互动课程，大佬手把手带你写出高质量提示词。

这是每个人都必须掌握的技能。
>如何构建一个好的提示
>避免常见的陷阱
>制作杀手级提示库
> 80/20 规则及其应用

它有 9 个循序渐进的章节，并附有练习。

课程地址（GitHub仓库） 👉 https://github.com/anthropics/prompt-eng-interactive-tutorial
#资源参考 #AI #提示词 #AI免费课程

GitHub - anthropics/prompt-eng-interactive-tutorial: Anthropic's Interactive Prompt Engineering Tutorial

Anthropic's Interactive Prompt Engineering Tutorial - anthropics/prompt-eng-interactive-tutorial

101 views14:14

硬核开源智库

自用总结，各有所长，收藏备用！！

1、豆包：专注情感，生活场景必备。
2、Kimi：专业长文，就是不怕内容多！
3、gamma：全球最牛的AI PPT，根据你的文章直接定制化生成。
4、可灵：文字生成视频，效果不错。
5、即梦：网上很多视频就是他做的。

6、剪映专业版：功能强大，素材特效丰富，剪辑视频必装软件。
7、美图秀秀：直接AI绘画，大家用的惯。
8、知乎AI：喜欢知乎文章的朋友必备
9、felo：全网最好用的小红书搜索工具，不知道的绝对是一大遗憾
10、 MindShow：输入文字大纲，自动整理成思维导图，还能一键转换成演示文稿。

11、稿定设计：涵盖平面设计、电商设计等，提供超多可编辑模板，满足各种设计需求。
12、易企秀：能快速做H5页面，模板种类多，适合活动宣传、产品推广。

13、Deepseek：最近在粉丝群偷偷发更新消息了，现在强的可怕，写代码完全不出错。
#资源参考 #工具 #AI工具

97 views14:20

硬核开源智库

Kontext 直接替代了很多原来需要 PS （美图秀秀、醒图）才能做的需求

写了篇东西详细总结了一下 FLUX Kontext 所有用法

还有如何去哪用这个模型，都在这里➡️：https://mp.weixin.qq.com/s/HPBzQqfg4npYAuh9zJHVVw

先介绍一下我探索出来的各种用法，看图也行：

> 给图片去水印，各种复杂水印都能解决
> 优化自己照片上身体的瑕疵
> 一键生成电商商品展示图
> 去掉景区照片里面各种无关的其他游客
> 将真实照片转换成各种动漫风格，或者反过来
> 修改海报或者图片上的文字
> 修改图片上的任何小的元素
> 给图片更换背景，让自己在快速时空旅行
> 将多张图片的元素整合到一张图片里面

如何使用呢

如果你就是单纯的想要尝试一下这个模型不想涉及到复杂操作的话我推荐两个渠道：
FLUX 官方的 Palyground （playground. bfl. ai/image/edit）和 Krea （krea. ai/edit）其中 FLUX 的 Palyground 还送了 200 积分，生成一张图只消耗 4 积分，够你玩很久了。
这两个地方的使用都很简单上传图片，输入提示词然后等待就行。
其中 Krea 选择 FLUX Kontext 的 Pro 模型就行 Max 模型在单图修改场景反而效果不好。
FLUX 的 Palyground 的话生成的时候记得把在输入框右边三个点那里把每次生成的张数改成 1，不然一次生成 4 张有点浪费。

如果你想要开发产品或者有 Comfyui 的基础想要玩一下多图参考，这里我推荐 Fal 的渠道（fal. ai/models/fal-ai/flux-pro/kontext/max/multi）。
Fal 的测试页面可以直接使用多图参考，上传图片输入提示词就行，如果你不想用多图了，可以在页面上方红框那里选择其他 Pro 模型尝试单图编辑。

FLUX Kontext 除了强大能力之外的另一个优势是他非常便宜，编辑一张图只需要 0.08美元也就是 5 毛钱人民币，相较于 GPT-4o 一张图 1.4 人民币的价格可以说非常便宜了。
另外他们后面还会开源一个 Dev 的 Kontext 模型这个会让成本进一步降低，太期待了。
#资源参考 #AI修图 #FLUX Kontext

139 views14:35

硬核开源智库

一款基于 AI 技术的 Web 应用程序，可将文本内容智能转换为 Mermaid 格式的代码，并将其渲染成可视化图表。

smart-mermaid.aizhi.site

128 views14:39

硬核开源智库

即梦AI的图片3.0上线了智能参考

可以基于上传的图像，生成任何你想要生成的内容，这太爽了！

不管是海报、电商封面、小红书封面还是视频封面，甚至只是想给你的照片添加一些装饰，都能搞定

我还写了套提示词帮你复刻任何你喜欢的电商或者小红书封面的排版样式

这里是详细的提示词和介绍：https://mp.weixin.qq.com/s/_kt9OLylR95sG7U37wseSw

基本能力测试

首先是照片和人像的测试，我们分别从大面积到小细节分别对一个人像照片进行修改。
从更换背景到增加配饰再到更改姿势，都没啥问题，只改了需要改的地方，更改的位置跟原有的融合度不错，人眼看不出来更改过。
然后我还让他给照片加了滤镜，测试了在上面覆盖内容的这种修改，也很好。

再然后就是即梦的看家本事了，中文生成，这次还要加上修改。
我们先来看一下生成，这里我那一张原有的图片让即梦帮我给这个武器设计加上文字。
可以看到即梦对于文字样式和位置的响应非常精准。

然后是改字，我在社区找了一个非常复杂的文字效果，除了字体不是常规字体外，还有 3D Q 版挤压效果。
然后让他修改的时候也增加了难度，没有单独改某个字而是让他把原来上面的三个字变成五个字，没想到搞得还挺好，新增的文字基本上都有类似的立体效果和挤压效果。

日常应用场景

我们日常分享照片的时候一般就是几类需求：
- 给照片加滤镜
- 修改照片内容，改变照片比例
- 给照片增加装饰帮助表达
- 用 AI 给照片转换风格

前三种基本上都是之前美图、醒图这类图片软件最常见的需求，现在即梦全都可以搞定了。
比如最近很火的撕拉片风格照片，我们只需要上传你拍的照片加一点提示词就可以用即梦图片3.0直接生成。

即梦图片3.0 还可以自己分析图片内容给图片生成海报和装饰，你只需要在提示词输入海报两个字就行，这门槛够低了吧。
这里就是模型自己搞的，生成的字体和装饰都非常契合原来照片的风格和感觉。

如果你不喜欢他自己加的文字的话也可以自己在提示词里面写一下，这种方式可以极大的增加日常分享照片的表现力。
比如对于每天喝咖啡的人完全可以给自己每天喝的咖啡加上日期和咖啡种类的标记，当做打卡方式，当时我记得就单纯给照片加水印这个功能有些软件就活得很不错了，现在要啥水印你自己定义。

营销物料生成
之前在图片3.0 发布的时候即梦生成的封面就已经很强了，主要就剩下跟现实照片相关的内容没办法做。
#工具 #资源参考 #提示词

103 views05:29

硬核开源智库

主要就是两类：
一类是电商商品，商品的还原度非常重要，所以原来直接生成不行。
另一类是小红书或者视频封面，一些主打 IP 的非常需要将 up 自己的人像放在封面上。

现在这两类直接全部都解决了，而且我还整理了一套生成提示词的提示词，你可以用来复刻你喜欢的博主的封面或者店铺的宣传图。
你只需要找一个支持多模态的 LLM，将你想要参考的排版和下面这段提示词放进去，就能直接生成对应的即梦智能参考提示词。

首先是电商的商品展示或者营销内容

可以看到人物和商品的 ID 都没有变化，甚至他还帮你把照片背景和封面的粉色背景做了渐变让两者更加融合。

当然你要是懒得输入提示词，其实即梦的智能参考也没问题。
比如这里我就写了一个“29.9 元蛋糕新品海报”，他就帮我生成了一个非常可爱和漂亮的蛋糕营销海报。
甚至连文案都帮我补充好了，萌趣造型，甜蜜诱惑这种词你让我想我想不出来反正，太强了。

然后是常见的小红书封面或者说视频封面。比如这种宣传旅游景点或者露营景点的，完全可以在保证照片是对应位置的情况下加上文字排版。

如果说这种风景图简单的话我们来个人像的。类似很多探店视频都是这种将人物抠出来加上其他店里的内容展示在加标题的方式，以往这一套还是挺麻烦的，现在一句话搞定。

模型信息&如何使用

刚好今天他们发了这个模型的公众号文章，原来这一个功能是有两个模型驱动的，分别是SeedEdit3.0和DreamPoster模型。
改文字、做海报功能调用的模型是字节的 DreamPoster模型。
智能参考的使用方式也很简单，选择图片图片3.0 模型，然后上传图片，默认就是智能参考，输入提示词直接生成就行。

目前这个功能在内测阶段，下周就会全量上线，到时候就可以拿着藏师傅的宝典操练起来了。

❤1

95 views05:30

硬核开源智库

DifyAIA：Dify工作流DSL开源示例库，助力开发者快速上手AI工作流

提供丰富的Dify工作流示例，涵盖Excel、PPT、Word等多种实用场景；开放协作，支持社区共同完善知识库；附带详细注释，适合新手快速学习
#资源参考 #Dify #工作流

GitHub - BannyLon/DifyAIA: 基于Dify自主创建的AI应用DSL工作流，你可以免费获取，无论是出于个人需求还是学习目的，它都能为您开启一段充满无限可能的智能之旅。

基于Dify自主创建的AI应用DSL工作流，你可以免费获取，无论是出于个人需求还是学习目的，它都能为您开启一段充满无限可能的智能之旅。 - BannyLon/DifyAIA

85 views07:46

硬核开源智库

llm-course：一站式学习大型语言模型（LLM）的免费课程。| #教程

课程分为LLM基础、科学家、工程师三部分，覆盖从理论到实践的全过程；提供多种实用工具，如模型合并、量化、自动评估等；互动式学习体验，配备LLM助教答疑
#资源参考 #AI教程 #LLM免费教程 #免费课程

GitHub - mlabonne/llm-course: Course to get into Large Language Models (LLMs) with roadmaps and Colab notebooks.

Course to get into Large Language Models (LLMs) with roadmaps and Colab notebooks. - mlabonne/llm-course

86 views07:47

硬核开源智库

下一代社会模拟器，用LLM驱动社会行为建模，它为社会科学与AI的融合提供了强大平台，核心价值在于通过自然语言构建复杂社会模拟场景，助力研究和探索。

无代码场景构建，通过对话设计模拟；50+默认场景覆盖8大社会科学领域；支持高达100,000个Agent的大规模模拟

YuLan-OneSim | #模拟器

GitHub - RUC-GSAI/YuLan-OneSim

Contribute to RUC-GSAI/YuLan-OneSim development by creating an account on GitHub.

75 views07:48