硬核开源智库

一篇详细介绍提示词缓存的长文 |blog

这篇文章不仅从工程原理角度详细介绍了 prompt‑caching（paged attention + prefix caching）的工作机制，还给出了实际工程中如何设计 prompt／上下文结构来提升缓存命中率、降低计算成本／延迟的建议。
#资源参考 #Prompt #提示词

sankalp's blog

How prompt caching works - Paged Attention and Automatic Prefix Caching plus practical tips

A deep dive into prompt caching - practical tips to improve cache hits and how vLLM's paged attention enables KV-cache reuse across requests via automatic prefix-caching

108 views14:36

硬核开源智库

管理自由职业和独立创业不必再分散在多个工具之间。Midday 提供了一站式的业务助理解决方案，集成时间追踪、自动发票匹配、文件安全存储和财务概览功能，帮助你简化日常运营，提高工作效率。

主要功能包括：

- 实时项目时间追踪，提升生产力和协作效果；
- 即将上线的在线发票功能，支持实时协作和项目同步；
- Magic Inbox 自动将发票和收据匹配到相应交易，简化财务管理；
- Vault 安全存储合同和重要文件，方便集中管理；
- 财务数据一键导出，轻松交给会计处理；
- 智能助理分析财务状况，帮助优化支出和查找文档。

支持现代前端技术栈，基于 React、Next.js、Supabase 等构建，适合自由职业者和小型创业团队使用。
#资源参考 #Midday #管理工具

GitHub

GitHub - midday-ai/midday: Invoicing, Time tracking, File reconciliation, Storage, Financial Overview & your own Assistant made…

Invoicing, Time tracking, File reconciliation, Storage, Financial Overview & your own Assistant made for Freelancers - midday-ai/midday

107 views14:40

硬核开源智库

Gemini 3和Nano Banana Pro的实用提示词技巧：

1. 把AI当协作者，明确给出示例、限制和期望的输出结构。倒推法——从最终结果反向设计提示词，能大幅提升生成质量和精准度。

2. 利用递归反馈，把模型帮你优化后的提示词再输入一次，反复打磨，效果越来越好。

3. 用大量风格相似的图片“教”模型你的审美，再让它创造匹配的提示词，变成你的专属创意助手。

4. 好的提示词不在于华丽辞藻，而是清晰的上下文、明确的目标和限制。告诉模型你想要什么，为什么要它，以及怎样才算好，剩下的交给它。

5. 简洁直接，告诉模型你期望的输出，避免模糊和冗余。

6. 如果遇到不理想的体验，比如图像生成异常或功能失效，建议先重启账号、清缓存，或通过App反馈，官方团队会持续改进。

7. 当模型某些细节无法满足时，可以先用外部工具手动调整，再让模型帮你润色融合，灵活应对限制。

8. 参考图像与提示词描述冲突时，模型更倾向于忽视文字描述，信赖图片信息。这提醒我们设计提示时要避免信息矛盾。

9. 反向工程和复杂实验式提示能激发模型潜力，比如模拟物理逻辑的场景生成，实现惊艳效果。

10. AI提示词的艺术在于与模型对话，理解它的“思路”，而非死板命令，真正做到“心有灵犀一点通”。
#资源参考 #AI #Prompt #提示词 #Gemini

143 views14:41

硬核开源智库

Hot Chips 2025的演讲PPT下载，也有youtube视频链接

Hot Chips 2025 是全球半导体与高性能计算领域的顶级技术峰会，是今年8月举办的。想学AI硬件的可关注

hc2025.hotchips.org

Hot Chips 2025

A Symposium on High Performance Chips

120 views14:47

硬核开源智库

🤖 AI 研究者博客资源大全：跟着全球顶尖 AI 研究者学习，站在巨人的肩膀上。| 飞书版

在 AI 爆发的时代，信息过载是最大的敌人。这份资源帮你：

🎯 精准定位：不再迷失在海量资料中，直达最有价值的内容
🧭 路径清晰：从入门到专家，每个阶段都有明确的阅读指南
🌍 全球视野：覆盖 OpenAI、DeepMind、Anthropic 等顶级机构的一手资料
🇨🇳 本土资源：通义千问、智谱AI、DeepSeek 等中国团队的技术博客

📖 两份核心文档
1️⃣ AI博客资源-精读指南.md
👉 推荐首先阅读

文章形式，阅读体验更好。包含：

按派别分类的博主介绍（百科全书派、机制解释派、架构扩展派...）
初学者 → 进阶 → 专家的学习路径
按角色推荐（工程师/研究员/管理者）
持续学习建议
2️⃣ AI博客资源-完整索引.md
👉 当作字典查阅

表格形式，信息更全。包含：

40+ 国际顶级研究者博客
20+ 中国 AI 团队博客
15+ 公司官方博客
10+ 学术机构博客
快速链接汇总表
#资源参考 #学习资源 #AI学习 #AI研究

GitHub

GitHub - joeseesun/ai-blog-res

Contribute to joeseesun/ai-blog-res development by creating an account on GitHub.

132 views14:48

硬核开源智库

想要快速了解一个域名的详细信息，通常需要在多个网站之间跳转查询，DNS 记录、SSL 证书、WHOIS 信息、SEO 数据分散在不同工具里，查起来费时费力。

Domainstack 是个开源域名分析的工具，只需输入域名就能一站式获取所有关键信息。| #工具

搜索任意域名后，自动抓取 WHOIS 和 RDAP 数据、DNS 记录、SSL 证书、HTTP 头信息、托管详情、地理位置和 SEO 信号。

还能提取网页标题、元标签、社交媒体预览图、robots.txt 规则等，甚至自动生成网站截图和提取网站图标，所有数据都缓存在数据库中，查询速度很快。

无需注册登录，直接访问即可使用，采用多层智能缓存机制，响应速度快且保护隐私。

GitHub

GitHub - jakejarvis/domainstack.io: 🧰 All-in-one domain name intelligence as a service

🧰 All-in-one domain name intelligence as a service - jakejarvis/domainstack.io

139 views15:11

硬核开源智库

做爬虫抓取或网站迁移时，面对满屏杂乱的 HTML 标签，想把它们清洗成干净的 Markdown 格式，往往让人头大。

python-markdownify 这个实用工具，专门用于解决 HTML 到 Markdown 的转化难题。| #工具

核心逻辑非常直接：将复杂的 HTML 字符串或文件，精准还原为结构清晰的 Markdown 文本。

支持高度定制化，无论是过滤特定标签、调整标题样式，还是处理表格与图片，都能按需配置。

通过 pip 即可一键安装，既能在 Python 代码中灵活调用，也支持命令行直接批量转换文件。

甚至允许继承类来重写转换规则，应对特殊的业务需求，扩展性相当高。

对于有处理大量文本数据、或者正在进行博客迁移的需求的人，这个库能省下大量写正则的时间。
#资源参考 #HTML清洗工具 #工具

GitHub

GitHub - matthewwithanm/python-markdownify: Convert HTML to Markdown

Convert HTML to Markdown. Contribute to matthewwithanm/python-markdownify development by creating an account on GitHub.

167 views15:11

硬核开源智库

俄罗斯数学家尤里·马宁的著作《数学家的数学逻辑课程》英文版第二版现在面向公众免费开放了 | #电子书

本书是为数学家提供的一本高级的数学逻辑教科书，涵盖了数学逻辑的重要发现，如连续统假设的独立性、可数集的丢番图性质以及一些古老问题的算法不可解性。

173 views15:15

硬核开源智库

Baidu

百度网盘请输入提取码

百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固，支持教育网加速，支持手机端。注册使用百度网盘即可享受免费存储空间

❤1

111 views04:30

硬核开源智库

Google发布了一份关于多智能体系统上下文工程的权威指南，提出了高效管理上下文的全新思路。核心在于用“工作上下文”、“会话”、“记忆”和“工件”四层结构替代传统庞大的提示语，有效降低了信息冗余和模型幻觉。| #指南

每次调用时，系统通过有序流程和处理器，从指令、精选会话事件、记忆结果和工件引用重建工作上下文。会话日志经过噪声过滤和格式化，变为清晰的聊天历史输入模型请求。

通过上下文压缩、过滤和缓存，旧信息被总结，没用事件被丢弃，稳定的前缀得以复用。大体量信息转为工件存储，长期知识保存在记忆中，记忆服务仅提取相关片段注入窗口，极大节省了Token消耗。

多智能体系统中，代理作为工具协同工作，子代理只访问所需上下文，防止幻觉和错误行为，保证效率和准确性。Google强调，将上下文工程视为与存储和计算同等重要的基础设施，而非简单的提示堆砌，是构建大规模多智能体系统的关键。

这套方法不仅能减少60%-80%的Token使用，还能显著提升多代理系统的稳定性和响应速度，真正推动生产级AI系统的落地。

Googleblog

Google for Developers Blog - News about Web, Mobile, AI and Cloud

ADK's Context Engineering scales production AI agents. Architect tiered context for efficiency, reliability, and multi-agent context scoping.

103 views05:04

硬核开源智库

有人花14个月跟踪5万条推文，逆向研究了Twitter算法，揭示了10个关键真相，颠覆了大多数“专家”的说法：帖子

1. 决定推文命运的是前47分钟。47分钟内无有效互动，推文基本死透。算法早早定调，之后的互动几乎无影响。你必须积极回复评论，保持活跃，才能让算法推你。

2. 点赞几乎没用。转发、评论、收藏、引用推文权重远超点赞。算法看重传播和对话，不是被动认可。想爆就得激发评论，制造争议和互动。

3. 线索帖（threads）不再吃香，2024年表现下降40%。人们不愿意看长串推文，长而值的单条推文更有效。故事型线索仍行得通，但“10条技巧”类线索已经过时。

4. 图片反而拉低互动率。虽然带图推文曝光多15%，但互动率低23%。图片让人停留但不参与，纯文字推文更能激发阅读和互动。除非是结果截图、私信或见证类图片，能提升可信度。

5. 钩子要藏在前40字符内（7-8个字）。前40字符钩子强的推文表现是钩子后置的3倍。开头7个字决定人们是继续看还是滑走，信息要直击痛点。

6. 发帖频率4-5条最佳，超过7条反而负增长。发太多推文互相竞争曝光，算法不喜欢同一账号刷屏。

7. 个人简介比单条推文更关键。具体、结果导向的简介转化率是模糊简介的4倍。简介是你的流量转化率，别当成可有可无的装饰。

8. 周末冷门反而有利。周末推文竞争少23%，活跃用户仅少12%，曝光机会更大。尤其是周日晚，人们预备新周，推文更易脱颖而出。

9. 负面内容互动高2.3倍，但“负面”吸粉，“正面”转化。60%问题导向内容拉新，40%解决方案内容促销，平衡才是王道。

10. 自己回复自己能提升34%表现。自评算评论，信号强，还能补充信息，别发完就走。

算法不是神秘魔法，而是人性规律的机器反映。理解并利用这些规律，不靠花哨工具和黑科技，也能赢得流量和变现。
#资源参考 #Twitter算法 #Twitter技巧

X (formerly Twitter)

🀅 (@ecomchigga) on X

found a guy who reverse engineered the entire twitter algorithm and I'm gonna expose everything he told me

he's not a coder. not some tech genius. just a dude who got mass obsessed with understanding why some tweets blow up and others die.

spent 14 months…

131 views05:08

硬核开源智库

All In One USB Drive | #工具

多合一启动U盘工具集，集合了各种系统安装器、救援工具和实用程序，方便随时应对各种电脑维护和系统重装需求。支持将多个ISO镜像整合到一个U盘，通过Ventoy实现直接启动，操作简单，更新灵活。

主要功能：

- Linux系统救援套件和磁盘镜像工具；
- 多种主流Linux发行版和Windows安装镜像；
- Windows及Office激活脚本支持；
- 详细步骤指导，轻松制作和使用多启动U盘；
- 支持常见平台格式，满足不同场景需求。

GitHub

GitHub - fathulfahmy/aio-usb-drive: Curated collection of useful to have programs on a multiboot USB drive

Curated collection of useful to have programs on a multiboot USB drive - fathulfahmy/aio-usb-drive

137 views05:11

硬核开源智库

PageLM：AI驱动的教育学习平台

这是一个开源AI教育平台，将学习材料转化为互动体验，支持上下文聊天、智能笔记、闪卡、测验等功能，兼容多AI模型与嵌入服务，通过WebSocket实时生成内容，采用Docker部署且支持本地开发。

✨重点
●📚【核心功能】上下文聊天（上传文档问答）、智能笔记（Cornell格式自动生成）、闪卡（间隔重复）、测验（带提示与评分）、AI播客（语音学习）、作业规划、考试模拟、辩论功能
●🔄【多模型支持】兼容Google Gemini、OpenAI GPT、Anthropic Claude、xAI Grok、Ollama（本地）、OpenRouter等LLM
●⚙️【技术栈】后端Node.js+TypeScript+LangChain，前端Vite+React+TailwindCSS，支持JSON/向量数据库存储，Markdown结构化输出
●🚀【部署方式】Docker一键部署（开发/生产环境），本地需Node.js v21.18+、ffmpeg，支持WebSocket实时流处理
●🎙【音频功能】集成Edge TTS、ElevenLabs、Google TTS生成播客，支持语音转录与学习材料整理
●🔍【数据安全】文件上传基于本地存储，环境变量配置敏感信息，支持自定义文件大小限制
●📝【学习工具链】提供AI辩论伙伴、Cornell笔记模板、考试模拟反馈，适合教育工作者与学习者
●🔧【开发指南】含详细本地开发步骤（克隆仓库→配置.env→启动前后端），支持Windows/Linux跨平台部署
#资源参考 #AI #学习平台 #开源学习

GitHub

GitHub - CaviraOSS/PageLM: PageLM is a community driven version of NotebookLM & a education platform that transforms study materials…

PageLM is a community driven version of NotebookLM & a education platform that transforms study materials into interactive resources like quizzes, flashcards, notes, and podcasts. - CaviraO...

147 views05:17

硬核开源智库

数据分析常常涉及多表关联、统计测试和复杂的可视化，手动处理不仅费时还容易出错。

quelmap 是一个开源的本地数据分析助手，集成了多功能的数据表分析、内置 Python 沙箱和多种大型语言模型（LLM）支持，帮助你快速洞察数据背后的价值。

quelmap 支持同时分析30多张表，处理无限行数据，内置 Lightning-4b 轻量级模型，性能优异且资源占用低。只需 Docker 环境即可一键启动，支持多种 LLM 提供商，灵活运行本地或云端。

主要功能包括：

- 多表连接与复杂数据可视化；
- 直接运行统计测试，自动生成分析代码；
- 内置 Python 沙箱，支持自定义数据处理；
- 支持上传 CSV、Excel、SQLite 等多种数据格式；
- 灵活切换 Ollama、OpenAI、Anthropic 等不同 LLM 模型；
- 支持完全本地运行，保护数据隐私。

非常适合数据科学家、分析师和开发者使用，尤其适合对数据安全和本地计算有较高要求的场景。
#资源参考 #工具 #数据分析 #Quelmap #本地化数据工具

GitHub

GitHub - quelmap-inc/quelmap: Open Source Local Data Analysis Assistant.

Open Source Local Data Analysis Assistant. Contribute to quelmap-inc/quelmap development by creating an account on GitHub.

105 views05:33

硬核开源智库

构建智能问答系统通常面临查询模糊、上下文理解不足和检索效率低等挑战。

Agentic RAG for Dummies 是一个基于 LangGraph 的极简 Agentic RAG（检索增强生成）框架，帮助你用最少代码快速搭建具备会话记忆和人机交互查询澄清能力的生产级系统。

项目集成了多功能模块：
- 会话记忆，保持对话上下文连贯；
- 智能查询澄清，自动重写或请求补充信息；
- 分层索引，实现精准且上下文丰富的检索；
- 多Agent并行处理复杂多问；
- 灵活切换多种大语言模型（Ollama、OpenAI、Google Gemini 等）；
- 开箱即用的 Gradio Web UI，方便体验和部署。

无论是学习 RAG 基础，还是构建定制化应用，这个项目都提供了交互式笔记本和模块化代码两条路径，助力开发者快速上手并轻松扩展。

主要功能：
- 支持多轮对话记忆，提升问答自然度；
- 自动拆分复杂查询，精准定位信息点；
- 结合关键词稀疏向量和语义稠密向量的混合检索；
- 内置人机交互机制，避免误解或无效查询；
- 多Agent协同，提升复杂问题的处理效率；
- 完整文档处理流水线，支持 PDF 转 Markdown 及分块索引。

适合 AI 研究者、开发者及数据工程师，轻松构建满足生产需求的智能问答系统。
#资源参考 #RAG #智能问答系统

GitHub

GitHub - GiovanniPasq/agentic-rag-for-dummies: A modular Agentic RAG built with LangGraph — learn Retrieval-Augmented Generation…

A modular Agentic RAG built with LangGraph — learn Retrieval-Augmented Generation Agents in minutes. - GiovanniPasq/agentic-rag-for-dummies

115 views05:36

硬核开源智库

《从零开始构建智能体》从基础理论到实际应用，全面掌握智能体系统的设计与实现

Hello-Agents 是 Datawhale 社区的系统性智能体学习教程。如今 Agent 构建主要分为两派，一派是 Dify，Coze，n8n 这类软件工程类 Agent，其本质是流程驱动的软件开发，LLM 作为数据处理的后端；另一派则是 AI 原生的 Agent，即真正以 AI 驱动的 Agent。

本教程旨在带领大家深入理解并构建后者——真正的 AI Native Agent。教程将带领你穿透框架表象，从智能体的核心原理出发，深入其核心架构，理解其经典范式，并最终亲手构建起属于自己的多智能体应用。我们相信，最好的学习方式就是动手实践。希望这本教程能成为你探索智能体世界的起点，能够从一名大语言模型的"使用者"，蜕变为一名智能体系统的"构建者"。

✨ 你将收获什么？
📖 Datawhale 开源免费完全免费学习本项目所有内容，与社区共同成长
🔍 理解核心原理深入理解智能体的概念、历史与经典范式
🏗 亲手实现掌握热门低代码平台和智能体代码框架的使用
🛠 自研框架HelloAgents 基于 Openai 原生 API 从零构建一个自己的智能体框架
⚙️ 掌握高级技能一步步实现上下文工程、Memory、协议、评估等系统性技术
🤝 模型训练掌握 Agentic RL，从 SFT 到 GRPO 的全流程实战训练 LLM
🚀 驱动真实案例实战开发智能旅行助手、赛博小镇等综合项目
📖 求职面试学习智能体求职相关面试问题
#资源参考 #Agent开发 #智能体开发 #教程

datawhalechina.github.io

Hello-Agents

Description

141 views05:40

硬核开源智库

Advent of Agents3：谷歌推出了一个圣诞季的25天AI Agent的课程，每天解锁一个主题，从最基础的Prompt工程到A2A协议，一直到企业级部署都有。

Adventofagents

Advent of Agents — Google Cloud

Seasonal AI Agent tutorials from Google Cloud. Build production-ready agents with Gemini, ADK, and Vertex AI.

142 views05:41

硬核开源智库

视频剪辑过程中，传统的轨道模式在处理复杂动效时往往显得不够直观，而专业的动效软件又过于厚重，学习成本极高。

Nugget 是一款基于 Electron 开发的开源视频剪辑工具，它专注于动效制作，采用了与众不同的图层化编辑系统，为视频创作提供了更高的灵活性。 | #工具

除了基础的剪辑功能，它还支持无限图层叠加、关键帧动画、音频混音以及 AI 自动字幕，旨在让创作者无需依赖复杂的专业软件也能轻松制作出精美的动态效果。

主要功能：

- 采用图层化编辑逻辑，支持无限图层叠加，方便对单个素材应用多种效果；
- 完善的关键帧动画系统，支持位置、缩放、透明度及旋转的精确控制；
- 集成 FFmpeg 实现高效渲染，兼容 mp4、mov、mp3 等主流多媒体格式；
- 内置 AI 自动字幕功能，利用 Whisper 技术实现快速的语音转文字；
- 提供屏幕录制、音频录制、色度键抠像及 WebGL 模糊滤镜等进阶工具；
- 支持外部插件扩展和多语言界面，满足不同场景下的定制化需求。

该项目基于 TypeScript 和 Lit 构建，支持跨平台运行。开发者只需通过 npm 安装依赖并配置相应的 FFmpeg 环境即可在本地启动，非常适合追求轻量化动效制作的创作者使用。
#资源参考 #视频编辑 #AI视频剪辑

GitHub

GitHub - cartesiancs/nugget-app: 📷 🖥️ Electron based video editing software. Focusing on adding motion effects using a layered…

📷 🖥️ Electron based video editing software. Focusing on adding motion effects using a layered editing system. - cartesiancs/nugget-app

154 views05:44

硬核开源智库

价值20亿美元的AI Agent秘密：三个Markdown文件如何解决上下文漂移难题

Meta刚以20亿美元收购了Manus。一位开发者深入研究了其核心工作原理，并将关键模式开源分享。

AI Agent面临一个普遍困境：经过大量工具调用后，它们会逐渐迷失目标。上下文膨胀、错误被淹没、任务偏离轨道。

Manus的解决方案出奇简单——仅用三个Markdown文件：

- task_plan.md：用复选框追踪进度
- notes.md：存储研究内容，避免塞满上下文
- deliverable.md：最终交付物

核心机制是：Agent在每次决策前都会重新读取计划文件，确保目标始终停留在注意力窗口内。

这个发现引发了社区热烈讨论，也暴露出一些关键洞见：

关于"这不是什么新东西"的质疑，确实如此。Claude Code本身就会自动创建plan.md文件，Spec-kit、APM等开源工具早已实现类似工作流。但这恰恰验证了这个模式的有效性——当多个独立开发者不约而同地收敛到同一解决方案时，说明它确实解决了真实问题。

关于"写入notes.md不也是在填充上下文吗"的技术追问，这是个精准的观察。写入操作确实会产生token消耗。但关键不在于减少token数量，而在于注意力操控。LLM存在"大海捞针"问题——随着上下文增长，它们会逐渐遗忘早期目标。通过在每次重大决策前重新读取计划文件，目标被强制拉回注意力窗口。

社区提出了更进阶的方案：使用子Agent处理上下文密集型任务。主Agent保持轻量，只负责追踪进度和协调；子Agent在独立上下文中完成繁重工作后汇报结果。这样既保持了主Agent上下文的清洁，又能处理复杂任务。

一位开发者分享了他的实战经验：将Claude视为员工，一次只分配一个任务，每完成一步就提交git，全程人工审核。这是8小时工作日的节奏，不是"设置后就忘"的自动化。

关于工作流设计的最佳实践：保持CLAUDE.md极度精简，只描述核心行为预期；将数据库、API等专项知识拆分到独立文件，仅在相关任务时加载；维护一个愿望清单，让未来功能不干扰当前工作。

有人一针见血地指出：20亿美元买的不是三个Markdown文件，而是一家6个月创造1亿美元收入的公司，以及其虚拟机能力、浏览器自动化和完整Agent平台。这个模式只是其中一块拼图。

这场讨论揭示了一个更深层的趋势：上下文工程正在成为一门独立学科。我们正在见证"Agent工程师"这个新角色的诞生——他们是软件工程师，但具备云服务、API和Agent能力的综合知识。

最实用的一句话总结来自社区：Claude是我的员工，我给它分配任务、检查每个任务、控制每个步骤。不要试图让Claude一次完成所有事情，那是不可能的。

reddit | 原始技能仓库 |Spec-kit |多Agent管理框架APM | Manus上下文工程博客
#资源参考 #Agent #智能体 #AI

From the ClaudeAI community on Reddit

Explore this post and more from the ClaudeAI community

193 views05:58

硬核开源智库

如何打造病毒式传播的Vibe Coding应用 | 原文

四个月前，我不用AI写代码，X上只有30个粉丝。如今，我靠公开构建积累了超过5000万次曝光。

很多人问我：怎么能持续做出爆款应用？

老实说，没有什么单一秘诀。是很多小事叠加起来的结果。

+ 关于Vibe Coding的误解

我曾是那种认为Vibe Coding只是AI垃圾代码的工程师。后来发现自己错了。

Vibe Coding的核心不是什么都不懂，而是消除摩擦，让你能构建更多东西。我做的项目里，90%以上的代码都是AI写的。目标不是理解每一行代码，而是在一天内把想法变成能用的东西。

+ 如何找到爆款创意

好点子不会凭空出现。要理解好内容，你得先消费内容。

刷信息流时，留意三件事：什么让你停下滑动、什么让你好奇、什么让你产生情绪共鸣。把这些记下来。

目的不是抄袭爆款，而是学习什么让好内容成为好内容。

有个帖子我获得了50万以上的曝光。我观察到几周内有多个关于计算机视觉和three.js的vibe coding帖子火了。然后我把这个观察和个人经历结合起来。

学编程时，我有个学校项目是展示分形图形，评判标准之一是“能不能让人感到惊艳”。这给了我灵感，做了一个可以用手势控制的分形模拟器。我对视觉效果有信心，因为我亲身体验过那种惊艳感。

+ 我的技术栈和工具

软件工程就是在各种权衡中做选择。我的建议很简单：快速发布，别在工具选择上纠结太久。

Rork是我主要的移动端vibe coding工具。我能直接在手机上开发，跳过本地环境配置，随时给朋友展示。很多想法是在健身房冒出来的，以前写在备忘录里回家就忘了。现在我能当场用Rork做出原型，尝试更多想法。

Claude Code用来处理其他几乎所有事情。升级到Max版后没了使用限制，可以并行运行多个Agent，测试想法更快，不用担心配额耗尽。

工具太多容易让人不知所措。我的建议是：试用几款有免费试用的工具，选2到3个你最喜欢的，然后深度学习它们。只有遇到硬性限制时才换工具。

+ 让设计好看的实用技巧

我不是设计专家，但知道很多人和我一样没有设计背景。

第一，多用设计参考。Screensdesign看引导流程，Dribbble和Pinterest找布局灵感。

第二，尽早建立一致性。创建一个共享的样式常量文件，所有页面从同一个文件调用。代码更好维护，应用也显得更干净、更有设计感。

第三，用AI找设计问题。每次做完新页面，我会发给ChatGPT问：对比同类头部应用能改进什么、颜色搭配有没有冲突、间距是否看起来不对劲。大概60%的时候能得到有用的反馈。这种反馈循环会积累，你接触好设计越多，品味自然会提升。

+ 如何写出爆款帖子

病毒式传播不是随机的，是可以复制的。

我有个帖子效果很好，原因是两点：开头就展示有趣的功能，前几秒就呈现惊艳效果。这让人看到最后。观看时间越长，算法就会推给更多人。我还在评论区加了使用的工具和模型，增加收藏量，最后附上体验链接。

另一个效果好的系列是“构建心理健康应用的第X天”。很少有人持续在心理健康领域发帖，所以这个开头让人一眼就认出是我的内容。

结构要保持简洁。我经常看到帖子堆满技术细节，但说实话大多数人并不关心。真正感兴趣的人会私信你。配图也很重要，它让帖子在时间线上占据更多空间，光这一点就能增加有人停下来看的概率。我用Canva做简洁的截图，直接展示正在演示的功能。

+ 让帖子关于读者，而非你自己

很多产品帖子失败的原因是只关注业务、功能、技术栈，却没有关注读者。

与其让帖子讲你构建了什么，不如框架成读者能共鸣的场景，或者你希望产品让他们产生的感受。

举个例子，别写“我做了一个情绪追踪的心理健康应用”，试试“表面说自己还好，内心其实在崩溃。我做了个应用，几秒钟就能记录你的真实情绪。”

前者是功能说明，后者让读者代入熟悉的场景，产生共鸣，进而互动。

+ 最后一点

去做那些你真正感兴趣的东西。

当你在乎自己构建的东西，这会体现在帖子里、演示里、你谈论它的方式里。人们能感受到你是不是在享受这个过程。我觉得这就是写一次爆款和反复做出爆款之间的关键区别。

X (formerly Twitter)

Avery (@averycode) on X

How to vibe code apps that go viral (full guide + examples)

233 views07:52

硬核开源智库

零成本本地运行Claude Code：一份完整的隐私编程助手搭建指南
最近开发者圈子里流传着一个有趣的玩法：用本地开源模型驱动Claude Code，实现完全离线、零API费用的AI编程助手。| 帖子

先说清楚一点：这套方案用的是Claude Code的工具链和交互框架，底层跑的是本地开源模型，并非Anthropic的Claude模型本身。但这恰恰是它的价值所在，你获得了一个能读写文件、执行终端命令、理解项目上下文的本地AI代理，数据完全不出本机。

整个搭建过程分四步：

第一步，安装Ollama作为本地模型引擎。Ollama负责托管AI模型并支持工具调用，安装后在后台静默运行。模型选择上，高配机器可以拉qwen3-coder:30b，普通配置用qwen2.5-coder:7b或gemma:2b也能跑。终端执行ollama run加模型名即可下载。

第二步，安装Claude Code本体。Mac和Linux用curl命令，Windows用irm命令，一行搞定。安装完用claude --version验证。如果之前登录过Anthropic账号，需要先登出。

第三步是关键，把Claude指向本地。默认情况下Claude会连Anthropic服务器，需要手动重定向。设置三个环境变量：ANTHROPIC_BASE_URL指向localhost:11434，ANTHROPIC_AUTH_TOKEN随便填个值比如ollama，再加上CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1关闭遥测。

第四步，进入任意项目目录，用claude --model加模型名启动，就能开始干活了。

评论区有些争议值得关注。有人质疑本地模型不支持工具调用，作者明确回应：支持。也有人反馈配置后无法创建文件，作者建议确保上下文长度超过32k，并尝试不同模型。还有人指出qwen3-coder:30b相比顶级闭源模型仍有差距，gemma:2b作为代理几乎不可用，而且要跑得流畅需要不错的硬件。

这套方案的真正意义在于提供了一种可能性：当你需要处理敏感代码、受限于网络环境、或者单纯想省钱时，本地AI代理是个可行选项。它不会取代云端大模型的能力上限，但在特定场景下足够实用。

至于什么时候能本地跑Opus 4.5？正如作者调侃的，得先问问Anthropic什么时候开源。
#资源参考 #LLM #本地化部署大模型

X (formerly Twitter)

Alvaro Cintas (@dr_cintas) on X

How to Run Claude Code Locally (100% Free & Fully Private)

333 views08:17

About

Blog

Apps

Platform