Workout.cool 是一个现代化的开源健身指导平台,提供全面的健身计划创建、进度跟踪以及详细的健身动作数据库和视频演示。该项目由 Snouzy 发起,旨在复兴和改进之前被遗弃的健身平台 workout.lol。由于原平台因健身视频合作问题被出售并最终被遗弃,Snouzy 决定重新启动一个全新的项目,以满足开源健身社区的需求。
#健康
https://github.com/Snouzy/workout-cool
#健康
https://github.com/Snouzy/workout-cool
GitHub
GitHub - Snouzy/workout-cool: 🏋 Modern open-source fitness coaching platform. Create workout plans, track progress, and access…
🏋 Modern open-source fitness coaching platform. Create workout plans, track progress, and access a comprehensive exercise database. - Snouzy/workout-cool
作为开发人员,我最重要的工具是一支笔和一个笔记本
Juha-Matti Santala 分享了作为软件开发者最重要的工具是笔和笔记本,而非电脑。他提到在开始新工作前,他特意购买了一本橙色笔记本,这对他来说意义非凡。他认为,开发软件或解决问题时,编写代码只是最后一步,而更重要的是确定要编写什么代码。他发现,自己在电脑前思考时效率不高,因为一旦打开代码编辑器,就会进入“功能模式”,难以激发创造力。因此,他常常离开电脑,或去散步,或带着笔记本坐在沙发上或户外思考。他会在笔记本上记录初始解决方案、绘制用户界面草图或流程图,帮助自己理解代码库中的数据流和交互,以便修复漏洞或添加新功能。
写作和绘图是强大的思考工具,能够将抽象的想法转化为具体的文字和图画,还能暴露知识或理解上的漏洞,因为写作时无法像单纯思考时那样轻易跳过这些问题。他喜欢在写完代码后,像向他人解释一样记录下来,甚至将其发布为博客文章。这种方式不仅能帮助他发现代码中的不一致、设计缺陷甚至错误,还能留下思考过程的记录,方便日后回顾。他鼓励读者通过电子邮件与他交流,分享自己的想法,并希望在 2025 年与世界各地的人进行更深入的讨论。
#写作 #软件开发
https://hamatti.org/posts/as-a-developer-my-most-important-tools-are-a-pen-and-a-notebook/
Juha-Matti Santala 分享了作为软件开发者最重要的工具是笔和笔记本,而非电脑。他提到在开始新工作前,他特意购买了一本橙色笔记本,这对他来说意义非凡。他认为,开发软件或解决问题时,编写代码只是最后一步,而更重要的是确定要编写什么代码。他发现,自己在电脑前思考时效率不高,因为一旦打开代码编辑器,就会进入“功能模式”,难以激发创造力。因此,他常常离开电脑,或去散步,或带着笔记本坐在沙发上或户外思考。他会在笔记本上记录初始解决方案、绘制用户界面草图或流程图,帮助自己理解代码库中的数据流和交互,以便修复漏洞或添加新功能。
写作和绘图是强大的思考工具,能够将抽象的想法转化为具体的文字和图画,还能暴露知识或理解上的漏洞,因为写作时无法像单纯思考时那样轻易跳过这些问题。他喜欢在写完代码后,像向他人解释一样记录下来,甚至将其发布为博客文章。这种方式不仅能帮助他发现代码中的不一致、设计缺陷甚至错误,还能留下思考过程的记录,方便日后回顾。他鼓励读者通过电子邮件与他交流,分享自己的想法,并希望在 2025 年与世界各地的人进行更深入的讨论。
#写作 #软件开发
https://hamatti.org/posts/as-a-developer-my-most-important-tools-are-a-pen-and-a-notebook/
Juha-Matti Santala - Community Builder. Dreamer. Adventurer.
As a developer, my most important tools are a pen and a notebook
Writing code is a part of being a software developer but often more important question is to figure what code to write and how and that I like to do away from computer with my notebook.
Claude 4 系统提示亮点精选
Simon Willison 详细分析了 Anthropic 发布的 Claude 4 系统提示。Claude 是由 Anthropic 开发的 AI 助手,Claude 4 家族包括 Claude Opus 4 和 Claude Sonnet 4,其中 Claude Opus 4 适用于复杂任务。系统提示中明确指出 Claude 的知识截止日期为 2025 年 1 月,尽管 Anthropic 的模型比较表显示训练数据截止日期为 2025 年 3 月。系统提示还强调了 Claude 在处理涉及未成年人、恶意代码、版权内容等方面的安全性和合规性,同时指出 Claude 应避免过度使用列表形式回答问题,并在对话中保持自然、温暖和富有同理心的语气。
Simon 还探讨了 Claude 4 的工具提示,这些提示并未由 Anthropic 官方发布,但通过泄露的版本得以窥见。Claude 4 支持交错思考模式,可以在思考过程中执行工具调用。系统提示中还包含了关于如何使用搜索工具的详细说明,强调 Claude 应在需要最新信息时使用搜索工具,并且在回答中严格遵守版权要求,避免直接复制或引用大量受版权保护的内容。
此外,系统提示还涉及 Claude 的“风格”功能,允许用户选择不同的回答风格,如简洁、解释性或正式等。Claude 需要根据用户选择的风格调整回答的语气和词汇。Simon 认为这些系统提示是 Anthropic 提供的宝贵文档,有助于用户更好地利用 Claude 4 的功能。
#AI #Claude #Prompt
https://simonwillison.net/2025/May/25/claude-4-system-prompt/
Simon Willison 详细分析了 Anthropic 发布的 Claude 4 系统提示。Claude 是由 Anthropic 开发的 AI 助手,Claude 4 家族包括 Claude Opus 4 和 Claude Sonnet 4,其中 Claude Opus 4 适用于复杂任务。系统提示中明确指出 Claude 的知识截止日期为 2025 年 1 月,尽管 Anthropic 的模型比较表显示训练数据截止日期为 2025 年 3 月。系统提示还强调了 Claude 在处理涉及未成年人、恶意代码、版权内容等方面的安全性和合规性,同时指出 Claude 应避免过度使用列表形式回答问题,并在对话中保持自然、温暖和富有同理心的语气。
Simon 还探讨了 Claude 4 的工具提示,这些提示并未由 Anthropic 官方发布,但通过泄露的版本得以窥见。Claude 4 支持交错思考模式,可以在思考过程中执行工具调用。系统提示中还包含了关于如何使用搜索工具的详细说明,强调 Claude 应在需要最新信息时使用搜索工具,并且在回答中严格遵守版权要求,避免直接复制或引用大量受版权保护的内容。
此外,系统提示还涉及 Claude 的“风格”功能,允许用户选择不同的回答风格,如简洁、解释性或正式等。Claude 需要根据用户选择的风格调整回答的语气和词汇。Simon 认为这些系统提示是 Anthropic 提供的宝贵文档,有助于用户更好地利用 Claude 4 的功能。
#AI #Claude #Prompt
https://simonwillison.net/2025/May/25/claude-4-system-prompt/
Simon Willison’s Weblog
Highlights from the Claude 4 system prompt
Anthropic publish most of the system prompts for their chat models as part of their release notes. They recently shared the new prompts for both Claude Opus 4 and Claude …
让 Bug 自动“蒸发”!我们造了个 AI 程序员同事
雪球工程师团队分享了他们开发的 AI 神器 AIFix,旨在帮助程序员自动修复代码中的 Bug,显著减轻手动修 Bug 的工作量。AIFix 能够端到端处理完整开发流程,如同 24 小时待命的代码医生,从发现问题到解决问题一气呵成。
在内部测试中,AIFix 表现亮眼,能够解决 70% 的前端样式问题、60% 的接口调用问题以及 80% 的 React Native 应用闪退问题,自动修复的准确率高达 66%。其核心技术包括 MCP 协议、Bug 信息智能工厂和自动修复流水线。MCP 协议如同一个“万能插座”,能够连接不同的 AI 模型,实现即插即用,方便调用各类数据和工具。Bug 信息智能工厂则通过引导 QA 填写标准模板、智能识别图片标注等方式,整合各类信息生成完整的 Bug 分析报告。自动修复流水线则能够精准判断 Bug 类型、定位代码问题并生成修复方案,对于可自动修复的问题,AI 直接修改代码并编译运行。
AIFix 的工作流程在 Dify 平台中得以实现,Dify 类似于一个智能厨房,能够让用户无需编写复杂代码,通过简单的界面操作即可编排 AI 模型完成定制任务。例如,通过 MCP 协议,AI 可以将不同工具的专业术语转换为统一语言,方便任务的执行和工具的扩展。
为了提高 AI 对 Bug 的判断准确性,团队通过分析历史数据,不断优化 AI 的判断逻辑,并借鉴了之前“雪莲”项目的成功经验。AI 还能够通过视觉识别模型读懂 Bug 截图,生成清晰的问题描述报告。未来,AIFix 将进一步扩展功能,如直接看懂视频中的 Bug,以及实现从 Bug 发现到代码修复提交的全自动流水线。
AIFix 的出现验证了规范、连接和人机协作的重要性。规范化的 Bug 描述模板提高了 AI 的理解准确率,MCP 协议让 AI 工具自由组合,发挥更大价值,而 AI 则将程序员从重复劳动中解放出来,专注于更具创造性的任务。
#AI #MCP #实践
https://juejin.cn/post/7514250027024285734
雪球工程师团队分享了他们开发的 AI 神器 AIFix,旨在帮助程序员自动修复代码中的 Bug,显著减轻手动修 Bug 的工作量。AIFix 能够端到端处理完整开发流程,如同 24 小时待命的代码医生,从发现问题到解决问题一气呵成。
在内部测试中,AIFix 表现亮眼,能够解决 70% 的前端样式问题、60% 的接口调用问题以及 80% 的 React Native 应用闪退问题,自动修复的准确率高达 66%。其核心技术包括 MCP 协议、Bug 信息智能工厂和自动修复流水线。MCP 协议如同一个“万能插座”,能够连接不同的 AI 模型,实现即插即用,方便调用各类数据和工具。Bug 信息智能工厂则通过引导 QA 填写标准模板、智能识别图片标注等方式,整合各类信息生成完整的 Bug 分析报告。自动修复流水线则能够精准判断 Bug 类型、定位代码问题并生成修复方案,对于可自动修复的问题,AI 直接修改代码并编译运行。
AIFix 的工作流程在 Dify 平台中得以实现,Dify 类似于一个智能厨房,能够让用户无需编写复杂代码,通过简单的界面操作即可编排 AI 模型完成定制任务。例如,通过 MCP 协议,AI 可以将不同工具的专业术语转换为统一语言,方便任务的执行和工具的扩展。
为了提高 AI 对 Bug 的判断准确性,团队通过分析历史数据,不断优化 AI 的判断逻辑,并借鉴了之前“雪莲”项目的成功经验。AI 还能够通过视觉识别模型读懂 Bug 截图,生成清晰的问题描述报告。未来,AIFix 将进一步扩展功能,如直接看懂视频中的 Bug,以及实现从 Bug 发现到代码修复提交的全自动流水线。
AIFix 的出现验证了规范、连接和人机协作的重要性。规范化的 Bug 描述模板提高了 AI 的理解准确率,MCP 协议让 AI 工具自由组合,发挥更大价值,而 AI 则将程序员从重复劳动中解放出来,专注于更具创造性的任务。
#AI #MCP #实践
https://juejin.cn/post/7514250027024285734
为无法仅凭直觉行事的团队准备的 AI 辅助编程
Atharva Raykar 探讨了 AI 辅助编程在团队开发中的应用,强调 AI 是一个乘数,其效果取决于使用者的能力。优秀的工程师能够更好地利用 AI 工具,因为他们擅长沟通技术思想、具备对系统的敏锐直觉,并且能够快速掌握新知识。AI 对语言和风格敏感,会反映提示者的品味和直觉,因此开发人员需要像工匠一样投入精力,确保 AI 生成的成果值得骄傲。
在开发过程中,AI 的速度优势至关重要,能够帮助团队更快地与用户进行反馈循环,从而打造更好的产品。然而,AI 工具使用不当可能会导致结果不尽如人意,甚至减慢开发速度。通过精心设计的提示,例如在实现 Python 速率限制器时,详细说明需求和考虑因素,可以更好地实现程序设计者的意图。此外,一种有效的技术是元提示(metaprompting),即先让模型帮助识别权衡和边缘情况,然后将其转化为技术规格,交给另一个 AI 代理执行。
AI 在高质量的团队和代码库环境中表现更好,这些环境具有良好的测试覆盖率、自动化的代码检查、持续集成与部署、清晰的文档记录、一致的代码风格以及简单、清晰、有组织的代码结构。AI 可以利用这些优势来提高工作效率,减少人工干预。例如,在一个具有良好测试和文档的项目中,AI 编程助手能够更轻松地完成任务,而在混乱的代码库中则会遇到困难。
在编辑器中使用 AI 时,建议采用先进的 AI 模型,并且不要吝啬成本,因为优质模型的效果会不断累积。同时,要善于提供上下文信息,使用能够自主分析文件、运行命令、获取文档并执行计划的“代理型”编码工具。此外,通过在 RULES.md 文件中编码编码标准和实践,可以指导 AI 遵循团队的开发规范。
在实现新功能或重构时,需要将问题分解为更具体的小任务,逐个提供给 AI,并在每个任务结束后提交代码。同时,提供技术规格和相关文档,帮助 AI 理解产品和功能的背景。在调试过程中,利用 AI 来分析错误,提供详细的错误上下文和尝试过的解决方案,以便 AI 生成准确的假设。
在编辑器之外,AI 可以用于提升个人技能和知识,通过与 AI 互动学习最佳实践。AI 还可以生成详细的文档,例如解释代码功能、创建知识库、总结指标和智能识别缺失的测试用例。此外,AI 可以用于创建模拟服务器、编写运行手册、自动化常见任务、代码审查、调试和监控应用程序以及性能优化。
AI 的出现改变了软件开发的某些传统观念。例如,现在重复工作变得不那么令人反感,因为 AI 可以处理一些重复性任务,避免过早抽象化。同时,测试变得不可或缺,因为 AI 可以快速生成测试用例,但需要人工审查断言。
#AI #指南 #实践 #Vibe_Coding
https://blog.nilenso.com/blog/2025/05/29/ai-assisted-coding/
Atharva Raykar 探讨了 AI 辅助编程在团队开发中的应用,强调 AI 是一个乘数,其效果取决于使用者的能力。优秀的工程师能够更好地利用 AI 工具,因为他们擅长沟通技术思想、具备对系统的敏锐直觉,并且能够快速掌握新知识。AI 对语言和风格敏感,会反映提示者的品味和直觉,因此开发人员需要像工匠一样投入精力,确保 AI 生成的成果值得骄傲。
在开发过程中,AI 的速度优势至关重要,能够帮助团队更快地与用户进行反馈循环,从而打造更好的产品。然而,AI 工具使用不当可能会导致结果不尽如人意,甚至减慢开发速度。通过精心设计的提示,例如在实现 Python 速率限制器时,详细说明需求和考虑因素,可以更好地实现程序设计者的意图。此外,一种有效的技术是元提示(metaprompting),即先让模型帮助识别权衡和边缘情况,然后将其转化为技术规格,交给另一个 AI 代理执行。
AI 在高质量的团队和代码库环境中表现更好,这些环境具有良好的测试覆盖率、自动化的代码检查、持续集成与部署、清晰的文档记录、一致的代码风格以及简单、清晰、有组织的代码结构。AI 可以利用这些优势来提高工作效率,减少人工干预。例如,在一个具有良好测试和文档的项目中,AI 编程助手能够更轻松地完成任务,而在混乱的代码库中则会遇到困难。
在编辑器中使用 AI 时,建议采用先进的 AI 模型,并且不要吝啬成本,因为优质模型的效果会不断累积。同时,要善于提供上下文信息,使用能够自主分析文件、运行命令、获取文档并执行计划的“代理型”编码工具。此外,通过在 RULES.md 文件中编码编码标准和实践,可以指导 AI 遵循团队的开发规范。
在实现新功能或重构时,需要将问题分解为更具体的小任务,逐个提供给 AI,并在每个任务结束后提交代码。同时,提供技术规格和相关文档,帮助 AI 理解产品和功能的背景。在调试过程中,利用 AI 来分析错误,提供详细的错误上下文和尝试过的解决方案,以便 AI 生成准确的假设。
在编辑器之外,AI 可以用于提升个人技能和知识,通过与 AI 互动学习最佳实践。AI 还可以生成详细的文档,例如解释代码功能、创建知识库、总结指标和智能识别缺失的测试用例。此外,AI 可以用于创建模拟服务器、编写运行手册、自动化常见任务、代码审查、调试和监控应用程序以及性能优化。
AI 的出现改变了软件开发的某些传统观念。例如,现在重复工作变得不那么令人反感,因为 AI 可以处理一些重复性任务,避免过早抽象化。同时,测试变得不可或缺,因为 AI 可以快速生成测试用例,但需要人工审查断言。
#AI #指南 #实践 #Vibe_Coding
https://blog.nilenso.com/blog/2025/05/29/ai-assisted-coding/
Nilenso
AI-assisted coding for teams that can't get away with vibes - nilenso blog
...
我们如何构建多智能体研究系统
Anthropic 团队详细介绍了他们构建多智能体研究系统的经验。该系统利用多个智能体(LLM 自主使用工具循环工作)协同完成复杂任务,其研究功能通过基于用户查询的计划过程,创建并行智能体同时搜索信息,显著提升了处理复杂问题的能力。
多智能体系统的优点在于其能够应对研究工作中难以预测的步骤。与传统的线性流程不同,多智能体系统能够在研究过程中动态调整方向,灵活探索新的线索。这种系统的本质是通过压缩大量信息来提炼关键见解,子智能体通过并行操作和各自的情境窗口,探索问题的不同方面,最终将重要信息汇总给主研究智能体。此外,子智能体的独立性减少了路径依赖性,使每个智能体能够独立进行彻底的调查。内部评估显示,以 Claude Opus 4 为主智能体、Claude Sonnet 4 为子智能体的多智能体系统,在内部研究评估中比单智能体 Claude Opus 4 的表现提升了 90.2%。
该研究系统采用主从模式的多智能体架构,主智能体负责协调整个过程,并将任务分配给专门的子智能体并行执行。用户提交查询后,主智能体分析查询内容,制定策略,并生成子智能体以同时探索不同方面。子智能体通过迭代使用搜索工具收集信息,并将结果返回给主智能体,后者汇总信息并决定是否需要进一步研究。与传统的检索增强生成(RAG)方法相比,该架构通过多步骤搜索动态发现相关信息,适应新发现,并分析结果以形成高质量答案。
多智能体系统与单智能体系统的主要区别在于协调复杂性的快速增长。提示工程是改善智能体行为的主要手段。例如,通过模拟智能体的工作过程,发现早期智能体存在生成过多子智能体、无休止地搜索不存在的来源以及因过多更新而相互干扰等问题。为解决这些问题,提出了以下原则:像智能体一样思考,以迭代提示并理解其效果;教导主智能体如何有效分配任务;根据查询复杂性调整努力程度;选择合适的工具至关重要;让智能体自我改进,例如 Claude 4 模型可以作为优秀的提示工程师,诊断失败模式并提出改进建议;搜索策略应先广泛探索再逐步缩小范围;引导智能体的思考过程,使用扩展思考模式来规划方法;并行工具调用可显著提升速度和性能。这些提示策略专注于灌输良好的启发式规则,而非僵化的规则,同时通过明确的防护措施避免智能体失控。
评估多智能体系统面临独特挑战,因为这些系统即使从相同起点出发,也可能采取完全不同的有效路径。因此,需要灵活的评估方法,判断智能体是否达到正确结果,同时遵循合理过程。建议从少量样本开始评估,因为早期的提示调整可能会产生显著影响。使用 LLM 作为评估工具可以有效扩展评估规模,通过设定标准对输出进行评分。此外,人工评估能够发现自动化评估遗漏的问题,如智能体选择低质量来源等。多智能体系统的出现行为需要通过观察智能体之间的互动模式来理解,而不仅仅是单独的智能体行为。
在传统软件中,错误可能导致功能故障、性能下降或停机,而在智能体系统中,即使是小错误也可能引发大规模行为变化。智能体系统需要长时间保持状态,因此需要有效执行代码并处理错误。通过构建能够从错误发生点恢复的系统,并结合模型的智能来优雅地处理问题,可以提高系统的可靠性。调试智能体系统需要新的方法,因为智能体的动态决策和非确定性使得问题诊断更加困难。通过添加完整的生产跟踪,可以系统地诊断和解决问题。部署更新时,需要避免破坏正在运行的智能体,因此采用逐步转移流量的彩虹部署策略。此外,当前主智能体同步执行子智能体,这虽然简化了协调,但会创建信息流瓶颈。异步执行可以增加并行性,但也带来了结果协调、状态一致性和错误传播等挑战。
尽管存在诸多挑战,多智能体系统在开放性研究任务中已被证明具有巨大价值。用户反馈表明,Claude 帮助他们发现了新的商业机会,解决了复杂的技术问题,并节省了大量时间。通过精心的工程设计、全面的测试、细致的提示和工具设计、稳健的操作实践以及研究、产品和工程团队之间的紧密合作,多智能体研究系统可以在大规模生产环境中可靠运行。
#AI #Claude #Research #指南
https://www.anthropic.com/engineering/built-multi-agent-research-system
Anthropic 团队详细介绍了他们构建多智能体研究系统的经验。该系统利用多个智能体(LLM 自主使用工具循环工作)协同完成复杂任务,其研究功能通过基于用户查询的计划过程,创建并行智能体同时搜索信息,显著提升了处理复杂问题的能力。
多智能体系统的优点在于其能够应对研究工作中难以预测的步骤。与传统的线性流程不同,多智能体系统能够在研究过程中动态调整方向,灵活探索新的线索。这种系统的本质是通过压缩大量信息来提炼关键见解,子智能体通过并行操作和各自的情境窗口,探索问题的不同方面,最终将重要信息汇总给主研究智能体。此外,子智能体的独立性减少了路径依赖性,使每个智能体能够独立进行彻底的调查。内部评估显示,以 Claude Opus 4 为主智能体、Claude Sonnet 4 为子智能体的多智能体系统,在内部研究评估中比单智能体 Claude Opus 4 的表现提升了 90.2%。
该研究系统采用主从模式的多智能体架构,主智能体负责协调整个过程,并将任务分配给专门的子智能体并行执行。用户提交查询后,主智能体分析查询内容,制定策略,并生成子智能体以同时探索不同方面。子智能体通过迭代使用搜索工具收集信息,并将结果返回给主智能体,后者汇总信息并决定是否需要进一步研究。与传统的检索增强生成(RAG)方法相比,该架构通过多步骤搜索动态发现相关信息,适应新发现,并分析结果以形成高质量答案。
多智能体系统与单智能体系统的主要区别在于协调复杂性的快速增长。提示工程是改善智能体行为的主要手段。例如,通过模拟智能体的工作过程,发现早期智能体存在生成过多子智能体、无休止地搜索不存在的来源以及因过多更新而相互干扰等问题。为解决这些问题,提出了以下原则:像智能体一样思考,以迭代提示并理解其效果;教导主智能体如何有效分配任务;根据查询复杂性调整努力程度;选择合适的工具至关重要;让智能体自我改进,例如 Claude 4 模型可以作为优秀的提示工程师,诊断失败模式并提出改进建议;搜索策略应先广泛探索再逐步缩小范围;引导智能体的思考过程,使用扩展思考模式来规划方法;并行工具调用可显著提升速度和性能。这些提示策略专注于灌输良好的启发式规则,而非僵化的规则,同时通过明确的防护措施避免智能体失控。
评估多智能体系统面临独特挑战,因为这些系统即使从相同起点出发,也可能采取完全不同的有效路径。因此,需要灵活的评估方法,判断智能体是否达到正确结果,同时遵循合理过程。建议从少量样本开始评估,因为早期的提示调整可能会产生显著影响。使用 LLM 作为评估工具可以有效扩展评估规模,通过设定标准对输出进行评分。此外,人工评估能够发现自动化评估遗漏的问题,如智能体选择低质量来源等。多智能体系统的出现行为需要通过观察智能体之间的互动模式来理解,而不仅仅是单独的智能体行为。
在传统软件中,错误可能导致功能故障、性能下降或停机,而在智能体系统中,即使是小错误也可能引发大规模行为变化。智能体系统需要长时间保持状态,因此需要有效执行代码并处理错误。通过构建能够从错误发生点恢复的系统,并结合模型的智能来优雅地处理问题,可以提高系统的可靠性。调试智能体系统需要新的方法,因为智能体的动态决策和非确定性使得问题诊断更加困难。通过添加完整的生产跟踪,可以系统地诊断和解决问题。部署更新时,需要避免破坏正在运行的智能体,因此采用逐步转移流量的彩虹部署策略。此外,当前主智能体同步执行子智能体,这虽然简化了协调,但会创建信息流瓶颈。异步执行可以增加并行性,但也带来了结果协调、状态一致性和错误传播等挑战。
尽管存在诸多挑战,多智能体系统在开放性研究任务中已被证明具有巨大价值。用户反馈表明,Claude 帮助他们发现了新的商业机会,解决了复杂的技术问题,并节省了大量时间。通过精心的工程设计、全面的测试、细致的提示和工具设计、稳健的操作实践以及研究、产品和工程团队之间的紧密合作,多智能体研究系统可以在大规模生产环境中可靠运行。
#AI #Claude #Research #指南
https://www.anthropic.com/engineering/built-multi-agent-research-system
Anthropic
How we built our multi-agent research system
On the the engineering challenges and lessons learned from building Claude's Research system
GitHub CEO:尽管 AI 蓬勃发展,但手动编码仍是关键
Thomas Dohmke 强调尽管 AI 工具在软件开发中日益普及,但保留手动编码技能仍然至关重要。Dohmke 指出,开发者需要具备修改 AI 生成代码的能力,以避免生产力问题。他描述了一种有效的开发流程,即 AI 工具生成代码并提交拉取请求,开发者随后利用其编程技能进行即时调整。Dohmke 警告说,过度依赖自动化工具会导致效率低下,例如在自然语言中花费过多时间解释简单更改,而不是直接编辑代码。他提到:“最糟糕的情况是试图用自然语言描述我已经知道如何用编程语言完成的任务。”
Dohmke 还讨论了 “vibe coding” 这一概念,这是由 OpenAI 联合创始人 Andrej Karpathy 提出的,用来描述过度依赖 AI 生成代码的现象。Dohmke 的观点与行业共识一致,即最有效的 AI 编码策略是将自动化与人类编程技能相结合。德勤的研究表明,开发者主要使用 AI 工具来完成特定任务,如编写样板代码,同时保持人工监督,这可以每天提高 10 到 20 分钟的生产力。研究还显示,大约一半的 AI 生成代码存在部分错误,这凸显了人类专业知识的持续需求。谷歌的经验也反映了这种混合模式,该公司报告称,其超过 25% 的代码现在由 AI 生成,但仍需要大量的人工审查和优化。这种平衡的方法反映了对 AI 在软件开发中能力和局限性的成熟理解,表明最成功的实现将是增强而非取代开发人员专业知识的方案。
AI 并非在消除编程工作,而是将开发者的角色从纯编码者转变为 AI 辅助开发流程的协调者。行业专家预测,开发者角色将分为两类:利用 AI 进行代码生成的产品工程师和确保软件系统质量和安全性的高级架构师。这种转变需要新的技能,专注于战略问题解决、有效指导 AI 和做出高级设计决策,而不是手动编写每一行代码。软件工程师的持续短缺,加上研究表明 AI 工具对初级开发人员特别有益,表明 AI 将有助于弥合人才缺口,同时为经验丰富的程序员创造新的机会。这种转变与软件开发中的历史模式一致,新的工具和抽象改变了开发人员的工作方式,但并未消除对人类智慧的需求。
“vibe coding” 这一新兴方法展示了 AI 生成代码的潜力和局限性,尤其是在初创企业和复杂项目中。虽然 AI 工具能够实现快速原型设计和与敏捷方法论一致的迭代开发,但也引发了对代码质量、安全漏洞和可维护性的重大担忧。真实案例已经揭示了过度依赖未经验证的 AI 生成代码的危险,尤其是那些可能不会立即显现的安全问题。对于初创企业来说,这种紧张关系尤为相关,因为非技术创始人可能难以使用主要由 AI 生成的代码构建可持续的复杂系统,可能会产生阻碍未来增长的技术债务。成熟科技公司的经验表明,成功的 AI 集成需要在自动化与严格的质量保证流程之间取得平衡,这一经验对于在 “vibe coding” 趋势中导航的小型组织来说可能至关重要。
#AI #Github #Vibe_Coding #思考
https://www.techinasia.com/news/github-ceo-manual-coding-remains-key-despite-ai-boom
Thomas Dohmke 强调尽管 AI 工具在软件开发中日益普及,但保留手动编码技能仍然至关重要。Dohmke 指出,开发者需要具备修改 AI 生成代码的能力,以避免生产力问题。他描述了一种有效的开发流程,即 AI 工具生成代码并提交拉取请求,开发者随后利用其编程技能进行即时调整。Dohmke 警告说,过度依赖自动化工具会导致效率低下,例如在自然语言中花费过多时间解释简单更改,而不是直接编辑代码。他提到:“最糟糕的情况是试图用自然语言描述我已经知道如何用编程语言完成的任务。”
Dohmke 还讨论了 “vibe coding” 这一概念,这是由 OpenAI 联合创始人 Andrej Karpathy 提出的,用来描述过度依赖 AI 生成代码的现象。Dohmke 的观点与行业共识一致,即最有效的 AI 编码策略是将自动化与人类编程技能相结合。德勤的研究表明,开发者主要使用 AI 工具来完成特定任务,如编写样板代码,同时保持人工监督,这可以每天提高 10 到 20 分钟的生产力。研究还显示,大约一半的 AI 生成代码存在部分错误,这凸显了人类专业知识的持续需求。谷歌的经验也反映了这种混合模式,该公司报告称,其超过 25% 的代码现在由 AI 生成,但仍需要大量的人工审查和优化。这种平衡的方法反映了对 AI 在软件开发中能力和局限性的成熟理解,表明最成功的实现将是增强而非取代开发人员专业知识的方案。
AI 并非在消除编程工作,而是将开发者的角色从纯编码者转变为 AI 辅助开发流程的协调者。行业专家预测,开发者角色将分为两类:利用 AI 进行代码生成的产品工程师和确保软件系统质量和安全性的高级架构师。这种转变需要新的技能,专注于战略问题解决、有效指导 AI 和做出高级设计决策,而不是手动编写每一行代码。软件工程师的持续短缺,加上研究表明 AI 工具对初级开发人员特别有益,表明 AI 将有助于弥合人才缺口,同时为经验丰富的程序员创造新的机会。这种转变与软件开发中的历史模式一致,新的工具和抽象改变了开发人员的工作方式,但并未消除对人类智慧的需求。
“vibe coding” 这一新兴方法展示了 AI 生成代码的潜力和局限性,尤其是在初创企业和复杂项目中。虽然 AI 工具能够实现快速原型设计和与敏捷方法论一致的迭代开发,但也引发了对代码质量、安全漏洞和可维护性的重大担忧。真实案例已经揭示了过度依赖未经验证的 AI 生成代码的危险,尤其是那些可能不会立即显现的安全问题。对于初创企业来说,这种紧张关系尤为相关,因为非技术创始人可能难以使用主要由 AI 生成的代码构建可持续的复杂系统,可能会产生阻碍未来增长的技术债务。成熟科技公司的经验表明,成功的 AI 集成需要在自动化与严格的质量保证流程之间取得平衡,这一经验对于在 “vibe coding” 趋势中导航的小型组织来说可能至关重要。
#AI #Github #Vibe_Coding #思考
https://www.techinasia.com/news/github-ceo-manual-coding-remains-key-despite-ai-boom
Tech in Asia
GitHub CEO: manual coding remains key despite AI boom
GitHub CEO Thomas Dohmke said developers can make immediate adjustments using their programming skills.
Google 推出 Gemini CLI,一款轻量级且功能强大的开源 AI 代理,可将 Gemini 直接带入终端。
利用最新 Gemini 2.5 Pro 推理模型,拥有高达 100 万 Token 的上下文窗口,可处理长文本和复杂场景。
内置 Gemini Code Assist,支持 VS Code 与 CLI 双端智能编码。
支持 Model Context Protocol (MCP) 扩展与自定义系统提示。
集成 Google 搜索以获取实时外部信息。
可调用 Veo 与 Imagen,实现视频和图像生成。
高额免费配额:提供业内最高使用限制——每分钟 60 次模型请求,每天 1000 次请求。
#AI #Google #Gemini
https://x.com/googleaidevs/status/1937861646082515205?s=52&t=Egk_JeNH7VpTJDgz1k_q5w
利用最新 Gemini 2.5 Pro 推理模型,拥有高达 100 万 Token 的上下文窗口,可处理长文本和复杂场景。
内置 Gemini Code Assist,支持 VS Code 与 CLI 双端智能编码。
支持 Model Context Protocol (MCP) 扩展与自定义系统提示。
集成 Google 搜索以获取实时外部信息。
可调用 Veo 与 Imagen,实现视频和图像生成。
高额免费配额:提供业内最高使用限制——每分钟 60 次模型请求,每天 1000 次请求。
#AI #Google #Gemini
https://x.com/googleaidevs/status/1937861646082515205?s=52&t=Egk_JeNH7VpTJDgz1k_q5w
X (formerly Twitter)
Google AI Developers (@googleaidevs) on X
Introducing Gemini CLI, a light and powerful open-source AI agent that brings Gemini directly into your terminal. >_
Write code, debug, and automate tasks with Gemini 2.5 Pro with industry-leading high usage limits at no cost.
Write code, debug, and automate tasks with Gemini 2.5 Pro with industry-leading high usage limits at no cost.
Vite 发布 7.0 版本,这标志着它自 2019 年第一版以来迈出的一大步。这一版本不仅庆祝了社区五年来的快速成长,也展示了 Vite 每周 3100 万次下载、较前七个月增长了 1400 万次的惊人成果 。
在新版本中,最显著的是构建工具链的核心重塑,VoidZero 团队推出了基于 Rust 的下一代打包器 Rolldown。开发者可以通过安装 rolldown-vite 包以插拔方式试用这一性能优化工具,而未来的 Vite 默认构建器也将基于它,从而显著缩短大型项目的构建时间 。
ViteConf 宣布将在 10 月 9–10 日首次以线下形式在阿姆斯特丹举办,由 JSWorld、Bolt、VoidZero 和 Vite 核心团队合作组织,这是继三届线上大会后的重要转型 。与此同时,VoidZero 与 NuxtLabs 联手推出 Vite DevTools,致力于为 Vite 和其生态系统提供更专业与深入的调试支持 。
为了配合这一系列更新,Vite 7 调整了 Node.js 的最低支持版本,将版本要求提升至 Node.js 20.19 及以上,或 22.12 及以上,淘汰了已在 2025 年 4 月末 EOL 的 Node.js 18,以便原生支持 ESM 包装器功能,并改为全 ESM 分发包 。
此外,Vite 调整了默认的浏览器构建目标,将之前的 modules 模式升级到新的 baseline-widely-available,覆盖主流浏览器约 30 个月以上的兼容性版本,如 Chrome 107、Edge 107、Firefox 104 和 Safari 16。这一调整旨在提升构建结果的稳定性与可预期性 。
在测试环境方面,Vitest 团队确认从 Vitest 3.2 起全面支持 Vite 7,使得测试链路可以与最新版工具无缝衔接 。关于 Environment API,尽管仍处于实验阶段,Vite 7 引入了新的 buildApp hook,鼓励社区继续测试并提出反馈,许多框架如 Cloudflare 插件正逐步整合这一特性 。
升级过程中,Vite 团队强调该版本更新对 Vite 6 用户来说相对平滑,剔除了已弃用的 Sass 旧 API 和 splitVendorChunkPlugin,并提供了详细的升级迁移指南和 Changelog,方便开发者逐步过渡 。整个版本背后凝聚了包括 1100 多位核心贡献者以及 VoidZero、Bolt、NuxtLabs 组织的参与与支持 。
#Vite #前端
https://vite.dev/blog/announcing-vite7.html
在新版本中,最显著的是构建工具链的核心重塑,VoidZero 团队推出了基于 Rust 的下一代打包器 Rolldown。开发者可以通过安装 rolldown-vite 包以插拔方式试用这一性能优化工具,而未来的 Vite 默认构建器也将基于它,从而显著缩短大型项目的构建时间 。
ViteConf 宣布将在 10 月 9–10 日首次以线下形式在阿姆斯特丹举办,由 JSWorld、Bolt、VoidZero 和 Vite 核心团队合作组织,这是继三届线上大会后的重要转型 。与此同时,VoidZero 与 NuxtLabs 联手推出 Vite DevTools,致力于为 Vite 和其生态系统提供更专业与深入的调试支持 。
为了配合这一系列更新,Vite 7 调整了 Node.js 的最低支持版本,将版本要求提升至 Node.js 20.19 及以上,或 22.12 及以上,淘汰了已在 2025 年 4 月末 EOL 的 Node.js 18,以便原生支持 ESM 包装器功能,并改为全 ESM 分发包 。
此外,Vite 调整了默认的浏览器构建目标,将之前的 modules 模式升级到新的 baseline-widely-available,覆盖主流浏览器约 30 个月以上的兼容性版本,如 Chrome 107、Edge 107、Firefox 104 和 Safari 16。这一调整旨在提升构建结果的稳定性与可预期性 。
在测试环境方面,Vitest 团队确认从 Vitest 3.2 起全面支持 Vite 7,使得测试链路可以与最新版工具无缝衔接 。关于 Environment API,尽管仍处于实验阶段,Vite 7 引入了新的 buildApp hook,鼓励社区继续测试并提出反馈,许多框架如 Cloudflare 插件正逐步整合这一特性 。
升级过程中,Vite 团队强调该版本更新对 Vite 6 用户来说相对平滑,剔除了已弃用的 Sass 旧 API 和 splitVendorChunkPlugin,并提供了详细的升级迁移指南和 Changelog,方便开发者逐步过渡 。整个版本背后凝聚了包括 1100 多位核心贡献者以及 VoidZero、Bolt、NuxtLabs 组织的参与与支持 。
#Vite #前端
https://vite.dev/blog/announcing-vite7.html
vitejs
Announcing Vite 7
Vite 7 Release Announcement
PNG 回来了!
PNG 格式在停滞了二十多年后,终于迎来了新的规范,这一更新让 PNG 重新焕发生机。美国国会图书馆、加拿大图书馆与档案馆以及澳大利亚国家档案馆都推荐使用 PNG 格式,因此保持 PNG 的现代化和竞争力至关重要。
新规范中引入了多项改进。首先是正式支持 HDR(高动态范围)功能,这不仅为未来做好了准备,而且仅需额外使用 4 个字节(加上 PNG 块的常规开销)。Chris Lilley——PNG 的原始作者之一,也是目前参与新 PNG 工作的技术总监——撰写了一篇优秀文章,详细解释了这一功能的实现方式。其次,PNG 现在正式支持动画 PNG(APNG),这种格式多年前由 Mozilla 提出,最初仅在 Firefox 中得到支持,如今已广泛被各种软件支持,规范也终于跟上了现实需求。
此外,PNG 现在还正式支持 Exif 数据,Exif 数据可以存储诸如版权信息、拍摄照片时的相机镜头信息以及 GPS 位置等附加信息。新规范还对旧版本的错误和模糊之处进行了清理和澄清。
上一个 PNG 规范发布于二十多年前,当时的技术水平与现在相差甚远,甚至比第一代 iPhone 的发布还要早 3.5 年。正是技术的进步促使 PNG 重新焕发生机。W3C 时间文本工作组(主要涉及字幕)需要在 PNG 中添加 HDR 支持,于是提出了一个提案,但一些专家认为可以做得更好。随后,越来越多的参与者加入,包括 Adobe、Apple、BBC、Comcast/NBCUniversal、Google、MovieLabs 以及负责维护规范的 W3C 等,形成了一个强大的团队。在这些行业巨头的支持下,PNG 格式重新获得了发展动力,目前已经开始着手进行接下来的两个规范更新。
许多常用的软件已经支持新的 PNG 规范,包括 Chrome、Safari、Firefox、iOS/macOS、Photoshop、DaVinci Resolve 和 Avid Media Composer 等。一些广播公司在幕后也在更新硬件和工具以支持新的 PNG 规范。下次看到新闻字幕滚动或体育比赛得分更新时,可以留意一下是否使用了 HDR 功能。
对于未来,团队已经在研究更好的压缩技术以及并行编码和解码功能,以确保这些改进能够像本次更新一样做到尽善尽美。预计下一次 PNG 更新(第四版)将主要改进 HDR 和标准动态范围(SDR)之间的互操作性,同时团队也将为 PNG 第五版研究压缩技术更新。
#PNG #新特性
https://www.programmax.net/articles/png-is-back/
PNG 格式在停滞了二十多年后,终于迎来了新的规范,这一更新让 PNG 重新焕发生机。美国国会图书馆、加拿大图书馆与档案馆以及澳大利亚国家档案馆都推荐使用 PNG 格式,因此保持 PNG 的现代化和竞争力至关重要。
新规范中引入了多项改进。首先是正式支持 HDR(高动态范围)功能,这不仅为未来做好了准备,而且仅需额外使用 4 个字节(加上 PNG 块的常规开销)。Chris Lilley——PNG 的原始作者之一,也是目前参与新 PNG 工作的技术总监——撰写了一篇优秀文章,详细解释了这一功能的实现方式。其次,PNG 现在正式支持动画 PNG(APNG),这种格式多年前由 Mozilla 提出,最初仅在 Firefox 中得到支持,如今已广泛被各种软件支持,规范也终于跟上了现实需求。
此外,PNG 现在还正式支持 Exif 数据,Exif 数据可以存储诸如版权信息、拍摄照片时的相机镜头信息以及 GPS 位置等附加信息。新规范还对旧版本的错误和模糊之处进行了清理和澄清。
上一个 PNG 规范发布于二十多年前,当时的技术水平与现在相差甚远,甚至比第一代 iPhone 的发布还要早 3.5 年。正是技术的进步促使 PNG 重新焕发生机。W3C 时间文本工作组(主要涉及字幕)需要在 PNG 中添加 HDR 支持,于是提出了一个提案,但一些专家认为可以做得更好。随后,越来越多的参与者加入,包括 Adobe、Apple、BBC、Comcast/NBCUniversal、Google、MovieLabs 以及负责维护规范的 W3C 等,形成了一个强大的团队。在这些行业巨头的支持下,PNG 格式重新获得了发展动力,目前已经开始着手进行接下来的两个规范更新。
许多常用的软件已经支持新的 PNG 规范,包括 Chrome、Safari、Firefox、iOS/macOS、Photoshop、DaVinci Resolve 和 Avid Media Composer 等。一些广播公司在幕后也在更新硬件和工具以支持新的 PNG 规范。下次看到新闻字幕滚动或体育比赛得分更新时,可以留意一下是否使用了 HDR 功能。
对于未来,团队已经在研究更好的压缩技术以及并行编码和解码功能,以确保这些改进能够像本次更新一样做到尽善尽美。预计下一次 PNG 更新(第四版)将主要改进 HDR 和标准动态范围(SDR)之间的互操作性,同时团队也将为 PNG 第五版研究压缩技术更新。
#PNG #新特性
https://www.programmax.net/articles/png-is-back/
www.programmax.net
PNG is back!
After 20 years, PNG is back with renewed vigor! A new PNG spec was just released.
日本京都的后院咖啡和爵士乐
Addison Del Mastro 分享了在日本京都的一次独特体验,即参观一家位于某车道上的小型咖啡店和爵士酒吧。这家店铺白天是咖啡店,晚上则变为酒吧,提供啤酒和威士忌。店铺空间虽小,但布置得十分温馨,内部有一台老式咖啡研磨机和一台 Denon 唱片机,播放着爵士乐。尽管店铺外观简陋,但内部却给人一种宽敞、舒适且充满怀旧氛围的感觉,仿佛进入了一个时光胶囊。
Mastro 认为这种小型商业形式在日本城市中非常普遍,它体现了日本商业和街边文化的活力,并且普通人参与其中的门槛非常低。这种小型商业模糊了商业与顾客、主人与客人之间的界限,让人们能够在一种亲密的环境中享受服务。与美国以汽车为中心的商业模式不同,日本的步行友好型城市环境使得人们能够更轻松地访问这些小型店铺。
这种小型商业形式允许人们以一种商业化的规模追求自己的爱好或兴趣,而不是被迫将其保留为个人爱好或冒险进入大规模商业领域。这种模式体现了真正的自由企业精神,低门槛使得几乎任何人都可以尝试创业,而不会受到过多监管的阻碍。这种模式不仅促进了小型、本地化和美丽事物的发展,还为人们提供了追求自由和创新的机会。
#旅游
https://thedeletedscenes.substack.com/p/backyard-coffee-and-jazz-in-kyoto
Addison Del Mastro 分享了在日本京都的一次独特体验,即参观一家位于某车道上的小型咖啡店和爵士酒吧。这家店铺白天是咖啡店,晚上则变为酒吧,提供啤酒和威士忌。店铺空间虽小,但布置得十分温馨,内部有一台老式咖啡研磨机和一台 Denon 唱片机,播放着爵士乐。尽管店铺外观简陋,但内部却给人一种宽敞、舒适且充满怀旧氛围的感觉,仿佛进入了一个时光胶囊。
Mastro 认为这种小型商业形式在日本城市中非常普遍,它体现了日本商业和街边文化的活力,并且普通人参与其中的门槛非常低。这种小型商业模糊了商业与顾客、主人与客人之间的界限,让人们能够在一种亲密的环境中享受服务。与美国以汽车为中心的商业模式不同,日本的步行友好型城市环境使得人们能够更轻松地访问这些小型店铺。
这种小型商业形式允许人们以一种商业化的规模追求自己的爱好或兴趣,而不是被迫将其保留为个人爱好或冒险进入大规模商业领域。这种模式体现了真正的自由企业精神,低门槛使得几乎任何人都可以尝试创业,而不会受到过多监管的阻碍。这种模式不仅促进了小型、本地化和美丽事物的发展,还为人们提供了追求自由和创新的机会。
#旅游
https://thedeletedscenes.substack.com/p/backyard-coffee-and-jazz-in-kyoto
NXTscape 是一个开源的智能浏览器,由 NXTscape 团队开发,旨在为用户提供隐私优先的 AI 浏览体验。它支持本地运行 AI 代理,用户可以使用自己的 API 密钥或通过 Ollama 使用本地模型,确保数据始终存储在本地设备上。该浏览器界面与谷歌浏览器类似,兼容所有扩展程序,并且开源,用户可以查看底层代码。NXTscape 的功能还包括即将推出的 MCP 商店,用户可以一键安装流行的 MCP 并直接在浏览器栏中使用,以及内置的 AI 广告拦截器,适用于更多场景。
NXTscape 的开发灵感来源于浏览器使用、Stagehand、Nanobrowser 等项目,并基于 Chromium 实现。它支持多种 AI 提供商,包括 OpenAI、Anthropic 和本地 Ollama。团队希望通过 AI 代理实现本地化、安全化的任务自动化,而不是将数据发送到搜索引擎或广告公司。与 Chrome、Brave、Arc/Dia 和 Perplexity Comet 等浏览器相比,NXTscape 更注重隐私保护和 AI 代理的本地运行。
#AI #浏览器
https://github.com/nxtscape/nxtscape
NXTscape 的开发灵感来源于浏览器使用、Stagehand、Nanobrowser 等项目,并基于 Chromium 实现。它支持多种 AI 提供商,包括 OpenAI、Anthropic 和本地 Ollama。团队希望通过 AI 代理实现本地化、安全化的任务自动化,而不是将数据发送到搜索引擎或广告公司。与 Chrome、Brave、Arc/Dia 和 Perplexity Comet 等浏览器相比,NXTscape 更注重隐私保护和 AI 代理的本地运行。
#AI #浏览器
https://github.com/nxtscape/nxtscape
GitHub
GitHub - browseros-ai/BrowserOS: BrowserOS is an open-source agentic web browser.
BrowserOS is an open-source agentic web browser. Contribute to browseros-ai/BrowserOS development by creating an account on GitHub.
Claude Code Usage Monitor 是一个由 Maciek-roboblog 团队开发的实时终端监控工具,用于跟踪 Claude AI 的 Token 使用情况。它具备实时监控、可视化的进度条、智能预测令牌耗尽时间、自动检测计划类型以及多种计划支持等功能。该工具支持 Pro、Max5、Max20 和自定义最大值计划,并能够根据当前消耗速率预测何时会耗尽令牌。
#Tools #AI #Claude
https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor?tab=readme-ov-file
#Tools #AI #Claude
https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor?tab=readme-ov-file
GitHub
GitHub - Maciek-roboblog/Claude-Code-Usage-Monitor: Real-time Claude Code usage monitor with predictions and warnings
Real-time Claude Code usage monitor with predictions and warnings - Maciek-roboblog/Claude-Code-Usage-Monitor
Hurl 是由 Orange-OpenSource 团队开发的一款命令行工具,能够运行在简单纯文本格式中定义的 HTTP 请求。它支持链式请求、捕获值以及在响应头和响应体中执行查询,适用于获取数据和测试 HTTP 会话,支持 HTML 内容、REST / SOAP / GraphQL API 以及基于 XML / JSON 的 API。
#HTTP #CLI
https://github.com/Orange-OpenSource/hurl
#HTTP #CLI
https://github.com/Orange-OpenSource/hurl
GitHub
GitHub - Orange-OpenSource/hurl at dailydev
Hurl, run and test HTTP requests with plain text. Contribute to Orange-OpenSource/hurl development by creating an account on GitHub.
Zvi 对当前人工智能领域的诸多现象进行了深入探讨。Meta 为吸引顶尖 AI 人才不惜支付高额薪酬,然而对于大多数人尤其是求职者而言,AI 对就业申请流程的影响正逐渐显现。与此同时,AI 在编程领域的应用正在改变行业格局,美国在 AI 编程方面处于领先地位,其 Python 函数的编写中有 30.1% 由 AI 完成,远超其他国家,这为美国带来了每年 96 亿至 960 亿美元的潜在价值。
在 AI 模型的使用和监管方面,Anthropic 赢得了关于模型训练属于合理使用的法律案件,这一判决对 AI 行业具有重要意义。然而,AI 生成音乐的兴起引发了版权和市场价值的讨论,预计到 2028 年,AI 音乐的收入将从 2023 年的 1 亿美元增长到 40 亿美元,但这种增长可能会导致人们对音乐真实性的质疑。
在技术发展方面,ChatGPT 和 Claude 等 AI 工具不断推出新功能,如 ChatGPT 的 Google Drive 连接器和 Claude 的创作空间,但 Gemini Pro 的用户反馈显示其存在一些问题,如频繁的干扰和无法降级的限制。此外,AI 在情感支持方面的应用也受到关注,尽管 Claude 被用于情感咨询和陪伴,但其使用频率相对较低。
在 AI 的风险和监管方面,OpenAI 警告其模型即将达到“高”风险阈值,这意味着 AI 在生物武器等领域的潜在威胁正在增加。同时,AI 的对齐问题仍然是一个挑战,模型的行为和目标与人类价值观之间的不一致性可能会导致不可预测的后果。尽管如此,一些人对 AI 的未来持乐观态度,认为 AI 将为人类带来巨大的利益,但也有人担心 AI 可能导致人类失去对技术的控制。
在政策和监管层面,AI 的发展引发了关于安全和监管的广泛讨论。Jack Clark 在国会听证会上表示,强大的 AI 系统将在未来 18 个月内建成,这要求我们必须迅速采取行动以确保安全。然而,对于如何实现安全以及如何在技术发展和安全之间取得平衡,各方仍存在分歧。一些人认为,当前的监管措施过于保守,而另一些人则担心过快的发展可能会带来不可预见的风险。
#AI
https://www.lesswrong.com/posts/DiHX6C6knmA5cezaf/ai-122-paying-the-market-price#Language_Models_Don_t_Offer_Mundane_Utility
在 AI 模型的使用和监管方面,Anthropic 赢得了关于模型训练属于合理使用的法律案件,这一判决对 AI 行业具有重要意义。然而,AI 生成音乐的兴起引发了版权和市场价值的讨论,预计到 2028 年,AI 音乐的收入将从 2023 年的 1 亿美元增长到 40 亿美元,但这种增长可能会导致人们对音乐真实性的质疑。
在技术发展方面,ChatGPT 和 Claude 等 AI 工具不断推出新功能,如 ChatGPT 的 Google Drive 连接器和 Claude 的创作空间,但 Gemini Pro 的用户反馈显示其存在一些问题,如频繁的干扰和无法降级的限制。此外,AI 在情感支持方面的应用也受到关注,尽管 Claude 被用于情感咨询和陪伴,但其使用频率相对较低。
在 AI 的风险和监管方面,OpenAI 警告其模型即将达到“高”风险阈值,这意味着 AI 在生物武器等领域的潜在威胁正在增加。同时,AI 的对齐问题仍然是一个挑战,模型的行为和目标与人类价值观之间的不一致性可能会导致不可预测的后果。尽管如此,一些人对 AI 的未来持乐观态度,认为 AI 将为人类带来巨大的利益,但也有人担心 AI 可能导致人类失去对技术的控制。
在政策和监管层面,AI 的发展引发了关于安全和监管的广泛讨论。Jack Clark 在国会听证会上表示,强大的 AI 系统将在未来 18 个月内建成,这要求我们必须迅速采取行动以确保安全。然而,对于如何实现安全以及如何在技术发展和安全之间取得平衡,各方仍存在分歧。一些人认为,当前的监管措施过于保守,而另一些人则担心过快的发展可能会带来不可预见的风险。
#AI
https://www.lesswrong.com/posts/DiHX6C6knmA5cezaf/ai-122-paying-the-market-price#Language_Models_Don_t_Offer_Mundane_Utility
Lesswrong
AI #122: Paying The Market Price — LessWrong
If you are Meta, and you want to attract top AI talent, you have a problem, because no one wants to work for you or on your products. So it is going…
Claudia 是一个优雅的桌面伴侣,专为 Claude Code 设计,旨在通过美观的图形界面简化 AI 编程工作流程,使管理 Claude 会话、创建自定义代理和跟踪使用情况变得轻松。
Claudia 提供了强大的功能,包括可视化项目管理、自定义 AI 代理创建、跟踪 AI 支出、内置 Markdown 编辑器、MCP 服务器管理、会话时间旅行等功能。其隐私优先的设计确保数据本地存储,无需依赖云端或外部跟踪。此外,Claudia 集成了 Claude Code,用户可以直接在应用程序内运行 Claude Code 会话。
开发者在使用终端管理 Claude Code 时常常面临诸多挑战,例如终端混乱、缺乏可视化浏览项目历史和会话的方式、难以跟踪令牌使用量和成本、手动编辑文件繁琐、创建和管理可复用 AI 代理困难,以及难以有效地回顾和分支之前的对话。Claudia 针对这些问题提供了直观且愉悦的解决方案。
#AI #Claude #Tools
https://claudia.asterisk.so/
Claudia 提供了强大的功能,包括可视化项目管理、自定义 AI 代理创建、跟踪 AI 支出、内置 Markdown 编辑器、MCP 服务器管理、会话时间旅行等功能。其隐私优先的设计确保数据本地存储,无需依赖云端或外部跟踪。此外,Claudia 集成了 Claude Code,用户可以直接在应用程序内运行 Claude Code 会话。
开发者在使用终端管理 Claude Code 时常常面临诸多挑战,例如终端混乱、缺乏可视化浏览项目历史和会话的方式、难以跟踪令牌使用量和成本、手动编辑文件繁琐、创建和管理可复用 AI 代理困难,以及难以有效地回顾和分支之前的对话。Claudia 针对这些问题提供了直观且愉悦的解决方案。
#AI #Claude #Tools
https://claudia.asterisk.so/
claudia.asterisk.so
Claudia - The Elegant Desktop Companion for Claude Code
Transform your AI coding workflow with a beautiful GUI that makes managing Claude sessions, creating custom agents, and tracking usage effortless.
软件在 AI 时代的变革:未来机遇与挑战
在当今科技飞速发展的背景下,软件行业正迎来一场深刻的变革。前特斯拉 AI 部门主管安德烈·卡帕西(Andrej Karpathy)在演讲中详细阐述了软件在 AI 时代的演变、未来趋势以及我们应如何应对这一变革。
随着人工智能(AI)技术的不断突破,软件的定义、开发方式和生态系统都在发生根本性变化。卡帕西指出,软件的演变可以划分为三个阶段:
软件1.0:传统的程序代码,明确指令,硬编码逻辑。
软件2.0:神经网络的出现,参数(weights)成为“程序”,通过调优数据集和优化器生成模型。
软件3.0:大规模语言模型(LLMs)成为“新型计算机”,通过自然语言提示(prompts)进行编程,几乎用英语直接“操控”计算机。
他强调,这一变革不仅仅是技术的升级,更是软件生态、开发范式和用户交互方式的革命。
1. 软件演变的深刻变化
软件1.0:传统编程,代码明确、可控,适用于固定功能。
软件2.0:神经网络参数化,模型“学习”任务,减少手工编码。
软件3.0:大语言模型(LLMs)成为“编程工具”,用英语提示实现复杂任务。
关键点:
神经网络从“被动执行”变为“可编程”,提示(prompt)成为新型“程序”。
2. 以 GitHub 为代表的“软件 2.0 ”生态
- 模型库:如 Hugging Face、Model Atlas,存储和管理模型参数。
- 参数调优:通过调节模型参数,创造不同的“生成器”或“识别器”。
- 示意图:中间的巨大圆圈代表“Flux”模型的参数,调优即“提交(commit)”。
3. 大语言模型(LLMs)作为“新型操作系统”
- 比喻:LLMs 像操作系统(OS),管理“记忆”和“计算”。
- 类比:
应用程序:如 VS Code,可以在不同的 LLM 平台(GPT、Gemini等)运行。
硬件:云端 GPU/TPU 资源,类似于传统的硬件基础设施。
生态系统:闭源(Windows、Mac)与开源(Linux)竞争,未来可能出现类似 Linux 的开放生态。
重要观点:
LLMs 不仅是工具,更是“操作系统”,管理复杂的多模态、多任务生态。
4. LLM 的“心理学”与“认知”
- 知识储备:如“Rainman”般的超强记忆,能记住海量信息。
- 认知缺陷:
幻觉:可能编造虚假信息。
“碎片化”认知:在某些任务表现超常,在其他方面犯低级错误。
“逆向失忆”:缺乏持续的上下文记忆,类似“记忆清零”的电影情节(如《记忆碎片》)。
- 安全风险:易受提示攻击(prompt injection)、数据泄露等。
5. 软件应用的未来:部分自主(partial autonomy)
- 代码辅助:如Cursor、Perplexity,协助管理代码、搜索、研究。
- “自治”程度:从“只提供建议”到“全自动执行”,用户可调节“自主滑块”。
6. 教育与知识传递的新模式
- 课程设计:利用 LLMs 生成、审核课程内容,确保符合教学大纲。
- “把关”机制:通过中间产物(如课程、文档)确保 AI 输出的质量。
- 未来趋势:教育、开发、内容创作都将变得更“自然”、更“普及”。
7. 让 AI “成为”用户的“代理”
- 新型数字操控者:如 robots.txt、lm.txt 文件,指导 AI 行为。
- 文档优化:将技术文档转为易于 LLMs 理解的格式(如Markdown)。
- 数据接入:简化数据导入流程(如 GitHub 内容转为文本),提升模型理解能力。
- 自动化操作:未来 LLMs 可能自主“点击”、“操作”网页,实现全自动任务。
#AI #软件开发
https://www.youtube.com/watch?v=LCEmiRjPEtQ
在当今科技飞速发展的背景下,软件行业正迎来一场深刻的变革。前特斯拉 AI 部门主管安德烈·卡帕西(Andrej Karpathy)在演讲中详细阐述了软件在 AI 时代的演变、未来趋势以及我们应如何应对这一变革。
随着人工智能(AI)技术的不断突破,软件的定义、开发方式和生态系统都在发生根本性变化。卡帕西指出,软件的演变可以划分为三个阶段:
软件1.0:传统的程序代码,明确指令,硬编码逻辑。
软件2.0:神经网络的出现,参数(weights)成为“程序”,通过调优数据集和优化器生成模型。
软件3.0:大规模语言模型(LLMs)成为“新型计算机”,通过自然语言提示(prompts)进行编程,几乎用英语直接“操控”计算机。
他强调,这一变革不仅仅是技术的升级,更是软件生态、开发范式和用户交互方式的革命。
1. 软件演变的深刻变化
软件1.0:传统编程,代码明确、可控,适用于固定功能。
软件2.0:神经网络参数化,模型“学习”任务,减少手工编码。
软件3.0:大语言模型(LLMs)成为“编程工具”,用英语提示实现复杂任务。
关键点:
神经网络从“被动执行”变为“可编程”,提示(prompt)成为新型“程序”。
2. 以 GitHub 为代表的“软件 2.0 ”生态
- 模型库:如 Hugging Face、Model Atlas,存储和管理模型参数。
- 参数调优:通过调节模型参数,创造不同的“生成器”或“识别器”。
- 示意图:中间的巨大圆圈代表“Flux”模型的参数,调优即“提交(commit)”。
3. 大语言模型(LLMs)作为“新型操作系统”
- 比喻:LLMs 像操作系统(OS),管理“记忆”和“计算”。
- 类比:
应用程序:如 VS Code,可以在不同的 LLM 平台(GPT、Gemini等)运行。
硬件:云端 GPU/TPU 资源,类似于传统的硬件基础设施。
生态系统:闭源(Windows、Mac)与开源(Linux)竞争,未来可能出现类似 Linux 的开放生态。
重要观点:
LLMs 不仅是工具,更是“操作系统”,管理复杂的多模态、多任务生态。
4. LLM 的“心理学”与“认知”
- 知识储备:如“Rainman”般的超强记忆,能记住海量信息。
- 认知缺陷:
幻觉:可能编造虚假信息。
“碎片化”认知:在某些任务表现超常,在其他方面犯低级错误。
“逆向失忆”:缺乏持续的上下文记忆,类似“记忆清零”的电影情节(如《记忆碎片》)。
- 安全风险:易受提示攻击(prompt injection)、数据泄露等。
5. 软件应用的未来:部分自主(partial autonomy)
- 代码辅助:如Cursor、Perplexity,协助管理代码、搜索、研究。
- “自治”程度:从“只提供建议”到“全自动执行”,用户可调节“自主滑块”。
6. 教育与知识传递的新模式
- 课程设计:利用 LLMs 生成、审核课程内容,确保符合教学大纲。
- “把关”机制:通过中间产物(如课程、文档)确保 AI 输出的质量。
- 未来趋势:教育、开发、内容创作都将变得更“自然”、更“普及”。
7. 让 AI “成为”用户的“代理”
- 新型数字操控者:如 robots.txt、lm.txt 文件,指导 AI 行为。
- 文档优化:将技术文档转为易于 LLMs 理解的格式(如Markdown)。
- 数据接入:简化数据导入流程(如 GitHub 内容转为文本),提升模型理解能力。
- 自动化操作:未来 LLMs 可能自主“点击”、“操作”网页,实现全自动任务。
#AI #软件开发
https://www.youtube.com/watch?v=LCEmiRjPEtQ
YouTube
Andrej Karpathy: Software Is Changing (Again)
Andrej Karpathy's keynote on June 17, 2025 at AI Startup School in San Francisco. Slides provided by Andrej: https://drive.google.com/file/d/1a0h1mkwfmV2PlekxDN8isMrDA5evc4wW/view?usp=sharing
Chapters:
00:00 - Intro
01:25 - Software evolution: From 1.0 to…
Chapters:
00:00 - Intro
01:25 - Software evolution: From 1.0 to…
康威、蚁群和 Apache Kafka 对人工智能系统设计的启示
Sean Falconer 探讨了多智能体系统(Multi-Agent Systems, MAS)如何为人工智能系统设计提供新的思路和方法。复杂系统往往由简单部分组合而成,例如微服务架构在软件开发中的应用,Apache Kafka 通过解耦合的方式将大型系统拆分为独立的服务,使得系统更加模块化、易于扩展和演化。类似地,多智能体系统为人工智能带来了类似的转变,通过将复杂任务分解为多个简单智能体,这些智能体专注于特定任务并协同工作,从而解决更复杂的问题。
Sean 强调了“涌现”(emergence)的概念,即简单规则或部分组合产生意外的复杂行为。例如,康威的生命游戏(Conway’s Game of Life)通过简单的规则模拟出类似运动、繁殖甚至计算的行为,而蚁群则通过每个蚂蚁遵循基本指令(如释放信息素、跟随路径、搬运食物)展现出智能和适应性行为。这些例子表明,复杂性并非直接设计而来,而是通过简单部分的交互自然涌现。
然而,生成式人工智能(Generative AI)常常面临过于复杂的问题,其单一提示(prompt)接口中包含了过多的复杂性。与传统的人工智能模型(如欺诈检测、推荐系统等)相比,生成式人工智能的灵活性虽然令人印象深刻,但也带来了测试困难、输出难以预测以及可扩展性受限等问题。这些问题使得生成式人工智能系统在实际应用中难以工程化、扩展和信任。
多智能体系统提供了一种解决方法。智能体不仅仅是模型,它们是具有目标导向、记忆、工具和自主性的实体。通过将任务分配给智能体,而不是简单地向模型发出提示,智能体可以自主规划、调用 API、检索信息、与其他智能体交互并根据上下文进行调整。例如,智能体可以执行确定性过程,如查询数据库、运行脚本或触发工作流,从而将语言模型与现实世界的应用相结合。
多智能体系统的优势在于其模块化和清晰的系统边界。每个智能体都有明确的职责、接口和范围,这使得它们更容易测试、独立扩展和演化。与蚁群或康威生命游戏类似,多智能体系统中的智能性并非嵌入在一个庞大的实体中,而是通过较小、目标驱动的单元的交互涌现出来。
多智能体系统能够将开放世界问题(如通用基础模型所面对的)转化为封闭世界问题。智能体在封闭世界中具有特定目标、已知工具和明确的成功标准,这使得它们可测试、可观察且可组合,从而满足现实世界中对可靠性的需求。具体而言,多智能体系统在测试性、可观测性、可组合性、可扩展性以及与现实世界约束的一致性方面表现出色。
以收入预测为例,多智能体系统可以将问题分解为多个智能体的任务:
1、检索智能体从内部系统获取销售和财务数据;
2、分析智能体应用确定性逻辑或调用预测模型;
3、质量检查智能体检查缺失数据或异常值;
4、报告智能体以自然语言总结结果;
5、规划智能体则协调整个工作流并处理错误或重试。
这种分解使得每个智能体都具有明确的范围、可测试性和可重用性,从而产生更可靠和可解释的结果。
构建智能系统不仅需要强大的模型,还需要合理地结构化和组合这些模型。复杂行为不需要复杂的部件,而是需要通过清晰的边界和交互协同工作的简单部件。多智能体系统正是基于这种涌现原理的核心设计原则。通过将单一的复杂提示分解为多个可测试的智能体,人工智能从一个实验性的黑盒转变为一个可观察、可扩展且与现实业务流程一致的工程化系统。
#AI #GenAI #多智能体系统 #思考
https://seanfalconer.medium.com/what-conway-ants-and-apache-kafka-can-teach-us-about-ai-system-design-1bc4c1051b7a
Sean Falconer 探讨了多智能体系统(Multi-Agent Systems, MAS)如何为人工智能系统设计提供新的思路和方法。复杂系统往往由简单部分组合而成,例如微服务架构在软件开发中的应用,Apache Kafka 通过解耦合的方式将大型系统拆分为独立的服务,使得系统更加模块化、易于扩展和演化。类似地,多智能体系统为人工智能带来了类似的转变,通过将复杂任务分解为多个简单智能体,这些智能体专注于特定任务并协同工作,从而解决更复杂的问题。
Sean 强调了“涌现”(emergence)的概念,即简单规则或部分组合产生意外的复杂行为。例如,康威的生命游戏(Conway’s Game of Life)通过简单的规则模拟出类似运动、繁殖甚至计算的行为,而蚁群则通过每个蚂蚁遵循基本指令(如释放信息素、跟随路径、搬运食物)展现出智能和适应性行为。这些例子表明,复杂性并非直接设计而来,而是通过简单部分的交互自然涌现。
然而,生成式人工智能(Generative AI)常常面临过于复杂的问题,其单一提示(prompt)接口中包含了过多的复杂性。与传统的人工智能模型(如欺诈检测、推荐系统等)相比,生成式人工智能的灵活性虽然令人印象深刻,但也带来了测试困难、输出难以预测以及可扩展性受限等问题。这些问题使得生成式人工智能系统在实际应用中难以工程化、扩展和信任。
多智能体系统提供了一种解决方法。智能体不仅仅是模型,它们是具有目标导向、记忆、工具和自主性的实体。通过将任务分配给智能体,而不是简单地向模型发出提示,智能体可以自主规划、调用 API、检索信息、与其他智能体交互并根据上下文进行调整。例如,智能体可以执行确定性过程,如查询数据库、运行脚本或触发工作流,从而将语言模型与现实世界的应用相结合。
多智能体系统的优势在于其模块化和清晰的系统边界。每个智能体都有明确的职责、接口和范围,这使得它们更容易测试、独立扩展和演化。与蚁群或康威生命游戏类似,多智能体系统中的智能性并非嵌入在一个庞大的实体中,而是通过较小、目标驱动的单元的交互涌现出来。
多智能体系统能够将开放世界问题(如通用基础模型所面对的)转化为封闭世界问题。智能体在封闭世界中具有特定目标、已知工具和明确的成功标准,这使得它们可测试、可观察且可组合,从而满足现实世界中对可靠性的需求。具体而言,多智能体系统在测试性、可观测性、可组合性、可扩展性以及与现实世界约束的一致性方面表现出色。
以收入预测为例,多智能体系统可以将问题分解为多个智能体的任务:
1、检索智能体从内部系统获取销售和财务数据;
2、分析智能体应用确定性逻辑或调用预测模型;
3、质量检查智能体检查缺失数据或异常值;
4、报告智能体以自然语言总结结果;
5、规划智能体则协调整个工作流并处理错误或重试。
这种分解使得每个智能体都具有明确的范围、可测试性和可重用性,从而产生更可靠和可解释的结果。
构建智能系统不仅需要强大的模型,还需要合理地结构化和组合这些模型。复杂行为不需要复杂的部件,而是需要通过清晰的边界和交互协同工作的简单部件。多智能体系统正是基于这种涌现原理的核心设计原则。通过将单一的复杂提示分解为多个可测试的智能体,人工智能从一个实验性的黑盒转变为一个可观察、可扩展且与现实业务流程一致的工程化系统。
#AI #GenAI #多智能体系统 #思考
https://seanfalconer.medium.com/what-conway-ants-and-apache-kafka-can-teach-us-about-ai-system-design-1bc4c1051b7a
Medium
What Conway, Ants, and Apache Kafka Can Teach Us About AI System Design
Multi-agent systems use simple agents to build reliable, scalable, and testable AI architectures.