时间的切片
7.33K subscribers
512 photos
4 videos
19 files
431 links
Download Telegram
听播客发现王朔和陈丹青这俩老爷子比我能刷短视频多了,这俩都是五零后,可爱看短视频了。

以前觉得这种严肃文化人不爱看呢,比我能看。可能时间太多了?我还得创业赚钱拍照片徒步拍视频 😂
墨问半年又增加了一系列 Pro 会员功能,谁用谁香 😄

https://note.mowen.cn/note/vip?inviteCode=V-RAOQDPY9MQ

朋友们抓紧,等上了更多 AI 功能就该涨价了
周末一个传统企业做 IT 的朋友问我 MCP 怎么玩,我和他介绍了一下墨问 MCP 和 OpenAPI 的设计和用法,很奇怪传统企业这么先锋了吗?

他说,别提了,现在到处 AI 提效,我们得天天琢磨怎么体现这玩意,AI 编程工具没用几回,天天得统计 AI 代码采用率,AI 为业务带来哪些增量,你的价值在哪……AI 带来的损耗比提效可大多了,tnnd。

他这么吐槽。

我拍了拍他的肩膀心想,好在我永远不需要在这种企业工作了……
让 AI 工具帮助你做 RSS 的事儿。想自动化总结X的信息流?只需用上Comet浏览器

在X上面关注了很多人,但很头疼的事情是,信息实在太多了,并且X的信息密度不高,虽然follow了很多人,但大部分帖子我都没有去看。直到我用到了Comet,这一切发生了改变。

https://note.mowen.cn/detail/C4Ad2vqEM2bLIz4-qDe8I
如果我是互联网大厂主导产品的高管,有两个产品我一定要做,一个是 AI 浏览器,另一个就是 AI IDE 编程工具。

在大模型彻底“下沉”到应用层的 2025 年,浏览器和编程工具这两个看似古老的入口,正在被重新发明。

浏览器握有用户全部网页、标签、搜索、购物、支付的实时行为数据。对大模型而言,这些数据就是最好的“长上下文”——能让 AI 既理解人,也能替人执行操作。要让 Agent 去网页里点按钮、填表格、下单,最直接的办法就是让它“长”在浏览器里。Dia、Comet 等,都在做这样的事情。

编程工具在 AI 时代被彻底泛化,不再是软件工程师的专属工具,有的 AI 编程工具在强化程序员的能力,比如 Copilot 和 Cursor,有的是编程 Agent,帮助普通人实现产品梦想,比如 Lovable、http://Bolt.new,还有做命令行的,比如 Claude Code、Gemini CLI 等等,产品线非常丰富。

最近阿里巴巴刚刚发布了 Agentic 编程平台 Qoder,这款产品有什么不一样呢?在我来看,最重要的就两点:对巨大代码工程的理解能力增强,代码生成的准确率提升。对,Qoder 还提供了个Quest Mode,你可以把 Qoder 当做全栈工程师用。

也可以直接调用墨问的 MCP,分析结果直接入墨问。https://note.mowen.cn/note/detail?noteUuid=Si0_aKoXen095-wHCOVGr
昨天和一个 X(推特) 上创作者交流,我说你这十几万的订阅,怎么评论这么少呢,是不是做了限制,关注你的才能评论?

他说,我的限制更严格,只有我关注的才能留言评论,这可以最大程度降低留言对作者和读者的困扰。

也就是这样:
这样几乎可以屏蔽所有噪音,因为自己的关注已经是非常严格的筛选了。但是这种做法也会挡住正常的交流,比如你的关注者们。

我最近几年的评论区基本都是对所有人开放,并且对评论不加干涉。这样,当你的内容被平台推荐的越来越多的时候,内容就会被更多陌生人遇到,负面评价就会多起来。

负面评价不都是坏事,就事论事没有任何问题,但另一部分负面评价可以判定为冒犯和垃圾信息,包括恶意揣测,以前这样的信息我也懒得管。最近推荐越来越多,我稍微研究了一下,这种在评论区大放厥词的用户,看 ta 主页,既没有粉丝,也没有内容,可能就是个不作个人形象经营的 nobody 或匿名者,基本上是来评论区找存在感的。

我现在的处理方式会严厉一点,删除 ta 的评论,然后拉黑了事。存在感,给不了一点。

这是一种小小的惩罚。

墨问目前这种情况很少,但也不是没有,到一定程度,评论权限也会做限制的,选择权交给墨主们就好。


https://note.mowen.cn/note/detail?noteUuid=x8m7AXuuOyAcqJqkEl1fP
上半年我写过一篇快手推荐大模型的文章,没想到特受欢迎,系统还推荐了,很多用户留言让我继续讲讲快手。还有用户问我,是不是快手这家公司,只做了推荐大模型和视频生成大模型,其他的一概不碰?看来还真有不少信息差。

其实在今年六月底,快手就开源了多模态大模型 Keye-VL。我们团队当时也做过测试,发现它对短视频内容的理解能力确实不同凡响。在这个时代,几乎所有成规模的互联网公司都在 AI 领域重兵集结,投入了大量资源。

先说说 Keye-VL 1.5 模型:https://note.mowen.cn/note/detail?noteUuid=EddJOgW0vkbUBJB5Wnsm0

这两天我们 CTO 发现,快手悄悄发布了 Keye-VL 的 1.5 版本。目前模型权重已经开源。注意,参数只有 8B,适合中小企业低成本部署使用。

和市面上常见多模态大模型不同,Kwai Keye 不是一味追求通用性,而是更侧重短视频场景。根据权威的基准测试集 Video-MME 的数据, Keye-VL-1.5-8B 在短视频的数据集中,超过了 GPT-4o 以及同等规模参数的其他模型,表现还是相当不错。
做个测评,下面是一段快手上的短视频,输入给 Keye-VL-1.5 后,提问:大狗咬小狗的耳朵是为什么?
人们如何使用 ChatGPT?

OpenAI 发文:ChatGPT 的用户群体已经超越了早期的爱好者,变得更加广泛,特别是性别差距已显著缩小。大多数对话都聚焦于解决日常问题,例如查询信息和寻求实用建议。同时,它的使用方式也在不断演进,无论是在个人生活还是职业领域,都在持续创造经济价值。这种日益广泛的应用,也印证了我们的信念:获取人工智能 (AI) 服务应被视为一项基本权利,它是一种能帮助人们释放潜力、塑造未来的强大技术 https://note.mowen.cn/detail/2nzXlUOX088EKIIDLOUF-
https://note.mowen.cn/note/detail?noteUuid=ch5sA6nArCbD8mSF3ip7M

看到一些内测用户曝光,Gemini 3.0 可以在 Google AI Studio 里内测了,功能极为强大。咱打开 Studio 发现还是 2.5 Pro,显然没有内测资格。不过看了 X 上一些用户展示的内容,确实惊艳。如果这些能力在发布后不会被削弱,那么 Gemini 3.0 在编程和编码能力上将有巨大飞跃,这种升级会远远超过 GPT5,还有“智能体(Agent)”功能,更主动地理解和执行复杂任务。
两天前,Andrej Karpathy 上了 Dwarkesh 的播客。油管上有视频版,周末我看了两遍,信息密度极高。他的核心结论可以用一句话概括:Agent 的发展还需要十年。
原文:https://www.dwarkesh.com/p/andrej-karpathy
我整理了一份尽可能保留 Andrej Karpathy 的原话原意的访谈记录,大约 6000 字

https://note.mowen.cn/note/detail?noteUuid=BiWrEFI30YaBm7QthPORy
https://note.mowen.cn/detail/VTopFX9NhZye3s5M5uKE8

突然发现,貌似谷歌的这个 AI 服务已经对几乎所有地区免费开放了。为了信息的准确性,我问了一些不同地区的朋友,确实,无论是在 Google App,还是在各种浏览器——Chrome、Safari、豆包、Atlas、Dia、Comet——上打开谷歌的搜索框,都能使用 AI Mode 了。如果你的页面是中文,如上图所示,AI Mode 会被翻译成“AI 模式”。

看一下这个产品的发布历史,时间线大概是这样子:

Google 的 AI 模式(AI Mode)在 2025 年 3 月首次推出,最初是 Google Search Labs 中的一项实验性功能。
2025 年 5 月 20 日:在 Google I/O 2025 大会上宣布向本国用户推出。
2025 年 6 月:开始在少数国家/地区推出。
2025 年 10 月:该服务扩展到全球 200 多个国家和地区,并支持超过 35 种新语言(包括简体和繁体中文),成为一项全球性的功能。

到了 11 月,能用 Google 搜索的差不多都能用 AI Mode 了。
最近在整理以前的文章,做墨问知识库,翻出了 2023 年初,ChatGPT 发布后墨问和徐文浩的一期访谈内容,后面还追加了吴军对 ChatGPT 的判断,对比一下很有意思。

现在看起来,徐文浩对大模型技术的判断非常精准,多模态,Agent 的趋势都指出来了。吴军则略显保守,低谷了 GPT 的创新性,对未来的判断也是模糊不清的。

https://note.mowen.cn/detail/-Uq_O8Zldwq22DQyzAD7x
上午写完 AI Coding 的趋势,下午把这篇 Simon Willison 写的 2025 大模型之年看完了,这哥是 Django 框架的共同创造者、Lanyrd 联合创始人,自己做了 100 多个 AI 项目,非常过瘾。

这是一篇作者每年回顾过去 12 个月 LLM 领域发展的系列文章,内容非常详实,我读完之后整理了一份中文完整版放墨问里了,包括文中的链接和图片,一共 1.7 万字:

2025,大模型之年回顾,建议收藏阅读。
https://note.mowen.cn/detail/lypEigmjeAU1fykX5n5Fq

主要内容包括:

这一年充满了很多不同的趋势。
这是“推理”的一年
这是 Agent 的一年
这是代码 Agent 与 Claude Code 的一年
这是 LLM 走进命令行的一年
这是 YOLO 与“偏差常态化”的一年
这是 200 美元/月订阅的一年
这是中国开源权重模型登顶的一年
这是“长任务”的一年
这是“用提示词编辑图片”的一年
这是模型在学术竞赛中拿金牌的一年
这是 Llama 迷失方向的一年
这是 OpenAI 失去领先优势的一年
这是 Gemini 的一年
这是“骑自行车的鹈鹕”的一年
这是我做了 110 个工具的一年
这是“告密者”的一年
这是 vibe coding 的一年
这是 MCP(也许是唯一)的那一年
这是 AI 浏览器令人不安的一年
这是“致命三要素”的一年
这是我用手机写代码的一年
这是一致性测试套件的一年
这是本地模型变好、但云端模型更强的一年
这是“AI 垃圾内容(slop)”的一年
这是数据中心变得极不受欢迎的一年