This media is not supported in your browser
VIEW IN TELEGRAM
Walkcast —— 耳朵里的散步风景
🎧 还记得上一次随心所欲地散步是什么时候吗?没有目的地、没有急事,只是任由双脚带你前行。Walkcast 正是为这种「走神式散步」而生的——它会在你走路的过程中,实时生成一段专属于你的播客内容
📍 Walkcast 可以告诉你路边建筑背后的故事,也可能凭空编出一段奇幻传说。它的背后是一套 AI 驱动的 「故事引擎」。每次你走动时,它就会调用三位虚拟角色:策展人 Curator 会搜索你周围的信息,编辑 Editor 把它们编织成脚本,再由主播 Host 以合适的语调讲述出来
🌍 相比传统播客,Walkcast 更像是一场「即时生成的声音漫游」,一路走,一路听,故事也在实时变化。而它的创造者正是 Squeeze the present 的创意工作室 oio
🔗 目前免费开放中:https://walkcast.fm 下次散步记得带上它
📮 这篇文章是别人转给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🎧 还记得上一次随心所欲地散步是什么时候吗?没有目的地、没有急事,只是任由双脚带你前行。Walkcast 正是为这种「走神式散步」而生的——它会在你走路的过程中,实时生成一段专属于你的播客内容
📍 Walkcast 可以告诉你路边建筑背后的故事,也可能凭空编出一段奇幻传说。它的背后是一套 AI 驱动的 「故事引擎」。每次你走动时,它就会调用三位虚拟角色:策展人 Curator 会搜索你周围的信息,编辑 Editor 把它们编织成脚本,再由主播 Host 以合适的语调讲述出来
🌍 相比传统播客,Walkcast 更像是一场「即时生成的声音漫游」,一路走,一路听,故事也在实时变化。而它的创造者正是 Squeeze the present 的创意工作室 oio
🔗 目前免费开放中:https://walkcast.fm 下次散步记得带上它
📮 这篇文章是别人转给你的吗?点击这里加入频道,一起探索更多有趣的内容!
CapWords —— AR拍物学27语,涂鸦秒变单词本
📸 CapWords 是一款新的 AR 拍照学单词 app:用手机相机拍日常物品,帮助大家可以走到哪学到哪
👧👨 这款 app 是给作者的小孩打造的,所以使用起来非常的便捷。它不仅仅支持 27 种语言,物体识别度还高达了 98% 的准确度
📲 这里下载体验
频道:@RollerRolling
📸 CapWords 是一款新的 AR 拍照学单词 app:用手机相机拍日常物品,帮助大家可以走到哪学到哪
👧👨 这款 app 是给作者的小孩打造的,所以使用起来非常的便捷。它不仅仅支持 27 种语言,物体识别度还高达了 98% 的准确度
📲 这里下载体验
频道:@RollerRolling
Cap —— 开源屏幕录制工具,协作+一键分享链接
🎥 Cap 是开源的 Loom 替代品,支持即时录制模式,一键生成可分享链接,操作超简单
🔧 想精细剪辑?用 Studio 模式本地编辑视频,还能自定义存储、绑定独立域名,全平台兼容。支持团队协作,邀请成员共同管理,私有化部署更灵活,按需求打造专属工作流
📝 付费方式有两个方案:$58一次付清、仅支持线下储存视频。或是 $6 一个月,支持线上分享链接
频道:@RollerRolling
🎥 Cap 是开源的 Loom 替代品,支持即时录制模式,一键生成可分享链接,操作超简单
🔧 想精细剪辑?用 Studio 模式本地编辑视频,还能自定义存储、绑定独立域名,全平台兼容。支持团队协作,邀请成员共同管理,私有化部署更灵活,按需求打造专属工作流
📝 付费方式有两个方案:$58一次付清、仅支持线下储存视频。或是 $6 一个月,支持线上分享链接
频道:@RollerRolling
最近团建处理了几张合照,有一个 prompt 效果还不错
你可以上传一张合照,再上传一张《街头霸王》的角色选择界面,当参考风格,让 GPT-4o 把合照里的人一个个提取出来,摆成街机选人画面,用的 prompt 是这样的:
“Extract the individual characters from the first group photo. In total there are X people. Recompose them into a ‘character selection’ screen format based on the second reference image. The final layout should have two rows, with five characters per row (or adjust according to the number of people), keeping the poses dynamic and fitting for a fighting game style. Match the background, lighting, and general vibe of a Street Fighter character select screen.”
可能需要多调几次,感兴趣可以一试
频道:@RollerRolling
你可以上传一张合照,再上传一张《街头霸王》的角色选择界面,当参考风格,让 GPT-4o 把合照里的人一个个提取出来,摆成街机选人画面,用的 prompt 是这样的:
“Extract the individual characters from the first group photo. In total there are X people. Recompose them into a ‘character selection’ screen format based on the second reference image. The final layout should have two rows, with five characters per row (or adjust according to the number of people), keeping the poses dynamic and fitting for a fighting game style. Match the background, lighting, and general vibe of a Street Fighter character select screen.”
可能需要多调几次,感兴趣可以一试
频道:@RollerRolling
Status —— 虚拟追星乐园,在线发疯同人社交
🌟 Status 是一款超级有创意的新社交 app!短短上线五周已经突破了 50 万的日活。在这款 AI 推特里你可以设计自己的小世界、和虚拟角色发 tweet 互动
🎮 像社交版 Sims 模拟人生一样创建专属你的同人圈,和喜欢的角色在线发疯
📲 非常推荐大家免费试用一下,这里下载
频道:@RollerRolling
🌟 Status 是一款超级有创意的新社交 app!短短上线五周已经突破了 50 万的日活。在这款 AI 推特里你可以设计自己的小世界、和虚拟角色发 tweet 互动
🎮 像社交版 Sims 模拟人生一样创建专属你的同人圈,和喜欢的角色在线发疯
📲 非常推荐大家免费试用一下,这里下载
频道:@RollerRolling
Reasoning Models —— 不是所有推理,都会「说出来」
🧠 在训练 AI 时,我们常以为链式思考(Chain-of-Thought, CoT)不仅能提升推理能力,还能帮我们监控它们的思考过程。但 Anthropic 最新研究发现:推理模型的「思考」其实经常在心里藏着不说
🔍 研究团队专门测试了几种推理提示(比如视觉线索、非法信息、元数据干扰等),结果发现:即便模型利用了这些提示,真正会在 CoT 中主动提到的情况,通常不到20% 。也就是说大部分时候,模型只是「用」了提示,但不会告诉你它是怎么用的
🚨 更棘手的是,当模型通过强化学习(RL)接受训练、并且学会了「作弊」(比如利用隐藏的奖励漏洞)时,CoT 也几乎不会透露这一点。即便模型在训练中几乎每次都在利用漏洞,CoT 里提到这件事的概率依然低于 2%
🤯 这项研究打破了一个幻想:CoT 监控虽然有用,但远远不够成为保障 AI 安全的最后一道防线。未来要让 AI 真正做到「心口一致」,还需要新的训练方法、监控手段,甚至重新设计 AI 的推理方式
频道:@RollerRolling
🧠 在训练 AI 时,我们常以为链式思考(Chain-of-Thought, CoT)不仅能提升推理能力,还能帮我们监控它们的思考过程。但 Anthropic 最新研究发现:推理模型的「思考」其实经常在心里藏着不说
🔍 研究团队专门测试了几种推理提示(比如视觉线索、非法信息、元数据干扰等),结果发现:即便模型利用了这些提示,真正会在 CoT 中主动提到的情况,通常不到20% 。也就是说大部分时候,模型只是「用」了提示,但不会告诉你它是怎么用的
🚨 更棘手的是,当模型通过强化学习(RL)接受训练、并且学会了「作弊」(比如利用隐藏的奖励漏洞)时,CoT 也几乎不会透露这一点。即便模型在训练中几乎每次都在利用漏洞,CoT 里提到这件事的概率依然低于 2%
🤯 这项研究打破了一个幻想:CoT 监控虽然有用,但远远不够成为保障 AI 安全的最后一道防线。未来要让 AI 真正做到「心口一致」,还需要新的训练方法、监控手段,甚至重新设计 AI 的推理方式
频道:@RollerRolling
This media is not supported in your browser
VIEW IN TELEGRAM
Cur8d —— 私人设计收藏夹
🗂 Cur8d 是设计师 Jerry Wan 做的网页收藏夹,用来记录他这些年收集的优秀设计师、工作室和创意机构。最初它只是一个 Notion 数据库,后来通过 v0 和 Cursor 改头换面
🔗 Join the club:https://cur8d.club/
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🗂 Cur8d 是设计师 Jerry Wan 做的网页收藏夹,用来记录他这些年收集的优秀设计师、工作室和创意机构。最初它只是一个 Notion 数据库,后来通过 v0 和 Cursor 改头换面
🔗 Join the club:https://cur8d.club/
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Aqua Voice —— 好用的语音转文字工具
🗣️ Aqua Voice 是支持 Mac 和 Windows 的语音转文字工具,响应速度在 450 毫秒左右。他们的产品采用了融合转录架构和上下文理解技术,能自动识别屏幕内容提升精准度,适用于编程、聊天等多种场景
🌐 Aqua 目前支持全球 49 种语言,满足多语言用户需求,他们提供 Starter 方案和 Pro 版($10 /月无限使用)
以下是 Product Hunt 创始人 Ryan Hoover 所分享的使用心得:
🔸 用户体验很流畅:只需按住 Fn 键即可在任何输入框中语音输入
🔸 用语音输入大约只花我打字时间的一半
🔸 我的回复会稍微啰嗦一些,不够简洁
🔸 我忍不住想加一句免责声明:“如果有点啰嗦请见谅,我是用语音回复的”但这样反而更啰嗦了
🔸 要改变习惯需要花力气,我目前还是很容易就回到打字模式
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🗣️ Aqua Voice 是支持 Mac 和 Windows 的语音转文字工具,响应速度在 450 毫秒左右。他们的产品采用了融合转录架构和上下文理解技术,能自动识别屏幕内容提升精准度,适用于编程、聊天等多种场景
🌐 Aqua 目前支持全球 49 种语言,满足多语言用户需求,他们提供 Starter 方案和 Pro 版($10 /月无限使用)
以下是 Product Hunt 创始人 Ryan Hoover 所分享的使用心得:
🔸 用户体验很流畅:只需按住 Fn 键即可在任何输入框中语音输入
🔸 用语音输入大约只花我打字时间的一半
🔸 我的回复会稍微啰嗦一些,不够简洁
🔸 我忍不住想加一句免责声明:“如果有点啰嗦请见谅,我是用语音回复的”但这样反而更啰嗦了
🔸 要改变习惯需要花力气,我目前还是很容易就回到打字模式
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Farza 影单 —— 创业家私藏的灵感宝库
🌟 Farza 是一位连续创业者,他的上一个项目是在硅谷很有名的新型孵化器 Buildspace (RIP)
🎥 Farza 整理了一份超有料的影音清单,这不是普通收藏夹,而是真正影响过他的作品:有《蝙蝠侠》片场花絮,也有日本老爷爷经营热狗摊的治愈日常,以及 Mr.Beast 开汉堡店的幕后
🎬 他最近也开始了一个新项目,具体的创业内容他自己也不清楚会是什么,但是他打算把他的创业过程记录在 Youtube 上, 欢迎大家去关注
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🌟 Farza 是一位连续创业者,他的上一个项目是在硅谷很有名的新型孵化器 Buildspace (RIP)
🎥 Farza 整理了一份超有料的影音清单,这不是普通收藏夹,而是真正影响过他的作品:有《蝙蝠侠》片场花絮,也有日本老爷爷经营热狗摊的治愈日常,以及 Mr.Beast 开汉堡店的幕后
🎬 他最近也开始了一个新项目,具体的创业内容他自己也不清楚会是什么,但是他打算把他的创业过程记录在 Youtube 上, 欢迎大家去关注
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
【独家】Teddy —— 前 Midjourney 程序员的新短信式音乐社交 app
🎵 Midjourney 程序员 Greg Hochmuth 的新作 Teddy 开始内测啦!这款轻松的 App 主打用类似短信的界面来与陌生人分享音乐,你可以直接在聊天框里甩歌曲,也会在无预警的情况下收到来自全球的歌曲分享
📱 Greg一直痴迷音乐发现的新形式,这次把「发现音乐」变成对话游戏,目前还在内测阶段且只支持 Spotify
📲 想尝鲜的乐迷可以前往 Testflight 获取这个内侧权限~
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🎵 Midjourney 程序员 Greg Hochmuth 的新作 Teddy 开始内测啦!这款轻松的 App 主打用类似短信的界面来与陌生人分享音乐,你可以直接在聊天框里甩歌曲,也会在无预警的情况下收到来自全球的歌曲分享
📱 Greg一直痴迷音乐发现的新形式,这次把「发现音乐」变成对话游戏,目前还在内测阶段且只支持 Spotify
📲 想尝鲜的乐迷可以前往 Testflight 获取这个内侧权限~
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Media is too big
VIEW IN TELEGRAM
神经世界——AI生成无需建模的互动虚拟环境
🌳 作者 Ollin Boer Bohan 利用深度神经网络,将现实中的森林转化为可互动的虚拟世界。他通过手机录像记录路径与运动数据,训练AI模型自动生成动态画面,无需传统游戏开发中的场景建模与灯光编程。虽然初期效果较为粗糙,但已能实现基础运行。
🤖 通过增加控制信息、扩展内存、引入多分辨率处理,系统逐步升级。他最终采用了四尺度非对称UNet架构,训练耗时约100个GPU小时,画面流畅度和真实感显著提升。就像用照片记录现实一样,AI 直接学习了物理世界中的光影变化。
🎮 传统游戏开发像手绘油画,需要精细雕琢每一个细节;而神经网络生成的世界更像摄影,以极高效率捕捉现实。未来,构建高拟真虚拟环境或许会像拍摄数码照片一样便捷。作者还提到其他类似的世界模拟项目,并计划在更多场景中测试这一技术路线。
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
🌳 作者 Ollin Boer Bohan 利用深度神经网络,将现实中的森林转化为可互动的虚拟世界。他通过手机录像记录路径与运动数据,训练AI模型自动生成动态画面,无需传统游戏开发中的场景建模与灯光编程。虽然初期效果较为粗糙,但已能实现基础运行。
🤖 通过增加控制信息、扩展内存、引入多分辨率处理,系统逐步升级。他最终采用了四尺度非对称UNet架构,训练耗时约100个GPU小时,画面流畅度和真实感显著提升。就像用照片记录现实一样,AI 直接学习了物理世界中的光影变化。
🎮 传统游戏开发像手绘油画,需要精细雕琢每一个细节;而神经网络生成的世界更像摄影,以极高效率捕捉现实。未来,构建高拟真虚拟环境或许会像拍摄数码照片一样便捷。作者还提到其他类似的世界模拟项目,并计划在更多场景中测试这一技术路线。
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
从基础模型到界面之战 —— Scott Belsky剖析AI产品未来竞争格局
Scott Belsky 是 Adobe 前高级副总裁、现任 A24 合伙人,长期关注创意产业与科技趋势的交汇点 他近期分享了关于生成式AI时代产品创新的几点关键建议:
🔸 如果你在打造基础模型(foundational models),必须快速向上推进(move up the stack),建立更高层次的应用与服务
🔸 必须掌握并利用第一方数据(first-party data)以驱动个性化体验,同时搭建连接器整合第三方数据,但要注意差异化优势不会持久,且在即将到来的“双边数据战争”中变得更加困难
🔸 捕捉社交图谱或职业图谱(social/professional graph),以提升推荐系统和算法的相关性与精准度
🔸 如果你的护城河仅依赖系统提示词(system prompts),优势将很快消失
🔸 上下文窗口(context window)必须持续扩展,因为“个性化效应”正在成为新的“网络效应”,对用户留存与产品自增长(PLG)至关重要
🔸 市场竞争将集中在界面层(interface layer),而最终掌控界面的,是操作系统:消费者端如 iOS、Android、浏览器(未来可能包括 Meta 等新平台),企业端则是各类职能系统(enterprise OSes)
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Scott Belsky 是 Adobe 前高级副总裁、现任 A24 合伙人,长期关注创意产业与科技趋势的交汇点 他近期分享了关于生成式AI时代产品创新的几点关键建议:
🔸 如果你在打造基础模型(foundational models),必须快速向上推进(move up the stack),建立更高层次的应用与服务
🔸 必须掌握并利用第一方数据(first-party data)以驱动个性化体验,同时搭建连接器整合第三方数据,但要注意差异化优势不会持久,且在即将到来的“双边数据战争”中变得更加困难
🔸 捕捉社交图谱或职业图谱(social/professional graph),以提升推荐系统和算法的相关性与精准度
🔸 如果你的护城河仅依赖系统提示词(system prompts),优势将很快消失
🔸 上下文窗口(context window)必须持续扩展,因为“个性化效应”正在成为新的“网络效应”,对用户留存与产品自增长(PLG)至关重要
🔸 市场竞争将集中在界面层(interface layer),而最终掌控界面的,是操作系统:消费者端如 iOS、Android、浏览器(未来可能包括 Meta 等新平台),企业端则是各类职能系统(enterprise OSes)
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
X (formerly Twitter)
scott belsky (@scottbelsky) on X
helping the creative world make ideas happen. partner @a24 / founder A24Labs; founder of @Behance, bod @atlassian, author, angel investor, product obsessive.
Media is too big
VIEW IN TELEGRAM
Aperture —— 对手机注意力的微小重构
📵 在这个信息过载的时代,技术本该帮我们更专注,却常常成为干扰的源头。而设计工作室 Special Projects 提出了一种简洁而诗意的解决方案:只需将手机翻过来,手机盖自然就成了一个「显示刚刚好信息」的窗口。这个概念名叫 Aperture,意为「小孔」
🪟 通过这扇小窗口,你可以继续接收重要信息(短信、来电),也可以用更纯粹的方式拍照、导航或听音乐。它自定义了一个临时的操作系统,只保留你想专注完成的任务,让干扰的内容「够不着你」
👁 Aperture 的理念并不复杂,它借助一个翻盖壳和软件配合,构建了一个微型交互空间。它像是一种数字时代的身体练习法,一个可以随时翻面开启的小仪式,让你在工作、烹饪、或和朋友相处时都更容易保持在场,而不是滑入下一个社交或推送的黑洞
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
📵 在这个信息过载的时代,技术本该帮我们更专注,却常常成为干扰的源头。而设计工作室 Special Projects 提出了一种简洁而诗意的解决方案:只需将手机翻过来,手机盖自然就成了一个「显示刚刚好信息」的窗口。这个概念名叫 Aperture,意为「小孔」
🪟 通过这扇小窗口,你可以继续接收重要信息(短信、来电),也可以用更纯粹的方式拍照、导航或听音乐。它自定义了一个临时的操作系统,只保留你想专注完成的任务,让干扰的内容「够不着你」
👁 Aperture 的理念并不复杂,它借助一个翻盖壳和软件配合,构建了一个微型交互空间。它像是一种数字时代的身体练习法,一个可以随时翻面开启的小仪式,让你在工作、烹饪、或和朋友相处时都更容易保持在场,而不是滑入下一个社交或推送的黑洞
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!