Roller | DeepSeek 中文社区
9.18K subscribers
486 photos
199 videos
2 files
375 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
Aqua Voice —— 好用的语音转文字工具

🗣️ Aqua Voice 是支持 Mac 和 Windows 的语音转文字工具,响应速度在 450 毫秒左右。他们的产品采用了融合转录架构和上下文理解技术,能自动识别屏幕内容提升精准度,适用于编程、聊天等多种场景

🌐 Aqua 目前支持全球 49 种语言,满足多语言用户需求,他们提供 Starter 方案和 Pro 版($10 /月无限使用)

以下是 Product Hunt 创始人 Ryan Hoover 所分享的使用心得:
🔸 用户体验很流畅:只需按住 Fn 键即可在任何输入框中语音输入
🔸 用语音输入大约只花我打字时间的一半
🔸 我的回复会稍微啰嗦一些,不够简洁
🔸 我忍不住想加一句免责声明:“如果有点啰嗦请见谅,我是用语音回复的”但这样反而更啰嗦了
🔸 要改变习惯需要花力气,我目前还是很容易就回到打字模式

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Farza 影单 —— 创业家私藏的灵感宝库

🌟 Farza 是一位连续创业者,他的上一个项目是在硅谷很有名的新型孵化器 Buildspace (RIP)

🎥 Farza 整理了一份超有料的影音清单,这不是普通收藏夹,而是真正影响过他的作品:有《蝙蝠侠》片场花絮,也有日本老爷爷经营热狗摊的治愈日常,以及 Mr.Beast 开汉堡店的幕后

🎬 他最近也开始了一个新项目,具体的创业内容他自己也不清楚会是什么,但是他打算把他的创业过程记录在 Youtube 上, 欢迎大家去关注

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Reve —— 强过于 Midjourney 的文生图模型出现了

🖼️ REVE 1.0 AI 是一款新的图像模型,它展现了超强的文本生成能力,无需复杂指令即可将简单文字描述转化为高质量视觉画面,更支持上传参考图片一键匹配风格与灵感

🧠 很可惜的是,他们发布一天后,GPT 4o 就发布了,完全把他们的声音压下去了

💵 作为注册用户,你每天有 20 个积分可以免费使用,非常推荐大家去尝试一下

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
【独家】Teddy —— 前 Midjourney 程序员的新短信式音乐社交 app

🎵 Midjourney 程序员 Greg Hochmuth 的新作 Teddy 开始内测啦!这款轻松的 App 主打用类似短信的界面来与陌生人分享音乐,你可以直接在聊天框里甩歌曲,也会在无预警的情况下收到来自全球的歌曲分享

📱 Greg一直痴迷音乐发现的新形式,这次把「发现音乐」变成对话游戏,目前还在内测阶段且只支持 Spotify

📲 想尝鲜的乐迷可以前往 Testflight 获取这个内侧权限~

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Media is too big
VIEW IN TELEGRAM
神经世界——AI生成无需建模的互动虚拟环境

🌳 作者 Ollin Boer Bohan 利用深度神经网络,将现实中的森林转化为可互动的虚拟世界。他通过手机录像记录路径与运动数据,训练AI模型自动生成动态画面,无需传统游戏开发中的场景建模与灯光编程。虽然初期效果较为粗糙,但已能实现基础运行。

🤖 通过增加控制信息、扩展内存、引入多分辨率处理,系统逐步升级。他最终采用了四尺度非对称UNet架构,训练耗时约100个GPU小时,画面流畅度和真实感显著提升。就像用照片记录现实一样,AI 直接学习了物理世界中的光影变化。

🎮 传统游戏开发像手绘油画,需要精细雕琢每一个细节;而神经网络生成的世界更像摄影,以极高效率捕捉现实。未来,构建高拟真虚拟环境或许会像拍摄数码照片一样便捷。作者还提到其他类似的世界模拟项目,并计划在更多场景中测试这一技术路线。

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
从基础模型到界面之战 —— Scott Belsky剖析AI产品未来竞争格局

Scott Belsky 是 Adobe 前高级副总裁、现任 A24 合伙人,长期关注创意产业与科技趋势的交汇点 他近期分享了关于生成式AI时代产品创新的几点关键建议:
🔸 如果你在打造基础模型(foundational models),必须快速向上推进(move up the stack),建立更高层次的应用与服务
🔸 必须掌握并利用第一方数据(first-party data)以驱动个性化体验,同时搭建连接器整合第三方数据,但要注意差异化优势不会持久,且在即将到来的“双边数据战争”中变得更加困难
🔸 捕捉社交图谱或职业图谱(social/professional graph),以提升推荐系统和算法的相关性与精准度
🔸 如果你的护城河仅依赖系统提示词(system prompts),优势将很快消失
🔸 上下文窗口(context window)必须持续扩展,因为“个性化效应”正在成为新的“网络效应”,对用户留存与产品自增长(PLG)至关重要
🔸 市场竞争将集中在界面层(interface layer),而最终掌控界面的,是操作系统:消费者端如 iOS、Android、浏览器(未来可能包括 Meta 等新平台),企业端则是各类职能系统(enterprise OSes)

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Media is too big
VIEW IN TELEGRAM
Aperture —— 对手机注意力的微小重构

📵 在这个信息过载的时代,技术本该帮我们更专注,却常常成为干扰的源头。而设计工作室 Special Projects 提出了一种简洁而诗意的解决方案:只需将手机翻过来,手机盖自然就成了一个「显示刚刚好信息」的窗口。这个概念名叫 Aperture,意为「小孔」

🪟 通过这扇小窗口,你可以继续接收重要信息(短信、来电),也可以用更纯粹的方式拍照、导航或听音乐。它自定义了一个临时的操作系统,只保留你想专注完成的任务,让干扰的内容「够不着你」

👁 Aperture 的理念并不复杂,它借助一个翻盖壳和软件配合,构建了一个微型交互空间。它像是一种数字时代的身体练习法,一个可以随时翻面开启的小仪式,让你在工作、烹饪、或和朋友相处时都更容易保持在场,而不是滑入下一个社交或推送的黑洞

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Perplexity 现在可以在 WhatsApp 上用了!

💬 你可以直接发消息给 +1 (833) 436-3285,问问题、查资料、让它生成图片,还能看到引用来源。官方说很快还会有更多功能上线,有兴趣可以 WhatsApp 试一下

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
真正的「代理」,不是软件

📄《Agency Is Eating the World》一文中,Replit 的创始工程师、数据科学家 Gian Segato 指出:如今我们口中的 「agent」,大多只是能完成任务的自动化工具,它们仍依赖人类指令、被动执行任务。而真正的 agent,是那些用 AI 构建个人杠杆、主动出手解决问题的人

🧭 这改变了整个游戏规则。AI 工具让实现变得便宜、迅速、几乎默认可得。你不再需要成为专家,才能完成专家级任务。关键不再是「怎么做」,而是「知道要做什么」;不在于手艺,而在于判断。架构胜于实现,意图胜于技能

🏢 这对现有的商业逻辑是一次底层震荡。过去的公司靠流程、分工和层级延续稳定,如今,一人公司开始替代传统组织;高能动性个体正打破岗位边界,在通才与 AI 合力下,实现前所未有的效率密度。这不是个别现象,而是结构性转变

🌱 Agency,正成为一种新的时代信号。不是等机会来,而是自己成为系统中的新变量

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Die With Me —— 5%电量开启的末日临终社交

🪫 「Die With Me」是一款另类聊天 app:只有当手机电量降到 5 % 以下 才能登入。那短短的“断电倒计时”里,你会被拉进一个全球聊天室,与同样濒临关机的陌生人一起“集体告别”

🧑🏽‍🎨 该项目由比利时艺术家 Dries Depoorter 与 David Surprenant 联合阿姆斯特丹纪录片节实验室打造。完整的创作理念可在官方网站查看。

📱 想亲自体验?
🔸 App Store: 下载链接
🔸 Google Play: 下载链接

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
Daniel de Bruin —— 把科技按下慢速键

 还记得我们两年多前分享的艺术家 Daniel de Bruin 吗?那时,他做了一款纯手动操作的 3D 陶瓷打印机,用机械结构代替代码编程

📈 如今,他成了「机械系网红」,YouTube 频道订阅数突破 19 万,热门影片包括百层 Googol Gearbox生物感应游乐设施 Neurotransmitter 3000

💐 他的项目把工程学、行为艺术与哲学反思揉在一起,是「反技术姿态」与「硬核制造」的并存范例。他的手动装置贴心的提醒着我们:降低效率,有时反而让创意升温

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
访谈 Cursor 创始人 —— 颠覆编程未来的直觉协作革命

🤖 Lenny Newsletter 最新一期播客请到 Cursor AI 的 CEO Michael Truell,聊了聊 AI 如何颠覆传统编程 他提到未来写代码可能不再依赖复杂语法,而是通过更直觉的 AI 协作方式,甚至预测未来几年技术圈会出现「统治级」的 AI 编程工具,市场潜力远超大家想象

🧠 从自动化 CAD 转型做 AI 编程工具,Cursor 团队分享了超速成长的秘诀:比起硬核编码能力,逻辑设计和对产品的「品味」在 AI 时代更关键。他们还自主研发了专属 AI 模型,证明不跟风大厂也能闯出新赛道

🎧 完整访谈已在 YouTubeSpotifyApple Podcasts 上线

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
This media is not supported in your browser
VIEW IN TELEGRAM
Varient AI —— 基于 Creative Intelligence 的工具正式宣布融资

👀 还记得几个礼拜前我们分享的 Pinterest 页面改造吗?那时候所提到的设计工具 Variant AI 如今他们宣布融资了 590 万美金

📩 目前邀请已陆续发出,去他们官网登记就能等待获取 access

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
This media is not supported in your browser
VIEW IN TELEGRAM
Dream Park —— AR 奇幻世界

创始人 Aiden WolfTwitter 上面分享了他们公司 Dream Park 的新作:他们在旧金山的一个公园里安装了进入他们 AR 时间的一个二维码入口。进入后的效果如视频上一样

虽然创始人还未公布太多关于他们产品的信息,但是这个 AR 的场景效果还是很令人期待的

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
This media is not supported in your browser
VIEW IN TELEGRAM
Figma Draw —— 矢量编辑功能重构Adobe Illustrator

✍️ 虽然 Figma 一直是 UI 设计中的主力工具,但它的矢量编辑体验长期以来并不理想。在刚结束的 Figma Config 2025 上,Figma 发布了 Draw 功能以补足这块短板。几个关键更新点:

🔍 图层结构更可视:向量图层常常是无命名状态,整理时容易混乱。新版本在图层树中提供图形预览,便于快速定位路径和组合关系

🧰 工具栏重排:原本藏在属性栏的布尔操作、蒙版等常用绘图工具被放到了主工具栏上,减少跳转,提升连续性

属性添加逻辑优化:新增属性时不再强制按固定顺序(如必须先加阴影才能加模糊),现在可以直接选择所需效果,避免冗余操作

🖊 描边控制更灵活:描边设置面板支持更快地调整端点、角点、位置等属性,并引入滑动调节器,响应更直观

🔁 Repeats 功能:可以一键生成重复图案,适合快速创建规则图形或背景纹理。适用范围有限,但交互方式比较轻巧

🤔 整体来看,这次更新不是为了拓展复杂功能,而是针对已有绘图场景做了“低干扰、高频率”的体验修复。如果你习惯用 Figma 做 icon、插画或图形操作,这次更新可能会让流程更流畅一些

📮 这篇文章是转发给你的吗?点击 这里 加入频道,一起探索更多有趣的内容!
Brainwave —— 用语音说 Prompt

🎙 最近发现一个非常顺手的小工具 Brainwave,强烈推荐给喜欢用语音说 prompt 的朋友

🗣 它的主打功能是:可以把录音内容(支持多语种)转成文字,也可以输入一段文本,自动帮你优化成更可读的版本。但对我来说最实用的,是用它来录我给 AI 的 prompt

🤖 现在很多 AI 应用虽然内建了录音功能,但常常会莫名中断或者识别成字幕,导致整段语音没录上。而 Brainwave 就稳很多,识别准确度非常高。我自己测试下来,中文、英文、韩语、日语都可以识别,就算语速快或带点口音也基本没问题

📲 如果你也习惯用语音给 AI 提示,不妨试试看这个工具

📮 这篇文章是转发给你的吗?点击 这里 加入频道,一起探索更多有趣的内容!
Media is too big
VIEW IN TELEGRAM
AI 2027 —— 一场未来 AI 社会的推演游戏

🧠 AI 2027 是一个由跨学科研究团队(包含前 OpenAI 研究员)主导的实验性项目,试图回答一个宏大的问题:如果 AGI 在未来几年被实现,社会将走向何方?他们没有给出一个答案,而是以时间线的形式,模拟了一整套社会可能性的推演路径

🔮 整个网站就像进入一本可滑动的未来史。你沿着时间线浏览每月的场景发展,最终可以选择两个不同的延续结局:Slow Down 或 Speed Up。不同的分支描绘了两种完全不同的 AI 社会世界观,也能为你自己的理解打开一些新的角度

📊 网站的数据可视化很棒,不只是辅助阅读,更像是一种“信息感知的设计体验”——帮你理解抽象的社会指标如何牵动整个系统的走向

📮 这篇文章是转发给你的吗?点击 这里 加入频道,一起探索更多有趣的内容!