Roller | AI AGENT 中文社区
9.08K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
human or not —— 你聊我猜

🔎 辨别 AIGC 和 HumanGC 是随着 AI 发展所一同兴起的互动形式,比如分辨 MidJourney 和真实照片已然成为了小红书等社交媒体上的流量密码

💬 human or not 则将这种互动衍生成了一个参与式的游戏,你作为游戏的参与者也会成为「混淆视听」的一份子。它的规则十分简单,进入游戏后系统会自动匹配一个「人」和你进行对话,总共 2 分钟的对话时间,交流内容不限不过每次输入都会有限时,而在 2 分钟后你需要猜测对方是人还是 AI

👾 它的有趣之处在于「伪装」,AI 可以通过预置的 prompt 脱离其安分守己的形象,而作为参与者的人也可以让自己的回答显得像一个机器。难怪 human or not 称自己是一个社会图灵游戏(A Social Turing Game)

🤯 笔者的第一次交流如图所示,最后遗憾猜错了。但细看对方的回答,一般人发纯数字时是不习惯加句号的,这一点上可能疏忽了… 有兴趣可一试,期待大家的游戏结果喔

频道:@RollerRolling
🔥4🤔31
Media is too big
VIEW IN TELEGRAM
Oppenheimer —— 诺兰导演的新作

🎞 Christopher Nolan 的电影大家或许都不陌生,从盗梦空间到星际穿越,我每次看之前都做好了认真烧脑的准备。在今年 7 月,他的新作 Oppenheimer 将会上映

⭐️ 这部美英合作的传记片改编自「美国普罗米修斯」,讲述了美国物理学家奥本海默研制原子弹的过程,主演的阵容包括了 Florence Pugh, Matt Damon, Cillian Murphy, Emily Blunt, 和 Robert Downey Jr

 虽然我们对于 Nolan 制作长篇电影并不陌生,不过听说导演自己也确认说这是他拍过至今最长的电影 「它比我们做过的最长的略长。这是三个小时的接吻。」

频道:@RollerRolling
👍9
Terrible Terms —— 去做没有用的事情

👻 我们曾经有发布过一场最烂音量控制交互大赛,它展现出除了「有用」和「效率」之外的可能性。诸如这样没有用的事情其实一直在发生,Stupid Hackathon 便占有一席,目前它在纽约、三番和波士顿都有举办活动,旨在聚集人们一起创造离谱、无用、可怕,且可能本不该存在的项目

📋 最新一期的 Boston Stupid Hackathon 在今年的 5 月 27 日刚刚结束,主题是我们所熟悉的在使用电子产品时无法逾越的「服务条款」。这里罗列了一部分创作成果,有条款通勤、原力觉醒、重复点击等等,其中不少是与 GPT 协作完成的,而这一切都发生在 9 个小时内。如果你还没看够,这里有前几年的项目回顾

🌗「没有奖品,更没有获胜者」,从意大利艺术家 Bruno Munari 试图通过制造非生产性的机器 Useless Machines 来对抗机器威权主义,到执着于用鲁布·戈德堡机械让无聊生活更有趣的 Joseph's Machines,还有即将在今年注销的深圳市无意义公司,「没有用」和「有用」只是意义的两面

频道:@RollerRolling
6👏2🥰1
VideoDoodles —— 在视频中自动渲染手绘动画

✏️ 研究员 Emilie Yu 和 TA 的同学们一起在 SIGGRAPH 上发布了他们的新论文:可以借由 computer vision 来提取视频里面的深景和动感数据,创建场景里的三维感知画布,并在画布上通过简单的 keyframing 来添加会自动感知未知的手绘涂鸦

🎮 以往,要在视频里面融入有三位感知的涂鸦是一件非常繁琐和复杂的过程。我相信在随着这些工具继续成熟下去,我们将会看到更多 UGC 的视频涂鸦滤镜和特效,甚至还有更多现在未想到的应用场景

❤️‍🔥 他们的场景里的画布可以随着视频里的物体移动来自动修正角度和视角。整篇论文可以在这里阅读

频道:@RollerRolling
🆒8
Paragraphica —— 星鼻鼹鼠的鼻子

📸 还记得和大树一起做字体的设计师 Bjørn Karmann 吗?最近他又发布一个新作品,一台结合地理位置数据和 AI 来可视化出特定地点与时刻下的「照片」的「context-to-image」照相机,名叫Paragraphica

🏞 这台情境转化相机通过开放 API 收集其所在位置的各类数据,比如天气、地址、时间、温度、周边活动等,而后这些数据会被组合成一段 prompt 用以详细描述当前的地点和时刻,紧接着利用生成式 AI 「拍下」一张「照片」

👁‍🗨 Bjørn 认为这样的「照片」好比是以 AI 之眼窥探当下的场景,带有一些复杂的微妙感,因为你会发现这些「照片」虽然有些与实景相似的氛围但仔细看来却大相径庭。AI 在这里作为另一种智能,提供了一种在视觉感知之外的体验周遭的方式。正如他的同僚 Simone Rebaudengo 所言 「Everything is Someone」

👃 目前 Paragraphica 相机有实体版和一个可以在线尝试的虚拟版(当前火热可能会有卡顿)。实体版相机的前端有一个造型奇异的部件,那是在模仿星鼻鼹鼠的鼻子。常年生活在地下的星鼻鼹鼠进化出了通过手指状触须感知世界的能力,这是它「看待」这个世界方式,同时也是一个对于 Paragraphica 存在的极佳隐喻

频道:@RollerRolling
9🤯3🆒3
RIZZ —— 聊天 App 上的王牌助攻

💬 RIZZ 是一款最近在美区 app store 上排行榜较高的 AI app,不过不同于我们看到的聊天软件,你并不是用它的 app 来和虚拟人物聊天,它是一款聊天主攻软件

❤️‍🔥 整款 app 主要支持你上传你和朋友或是约会对象聊天的截图,在读取截图里面的内容后,它会给到你接话的建议和内容,帮你去「优化」和「提升」整个对话质量

🎓 创立 RIZZ 的是四名大三学生:20 岁的 Charis Zhang 和 Oliver Johansson、19 岁的 Tobias Worledge,他们就读柏克莱加州大学,加上 20 岁的南加大学生 Daniel He

🥺 虽然整款 app 都做的还不错,但是我觉得这时代真不容易啊,以后跟朋友聊天都不知道是不是人家的 AI 小号在我跟讲话了

频道:@NewlearnerChannel | @RollerRolling
6
This media is not supported in your browser
VIEW IN TELEGRAM
Spiderverse —— 动画电影的游戏规则改变者

🕸「蜘蛛侠:纵横宇宙」今天上映了。还记得 Spiderverse 刚上映的时候我完全提不起来兴趣去看这部,结果一个在迪斯尼工作的朋友逼着我去看。他说「这部动画颠覆了我们行业,并不是说迪士尼、皮克斯等团队做不出这样的技术和效果,但是要做出蜘蛛侠这样的电影需要打破整个动画制作的流水线和团队交接的模式,而在这样的大公司里从来没人能去撼动已经定型的动画制作流程」

👾 虽然我还没有去看也不知道这部会不会好看但是今天想要聊聊我做为一个外行人觉得这部电影的重要性。它的视觉叙事方式透过融合 CGI 和手绘动画是我以前从来没有见过的。这种结合有一种独特的视觉风格,完完全全捕捉了漫画艺术的精髓。比如说:

👉🏽 整部电影里面的人物和物体都没有渲染出来的「影子」,它们选择仿用 CMYK 的错位印刷方式来呈现影子,做出了「远与近」的视觉效果

👉🏽 男主角在还没掌握到蜘蛛侠技巧之前所有的动作都是 12 fps 的而且是走拍的,而动画里面其他角色的动作都是 60 fps 的

频道:@RollerRolling
🔥43
Yes, But —— 深有同感系列

👻 生活中总有许多前后矛盾或是令人无可奈何的时刻,比如试三次才能插入的 U 盘、下一秒就被搅浑的咖啡拉花、停满助动车的盲道… 俄罗斯艺术家 Antоn Gudim 非常善于捕捉这些过于真实的荒谬场景,通过 Yes 和 But 的两格插画进行精准打击

🕳 Yes, But 的聪明之处在于打造了一枚形式符号,TikTok 网红 Khaby Lame 的创作也可以看做是短视频版的 Yes, But. 不过 Anton 更多关注在现代社会的 Mundane Life,并对特定的生活方式、日常行为、网络流行进行黑色讽刺。据 Anton 说,这些都是出于他的个人兴趣,毕竟画插画只是他的副业(本职是一名工程师)

🥴 而如果让我来想一个 Yes, But 的话,那就微信的网页链接吧

频道:@RollerRolling
4🤓2
This media is not supported in your browser
VIEW IN TELEGRAM
Prototyping —— 一个合作式研发的过程

🖊 今天想要跟大家再聊一下 prototyping,不过这次不是从这门技术的角度出发,而是从这个「process / 过程」的角度出发

🪀 在产品研发的过程中,常常是由技术或是设计其中一方来做 owner 的,那一方的话语权会大很多来主导整个产品的发展方向,而另一方会是以一个支配的角色来辅助整个产品落地的

🧬 而若团队 DNA 里有 prototyping 的合作模式的话,或许这个过程不会是那么线性的,而是更像是打乒乓球的一个过程 ——

🏓 Prototyper Julius Tarng 前阵子在 Twitter 上面分享了他做的塔罗 app Moonlight 的一个过程。他在拿到初步的视觉设计稿后,他为这个洗牌和选牌的交互过程做了一个面板,把所有的参数都曝露在一个面板上让整个团队都可以一起来感受这些参数上所带来的变化。这个共创的过程或许不适合所有阶段的产品和所有功能的开发,但是在不确定性和可能性无限大的一些交互点上,很适合以这种方式来和队友「打几场乒乓」,从中切磋出合适的交互

频道:@RollerRolling
4🆒2
MidJourney, Rap 和诗歌

⌨️ 生成式 AI 的热潮带起了一众 AI 提词产品和插件,它们会结构化地拆解 prompt,并根据 AI 的工作原理梳理出与之对话的逻辑。就 MidJourney 而言,prompt 一般会包含人物、样貌、动作、环境等客观的描述性内容,辅以各类艺术效果与参数。如此一般,我们把 MidJourney 当做是一个工具(它的确是),互动的方式则是给它一段较为明确的指令便于其执行

⚙️ 这是在生产力语境下我们对于 AI 的定位。施咒者在撰写 prompt 的时候大多在脑中已经有了结果/想象,甚至也做好了产出的模版,AI 做的是快速逼近人类想象的轮廓,不确定性可以带来一点惊喜但多数情况需要被干预和控制。但是,一句名言、一段歌词或一首诗可以作为 prompt 吗?

💬 以下是分别用了作家伍尔夫的语录,Rapper 肯德里克·拉马尔的一段歌词和诗人艾伦·金斯堡的诗歌《嚎叫》节选作为 prompt,没有加过多的修饰,生成结果如图依次所示

🔻 Virginia Woolf:「The authentic life is a life together, not as isolated individuals indifferent to one another, mood, literature, oil paint, — v5」

🔻 Kendrick Lamar:「I met her on the third night of Chicago North America tour, my enclave Fee-fi-fo-fum, she was a model Dedicated to the songs I wrote and the Bible Eyes like green, penetratin' the moonlight Hair done in a bun, photography, hyper realistic, camera, — v5」

🔻 Allen Ginsberg:「I saw the best minds of my generation destroyed by madness, starving hysterical naked, dragging themselves through the negro streets at dawn, mood, poetry, sketch, stylish, — v5」

🤔 之前介绍过的 AI 相机 Paragraphica 将 AI 看作是另一种智能,当我们不再用客观的描述作为 prompt 而尝试用更具文学性或故事性的内容时,其实也在做类似的事情 —— 我们在试探对方的想象力

频道:@RollerRolling
👍4
👓 Vision Pro 不详细反应合集

✏️ 过去一天里看到了许多网上朋友和陌生人写的对于苹果新出的 Vision Pro 大大小小的反应。我把他们整理了一遍放在这里。这里的作者都过着不一样的生活,有许多是深入在相似行业的朋友,有些不是,希望在被所有信息冲击下的大家可以借此看到我们未来的不同可能性。如果你愿意分享的话,欢迎一起谈谈自己的感受

🔸”Weird how many times they chose to show parents spending time w/ their kids while wearing the headset?” — MIT 博士生 Geoffrey
🔸前 Bose R&D 研究员 Francois 列了一些他的看法,还是很值得读一下的
🔸美国外卖的前设计 VP Ben 认为这个演讲做的很好,起码它糊弄了大部分人,让大家认为它是一个透明的头罩
🔸Stripe 的设计主管 Owen 认为这个平台目前还是一如既往的却少了场景
🔸Product Hunt 发了一张我们人类 2024 年样貌的梗图
🔸独立开发者 James 比较幽默的点出了这个产品的诡异未来
🔸disney 设计师 Eric 发了一个 iCloud 容量在 VisionOS 里面满了的弹窗梗图
🔸前 Facebook 产品总监 Nikita 浅浅的比较了一下苹果和脸书的文化区别
🔸Engineering manager Kate 嘲讽说「所以我们活在一个大家会愿意戴一个 4 千刀的笨拙设备,但是打死都不愿意戴上口罩的社会」

频道:@RollerRolling
🤔3🤓3👎1