Roller | AI AGENT 中文社区
9.09K subscribers
515 photos
220 videos
2 files
421 links
有趣的 AI 科技日记
💬 群组: t.me/+XThkfMjY1bRiYTVh
🪄 由@bnl5110和@endingwalker一同撰写

#DeepSeek #GenAI #AIGC #互联网 #科技 #人工智能 #AI产品 #ChatGPT #Claude
谢谢订阅,喝杯茶再走?🍵
Download Telegram
VALL-E —— 通过三秒钟样本克隆任何人的声音

🗣 微软最近在一篇论文中宣布了其最新研究的语音合成系统(Text-to-speech)VALL-E,它可以基于一段三秒钟的语音样本,生成具备讲者声线特质的语音模型,并可以用于其他内容的朗读。据称,开发人员在训练 VALL-E 时使用了6万小时的语音素材,其中大部分素材来自于 Teams 的录音

📞 除了复刻声线,VALL-E 还可以就一段话随机生成不同风格(语音、语调、停顿等)的讲话模式,可以还原讲者的环境噪音(比如经典的话筒声),甚至可以保持讲者在声音样本中的情感(愤怒、困倦、逗趣等)

👂 有兴趣可以去论文的 Github 专页试听上面提到的 demo,一些简要说明:Text 指需要生成的语音内容,Speaker Prompt 即三秒的语音样本,Ground Truth 是由样本的讲者亲述的 Text,Baseline 是指一款被选作基线的语音合成系统来帮助比对

🧐 VALL-E 的惊异表现让人称奇,但也引发了人们对于滥用风险的担忧,比如 VALL-E 可能会被用于身份冒充或网络诈骗。技术媒体 Tech Monitor 已经就如何规范使用 VALL-E 向微软进行了发问
👍5🤔4
⌨️ Genuary —— 集结了creative coding的一月专属标签

🥢 不论是在Instagram,TikTok,还是Twitter上面,标签都是一个可以瞬间聚集一群人的一个方式

💻 #Genuary 这个标签结合了「Generative」和「January」这两个词。若在Twitter上面上面搜索这个标签的话,你会看到不同的 creative technologist 在一月份每天制作的一个用代码写出来的艺术作品。这边上传了其中四个作品,点进他们的个人页面你便可以看到他们这个月以来每天的作品:
🔸 @colormotor
🔸
@dataneel
🔸 @okazz_
🔸 @jbarbeau_art

🎨 除了这个标签外,也推荐看看 #artvsartist#portfolioday#inktober
🆒4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Space Type Generator —— 在线动态文字生成器

🔤 今天为大家介绍一款简单易用的线上动态文字生成器 Space Type Generator. 通过调用预制的文字效果,你可以自定义文字的内容(目前仅支持英文和符号),加上调整对应的参数(比如字体大小、间距、旋转速率等等),就能得到变化多端的动态文字效果了

👀 该生成器的操作采用「所见即所得」(What you see is what you get)的交互方式,直白明了,大家可以上手试一下(PC 端体验更佳)

📤 设计师 Kiel D. Mutschelknaus 是 Space Type Generator 的创始人,在一次采访中他提到希望创作者可以从既有的工具(Creative Cloud)中解放开来,要敢于去尝试不熟悉的媒介和工具
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉4🆒3👍1
💌 2023年不详细新愿望总汇

🧨 两周前我看到许多人的年度回顾并且把它们整理在一起了。除了往回看,我也很好奇有多少人会(公开)为新年许愿。这里把我在网上冲浪到的新年愿望整理了一遍

🎇 芒果在自己的频道里写了新年愿望
🎇 在皮克斯工作的 Jeremy 为他新年的目标写了一首很美的诗
🎇 有人在一本书里看到了一个写给我们的愿望
🎇 一个激励型的 Twitter 账号许愿说 self love 是他今年的首要任务
🎇 也有人说,今年就是要去实践去年学到的课题
🎇 名为 Adie Garcia 的菲律宾网红许愿说今年要身心健康
🎇 Y Combinator 的创始人之一 Paul Graham 说今年的书单就是看到什么想读就读
🎇 Redbull 的设计师列了一下他今年的(工作)愿望
🎇 插画家 itousa 画了一下他今年的目标 (上图)

欢迎补充和自荐
👍11
寻隐 APP —— 用文字找照片

📱 寻隐 Queryable 是一款可以让你通过文字搜索手机照片的 APP,它实则是一个在本地运行的 CoreML 模型

🔍 引用一段 APP 的介绍:你可以用任何你能想到的描述性的文字来寻找某张照片,可以是一个场景(如:“雨中漫步”)、一种色彩("漆黑房间里的橘色台灯")、一个物体的动作("小狗张嘴巴"),甚至是照片中传达的情感("我们恋爱啦")

🔒 通过离线运行保证用户的相册隐私是寻隐的一大特点,如果不放心也可以关闭它的网络权限。该 APP 目前支持 iOS 16.0 以上系统以及 iPhone 11 或以上机型

🙃 目前使用下来最吸引我的,是它所带来的「在回想的照片内容和描述性的文字之间回弹」的体验
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12
This media is not supported in your browser
VIEW IN TELEGRAM
Touch Type —— iOS字符玩耍器

✏️ 这款线上字符生成器 Touch Type 是由一个名叫 Schultzschultzgrafik (嗯,很长的名字)的工作室制作的实验性项目

📱这个网站目前只支持有触屏的 iOS 设备,若你身边有一台 iPhone 或是 iPad,不妨打开这个网站,用不同的手指头来调整字符的参数

🧰 工作室里的其他实验性工具可以在这里打开,有好几个有趣的图片文字扭曲工具
🔥8👍4🤣1
街头辩论师 Street Debater —— 流浪者回归社会的台阶

🫥 在之前介绍的 No Fixed Address System 里提到,无家可归的流浪者处在社会的边缘,也面临着被社会继续边缘化的困境。流浪者无法参与正常的社会活动,行人大多不愿留意他们,乞讨也并不是一个体面和可持续的维生方式 —— 所谓心理和生理的双重流浪

⚖️ 我们的朋友,设计师 Tomo Kihara 留意到了这一点,设计了一个简单却又巧妙的装置:一杆话题天平秤,让流浪者可以重新融入公共视野。顾名思义,使用者可以从时事热点中选择两个观点放在天平的两端(比如应不应该发放全民基本收入),邀请路人用硬币来投票,以自然的方式让周围的人们不约而同地参与到公共的「讨论」以及与流浪者的互动中去。于是流浪者有了一个新的「职业」:街头辩论师

🪬 Tomo 称自己的设计理念是一种「游戏式干预」,即通过游戏的方式来介入社会性问题的实践。他灵活地运用「魔法圈」这一游戏概念构筑全新的社会规则和关系,比如用话题天平秤将原本「路人和乞丐」的不对等关系转变成了「街头表演者和观众」的平等关系。更多设计内涵可以看下他在 Design INDABA 的演讲自述文章

🧩 这个项目是 Tomo 在学校的作业,但他在各种意义上把它规模化了。我想一个重要的原因是他打造了一个坚实的理念系统,任何项目都是实践循环中的养分,而不是散状的创意
👍18💯3
推荐两款压缩视频的软件 —— HandBrake & EZgif

📹 不少聊天软件都有文件传输上面的限制,今天来分享两个压缩视频的软件 —

💽 Handbrake 是一个开源的 video transcriber,他的压缩选项很贴心,你可以选择「确保视频小于Discord 8mb的限制」。它支持 Mac,Windows,及Linux

🌐 Ezgif 是一个 Web 端的压缩网站,你可以用它来压缩视频也可以用它来压缩和剪辑GIF
👍51
Readwise Reader —— 一站式的阅读百草园

📖 Readwise 推出了一款 All-in-One 的阅读工具 Reader,可以整合多种信息源并辅以专业的高亮、标签和笔记功能。总结一下 Reader 有以下特点:

🔹 支持 RSS、Newsletter 订阅
🔹 通过浏览器插件可以收藏文章、Twitter threads 和 Youtube 视频(能够识别字幕转化成文字)
🔹 可以收录 Epub 电子书和 PDF 文件
🔹 针对上述内容进行标记 Highlight,为标记内容打标签并可导出至 Obsidian, Notion, Roam Research, Evernote 和 Logseq
🔹 嵌入了 GPT-3 bot「Ghostreader」可以总结文章内容,回答你对文章的问题,通过启发性提问助力思考,甚至根据你的标记内容进行 Q&A

📱 Readwise Reader 有 Web 端和移动端,支持 iOSAndroid 系统,新用户可以获得一个月的免费试用

💰 关于收费标准,Reader 目前处于 Beta 阶段,订阅费为 7.99 美元/月(按年计费)。但它也在官网上表明过了 Beta 阶段可能会重新定价,但对 Beta 阶段的存量用户不会涨价

🫰 另外,对于学生、教师、非盈利组织、军人、种子用户和发展中国家的使用者,Reader 可以提供一定的折扣优惠,具体的申请方式可以参考官网说明以及一位即刻用户的实操分享
10👏2
This media is not supported in your browser
VIEW IN TELEGRAM
写在频道突破1000 位读者

离上次的 500 位读者纪念过去了 18 天,我们却已迎来了 1000 多位读者。将自己习惯且也喜欢做的事情记录下来、分享出去,自然而然地吸引人们聚在一起,这是一件不可思议的事情,它发生在每日更新的 55 天后

前天我们(Weiwei & Sen)又在上海世纪公园散步了一下午,不仅从感情聊到工作,还讨论着 Roller 的「未来」,互换想法。要不要做 Newsletter,搭个网站吧,要不每周来个 Podcast 播报下一周的分享,想办线下见面会… 在一切还没有定论时,我们达成一致:先保证质量和频率,然后小小探步抓住适时的机会

另外对于内容的选型,我们想要继续保留甚至是强化一定的个人色彩,我们相信非中立性带来的人为趣味和讨论空间,也希望这会成为 Roller 独特的气质

友情提示,根据 Telegram 此前的政策规定,订阅人数超过 1000 的频道可能会被投放广告,频道主无法控制。根据其他频道的观察,广告内容大多与加密货币有关,消息会标注 Sponsored,如若出现请大家注意辨别

「晴天雨天,每天上演」。谢谢各位的停留、阅读、支持和分享,祝大家🐰年快乐!这两天吃什么,下周有什么计划吗?
17👍4🔥4
a short hike —— 一款无比解压的单人游戏

🏓 a short hike 是一款由 Adam Robinson Yu 制作的游戏。在游戏里,你是一只叫做 Claire 的小鸟,放暑假时来到了阿姨居住的山里。为了打发时间,也为了回妈妈一通电话,你需要爬到山顶上

🍵 整个游戏都很令人放松,里面也穿插了许多可爱的小游戏。这款大概只需要 2-3 小时即可通关,从它发布了以后我已经玩了3-4 次了。若你有兴趣,可以花大概 50 rmb 购买它,它已在 xbox, ps5, nintendo switch, pc, mac 上面发布

👀 创作者 Adam 是一个从小就想要做游戏的软件程序员,几年前在家人朋友的鼓励下辞职开始研发自己的游戏。 a short hike 其实是他在 ”逃避“ 他的主项目时开始玩弄的一个小项目,但是没想到他在 twitter 上面分享的荧幕截屏太受欢迎了,所以他便把他的主项目搁置了先做出来了 a short hike。若你对他的开发过程和个人背景有兴趣的话,我非常推荐他在 GDC 上的 30 分钟演讲

💡 若环境允许的话,可以打开声音听听这款游戏的背景音乐
👍6🥰2