Newlearnerの自留地

#Photos #Web #AI

🏞 River：又一个基于 AI 的视觉艺术搜索引擎

🔗：Web

👉 Features

- 调用 Are.na 艺术库作品
- 支持点选图片，AI 将据此展示风格相关图片
- 提供一些风格和主题选项，可快速找到感兴趣主题
- 可标记为 NSFW、无聊图片

👍 和之前介绍的同类项目有所不同，River 虽然也是基于 AI 的「流」式图片搜索网站，但内容上更加天马行空一些。它使用的数据来自 Are.na，这是一个在线数字艺术藏品库

🧑‍💻 虽然照片和日用关联并不太大，但如果你恰好是一个喜欢特立独行的人，相信你会对其中的一些艺术藏品感兴趣。但我要说，如果瀑布流真的是面对未知时有效的一种迅速发现兴趣的有效手段，我只能表示遗憾

📘 关联阅读：Same Energy - 基于 AI 的视觉搜索引擎

频道：@NewlearnerChannel

Please open Telegram to view this post

VIEW IN TELEGRAM

8.2K views初学者 | newlearner.site, edited 04:01

Newlearnerの自留地

#Blog #AI #Tools

📩 接读者来稿，他向我们分享了自己使用 Whisper API 进行音视频转录文字的一些心得

🎙 精准转写：利用 Whisper 处理音视频转文字不完全指南

🔗：Blog

📝 文章概述

- 背景
- 方案选择
- 操作流程
- 潜在问题与更多场景

🔮 音视频转录 / 翻译文字一直是一个比较热门的使用场景，在 AI 迅速普及后，这个问题的解决也取得了一些突破。作者在使用传统商业转录遇到精度不高的问题后，开始拥抱 OpenAI 发布的 Whisper API

💡 在文中，作者详细介绍了 Whisper 使用效果、具体实现方法、Prompt 探讨，并在结尾指出了该方案存在的一些问题。如果你也有类似的需求，可以根据这篇文章「抄作业」了

👀 正如我一直所认为的，AI 是处理「机械化」流程的一把好手，但最终对于结果的把控，还在于人。善于利用 AI 工具是好的，但在 AI 还并不是那么成熟的今天，过分依赖而不加思考，容易被事实性错误所困扰

📘 关联阅读：WhisperNotes - 利用 Whisper 模型的本地语音转文字「速记」App

频道：@NewlearnerChannel

6.9K views初学者 | newlearner.site, 07:01

Newlearnerの自留地

#RSS #AI #GitHub情报

📩 接读者来稿，他向我们推荐了自己的 RSS 订阅源 AI 总结开源项目

📢 RSS-GPT：用 ChatGPT 总结 RSS 订阅源，并托管在 GitHub 仓库和 Pages 上

🔗: GitHub | Wiki

💡 原理

使用 GitHub Actions 自动运行一个简单的 Python 脚本，调用 OpenAI API 总结订阅源中的文章，然后将新生成的 RSS 订阅源推送到 GitHub Pages。配置简单快速，无需服务器。

👉 Features

- 使用 AI 生成关键词以及摘要附在原文前面，支持自定义摘要长度，自定义语言。
- 聚合多个 RSS 订阅源，去除重复文章，用单一地址订阅。
- 为 RSS 源添加基于标题，内容，URL 的关键词过滤器。
- 在 GitHub 仓库和 GitHub Pages 上自托管 RSS 订阅源，并在任意客户端中订阅。

👍 作者在博客写了关于本项目的简单介绍以及配置教程，并分享了几条 RSS-GPT 处理后的订阅源供大家参考订阅。

👨🏻‍💻 作者的话

RSS 是我主要的信息获取方式，我可以把关注的内容和创造者聚合在一起集中阅读。但如若不加筛选，富含噪音的 RSS 在订阅中堆积会让让人疲惫不堪。每天几百几千条未读产生，如果“强迫症和焦虑症患者”强求 RSS 也 inbox-zero 的话，每天会花费很多的时间执着于清空未读上面。

在这种情况下，一个非常有效的方法就是，对 RSS 进行关键词过滤，只保留自己真正感兴趣愿意花时间阅读的内容。而另一方面，在关键词筛选玩完，对 RSS 全文的中文总结也很有意义，这样可以快速了解到这篇文章的主要内容，来决定是否进一步精读。

所以我开发了这样一个工具，并尽量在保证 API 和 Actions token 使用的前提，满足这两个需求。目前仅支持 OpenAI API 调用，未来会考虑加上 Azure OpenAI 或自定义 OpenAI 代理地址，或加上更多 AI 模型支持。

频道：@NewlearnerChannel

Please open Telegram to view this post

VIEW IN TELEGRAM

7.3K views初学者 | newlearner.site, 07:01

Newlearnerの自留地

#Blog #AI

🧐 Rewind 所引发的思考——到底是“生产力”还是现实版“黑镜”？

🔗：Blog

📝 文章概述

- Rewind 和 Rewind Pendant
- 生产力还是“黑镜”：说说我的看法
- 总结一下

📋 片段节选

正如上文我所产生的问题“是否我在使用这款App的同时，也完全的交出了自己的隐私？”，如今AI的飞速发展，让厂商们你追我赶，争抢着成为那个“站在风口上的第二头猪”，但同时也打了用户一个措手不及：大学对于ChatGPT是否可以用于写作的看法百家争鸣、画师群体对于AIGC“尸块”的不满与无奈、互联网大厂对于员工使用ChatGPT的隐私限制不尽完善……

不过看似有各种各样的不满，总结凝练下来，其实也不多，在我看来就三个：

- 社会变革与隐私权
- 技术依赖与自由意志
- 虚拟与现实的交叠

我们一个一个说。

频道：@NewlearnerChannel

6.5K views𝙈𝙖𝙧𝙫𝙞𝙣 𝘾𝙪𝙞, 04:00

Newlearnerの自留地

#App #GitHub情报 #AI

📔 Pile: 让 AI 和你一起思考

🔗：GitHub | 官网

✨ Features

- 清晰明了的时间线视图
- MacOS 原生体验设计
- Twitter Thread 风格的内容展示
- 安全的本地存储机制
- 智能 AI 点评功能
- 灵活的信息标签系统

Pile，一款还处于概念阶段的日记软件，其最大特色在于与人工智能的交互功能。这款软件不仅仅是一个日记记录工具，它的 AI 辅助功能能够引导用户深入反思自己的记录。体验上，Pile 让我想起了学生时代写周记，老师在旁边批注点评的场景，既有对内容的评价，也有对思考主题的深化指导。

尽管 Pile 强调的是反思与深入思考，其设计上类似于 Twitter Thread，对于短篇文章极为友好。这种问答式的交互方式，能够激发用户更多地思考并记录下更多内容。

然而，作为一个概念产品，Pile 在实际应用上仍有局限。例如，软件界面左侧的时间线仅作展示用途，无法进行交互操作。此外，Pile 目前还没有集成搜索功能，这在日常使用中可能会带来不便。

总体而言，虽然 Pile 作为 AI 日记软件在理念上颇具创新，但考虑到其还在概念阶段且存在一些实用性的缺陷，我暂时不建议将其作为主要的日记记录工具。Pile 在未来的发展值得期待，但目前它更适合作为对日常记录方式的一种补充尝试

频道：@NewlearnerChannel

7.0K viewsglaze c, edited 04:01

Newlearnerの自留地

#Web #AI

🕘 MyLens.AI：基于 AI 的在线主题时间线生成网页

🔗：Web

💡 Timeline 是我很喜欢的一种展示方式，它能够让人一目了然地了解某样事物的发展历程和重要里程碑事件。今天介绍的一个在线工具，能够帮助我们快速生成 Timeline

😌 打开网页，输入你感兴趣的话题，等待一些时间即可看到时间线和所有里程碑节点了。我输入的是「Apple」，比较好奇它会识别成水果还是科技公司，事实是后者

🍎 关于 Apple 的里程碑时间中，有 Macintosh、Steve Jobs、iPhone、iPod、iPad、Apple Watch 以及市值万亿的时刻。最有趣的是，在最后并未提及 Apple Vision 这一次世代产品，而是着重强调了一下 App Store 引入了隐私标签，或许 AI 也觉得隐私很重要吧

👀 总之欢迎大家试用，时间线生成后可以便捷地分享给他人，你还可以通过下载图片的方式获得适用于 Instagram 的多张拆分照片

频道：@NewlearnerChannel

6.8K views初学者 | newlearner.site, 04:02

Newlearnerの自留地

#Web #Design #Tools #AI

🏞 AI 图片搜索库 aisplash 以及其背后的 Figma 插件项目 Musho AI

🔗： aisplash | Musho AI

📷 相信大家日常在寻找实拍图片的时候，都会考虑 Unsplash 这个网站，自留地一些推送的头图也是出自它。临近 2024 年，只要提供好的 Prompt，现在很多大模型都能够生成不同风格的、栩栩如生的图片

🧠 aisplash 就是一个聚合了这些 AI 生成图片的在线网站，UI 设计和 Unsplash 高度相似。用户可以自行上传自己生成的 AI 图片，也可以通过分类或者关键词寻找自己想要的图片风格

🧑‍💻 需要注意的是，aisplash 对于图片的版权较为严格，请先阅读他们的 TOS 之后再使用。后续个人希望能够加入每张图片是怎么得来的，即大模型种类 + Prompt，这样能够给其他人带来更多的灵感

💡 aisplash 背后的项目是一个 Figma 插件 —— Musho AI，它旨在利用 AI 为网页设计师减轻负担，迅速获得想要设计样式的 Demo。它包含了网站着陆页设计、品牌设计、图片 / 涂鸦生成等插件，部分插件正在 Beta，还有一些尚未推出

📘 关联阅读： River - 又一个基于 AI 的视觉艺术搜索引擎

频道：@NewlearnerChannel

Please open Telegram to view this post

VIEW IN TELEGRAM

6.9K views 初学者 | Newlearner365, 07:01

Newlearnerの自留地

#App #AI

✒️ MemoAI：好用的语音转文字工具

官网｜安装地址

✨ Features

- YouTube 视频一键转文字
- 多语言转写，添加自定义词汇
- 多语言翻译
- 文字合成语音
- Nvidia，AMD，Apple Silicon GPU 加速
- 音频回放搭配字幕
- AI 总结
- 修改转录文字
- 支持多种导出格式
- 支持多种语音转文字模型

👍 感想

MemoAI 是我今年用过最棒的免费的语音转文字工具。它功能齐全，完成度很高。基本上所有和语音转文字相关的工具都可以在 MemoAI 中找到。

我的日常使用习惯便是将会议视频导入到 MemoAI 中，添加一些自定义词汇，等待转译完成后使用 AI 更高效的消化这段会议内容。

🏦 价格

Memo 的定价为 $22.99 和 $99.99。$22.99 只有一年的更新，$99.99 永久更新。大家觉得这个定价怎么样？

😊 我的期待

MemoAI 整体使用下来我觉得功能比较完善，一些使用层面可以再进行打磨。对于功能上我期待 Memo AI 未来加入识别说话人，支持用音频中说话人的声音朗读 AI 总结或者自定义文字的功能。

使用体验上，我期待在模型下载中可以加入中断后自动继续下载，AI 总结时添加进度条的功能。

⚙️ 竞品

今年语音转文字的功能我用的很多，除了 MemoAI，我用的最多的是 Otter.ai 和 insanely-fast-whisper。Otter.ai 功能完善，速度也很快。使用体验上我对其唯一的诟病是对生成后的文字进行修改会非常卡。定价也比较高。 insanely-fast-whisper 需要使用命令行进行操作，生成速度非常快，但是格式比较单一。

频道：@NewlearnerChannel

7.2K viewsglaze c, edited 07:02

Newlearnerの自留地

#Life #buybuybuy #Web #AI

👕 最佳平替：基于 AI 的消费品平替自动生成网站

🔗：Web

👀 每当我们涉足一个新消费领域并十分感兴趣时，好奇心总会驱使着我们不断探索优秀的品牌和商品，有时不惜重金只为体验一下

🛒 但兴趣总会成为「日常」，热情总会消退，钱包总会瘪瘪。在那些我们觉得无需投入太多的消费品类中，我们往往会主动寻找「平替」产品，想要追求既实用又低价

💡 今天介绍的网页「最佳平替」基于 AI 训练而成，旨在实现：用户输入想搜索的商品，模型给出便宜的平替商品名。虽然有些结果比较离谱，但有些还是蛮有用的

👍 网页开发者进一步总结了自己的消费折叠观：每一个平替商品的搜索技巧背后，都隐藏着一种对生活的折叠。商品可以平替，但你的生活无法被平替

* 结果可能不准，开心就好

📘 关联阅读：当我说起极简时，我在说什么

频道：@NewlearnerChannel

7.0K views 初学者 | Newlearner365, 07:02

Newlearnerの自留地

#telegram #GitHub情报 #Bot #AI

📩 接读者来稿，他向我们分享了自己开发的 Telegram 机器人

🤖 Poe-Telegram-Chatbot：基于 Poe 官方 API 的开源 Telegram AI 机器人

🔗：GitHub | Wiki

👉 Features

- 支持与 GPT-4 和 Claude-3-Opus 模型进行对话
- 可以保持对话上下文，实现连续对话
- 提供命令切换不同的 AI 模型
- 支持 Docker 容器化部署

💡 Poe 是一个 AI 聊天平台，提供了多种 AI 模型供用户选择。然而，Poe 平台上的积分消耗速度非常快，尤其是在使用高级模型如 Claude 和 GPT-4 时。为了更经济地使用这些 AI 模型，我们可以利用 Poe 会员 API 来制作自己的 Telegram AI Bot

👨🏻‍💻 开发者的话

这个项目目前还比较简陋，机器人只支持纯文字交互，暂时不支持上传图片文件等功能。内置的 AI 模型包括 Claude-3-Opus 和 GPT-4，理论上 Poe 平台上的所有模型都可以使用，只需要在代码中进行相应的修改

我希望有更多的开发者能够参与到这个项目中来，帮助完善和优化这个聊天机器人。例如，可以添加上传图片文件的功能，优化代码结构和性能等。让我们一起为这个项目贡献自己的力量，创造出一个更加强大和实用的 Telegram 聊天机器人

频道：@NewlearnerChannel

6.5K views 初学者 | Newlearner365, 10:02

About

Blog

Apps

Platform