Newlearnerの自留地
56.8K subscribers
12K photos
30 videos
63 files
9.1K links
🆕 不定期推送 IT 相关资讯,欢迎关注!

👥 博客群&投稿群&交流群: @NewlearnerGroup

📩 投稿请私信 @newlearner_pm_bot

🔍 频道内容关键词索引 Bot: @newlearner_search_bot

* 未经授权或标注来源,不得转载本频道内容
Download Telegram
#Photos #Web #AI

🏞 River:又一个基于 AI 的视觉艺术搜索引擎

🔗Web

👉 Features

- 调用 Are.na 艺术库作品
- 支持点选图片,AI 将据此展示风格相关图片
- 提供一些风格和主题选项,可快速找到感兴趣主题
- 可标记为 NSFW、无聊图片

👍 和之前介绍的同类项目有所不同,River 虽然也是基于 AI 的「流」式图片搜索网站,但内容上更加天马行空一些。它使用的数据来自 Are.na,这是一个在线数字艺术藏品库

🧑‍💻 虽然照片和日用关联并不太大,但如果你恰好是一个喜欢特立独行的人,相信你会对其中的一些艺术藏品感兴趣。但我要说,如果瀑布流真的是面对未知时有效的一种迅速发现兴趣的有效手段,我只能表示遗憾

📘 关联阅读:Same Energy - 基于 AI 的视觉搜索引擎

频道:@NewlearnerChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
#Blog #AI #Tools

📩 接读者来稿,他向我们分享了自己使用 Whisper API 进行音视频转录文字的一些心得

🎙 精准转写:利用 Whisper 处理音视频转文字不完全指南

🔗Blog

📝 文章概述

- 背景
- 方案选择
- 操作流程
- 潜在问题与更多场景

🔮 音视频转录 / 翻译文字一直是一个比较热门的使用场景,在 AI 迅速普及后,这个问题的解决也取得了一些突破。作者在使用传统商业转录遇到精度不高的问题后,开始拥抱 OpenAI 发布的 Whisper API

💡 在文中,作者详细介绍了 Whisper 使用效果、具体实现方法、Prompt 探讨,并在结尾指出了该方案存在的一些问题。如果你也有类似的需求,可以根据这篇文章「抄作业」了

👀 正如我一直所认为的,AI 是处理「机械化」流程的一把好手,但最终对于结果的把控,还在于人。善于利用 AI 工具是好的,但在 AI 还并不是那么成熟的今天,过分依赖而不加思考,容易被事实性错误所困扰

📘 关联阅读:WhisperNotes - 利用Whisper模型的本地语音转文字「速记」App

频道:@NewlearnerChannel
#RSS #AI #GitHub情报

📩 接读者来稿,他向我们推荐了自己的 RSS 订阅源 AI 总结开源项目

📢 RSS-GPT:用 ChatGPT 总结 RSS 订阅源,并托管在 GitHub 仓库和 Pages 上

🔗: GitHub | Wiki

💡 原理

使用 GitHub Actions 自动运行一个简单的 Python 脚本,调用 OpenAI API 总结订阅源中的文章,然后将新生成的 RSS 订阅源推送到 GitHub Pages。配置简单快速,无需服务器。

👉 Features

- 使用 AI 生成关键词以及摘要附在原文前面,支持自定义摘要长度,自定义语言。
- 聚合多个 RSS 订阅源,去除重复文章,用单一地址订阅。
- 为 RSS 源添加基于标题,内容,URL 的关键词过滤器。
- 在 GitHub 仓库和 GitHub Pages 上自托管 RSS 订阅源,并在任意客户端中订阅。

👍 作者在博客写了关于本项目的 简单介绍 以及 配置教程 ,并分享了几条 RSS-GPT 处理后的订阅源供大家参考订阅。

👨🏻‍💻 作者的话

RSS 是我主要的信息获取方式,我可以把关注的内容和创造者聚合在一起集中阅读。但如若不加筛选,富含噪音的 RSS 在订阅中堆积会让让人疲惫不堪。每天几百几千条未读产生,如果“强迫症和焦虑症患者”强求 RSS 也 inbox-zero 的话,每天会花费很多的时间执着于清空未读上面。

在这种情况下,一个非常有效的方法就是,对 RSS 进行关键词过滤,只保留自己真正感兴趣愿意花时间阅读的内容。而另一方面,在关键词筛选玩完,对 RSS 全文的中文总结也很有意义,这样可以快速了解到这篇文章的主要内容,来决定是否进一步精读。

所以我开发了这样一个工具,并尽量在保证 API 和 Actions token 使用的前提,满足这两个需求。目前仅支持 OpenAI API 调用,未来会考虑加上 Azure OpenAI 或自定义 OpenAI 代理地址,或加上更多 AI 模型支持。

频道:@NewlearnerChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
#Blog #AI

🧐 Rewind 所引发的思考——到底是“生产力”还是现实版“黑镜”?

🔗Blog

📝 文章概述

- Rewind 和 Rewind Pendant
- 生产力还是“黑镜”:说说我的看法
- 总结一下

📋 片段节选

正如上文我所产生的问题“是否我在使用这款App的同时,也完全的交出了自己的隐私?”,如今AI的飞速发展,让厂商们你追我赶,争抢着成为那个“站在风口上的第二头猪”,但同时也打了用户一个措手不及:大学对于ChatGPT是否可以用于写作的看法百家争鸣、画师群体对于AIGC“尸块”的不满与无奈、互联网大厂对于员工使用ChatGPT的隐私限制不尽完善……

不过看似有各种各样的不满,总结凝练下来,其实也不多,在我看来就三个:

- 社会变革与隐私权
- 技术依赖与自由意志
- 虚拟与现实的交叠

我们一个一个说。

频道:@NewlearnerChannel
#App #GitHub情报 #AI

📔 Pile: 让 AI 和你一起思考

🔗GitHub | 官网

Features

- 清晰明了的时间线视图
- MacOS 原生体验设计
- Twitter Thread 风格的内容展示
- 安全的本地存储机制
- 智能 AI 点评功能
- 灵活的信息标签系统

Pile,一款还处于概念阶段的日记软件,其最大特色在于与人工智能的交互功能。这款软件不仅仅是一个日记记录工具,它的 AI 辅助功能能够引导用户深入反思自己的记录。体验上,Pile 让我想起了学生时代写周记,老师在旁边批注点评的场景,既有对内容的评价,也有对思考主题的深化指导。

尽管 Pile 强调的是反思与深入思考,其设计上类似于 Twitter Thread,对于短篇文章极为友好。这种问答式的交互方式,能够激发用户更多地思考并记录下更多内容。

然而,作为一个概念产品,Pile 在实际应用上仍有局限。例如,软件界面左侧的时间线仅作展示用途,无法进行交互操作。此外,Pile 目前还没有集成搜索功能,这在日常使用中可能会带来不便。

总体而言,虽然 Pile 作为 AI 日记软件在理念上颇具创新,但考虑到其还在概念阶段且存在一些实用性的缺陷,我暂时不建议将其作为主要的日记记录工具。Pile 在未来的发展值得期待,但目前它更适合作为对日常记录方式的一种补充尝试

频道:@NewlearnerChannel
#Web #AI

🕘 MyLens.AI:基于 AI 的在线主题时间线生成网页

🔗Web

💡 Timeline 是我很喜欢的一种展示方式,它能够让人一目了然地了解某样事物的发展历程和重要里程碑事件。今天介绍的一个在线工具,能够帮助我们快速生成 Timeline

😌 打开网页,输入你感兴趣的话题,等待一些时间即可看到时间线和所有里程碑节点了。我输入的是「Apple」,比较好奇它会识别成水果还是科技公司,事实是后者

🍎 关于 Apple 的里程碑时间中,有 Macintosh、Steve Jobs、iPhone、iPod、iPad、Apple Watch 以及市值万亿的时刻。最有趣的是,在最后并未提及 Apple Vision 这一次世代产品,而是着重强调了一下 App Store 引入了隐私标签,或许 AI 也觉得隐私很重要吧

👀 总之欢迎大家试用,时间线生成后可以便捷地分享给他人,你还可以通过下载图片的方式获得适用于 Instagram 的多张拆分照片

频道:@NewlearnerChannel
#Web #Design #Tools #AI

🏞 AI 图片搜索库 aisplash 以及其背后的 Figma 插件项目 Musho AI

🔗aisplash | Musho AI

📷 相信大家日常在寻找实拍图片的时候,都会考虑 Unsplash 这个网站,自留地一些推送的头图也是出自它。临近 2024 年,只要提供好的 Prompt,现在很多大模型都能够生成不同风格的、栩栩如生的图片

🧠 aisplash 就是一个聚合了这些 AI 生成图片的在线网站,UI 设计和 Unsplash 高度相似。用户可以自行上传自己生成的 AI 图片,也可以通过分类或者关键词寻找自己想要的图片风格

🧑‍💻 需要注意的是,aisplash 对于图片的版权较为严格,请先阅读他们的 TOS 之后再使用。后续个人希望能够加入每张图片是怎么得来的,即大模型种类 + Prompt,这样能够给其他人带来更多的灵感

💡 aisplash 背后的项目是一个 Figma 插件 —— Musho AI,它旨在利用 AI 为网页设计师减轻负担,迅速获得想要设计样式的 Demo。它包含了网站着陆页设计、品牌设计、图片 / 涂鸦生成等插件,部分插件正在 Beta,还有一些尚未推出

📘 关联阅读: River - 又一个基于 AI 的视觉艺术搜索引擎

频道:@NewlearnerChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
#App #AI

✒️ MemoAI:好用的语音转文字工具

官网安装地址

Features

- YouTube 视频一键转文字
- 多语言转写,添加自定义词汇
- 多语言翻译
- 文字合成语音
- Nvidia,AMD,Apple Silicon GPU 加速
- 音频回放搭配字幕
- AI 总结
- 修改转录文字
- 支持多种导出格式
- 支持多种语音转文字模型

👍 感想

MemoAI 是我今年用过最棒的免费的语音转文字工具。它功能齐全,完成度很高。基本上所有和语音转文字相关的工具都可以在 MemoAI 中找到。

我的日常使用习惯便是将会议视频导入到 MemoAI 中,添加一些自定义词汇,等待转译完成后使用 AI 更高效的消化这段会议内容。

🏦 价格

Memo 的定价为 $22.99 和 $99.99。$22.99 只有一年的更新,$99.99 永久更新。大家觉得这个定价怎么样?

😊 我的期待

MemoAI 整体使用下来我觉得功能比较完善,一些使用层面可以再进行打磨。对于功能上我期待 Memo AI 未来加入识别说话人,支持用音频中说话人的声音朗读 AI 总结或者自定义文字的功能。

使用体验上,我期待在模型下载中可以加入中断后自动继续下载,AI 总结时添加进度条的功能。

⚙️ 竞品

今年语音转文字的功能我用的很多,除了 MemoAI,我用的最多的是 Otter.aiinsanely-fast-whisper。Otter.ai 功能完善,速度也很快。使用体验上我对其唯一的诟病是对生成后的文字进行修改会非常卡。定价也比较高。 insanely-fast-whisper 需要使用命令行进行操作,生成速度非常快,但是格式比较单一。

频道:@NewlearnerChannel
#Life #buybuybuy #Web #AI

👕 最佳平替:基于 AI 的消费品平替自动生成网站

🔗Web

👀 每当我们涉足一个新消费领域并十分感兴趣时,好奇心总会驱使着我们不断探索优秀的品牌和商品,有时不惜重金只为体验一下

🛒 但兴趣总会成为「日常」,热情总会消退,钱包总会瘪瘪。在那些我们觉得无需投入太多的消费品类中,我们往往会主动寻找「平替」产品,想要追求既实用又低价

💡 今天介绍的网页「最佳平替」基于 AI 训练而成,旨在实现:用户输入想搜索的商品,模型给出便宜的平替商品名。虽然有些结果比较离谱,但有些还是蛮有用的

👍 网页开发者进一步总结了自己的 消费折叠观:每一个平替商品的搜索技巧背后,都隐藏着一种对生活的折叠。商品可以平替,但你的生活无法被平替

* 结果可能不准,开心就好

📘 关联阅读:当我说起极简时,我在说什么

频道:@NewlearnerChannel
#telegram #GitHub情报 #Bot #AI

📩 接读者来稿,他向我们分享了自己开发的 Telegram 机器人

🤖 Poe-Telegram-Chatbot:基于 Poe 官方 API 的开源 Telegram AI 机器人

🔗GitHub | Wiki

👉 Features

- 支持与 GPT-4 和 Claude-3-Opus 模型进行对话
- 可以保持对话上下文,实现连续对话
- 提供命令切换不同的 AI 模型
- 支持 Docker 容器化部署

💡 Poe 是一个 AI 聊天平台,提供了多种 AI 模型供用户选择。然而,Poe 平台上的积分消耗速度非常快,尤其是在使用高级模型如 Claude 和 GPT-4 时。为了更经济地使用这些 AI 模型,我们可以利用 Poe 会员 API 来制作自己的 Telegram AI Bot

👨🏻‍💻 开发者的话

这个项目目前还比较简陋,机器人只支持纯文字交互,暂时不支持上传图片文件等功能。内置的 AI 模型包括 Claude-3-Opus 和 GPT-4,理论上 Poe 平台上的所有模型都可以使用,只需要在代码中进行相应的修改

我希望有更多的开发者能够参与到这个项目中来,帮助完善和优化这个聊天机器人。例如,可以添加上传图片文件的功能,优化代码结构和性能等。让我们一起为这个项目贡献自己的力量,创造出一个更加强大和实用的 Telegram 聊天机器人

频道:@NewlearnerChannel