#AI #Windows #开源
⏺ Windrecorder - Windows 捕风记录仪
📄 开发者的灵感来源于 Rewind,它可以持续记录屏幕画面、通过关键词搜索等方式随时找回相关记忆
它的所有能力(录制、识别处理、存储回溯等)完全运行在本地,无需联网,不上传任何数据
虽然项目比较早期,但是毕竟是开源的,所有未来会有更多的可能,对比 Rewind 19 刀的价格已经很良心了
📮投稿 📢频道 💬群聊🔎 索引
它的所有能力(录制、识别处理、存储回溯等)完全运行在本地,无需联网,不上传任何数据
虽然项目比较早期,但是毕竟是开源的,所有未来会有更多的可能,对比 Rewind 19 刀的价格已经很良心了
Rewind:你可以理解为一个记录你使用 iPhone 或 Mac 所有操作记录的 AI
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11
#开源 #视频处理 #翻译 #AI
💬 视频翻译和配音 - 将视频从一种语言翻译为另一种语言,并添加配音
📄 开发者甚至没有给这个软件取一个正式的名字,不过并不影响他开源且好用
软件的语音识别基于 Openai-whisper 离线模型、文字翻译使用Google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,支持 12 种语言
可以直出外语至中文字幕以及中文语音效果视频
🎞 测试
我的主观感受是它对苏纳克的语言识别和翻译比较准确,准确度有8成左右,对马斯克则稍微差些,可能准确度6成左右
当然苏纳客是英伦腔,所以吐字清晰一些识别率也高些。如果有这方面需求的还可以下载大杯版本的 whisper 模型,估计效果会更佳
📮投稿 📢频道 💬群聊🔎 索引
软件的语音识别基于 Openai-whisper 离线模型、文字翻译使用Google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,支持 12 种语言
可以直出外语至中文字幕以及中文语音效果视频
视频:马斯克和苏纳克对 AI 的讨论(前5分钟
语音识别模型:whisper base
我的主观感受是它对苏纳克的语言识别和翻译比较准确,准确度有8成左右,对马斯克则稍微差些,可能准确度6成左右
当然苏纳客是英伦腔,所以吐字清晰一些识别率也高些。如果有这方面需求的还可以下载大杯版本的 whisper 模型,估计效果会更佳
PS:支持日语,未测试
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤5🌚4👏1
#AI #x #twitter #大模型
🕊 x.ai 发布首个 AI 聊天机器人「Grok」
Grok 是一款模仿《银河系漫游指南》的人工智能,马斯克曾直言这是他最喜欢的科幻小说
Grok 最亮眼的特点便是能回答大多数其他聊天机器人拒绝回答的“敏感问题”
⚡ Features
▫️25000 Tokens 的上下文窗口
▫️采用了 Rust 语言以及深度学习框架新秀 JAX(无Python)
▫️极快的响应速度,能实时获取 𝕏 的信息
▫️Grok 的知识库是基于 886.03GB 的开源语言数据库 The Pile 和整个 𝕏 平台的 Exabytes 数据库微调而成;
▫️计划提供 API,还有图像识别和音频识别
▫️Grok 的一个版本将使用本地计算能力在 Tesla 中「本地」运行
💲 价格
Grok 结束早期测试后,会向的所有 𝕏 Premium+ 订阅者开放,每月 16 美元
🎙 预测
xAI 背靠 𝕏 与 Tesla 两大平台的文本、图像还有现实世界的数据,这两大优势极有可能会弯道超车 ChatGPT,实现真正意义上的通用人工智能,让我们拭目以待
📮投稿 📢频道 💬群聊🔎 索引
Grok 是一款模仿《银河系漫游指南》的人工智能,马斯克曾直言这是他最喜欢的科幻小说
Grok 最亮眼的特点便是能回答大多数其他聊天机器人拒绝回答的“敏感问题”
▫️25000 Tokens 的上下文窗口
▫️采用了 Rust 语言以及深度学习框架新秀 JAX(无Python)
▫️极快的响应速度,能实时获取 𝕏 的信息
▫️Grok 的知识库是基于 886.03GB 的开源语言数据库 The Pile 和整个 𝕏 平台的 Exabytes 数据库微调而成;
▫️计划提供 API,还有图像识别和音频识别
▫️Grok 的一个版本将使用本地计算能力在 Tesla 中「本地」运行
Grok 结束早期测试后,会向的所有 𝕏 Premium+ 订阅者开放,每月 16 美元
xAI 背靠 𝕏 与 Tesla 两大平台的文本、图像还有现实世界的数据,这两大优势极有可能会弯道超车 ChatGPT,实现真正意义上的通用人工智能,让我们拭目以待
还得是你马一龙
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚14👍9❤5😁2
#网址导航 #开源 #建站
🌐 TwoNav - 一款开源的网址导航程序
🌐 演示
📄 TwoNav 可帮助你将浏览器书签集中式管理,解决跨设备、跨平台、跨浏览器之间同步和访问困难问题,做到一处部署,随处访问
这个程序前台没啥好说的,基本和市面上的大同小异,亮点在于后台功能比较完善
➡️ 已收录至「网址导航」
📮投稿 📢频道 💬群聊🔎 索引
这个程序前台没啥好说的,基本和市面上的大同小异,亮点在于后台功能比较完善
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤1
#ChatGPT #AI
🤖️ ChatGPT 更新汇总
美东时间11月6日,OpenAI 在旧金山举办的首届开发者大会上发布了最新 GPT-4 Turbo 人工智能模型,并且允许用户创建 ChatGPT 自定义版本,以下是部分总结
⏺ 每个人都能定制GPT:用户可以为特定任务创建定制版本的 ChatGPT ,且无需编写代码。断了部分一部分套壳定制产品的活路
⏺ 即将推出 GPT Store:所有用户可上传自定义的 ChatGPT ,创作者可参与收益分成
⏺ GPT-4 API 升级为 GPT-4 Turbo:
▫️上下文长度从 8K 提升至 128K;
▫️多模态视觉、DALL·E 3 和语音合成 API 一起开放;
▫️知识库更新到 2023 年 4 月;
▫️对部分企业开放 GPT4 微调
⏺ 降价:
▫️GPT4 输入降低 70%,输出降低 50%;
▫️与 GPT-4 相比。Turbo 整体价格降低超过 2.75 倍;
▫️降低 GPT-3.5 Turbo 16K的价格,输入降低 4 倍,输出降低 3 倍
⏺ 开源语音和图像模块:开源 WhisperV3、Consistency Decoder
发布 GPT Assistant API:可以帮助开发者在自己的应用程序中构建 Agent,包含代码解释器、知识库、函数调用
⏺ 数据:200 万开发者和 1 亿周活跃用户,约 90% 的财富 500 强公司正在内部使用这些工具
📮投稿 📢频道 💬群聊🔎 索引
美东时间11月6日,OpenAI 在旧金山举办的首届开发者大会上发布了最新 GPT-4 Turbo 人工智能模型,并且允许用户创建 ChatGPT 自定义版本,以下是部分总结
▫️上下文长度从 8K 提升至 128K;
▫️多模态视觉、DALL·E 3 和语音合成 API 一起开放;
▫️知识库更新到 2023 年 4 月;
▫️对部分企业开放 GPT4 微调
▫️GPT4 输入降低 70%,输出降低 50%;
▫️与 GPT-4 相比。Turbo 整体价格降低超过 2.75 倍;
▫️降低 GPT-3.5 Turbo 16K的价格,输入降低 4 倍,输出降低 3 倍
发布 GPT Assistant API:可以帮助开发者在自己的应用程序中构建 Agent,包含代码解释器、知识库、函数调用
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30❤3🆒2
#插件 #阅读 #破解
✅ Medium Parser - 一个用于查看 Medium 付费文章的浏览器插件
🌐 Chrome Store
📄 它的原理是通过 Google Web 缓存查看 Medium 付费文章
安装插件之后,需要付费解锁的文章右侧会出现两个按钮,点击任意一个都可以查看该文章的完整内容
❗️ 谷歌商店无法下载,点击此链接即可手动安装,报错可无视
🔗 Medium:一个美国的社交新闻网站,集合了业余和专业的个人和出版物,拥有许多优质的文章
➡️ 已收录至「破解付费阅读」
📮投稿 📢频道 💬群聊🔎 索引
安装插件之后,需要付费解锁的文章右侧会出现两个按钮,点击任意一个都可以查看该文章的完整内容
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18❤2