#开源 #视频处理 #翻译 #AI
💬 视频翻译和配音 - 将视频从一种语言翻译为另一种语言,并添加配音
📄 开发者甚至没有给这个软件取一个正式的名字,不过并不影响他开源且好用
软件的语音识别基于 Openai-whisper 离线模型、文字翻译使用Google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,支持 12 种语言
可以直出外语至中文字幕以及中文语音效果视频
🎞 测试
我的主观感受是它对苏纳克的语言识别和翻译比较准确,准确度有8成左右,对马斯克则稍微差些,可能准确度6成左右
当然苏纳客是英伦腔,所以吐字清晰一些识别率也高些。如果有这方面需求的还可以下载大杯版本的 whisper 模型,估计效果会更佳
📮投稿 📢频道 💬群聊🔎 索引
软件的语音识别基于 Openai-whisper 离线模型、文字翻译使用Google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,支持 12 种语言
可以直出外语至中文字幕以及中文语音效果视频
视频:马斯克和苏纳克对 AI 的讨论(前5分钟
语音识别模型:whisper base
我的主观感受是它对苏纳克的语言识别和翻译比较准确,准确度有8成左右,对马斯克则稍微差些,可能准确度6成左右
当然苏纳客是英伦腔,所以吐字清晰一些识别率也高些。如果有这方面需求的还可以下载大杯版本的 whisper 模型,估计效果会更佳
PS:支持日语,未测试
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤5🌚4👏1
#AI #x #twitter #大模型
🕊 x.ai 发布首个 AI 聊天机器人「Grok」
Grok 是一款模仿《银河系漫游指南》的人工智能,马斯克曾直言这是他最喜欢的科幻小说
Grok 最亮眼的特点便是能回答大多数其他聊天机器人拒绝回答的“敏感问题”
⚡ Features
▫️25000 Tokens 的上下文窗口
▫️采用了 Rust 语言以及深度学习框架新秀 JAX(无Python)
▫️极快的响应速度,能实时获取 𝕏 的信息
▫️Grok 的知识库是基于 886.03GB 的开源语言数据库 The Pile 和整个 𝕏 平台的 Exabytes 数据库微调而成;
▫️计划提供 API,还有图像识别和音频识别
▫️Grok 的一个版本将使用本地计算能力在 Tesla 中「本地」运行
💲 价格
Grok 结束早期测试后,会向的所有 𝕏 Premium+ 订阅者开放,每月 16 美元
🎙 预测
xAI 背靠 𝕏 与 Tesla 两大平台的文本、图像还有现实世界的数据,这两大优势极有可能会弯道超车 ChatGPT,实现真正意义上的通用人工智能,让我们拭目以待
📮投稿 📢频道 💬群聊🔎 索引
Grok 是一款模仿《银河系漫游指南》的人工智能,马斯克曾直言这是他最喜欢的科幻小说
Grok 最亮眼的特点便是能回答大多数其他聊天机器人拒绝回答的“敏感问题”
▫️25000 Tokens 的上下文窗口
▫️采用了 Rust 语言以及深度学习框架新秀 JAX(无Python)
▫️极快的响应速度,能实时获取 𝕏 的信息
▫️Grok 的知识库是基于 886.03GB 的开源语言数据库 The Pile 和整个 𝕏 平台的 Exabytes 数据库微调而成;
▫️计划提供 API,还有图像识别和音频识别
▫️Grok 的一个版本将使用本地计算能力在 Tesla 中「本地」运行
Grok 结束早期测试后,会向的所有 𝕏 Premium+ 订阅者开放,每月 16 美元
xAI 背靠 𝕏 与 Tesla 两大平台的文本、图像还有现实世界的数据,这两大优势极有可能会弯道超车 ChatGPT,实现真正意义上的通用人工智能,让我们拭目以待
还得是你马一龙
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚14👍9❤5😁2
#网址导航 #开源 #建站
🌐 TwoNav - 一款开源的网址导航程序
🌐 演示
📄 TwoNav 可帮助你将浏览器书签集中式管理,解决跨设备、跨平台、跨浏览器之间同步和访问困难问题,做到一处部署,随处访问
这个程序前台没啥好说的,基本和市面上的大同小异,亮点在于后台功能比较完善
➡️ 已收录至「网址导航」
📮投稿 📢频道 💬群聊🔎 索引
这个程序前台没啥好说的,基本和市面上的大同小异,亮点在于后台功能比较完善
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤1
#ChatGPT #AI
🤖️ ChatGPT 更新汇总
美东时间11月6日,OpenAI 在旧金山举办的首届开发者大会上发布了最新 GPT-4 Turbo 人工智能模型,并且允许用户创建 ChatGPT 自定义版本,以下是部分总结
⏺ 每个人都能定制GPT:用户可以为特定任务创建定制版本的 ChatGPT ,且无需编写代码。断了部分一部分套壳定制产品的活路
⏺ 即将推出 GPT Store:所有用户可上传自定义的 ChatGPT ,创作者可参与收益分成
⏺ GPT-4 API 升级为 GPT-4 Turbo:
▫️上下文长度从 8K 提升至 128K;
▫️多模态视觉、DALL·E 3 和语音合成 API 一起开放;
▫️知识库更新到 2023 年 4 月;
▫️对部分企业开放 GPT4 微调
⏺ 降价:
▫️GPT4 输入降低 70%,输出降低 50%;
▫️与 GPT-4 相比。Turbo 整体价格降低超过 2.75 倍;
▫️降低 GPT-3.5 Turbo 16K的价格,输入降低 4 倍,输出降低 3 倍
⏺ 开源语音和图像模块:开源 WhisperV3、Consistency Decoder
发布 GPT Assistant API:可以帮助开发者在自己的应用程序中构建 Agent,包含代码解释器、知识库、函数调用
⏺ 数据:200 万开发者和 1 亿周活跃用户,约 90% 的财富 500 强公司正在内部使用这些工具
📮投稿 📢频道 💬群聊🔎 索引
美东时间11月6日,OpenAI 在旧金山举办的首届开发者大会上发布了最新 GPT-4 Turbo 人工智能模型,并且允许用户创建 ChatGPT 自定义版本,以下是部分总结
▫️上下文长度从 8K 提升至 128K;
▫️多模态视觉、DALL·E 3 和语音合成 API 一起开放;
▫️知识库更新到 2023 年 4 月;
▫️对部分企业开放 GPT4 微调
▫️GPT4 输入降低 70%,输出降低 50%;
▫️与 GPT-4 相比。Turbo 整体价格降低超过 2.75 倍;
▫️降低 GPT-3.5 Turbo 16K的价格,输入降低 4 倍,输出降低 3 倍
发布 GPT Assistant API:可以帮助开发者在自己的应用程序中构建 Agent,包含代码解释器、知识库、函数调用
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍30❤3🆒2
#插件 #阅读 #破解
✅ Medium Parser - 一个用于查看 Medium 付费文章的浏览器插件
🌐 Chrome Store
📄 它的原理是通过 Google Web 缓存查看 Medium 付费文章
安装插件之后,需要付费解锁的文章右侧会出现两个按钮,点击任意一个都可以查看该文章的完整内容
❗️ 谷歌商店无法下载,点击此链接即可手动安装,报错可无视
🔗 Medium:一个美国的社交新闻网站,集合了业余和专业的个人和出版物,拥有许多优质的文章
➡️ 已收录至「破解付费阅读」
📮投稿 📢频道 💬群聊🔎 索引
安装插件之后,需要付费解锁的文章右侧会出现两个按钮,点击任意一个都可以查看该文章的完整内容
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18❤3
#AI #ChatGPT #开源
🔄 Draw-a-UI - 一个将草图转换为网页的工具
📄 如图所示,画一张网页草图,该工具可以为其生成一个网页
该项目基于 tldraw 和 GPT-4- Vision API,它的工作原理是获取当前画布的 SVG,将其转换为 PNG,然后将该 PNG 发送给 GPT-4-vision,并指示其返回带有 Tailwind 的单个 html 文件
⚙ 想要使用该项目,你需要一个能够访问 GPT-4 Vision API 的 OpenAI API 密钥,然后运行一行命令,最后在浏览器中画草图即可
➡️ 已收录至「AI 生成应用、网页的工具」
📮投稿 📢频道 💬群聊🔎 索引
该项目基于 tldraw 和 GPT-4- Vision API,它的工作原理是获取当前画布的 SVG,将其转换为 PNG,然后将该 PNG 发送给 GPT-4-vision,并指示其返回带有 Tailwind 的单个 html 文件
ChatGPT 愈发牛逼,套壳 AI 创业也将愈发困难
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16
#开源 #相册
🖼️ PhotoPrism - 一款 AI 驱动的开源照片管理程序
🌐 开源地址 | ▶️ 演示
📄 宣传说是去中心化和人工智能,其实不太搭边,UI还行,但是识别搜索功能有点拉垮
该有的功能都有,安装部署也比较简单,总之适合自己的才是最好的,没有十全十美的产品
📑 相关阅读
Immich - 一个开源的照片和视频备份系统
📮投稿 📢频道 💬群聊🔎 索引
该有的功能都有,安装部署也比较简单,总之适合自己的才是最好的,没有十全十美的产品
Immich - 一个开源的照片和视频备份系统
📮投稿 📢频道 💬群聊
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍2
#阅读 #AI
📱 Humane 推出人工智能硬件「AI Pin」
这是一款由 OpenAI 驱动的可穿戴 AI 设备,它设计小巧,可通过磁力吸附佩戴在身体的任何部位,内置 GPT 模型用于语音交互
它有一个激光投影系统,可以投影到用户的手上,方便用户查看天气、时
间、日期、信息等等
该设备在正式发布之前就被《时代》杂志评为 2023 年最佳发明之一
值得注意的是,该公司创始人为 Apple 前员工,OpenAI CEO 奥特曼是其最大股东
这是一款由 OpenAI 驱动的可穿戴 AI 设备,它设计小巧,可通过磁力吸附佩戴在身体的任何部位,内置 GPT 模型用于语音交互
它有一个激光投影系统,可以投影到用户的手上,方便用户查看天气、时
间、日期、信息等等
该设备在正式发布之前就被《时代》杂志评为 2023 年最佳发明之一
值得注意的是,该公司创始人为 Apple 前员工,OpenAI CEO 奥特曼是其最大股东
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25❤4🔥2