这款文本转语音小工具可以
试听,试听会根据你选的语言、语音、说话风格、角色、语速和音调自动播放(文本前40个字)的语音效果。
下载,下载会根据你选的语言、语音、说话风格、角色、语速和音调生成(全部文本)每次最大10分钟(大概2600字左右)的音频。
音频文件会在存放与工具同一目录下,名称为"语音.mp3"
可以点击播放,再次试听音频,也可以立即停止播放。
支持win10、win11系统,可以试听(自动播放文本前40个字的语音效果),
也可以下载(全部文本,每次最大10分钟,大概2600字左右的音频效果),
修复了文字多卡死的问题,添加了三个常用的语言,说话风格和角色,
保持网络畅通,不会卡顿,使用中出现什么问题可以直接在评论下说明。
调用的是微软免费的TTS,希望大家喜欢。
第一次发贴,额,就这样吧。。。
下载地址:
https://wwt.lanzout.com/b02p9lkud
密码:4h9h
link
#微软 #微软晓晓 #语音 #tts #软件 #windows #人工智能
试听,试听会根据你选的语言、语音、说话风格、角色、语速和音调自动播放(文本前40个字)的语音效果。
下载,下载会根据你选的语言、语音、说话风格、角色、语速和音调生成(全部文本)每次最大10分钟(大概2600字左右)的音频。
音频文件会在存放与工具同一目录下,名称为"语音.mp3"
可以点击播放,再次试听音频,也可以立即停止播放。
支持win10、win11系统,可以试听(自动播放文本前40个字的语音效果),
也可以下载(全部文本,每次最大10分钟,大概2600字左右的音频效果),
修复了文字多卡死的问题,添加了三个常用的语言,说话风格和角色,
保持网络畅通,不会卡顿,使用中出现什么问题可以直接在评论下说明。
调用的是微软免费的TTS,希望大家喜欢。
第一次发贴,额,就这样吧。。。
下载地址:
https://wwt.lanzout.com/b02p9lkud
密码:4h9h
link
#微软 #微软晓晓 #语音 #tts #软件 #windows #人工智能
Forwarded from 黑科技广播站 (米开朗基杨)
#GPT #AI #人工智能 #Laf #函数计算 #Serverless #FaaS #云开发 #思维导图
一个能自动生成思维导图的工具 —— #ChatMind,据说也是用 Laf 写的。只要输入想做的事,它就能列出步骤。知识面还是很广阔的嘛,从三体人攻占地球到如何减肥它都懂😂
🌐链接:https://www.chatmind.tech/
📢关注频道:@cloud_native_share
💬加入群聊:@fuck_you_chatgpt
📮欢迎投稿:@cloud_native_yang
🎁访问主页: icloudnative.io
一个能自动生成思维导图的工具 —— #ChatMind,据说也是用 Laf 写的。只要输入想做的事,它就能列出步骤。知识面还是很广阔的嘛,从三体人攻占地球到如何减肥它都懂😂
🌐链接:https://www.chatmind.tech/
📢关注频道:@cloud_native_share
💬加入群聊:@fuck_you_chatgpt
📮欢迎投稿:@cloud_native_yang
🎁访问主页: icloudnative.io
Forwarded from Solidot
以 BitTorrent 的方式在家用电脑上运行大语言模型
2023-03-21 13:51:00 by 魔法生活
OpenAI 的 AI 聊天机器人 ChatGPT 运行在微软的 Azure 云计算平台,普通用户即使能获得 ChatGPT 使用的大语言模型 GPT-3 或 GPT-4,也不可能在家用电脑上运行它们。如果人人都能运行一个分布式计算系统,联合起来打造一个在算力上能与最强大云计算平台匹敌的平台,那么我们有可能在自己的家用电脑上运行和使用类似
ChatGPT 的 AI 聊天机器人。BigScience 社区正在开发名为 Petal 的系统,以 BitTorrent 的方式在家用电脑上运行大语言模型。Petal 可以集成最新的大语言模型,当前支持性能与 GPT-3 相近的 BLOOM-176B 大语言模型。
https://petals.ml/
#人工智能
2023-03-21 13:51:00 by 魔法生活
OpenAI 的 AI 聊天机器人 ChatGPT 运行在微软的 Azure 云计算平台,普通用户即使能获得 ChatGPT 使用的大语言模型 GPT-3 或 GPT-4,也不可能在家用电脑上运行它们。如果人人都能运行一个分布式计算系统,联合起来打造一个在算力上能与最强大云计算平台匹敌的平台,那么我们有可能在自己的家用电脑上运行和使用类似
ChatGPT 的 AI 聊天机器人。BigScience 社区正在开发名为 Petal 的系统,以 BitTorrent 的方式在家用电脑上运行大语言模型。Petal 可以集成最新的大语言模型,当前支持性能与 GPT-3 相近的 BLOOM-176B 大语言模型。
https://petals.ml/
#人工智能
Forwarded from 蓝点网订阅频道
This media is not supported in your browser
VIEW IN TELEGRAM
#科技资讯 #人工智能 [视频] 又是一个waitlist:斯坦福大学的研究人员基于ChatGPT开了个浏览器助手 — MULTI・ON
全文链接:https://ourl.co/97970
MULTI・ON能干啥?还挺有意思:可以通过命令让AI自动执行任务,例如买汉堡。AI自动打开谷歌搜索用户指定的平台浏览菜单,将汉堡添加到购物车,使用用户在浏览器预留的地址和信用卡进行下单。
这个应用解决了GPT不联网问题,算是可视化执行任务。不过文字交互毕竟麻烦,后续研究人员准备为其添加语音交互,这样操作更简单。
现在你就可以报名参与该扩展并等待获取资格测试。
🎉 订阅频道:蓝点网订阅
🥰 推特账号:蓝点网(2代目)
👋 交流频道:蓝点网读者群
全文链接:https://ourl.co/97970
MULTI・ON能干啥?还挺有意思:可以通过命令让AI自动执行任务,例如买汉堡。AI自动打开谷歌搜索用户指定的平台浏览菜单,将汉堡添加到购物车,使用用户在浏览器预留的地址和信用卡进行下单。
这个应用解决了GPT不联网问题,算是可视化执行任务。不过文字交互毕竟麻烦,后续研究人员准备为其添加语音交互,这样操作更简单。
现在你就可以报名参与该扩展并等待获取资格测试。
🎉 订阅频道:蓝点网订阅
🥰 推特账号:蓝点网(2代目)
👋 交流频道:蓝点网读者群
Forwarded from 蓝点网订阅频道
#科技资讯 #人工智能 重磅!OPENAI宣布ChatGPT可以联网获取最新数据了!!!赶紧报名然后waitlist
全文链接:https://ourl.co/97965
今天OPENAI宣布ChatGPT支持插件服务,其中OPENAI自己开发了网络浏览插件,可以在回答用户问题时调用网络浏览插件检索互联网上的最新消息。
不过基于安全考虑联网功能仅支持发出GET请求,不支持其他请求,同时调用必应搜索API,微软已经对必应过滤了一遍,OPENAI自己又过滤了一遍,尽可能提高安全性。
另外联网服务还和ChatGPT基础设施分离了。
🎉 订阅频道:蓝点网订阅
🥰 推特账号:蓝点网(2代目)
👋 交流频道:蓝点网读者群
全文链接:https://ourl.co/97965
今天OPENAI宣布ChatGPT支持插件服务,其中OPENAI自己开发了网络浏览插件,可以在回答用户问题时调用网络浏览插件检索互联网上的最新消息。
不过基于安全考虑联网功能仅支持发出GET请求,不支持其他请求,同时调用必应搜索API,微软已经对必应过滤了一遍,OPENAI自己又过滤了一遍,尽可能提高安全性。
另外联网服务还和ChatGPT基础设施分离了。
🎉 订阅频道:蓝点网订阅
🥰 推特账号:蓝点网(2代目)
👋 交流频道:蓝点网读者群
WhisperX是一个具有以下特点的自动语音识别(ASR)项目:
1. 快速实时转录:WhisperX利用Whisper模型进行批处理推断,实现了70倍的实时转录速度。这使得处理大量音频数据变得更加高效。
1. 单词级时间戳:WhisperX提供准确的单词级时间戳,使得识别结果可以更精细地对应到语音中的每个单词。
1. 说话人分离:通过集成pyannote-audio的说话人分离功能,WhisperX实现了多说话人ASR。它能够识别和区分不同说话人的语音,为多人对话场景提供更准确的识别结果。
1. VAD预处理:WhisperX使用语音活动检测(VAD)进行预处理,有效减少了虚假识别和批处理时的错误,同时不会降低识别准确性。
#自动语音识别 #语音识别 #说话人识别 #时间戳 #音频处理 #深度学习 #机器学习 #Python #语音技术 #开发工具 #音频转录 #音频处理 #开源项目 #人工智能 #软件 #whisperx #开源
https://github.com/m-bain/whisperX
1. 快速实时转录:WhisperX利用Whisper模型进行批处理推断,实现了70倍的实时转录速度。这使得处理大量音频数据变得更加高效。
1. 单词级时间戳:WhisperX提供准确的单词级时间戳,使得识别结果可以更精细地对应到语音中的每个单词。
1. 说话人分离:通过集成pyannote-audio的说话人分离功能,WhisperX实现了多说话人ASR。它能够识别和区分不同说话人的语音,为多人对话场景提供更准确的识别结果。
1. VAD预处理:WhisperX使用语音活动检测(VAD)进行预处理,有效减少了虚假识别和批处理时的错误,同时不会降低识别准确性。
#自动语音识别 #语音识别 #说话人识别 #时间戳 #音频处理 #深度学习 #机器学习 #Python #语音技术 #开发工具 #音频转录 #音频处理 #开源项目 #人工智能 #软件 #whisperx #开源
https://github.com/m-bain/whisperX
This media is not supported in your browser
VIEW IN TELEGRAM