LinuxDo 新帖推送
188 subscribers
254K photos
317K links
Download Telegram
标题: ::fire::【原创长文】哪个AI语音输入法最强,你知道吗?我的全平台AI语音输入法排名
作者: #dwqxq1
板块: #文档共建
编号: 833194
帖子: https://linux.do/t/topic/833194
时间: 2025-07-31 21:21:21
摘要:
经过两个月的研究,我暂时的 语音输入法+笔记 排名(不限平台)
这里重点研究AI输入法,笔记不是重点,用Obsidian,Tana,Roam,Notion都行
实际效果需要:第一梯队软件功能 + 第一梯队听写模型 + 第一梯队润色模型 + 合适润色提示词(自己写),四个要素都高,才能取得最好效果

软件第一梯队
支持听写模型api key + 润色模型api key,或不支持apikey但包月听写模型很全
例如macwhisper(mac),superwisper(mac正常/iso缩水/win开发中),spokenly(mac)
第一第二梯队app几乎都在mac上,windows/ios/安卓没有能进入第一第二梯队
软件第二梯队
包月听写模型(whisper)+包月润色模型,不支持api key
例如Audiopen
软件第三梯队
润色模型弱,不能自动执行润色等。
办法:初稿瑕疵多,看初稿心情差,需要把初稿手动粘贴到aistudio等润色,润色后效果与第一梯队相当,
例如:CleverType(安卓正常/ios缩水)
软件第四梯队
润色模型弱,本身不是输入法,不能嵌入Obsidian等笔记中使用(只能复制粘贴过去)。app本身就是笔记,但笔记功能又极其简陋,用惯先进笔记的人,难以忍受
例如:VoiceNotes(网页/安卓/ios)
软件第五梯队
只有听写,没有自动润色,识别率高,或不是专门听写app
例如:ChatGPT app,Gemini app,Copilot app的语音对话模式
Obsidian上各种ai听写插件
软件第六梯队:只有听写,没有润色,识别率低
例如:搜狗,讯飞,百度,谷歌,微软语音输入法,讯飞语记,讯飞听见,微信留言转文字
ChatGPT app,Gemini app,Copilot app,claude app,元宝,豆包,文小言的语音留言模式

听写模型
听写第一梯队
4o-transcribe,elevenlabs-scribe
听写第二梯队
whisper-large-3,gemini-2.5-pro-Transcribe,4o-mini-transcribe,
听写第三梯队
whisper-medium本地,国产多模态模型,例如阿里
听写第四梯队
国产非多模态模型,搜狗,讯飞,百度等

润色模型
润色第一梯队
顶级推理模型,2.5pro(三万字+),claude4(三万字+),Grok4(实测一次输出17万字)
润色第二梯队
2.5flash(2万字+)
另有些模型,性能第一梯队,但限制输出1~4k字,字多容易缩写的,字少可以用:o3,o4mini,r1
润色第三梯队
推理模型关闭推理功能。
非推理模型deepseek3/4o/4.1,但限制输出1~4k字

附老外写的AI语音输入法对比表



docs.google.com





Definitive MacApp Comparisons

This Sheet is private












##近期我发的其他文章可以参考
语音模型2:🔥【原创长文】AI语音模型研究2:4o-transcribe vs whisper vs gemini-2.5 vs 搜狗讯飞的识别率实测,250716更新gemini和elevenlabs-scribe
语音模型1:🔥【原创长文】深度分析AI语音输入法CleverType,如何降维打击讯飞搜狗语音,成为你的效率利器【长期更新】

深度研究5:分享个提升Gemini/ChatGPT Deep research最大输出,以及查看ChatGPT Deep research剩余次数的方法
深度研究4:🔥【原创长文】O3 Deep research vs 2.5-pro Deep research
深度研究3:🔥【原创长文】让AI为你写有声书:基于Deep research+音频朗读的学习方法

大模型11:🔥【原创长文】关于Grok4,你想知道的一切。250716更新:LMArena评分,网页版支持语音,加入类似3d waifu
大模型10:🔥【原创长文】关于O3-pro,你想知道的一切,更新LiveBench评分【长期更新】
大模型9:🔥【原创长文】关于Deepseek R1-0528,你想知道的一切【250530更新LiveBench评分】
大模型8:🔥【原创长文】关于Claude4,你想知道的一切,250529更新Lmarena前端编程评分【长期更新】
大模型7:🔥【原创长文】关于Gemini 2.5 Flash,你想知道的一切。2.5-flash-0520Lmarena和长上下文评分【250525更新见底楼】
大模型6:🔥【原创长文】关于GPT-O3,O4-mini和4.1,你想知道的一切:250425:Lmarena评分出来了【长期更新】
大模型5:【原创长文】关于Gemini 2.5 Pro,你想知道的一切。2.5-pro-0605 Aider编程分数超过o3【更新见底楼】

其他:🔥【原创长文】顶级会员科普:ChatGPT Pro vs Gemini Ultra vs Claude Max vs SuperGrok Heavy
其他:🔥【原创长文】全网最全,中美AI相关社区汇总【长期更新】
其他:【原创长文】不要被官方参数骗了,各大模型实际长文输出能力测试研究【长期更新】
其他:【原创长文】Gemini-2.5-flash做沉浸式翻译的研究
其他:【ChatGPT】Sora画图 vs 4o画图,有什么区别,你知道吗?
其他:🔥【原创长文】关于免费和包月限量,你想知道的一切:ChatGPT Deep research限量翻倍【250518底楼更新】
其他:AI梗图大全,总有一张让你大笑,250410更新Llama梗图在底部【长期更新】
其他:《Deepseek时刻》原创长文,深度分析Deepseek这几天在全球到底发生了什么(1月28日17点40更新)
标题: 哪吒之魔童降世 (2019)【4K.REMUX UHD 原盘】【杜比视界 & 杜比全景声】【内封简繁英双语字幕】难道还有人没看过哪吒🤔
作者: #绿色演奏家
板块: #资源荟萃
编号: 833205
帖子: https://linux.do/t/topic/833205
时间: 2025-07-31 21:24:40
摘要:
pan.baidu.com





百度网盘 请输入提取码

百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固,支持教育网加速,支持手机端。注册使用百度网盘即可享受免费存储空间















pan.quark.cn





夸克网盘分享

夸克网盘是夸克推出的一款云服务产品,功能包括云存储、高清看剧、文件在线解压、PDF一键转换等。通过夸克网盘可随时随地管理和使用照片、文档、手机资料,目前支持Android、iOS、PC、iPad。
标题: 免费glm4.5,500刀
作者: #CNk Yuw
板块: #福利羊毛
编号: 833208
帖子: https://linux.do/t/topic/833208
时间: 2025-07-31 21:26:59
摘要:
如题
接口




voapi-latest-gf33.onrender.com





Veloera

OpenAI 接口聚合管理,支持多种渠道包括 Azure,可用于二次分发管理 key,仅单可执行文件,已打包好 Docker 镜像,一键部署,开箱即用












api key:sk-A0PKiWbF1tDwgt3bFlGBWE21NRKgjpAMRlKtjIcFy6Q5azMp
标题: 装修避坑指南+装修避坑资料包
作者: #tassel
板块: #资源荟萃
编号: 833213
帖子: https://linux.do/t/topic/833213
时间: 2025-07-31 21:28:59
摘要:
装修避坑指南+装修避坑资料包,包含实用装修避坑 装修小白 省钱避坑 视频教程和装修避坑文件包、资料包
链接:https://pan.quark.cn/s/7c1d538c8f62
链接:https://pan.xunlei.com/s/VOWVeuqXbfQIeQeRtcYX_qC_A1?pwd=5987#
标题: GPT也有一个月试用了?
作者: #Geng
板块: #搞七捻三
编号: 833214
帖子: https://linux.do/t/topic/833214
时间: 2025-07-31 21:29:07
摘要:
今天打开邮箱发现的,之前一直没买过 plus 


之前一直没听说过这个活动,不知道是要满足特定条件还是没开过plus的都有(我这个号已经用一年多了)
标题: 【前沿不知快不快讯】迅雷x已无
作者: #ctforc3
板块: #前沿快讯
编号: 833216
帖子: https://linux.do/t/topic/833216
时间: 2025-07-31 21:31:05
摘要:
这是图中公告内容的中文翻译:
抱歉
停服公告
由于业务战略调整,Thunder X 将于 2025年7月30日 24:00 (UTC+8) 永久停止服务。
如果您在2025年7月28日时仍持有有效的付费订阅,我们已将全额款项原路退还至您的支付账户。
spoiler
标题: 找个PackyCode合租
作者: #蔚蓝
板块: #搞七捻三
编号: 833217
帖子: https://linux.do/t/topic/833217
时间: 2025-07-31 21:31:46
摘要:
买了36刀档,每天额度100刀 还有31天 ,合租50刀额度。明盘 120,直接给key,超过当天删除 隔天再给key。自己查看 /cost 控制额度。
今天还有70刀 给10个佬们试试,看看实力,求个赞!!




cdk.linux.do





LINUX DO CDK

Linux Do 社区 CDK 快速分享平台 - 让分享变得更简单
标题: 我宣布:不爱夸克就爱天翼云盘
作者: #lking
板块: #搞七捻三
编号: 833218
帖子: https://linux.do/t/topic/833218
时间: 2025-07-31 21:31:55
摘要:
想着搞个夸克玩玩,但即使我坚持只在一个电脑登陆,即使只是偶尔用用(一个星期都难得用一次)
但验证两次后又要验证了
下载某影视速度只有几百k
于是切换到天翼云盘,下载速度二十来兆
标题: 二手MacBook Air翻车了
作者: #liu
板块: #搞七捻三
编号: 833220
帖子: https://linux.do/t/topic/833220
时间: 2025-07-31 21:33:07
摘要:
佬友们帮忙分析分析这合理吗?别的角度看都没太大问题,硬盘读写也几百g正常,还有多半年保修,就这个电池搞得太难受了,咋整啊,佬们帮帮忙
标题: 佬友们,vibe coding 用那个模型好一点呀
作者: #innocentshen
板块: #开发调优
编号: 833221
帖子: https://linux.do/t/topic/833221
时间: 2025-07-31 21:33:25
摘要:
准备整一个小型项目,前后端分离,后端数据调用云端数据库存取
用了cursor,ccr+gemini-2.5-pro 效果都不是很理想
想问问佬友们,我这个场景,就目前市面上来说那个组合或者软件是目前的最优解了?
标题: 求问佬们这是啥东西?
作者: #amojury
板块: #搞七捻三
编号: 833222
帖子: https://linux.do/t/topic/833222
时间: 2025-07-31 21:33:40
摘要:
新租的房,发现插在了路由器上,名字叫什么提速器
标题: B站食贫道充电视频【你好美国 Reaction】,美国人自己怎么看?【4K】
作者: #coop
板块: #资源荟萃
编号: 833226
帖子: https://linux.do/t/topic/833226
时间: 2025-07-31 21:37:56
摘要:
食贫道出品,看着还行,感兴趣的下方自取
【4k 】美国人自己怎么看?【你好美国 Reaction】.mp4
链接: https://pan.baidu.com/s/1lB7CACedSBrZHuydwGX8mg?pwd=6666 提取码: 6666
标题: 黑胶v7 258天会员
作者: #weiai987
板块: #福利羊毛
编号: 833234
帖子: https://linux.do/t/topic/833234
时间: 2025-07-31 21:41:09
摘要:
1http:/$VjQbau15d80f88$【復淛整段文案并咑閞「网易云音乐」,领免费会员】 黑胶邀请官 快***吧 送你网易云音乐会员卡,领取享20+会员权益。
标题: 如何获得领域专家称号?
作者: #TechnologyStar
板块: #搞七捻三
编号: 833235
帖子: https://linux.do/t/topic/833235
时间: 2025-07-31 21:41:51
摘要:
如何获得领域专家称号?
看到有一个请类别专家回应的按钮,这有啥用
标题: 求推荐相关书籍
作者: #misury
板块: #搞七捻三
编号: 833248
帖子: https://linux.do/t/topic/833248
时间: 2025-07-31 21:48:15
摘要:
rt
从去年读了《明朝那些事儿》之后,发现真的很难找到别的断代史同等质量的书籍了。
汉朝、唐朝、清朝。都去尝试读过《弃长安》、《问清:他们的清朝》、《趣说汉朝 407 年》。
有的书是围绕某件事情展开,
有的是类似于《万历十五年》,通过核心的几个人物来概括整个朝代,
有的是具备了有趣但网络词、抖机灵、主观评价太多,真的很难让人坚持读下去。
所以想让神通广大的佬友推荐一番相关书籍
标题: 今天就写了一个接口
作者: #yehuoshun
板块: #搞七捻三
编号: 833251
帖子: https://linux.do/t/topic/833251
时间: 2025-07-31 21:49:49
摘要:
后端 注释+换行一共120行
前端 140行
标题: 新的编程模型也许即将出现
作者: #ffep
板块: #开发调优
编号: 833252
帖子: https://linux.do/t/topic/833252
时间: 2025-07-31 21:50:10
摘要:
Deepseek 凭借在长上下文中的突破性创新赢得了 ACL 2025 最佳论文奖,基于此的模型可能很快就会出现
简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了11倍。更厉害的是,性能不仅没降反而还超越了传统的全注意力模型。
一作 袁境阳在会上发表演讲,透露这项技术可以 把上下文长度扩展到1百万tokens,将被应用到下一个前沿模型中。
结合论文发表于DeepSeek-R1推出之后,实验设置中也提到使用了DeepSeek-R1的蒸馏数据来微调了新的模型。
大家纷纷猜测,这项技术将被用于下一代DeepSeek-V4以及DeepSeek-R2。