LinuxDo 新帖推送
193 subscribers
256K photos
320K links
Download Telegram
标题: Gemini 3似乎在ASR(音频转字幕)方面反而退步了,佬友们有什么好的替代吗
作者: #Tairitsu
板块: #搞七捻三
编号: 1184954
帖子: https://linux.do/t/topic/1184954
时间: 2025-11-19 02:55:18
摘要:
gemini app/web上的是最离谱的,上传的.m4a音频(14分钟),来自这个视频,3.0pro能做到一点都没获取到,给我编了1分钟的字幕……
flash可以转录3分钟,但怎么调也做不到完全转录
aistudio上3.0pro生成同样有缺失,以及时间轴完全是错的

这个是之前gemini2.5pro(aistudio)生成的正确部分

结果因为76和79(这里的36)开头相似,3.0pro(aistudio)就错误的把两句当一句,把77和78两段直接忽略了(以及明显能看出时间错了)
spoiler
目前刚试的2.5pro也还是可以正确的:

不知道佬友们对此有什么招吗(
之前试过gpt grok claude都是不支持的,qwen是600秒以内支持,豆包是生成3分钟后面开始编,我之前装过whisperdesktop时间之类的感觉没大问题,但是没法生成日语英语混合的视频,以及读大段文字会直接摆烂变成这样:

不知道佬友们在这方面有什么招吗,目前2.5pro确实还能再用,但是想找一个更稳定最好可以本地部署的方案,最好是

能支持中英日语混合的
windows能用的
8gb显存4060能用的
读一长串文字不会像上面一样变成“reading text”的
标题: Gemini 3 Pro 模型卡的原文件 大伙来看看真假吧 ::
作者: #啊天
板块: #前沿快讯
编号: 1184955
帖子: https://linux.do/t/topic/1184955
时间: 2025-11-19 02:55:22
摘要:
Gemini-3-Pro-Model-Card.pdf (848.9 KB)
标题: Gemini 3 Pro 现已在 Github Copilot 中可用
作者: #星塔旅人
板块: #前沿快讯
编号: 1184964
帖子: https://linux.do/t/topic/1184964
时间: 2025-11-19 03:26:22
摘要:
VS Code 插件中可以使用 Gemini 3 Pro 了,倍率 1x,网页端似乎还没上





GitHub Docs





Hosting of models for GitHub Copilot Chat - GitHub Docs

Learn how different AI models are hosted for Copilot Chat.
标题: 哇,直连google
作者: #Yang9
板块: #搞七捻三
编号: 1184965
帖子: https://linux.do/t/topic/1184965
时间: 2025-11-19 03:29:20
摘要:
非代理这些,是直连,google没拉黑cn吗?之前linux被墙捣鼓了一个玩具,利用hosts,dns修改绕过sni,具体实现下次再说,局域网设备可以共享dns,基本因墙访问不了的都可以访问了
标题: gemini3.0的聊天能力已经超越了claude
作者: #MIKUSCAT
板块: #搞七捻三
编号: 1184971
帖子: https://linux.do/t/topic/1184971
时间: 2025-11-19 03:49:08
摘要:
以前我是最喜欢和claude聊天的,但是3.0出了以后,同样是问ATRI,它能分析的头头是道,关键是直接点出了核心问题:ATRI的心
很厉害,真的,语言风格也很棒
标题: 佬们,想要绑卡GCP,请问哪种方式能活得久一点。
作者: #pangkai
板块: #搞七捻三
编号: 1184972
帖子: https://linux.do/t/topic/1184972
时间: 2025-11-19 03:59:14
摘要:
目前已知的一是绑完之后去AIstudio建apikey,二是vertex导出json来用。
具体用途是几个朋友合用耍酒馆,所以肯定会有一些犯禁的内容。
想问一下哪种途径比较稳,不容易被封。
标题: 深夜睡不着胡思乱想一下
作者: #Meiko Mei
板块: #搞七捻三
编号: 1184977
帖子: https://linux.do/t/topic/1184977
时间: 2025-11-19 04:13:16
摘要:
之,如果天上掉下来200万RMB你接下来会做什么
标题: 谷歌永远的神!Antigravity的Sonnet4.5速度快的起飞!!
作者: #clggest
板块: #开发调优
编号: 1184978
帖子: https://linux.do/t/topic/1184978
时间: 2025-11-19 04:15:22
摘要:
比很多中转站蹬的都快多了!!
一毛钱没花又蹭起顶级模型了!!
感谢公益站大佬们!! 感谢谷歌!!!
标题: 哈基米3这速度真快啊,太舒服了
作者: #熊猫撒嘛
板块: #开发调优
编号: 1184986
帖子: https://linux.do/t/topic/1184986
时间: 2025-11-19 04:40:33
摘要:
比之前2.5那个狗吃shi的速度强多了佬友们
标题: 为什么我登录谷歌报400...
作者: #kitakira
板块: #搞七捻三
编号: 1184996
帖子: https://linux.do/t/topic/1184996
时间: 2025-11-19 05:20:07
摘要:
还想睡前玩一下antigravity的(
标题: GITHUB 挂了 我提交了半天...
作者: #zidan
板块: #搞七捻三
编号: 1185002
帖子: https://linux.do/t/topic/1185002
时间: 2025-11-19 05:37:19
摘要:
其他老有遇到吗
标题: Antigravity 进不去啊
作者: #Sen
板块: #搞七捻三
编号: 1185005
帖子: https://linux.do/t/topic/1185005
时间: 2025-11-19 05:41:47
摘要:
标题: Gemini 3 pro high在livebench上拿下榜一
作者: #lueluelue
板块: #前沿快讯
编号: 1185006
帖子: https://linux.do/t/topic/1185006
时间: 2025-11-19 05:58:32
摘要:
livebench的题真该更新更新了
标题: 我怎麼覺的 Augment 越來越難用
作者: #JayHsu
板块: #开发调优
编号: 1185010
帖子: https://linux.do/t/topic/1185010
时间: 2025-11-19 06:13:18
摘要:
最近使用起來越來越慢
sonnet 4 4.5 也跟弱智一樣
現在都沒有比較正常的ai開發了嘛 很想退訂 花錢找罪受
感覺它故意讓它變智障 然後回覆一堆垃圾東西浪費你的 token
标题: Gemini 3 Pro Preview 发布第一天教你如何辨别 API 真假思考预算
作者: #purr
板块: #开发调优
编号: 1185011
帖子: https://linux.do/t/topic/1185011
时间: 2025-11-19 06:18:36
摘要:
老prompt新用
还记得这个吧
Drawing letters "LaTeX", using ASCII art
Note the upper and lower case
Note that the result must be wrapped in a code box

这么多年过去了 Gemini 依旧不会 ASCII
temperature=0.65
在Low预算的情况下
经过测试 大约只有 1/10 的情况能够画出正常的 LaTeX 其他时间都是乱花
并且是秒出 基本 < 5s 的思考时间
在High预算的情况下
不仅会有大约20-40s的思考过程
而且目前是100%画出准确的 LaTeX
可能难看 但字母是正确的
欢迎测试
没测Gemini app
只测了API

如果问为什么不直接看思考时间 那是没见过真正的黑心商家 (手动增加超时时间)
标题: 【水】凑热闹,对Gemini 3 Pro Preview的小测试(测试题目:文字加解密工具)
作者: #弦塔_
板块: #搞七捻三
编号: 1185017
帖子: https://linux.do/t/topic/1185017
时间: 2025-11-19 06:36:58
摘要:
是的还是我经常拿来测试的一个啸题目()
不过我改了一下提示词:

请帮我编写一个小程序:
要求:任意的 UTF-8 字符输入程序后,都可以得到密文和密钥,密文和密钥均由简体中文构成。
该程序需要同时提供加解密功能,并可以根据输出的密文和密钥正确的解密。
该程序需要有供用户操作的图形化页面
优先以单html文件的格式输出。


效果如何自行评判吧~
示例文本,方便复制:
秘钥测试 123 ABC: こんにちは!The quick brown fox jumps over the lazy dog. 吾輩は猫である。🚀🎉 こんにちは、世界!$#@%^&*()_+=-~[]\{}|;':",./<>?
标题: 好好好cf挂完gihub挂,下一个轮到谁了?
作者: #陈纶
板块: #搞七捻三
编号: 1185018
帖子: https://linux.do/t/topic/1185018
时间: 2025-11-19 06:39:49
摘要:
离谱他妈给离谱开门,离谱到家了?
标题: 第一次发帖,vibe code 并开源了一个优雅美丽的学术个人网站模板
作者: #Joey
板块: #搞七捻三
编号: 1185019
帖子: https://linux.do/t/topic/1185019
时间: 2025-11-19 06:40:09
摘要:
高校老师和学生们现在做的个人学术网站大多都基于 Jeklly / Hexo,模板大都风格相似,也不够响应式、美丽和优雅
因此,花了几天摸鱼的时间,和 AI 一起写了一个更现代、更优雅的学术个人主页模板,重点放在了交互细节和视觉呈现,具体在:



使用 Next.js 从零构建,精心设计的颜色、布局和字体。


全站集成 Framer Motion 动画。鼠标的每一次悬停、页面的每一次切换,都有细腻流畅的过渡效果。没有生硬的闪烁,只有行云流水的浏览体验。


原生支持 BibTex,只需要粘贴 bib 文件即可自动解析论文列表。集成搜索、筛选和引用生成。


无需更改核心代码,只需要依葫芦画瓢使用 TOML 和 md 文件创建和修改页面,就能获得和 demo 一样漂亮的网站。


Next.js + Tailwind,站在巨人的肩膀上,性能极佳,SEO 友好,原生支持动画,并且输出纯静态网页,可以部署在任何地方。


项目完全免费和开源,采用 MIT 许可证:
Github 链接:GitHub - xyjoey/PRISM: An Elegant Academic Homepage Builder
演示(电脑效果更佳):https://prism-demo.pages.dev/
欢迎大家 star