LinuxDo 新帖推送

标题: Gemini 3 Flash 视觉测试，和 3 Pro 几乎同一水平
作者: #Mozi
板块: #开发调优
编号: 1310535
帖子: https://linux.do/t/topic/1310535
时间: 2025-12-14 15:20:21
摘要:

【Wiki】语言模型区分题库：从文本到多模态 
  

文档共建
    
  
  
     模型区分题库（逻辑类）
 
模型区分题库（逻辑类）

 知识储备类题库
 
知识储备类题库

 识图能力测试
 
识图题库

 脑筋急转弯
 
脑筋急转弯

 Code
 
Code
 工具调用
 工具调用题库
 幻觉
 
幻觉
 ASR 能力
 ASR 能力测试


开放 Wiki编辑建议
开放 Wiki，大家…
  






序号
问题 / 初始素材
状态
推理过程 & 结果截图




1


  


2





3





4





5





6





7





8





9





10





11





12

2 views07:21

LinuxDo 新帖推送

标题: 0.5和0.50一样吗？
作者: #神墨
板块: #搞七捻三
编号: 1310546
帖子: https://linux.do/t/topic/1310546
时间: 2025-12-14 15:24:08
摘要:

1 view07:24

LinuxDo 新帖推送

标题: 记薄荷站第一次大奖
作者: #Adgg
板块: #搞七捻三
编号: 1310547
帖子: https://linux.do/t/topic/1310547
时间: 2025-12-14 15:24:08
摘要:

1 view07:24

LinuxDo 新帖推送

标题: 推一下，ai feedback打断工具，vsc插件版（功能如寸止，interactive-feedback-mcp）
作者: #justindoit
板块: #开发调优
编号: 1310558
帖子: https://linux.do/t/topic/1310558
时间: 2025-12-14 15:25:58
摘要:

github.com
  

  
    
  

  GitHub - fhyfhy17/panel-feedback: IDE embedded AI feedback panel - A better...

    IDE embedded AI feedback panel - A better alternative to pop-up dialogs


  

  
    
    
  

  


插件版， 自己测试了macos 版的 windsurf和cursor，理论上就是个vsc插件，windows应该也能没，没测试过。
右边用ai，左边聊天，感觉场景挺流畅的。
还在优化中，有啥问题找我反馈啊，
还有我想做个功能，就是不在当前界面时，回复时，windsurf  dock图标能跳动，因为不太会编程。。。ai两天没搞定 哈哈

1 view07:26

LinuxDo 新帖推送

标题: Gemini business最近频繁出现回答失败
作者: #Jack X
板块: #搞七捻三
编号: 1310559
帖子: https://linux.do/t/topic/1310559
时间: 2025-12-14 15:26:00
摘要:

目前原因不明，包括我在内部分车队成员无论问什么，切换节点，都会回答“回答您的问题时出错，请稍后重试”

1 view07:26

LinuxDo 新帖推送

标题: 各位佬友，我想搞个gpt team车位抽奖，应该如何弄？
作者: #wucd2023
板块: #搞七捻三
编号: 1310589
帖子: https://linux.do/t/topic/1310589
时间: 2025-12-14 15:32:31
摘要:

rt，第一次搞抽奖，请教下如何弄？谢谢佬友！

2 views07:34

LinuxDo 新帖推送

标题: CC 中站里面哪家性价比最高呢
作者: #unclezs
板块: #开发调优
编号: 1310595
帖子: https://linux.do/t/topic/1310595
时间: 2025-12-14 15:33:45
摘要:

最近觉得 opus4.5 用着实在是太舒适了，想找个比较合适的中转付费用用，不知道各位佬有没有在用的推荐推荐

2 views07:34

LinuxDo 新帖推送

标题: 不是你真薅我啊？
作者: #Sanyela
板块: #搞七捻三
编号: 1310599
帖子: https://linux.do/t/topic/1310599
时间: 2025-12-14 15:34:40
摘要:

你这批量注册真以为我查不到嘛

2 views07:36

LinuxDo 新帖推送

标题: oiioii这个产品，我觉得，就是我们自己做自己动漫的时候，在搭配suno就是一部动漫！
作者: #方盾CHEN
板块: #搞七捻三
编号: 1310604
帖子: https://linux.do/t/topic/1310604
时间: 2025-12-14 15:37:00
摘要:

这两天要不是因为积分限制，我都可以做一个动漫了，国内动漫反正现在重要剧情也就五六分钟。
suno音乐制作主题曲，就是一个人人当导演的时代，有一些镜头花时间去抽奖，抽不出来删除重新生成即可。我今天分享了100多个激活码，明天社区就会有最少1000的分裂激活码，我的目的达到了也就不在发了。
加油未来的导演们，这个就是一次机会，在目前失业潮和副业之间这个就是机会

2 views07:39

LinuxDo 新帖推送

标题: 目前使用codex5.2和opus4.5的习惯
作者: #Imaxwel
板块: #搞七捻三
编号: 1310607
帖子: https://linux.do/t/topic/1310607
时间: 2025-12-14 15:37:18
摘要:

codex5.2 xhigh实在是太慢了，一个小rpa项目全局日志重构，动不动就给你搞27分钟，现在每次只在吃饭上桌前或者上洗手间之前把提示词准备好敲下去。其他时候vibe coding都是用OPus 4.5了 
话说论坛佬友指路薅的kiro pro+的本月2500额度的调用太耐用了，根本用不完
感觉Codex的好处是考虑比较全面，一般需要全面修改的时候，才用codex，不得不等结果的时候就刷一会儿各大论坛等结果。

2 views07:39

LinuxDo 新帖推送

标题: 用了10年的显示器才发现要用DP线
作者: #ytsingshao
板块: #搞七捻三
编号: 1310629
帖子: https://linux.do/t/topic/1310629
时间: 2025-12-14 15:42:04
摘要:

当年买了个4K显示器就一直插着HDMI线，开高分辨率就一直感觉卡卡的，潜意识认为显卡分辨率过高显卡吃不消，慢慢的，显卡也从980到了3060，问题依旧，常年开着2K分辨率倒也相安无事。
前两天显示器突然泛白，排查一遍确认显示器问题，准备换掉，鬼使神差查询该显示器优缺点，被告知高分辨率只支持DP线，于是接上之后，丝滑的世界重新向我打开了大门，妈耶
这和插在集显没啥区别了…
人果然无法触及理解之外的东西，思考的惯性真可怕。

2 views07:43

LinuxDo 新帖推送

标题: 除了中国与美国其他国家的大模型怎么样?
作者: #猫大
板块: #搞七捻三
编号: 1310635
帖子: https://linux.do/t/topic/1310635
时间: 2025-12-14 15:43:05
摘要:

总是看见国内的一些大模型和美国的一些大模型，其他国家的好像很少看见

2 views07:43

LinuxDo 新帖推送

标题: 学校搞得gpt5.2体验点好抽象呀
作者: #辉夜姬
板块: #搞七捻三
编号: 1310649
帖子: https://linux.do/t/topic/1310649
时间: 2025-12-14 15:45:32
摘要:

2 views07:46

LinuxDo 新帖推送

标题: 说实话，我想不到这场AI军备竞赛中谷歌输的理由...
作者: #木瓜蛋白酶Tea🎋
板块: #搞七捻三
编号: 1310650
帖子: https://linux.do/t/topic/1310650
时间: 2025-12-14 15:45:49
摘要:

模型层：有目前第一梯队的多模态闭源模型和开源模型，在生物学领域也是近乎垄断的AlphaFold
应用层：谷歌全家桶、搜索引擎、AndroidOS。google已经接入了AI overviews
数据来源和用户来源：目前访问量最大的网站，google.com 和 youtube.com，移动端操作系统AndroidOS
带宽费用：谷歌提前购买了大量的暗光纤，带宽成本近乎为零
硬件层：连openai都来租用的TPU集群算力，训练超大模型的最佳选择，不依赖英伟达
…（其他待补充）

2 views07:46

LinuxDo 新帖推送

标题: antigravity 配合chrome agent 前端开发是独一档
作者: #devinfan
板块: #开发调优
编号: 1310658
帖子: https://linux.do/t/topic/1310658
时间: 2025-12-14 15:46:36
摘要:

最近做一个项目的重构，发现可以配合chrome 的antigravity 插件，反重力可以直接操作chrome 实时查看修改的结果，这一点太牛了。
之前codex和claude 修改前端的显示style或者ui 的具体布局还是会摸不到头脑，现在gemini-3 可以直接截图，查看UI显示，然后反馈修改。太牛了

2 views07:49

LinuxDo 新帖推送

标题: 关于小程序开发未来如何快速转成android、ios甚至是鸿蒙
作者: #javaStudy
板块: #开发调优
编号: 1310672
帖子: https://linux.do/t/topic/1310672
时间: 2025-12-14 15:48:34
摘要:

目前有项目做的小程序，没有做原生的android、ios，主要还是考虑成本问题；
后面如果要做原生的，有什么快速的方式生成嘛，大老板给点实际经验

2 views07:49

LinuxDo 新帖推送

标题: 我开源了一个智能OCR工具："不止于识别，更懂内容"
作者: #xstongxue
板块: #资源荟萃
编号: 1310705
帖子: https://linux.do/t/topic/1310705
时间: 2025-12-14 15:57:11
摘要:

为什么我们需要一个新的OCR工具？
在数字化时代，我们每天都在与各种文字打交道：扫描文档、截图内容、手写笔记、表格数据…
传统的 OCR 工具虽然能识别文字，但往往只是"看到"而不能"理解"。
想象一下这样的场景：


你需要从截图中快速提取各种类型(表格/手写体等)图片的内容
你遇到一张外文图片，想要翻译的同时保持原有的格式和语境
你拍了一张复杂的财务报表，不仅想提取文字，还想让AI帮你分析数据趋势
你有一份手写的会议记录，希望不仅转成文字，还能自动整理成结构化的会议纪要


这就是 XS-VLM-OCR 诞生的原因——我们不只是在做OCR，而是在构建一个智能视觉语言理解系统。
不只是识别，更是理解
多模型智能引擎


Qwen-VL系列：阿里云全系列视觉语言模型，支持Qwen-VL-Plus/Max/235B-VL等
GLM-4V系列：智谱AI的多模态大模型，支持GLM-4.5V/4.6V
PaddleOCR-VL：百度飞桨OCR-VL系列，支持PaddleOCR-VL
自定义适配器：支持接入任何与 OpenAPI 兼容的多模态大模型
Tesseract离线：经典 OCR 引擎，无网络依赖


智能提示词系统
内置丰富的提示词模板，让 AI 真正理解你的需求：
识别类提示词
通用识别：请识别图片中的所有文字内容，保持原有格式
表格识别：请将图片中的表格转换为Markdown格式
公式识别：请识别图片中的数学公式，输出LaTeX格式
手写识别：请识别手写文字，注意字迹模糊的部分
证件识别：请提取身份证/护照等证件的关键信息

翻译类提示词
中英互译：请将图片中的文字翻译成中文/英文
多语言翻译：请识别语言并翻译成目标语言
保持格式翻译：翻译时保持原有的排版和格式
专业术语翻译：这是技术文档，请注意专业术语的准确性

解答类提示词
题目解答：这是一道数学/物理题，请给出详细解答过程
代码解释：请解释这段代码的功能和逻辑
图表分析：请分析图表数据并总结关键趋势
文档总结：请总结文档的核心内容和要点

整理类提示词
结构化输出：请将内容整理成JSON

1 view07:59

LinuxDo 新帖推送

标题: newapi可以重试掉报错的，但是空回怎么办？
作者: #谢谢不吃香菜
板块: #开发调优
编号: 1310711
帖子: https://linux.do/t/topic/1310711
时间: 2025-12-14 15:59:46
摘要:

如题，莫名其妙空回。。。从那个。使用日志可以看出来是空回的

1 view08:02

About

Blog

Apps

Platform