标题: Gemini 3 Flash 视觉测试,和 3 Pro 几乎同一水平
作者: #Mozi
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1310535
时间: 2025-12-14 15:20:21
摘要:
作者: #Mozi
板块: #开发调优
编号:
1310535帖子: https://linux.do/t/topic/1310535
时间: 2025-12-14 15:20:21
摘要:
【Wiki】语言模型区分题库:从文本到多模态
文档共建
模型区分题库(逻辑类)
模型区分题库(逻辑类)
知识储备类题库
知识储备类题库
识图能力测试
识图题库
脑筋急转弯
脑筋急转弯
Code
Code
工具调用
工具调用题库
幻觉
幻觉
ASR 能力
ASR 能力测试
开放 Wiki编辑建议
开放 Wiki,大家…
序号
问题 / 初始素材
状态
推理过程 & 结果截图
1
2
3
4
5
6
7
8
9
10
11
12
标题: 0.5和0.50一样吗?
作者: #神墨
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310546
时间: 2025-12-14 15:24:08
摘要:
作者: #神墨
板块: #搞七捻三
编号:
1310546帖子: https://linux.do/t/topic/1310546
时间: 2025-12-14 15:24:08
摘要:
标题: 记薄荷站第一次大奖
作者: #Adgg
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310547
时间: 2025-12-14 15:24:08
摘要:
作者: #Adgg
板块: #搞七捻三
编号:
1310547帖子: https://linux.do/t/topic/1310547
时间: 2025-12-14 15:24:08
摘要:
标题: 推一下,ai feedback打断工具 ,vsc插件版(功能如寸止,interactive-feedback-mcp)
作者: #justindoit
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1310558
时间: 2025-12-14 15:25:58
摘要:
作者: #justindoit
板块: #开发调优
编号:
1310558帖子: https://linux.do/t/topic/1310558
时间: 2025-12-14 15:25:58
摘要:
github.com
GitHub - fhyfhy17/panel-feedback: IDE embedded AI feedback panel - A better...
IDE embedded AI feedback panel - A better alternative to pop-up dialogs
插件版, 自己测试了macos 版的 windsurf和cursor,理论上就是个vsc插件,windows应该也能没,没测试过。
右边用ai,左边聊天,感觉场景挺流畅的。
还在优化中,有啥问题找我反馈啊,
还有我想做个功能,就是不在当前界面时,回复时,windsurf dock图标能跳动,因为不太会编程。。。ai两天没搞定 哈哈
标题: Gemini business最近频繁出现回答失败
作者: #Jack X
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310559
时间: 2025-12-14 15:26:00
摘要:
作者: #Jack X
板块: #搞七捻三
编号:
1310559帖子: https://linux.do/t/topic/1310559
时间: 2025-12-14 15:26:00
摘要:
目前原因不明,包括我在内部分车队成员无论问什么,切换节点,都会回答“回答您的问题时出错,请稍后重试”
标题: 各位佬友,我想搞个gpt team车位抽奖,应该如何弄?
作者: #wucd2023
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310589
时间: 2025-12-14 15:32:31
摘要:
作者: #wucd2023
板块: #搞七捻三
编号:
1310589帖子: https://linux.do/t/topic/1310589
时间: 2025-12-14 15:32:31
摘要:
rt,第一次搞抽奖,请教下如何弄?谢谢佬友!
标题: CC 中站里面哪家性价比最高呢
作者: #unclezs
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1310595
时间: 2025-12-14 15:33:45
摘要:
作者: #unclezs
板块: #开发调优
编号:
1310595帖子: https://linux.do/t/topic/1310595
时间: 2025-12-14 15:33:45
摘要:
最近觉得 opus4.5 用着实在是太舒适了,想找个比较合适的中转付费用用,不知道各位佬有没有在用的推荐推荐
标题: 不是 你真薅我啊?
作者: #Sanyela
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310599
时间: 2025-12-14 15:34:40
摘要:
作者: #Sanyela
板块: #搞七捻三
编号:
1310599帖子: https://linux.do/t/topic/1310599
时间: 2025-12-14 15:34:40
摘要:
你这批量注册真以为我查不到嘛
标题: oiioii这个产品,我觉得,就是我们自己做自己动漫的时候,在搭配suno就是一部动漫!
作者: #方盾CHEN
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310604
时间: 2025-12-14 15:37:00
摘要:
作者: #方盾CHEN
板块: #搞七捻三
编号:
1310604帖子: https://linux.do/t/topic/1310604
时间: 2025-12-14 15:37:00
摘要:
这两天要不是因为积分限制,我都可以做一个动漫了,国内动漫反正现在重要剧情也就五六分钟。
suno音乐制作主题曲,就是一个人人当导演的时代,有一些镜头花时间去抽奖,抽不出来删除重新生成即可。我今天分享了100多个激活码,明天社区就会有最少1000的分裂激活码,我的目的达到了也就不在发了。
加油未来的导演们,这个就是一次机会,在目前失业潮和副业之间这个就是机会
标题: 目前使用codex5.2和opus4.5的习惯
作者: #Imaxwel
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310607
时间: 2025-12-14 15:37:18
摘要:
作者: #Imaxwel
板块: #搞七捻三
编号:
1310607帖子: https://linux.do/t/topic/1310607
时间: 2025-12-14 15:37:18
摘要:
codex5.2 xhigh实在是太慢了,一个小rpa项目全局日志重构,动不动就给你搞27分钟,现在每次只在吃饭上桌前或者上洗手间之前把提示词准备好敲下去。其他时候vibe coding都是用OPus 4.5了
话说论坛佬友指路薅的kiro pro+的本月2500额度的调用太耐用了,根本用不完
感觉Codex的好处是考虑比较全面,一般需要全面修改的时候,才用codex,不得不等结果的时候就刷一会儿各大论坛等结果。
标题: 用了10年的显示器才发现要用DP线
作者: #ytsingshao
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310629
时间: 2025-12-14 15:42:04
摘要:
作者: #ytsingshao
板块: #搞七捻三
编号:
1310629帖子: https://linux.do/t/topic/1310629
时间: 2025-12-14 15:42:04
摘要:
当年买了个4K显示器就一直插着HDMI线,开高分辨率就一直感觉卡卡的,潜意识认为显卡分辨率过高显卡吃不消,慢慢的,显卡也从980到了3060,问题依旧,常年开着2K分辨率倒也相安无事。
前两天显示器突然泛白,排查一遍确认显示器问题,准备换掉,鬼使神差查询该显示器优缺点,被告知高分辨率只支持DP线,于是接上之后,丝滑的世界重新向我打开了大门,妈耶
这和插在集显没啥区别了…
人果然无法触及理解之外的东西,思考的惯性真可怕。
标题: 除了中国与美国其他国家的大模型怎么样?
作者: #猫大
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310635
时间: 2025-12-14 15:43:05
摘要:
作者: #猫大
板块: #搞七捻三
编号:
1310635帖子: https://linux.do/t/topic/1310635
时间: 2025-12-14 15:43:05
摘要:
总是看见国内的一些大模型和美国的一些大模型,其他国家的好像很少看见
标题: 学校搞得gpt5.2体验点 好抽象呀
作者: #辉夜姬
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310649
时间: 2025-12-14 15:45:32
摘要:
作者: #辉夜姬
板块: #搞七捻三
编号:
1310649帖子: https://linux.do/t/topic/1310649
时间: 2025-12-14 15:45:32
摘要:
标题: 说实话,我想不到这场AI军备竞赛中谷歌输的理由...
作者: #木瓜蛋白酶Tea🎋
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1310650
时间: 2025-12-14 15:45:49
摘要:
作者: #木瓜蛋白酶Tea🎋
板块: #搞七捻三
编号:
1310650帖子: https://linux.do/t/topic/1310650
时间: 2025-12-14 15:45:49
摘要:
模型层:有目前第一梯队的多模态闭源模型和开源模型,在生物学领域也是近乎垄断的AlphaFold
应用层:谷歌全家桶、搜索引擎、AndroidOS。google已经接入了AI overviews
数据来源和用户来源:目前访问量最大的网站,google.com 和 youtube.com,移动端操作系统AndroidOS
带宽费用:谷歌提前购买了大量的暗光纤,带宽成本近乎为零
硬件层:连openai都来租用的TPU集群算力,训练超大模型的最佳选择,不依赖英伟达
…(其他待补充)
标题: antigravity 配合chrome agent 前端开发是独一档
作者: #devinfan
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1310658
时间: 2025-12-14 15:46:36
摘要:
作者: #devinfan
板块: #开发调优
编号:
1310658帖子: https://linux.do/t/topic/1310658
时间: 2025-12-14 15:46:36
摘要:
最近做一个项目的重构,发现可以配合chrome 的antigravity 插件,反重力可以直接操作chrome 实时查看修改的结果,这一点太牛了。
之前codex和claude 修改前端的显示style或者ui 的具体布局还是会摸不到头脑,现在gemini-3 可以直接截图,查看UI显示,然后反馈修改。太牛了
标题: 关于小程序开发未来如何快速转成android、ios甚至是鸿蒙
作者: #javaStudy
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1310672
时间: 2025-12-14 15:48:34
摘要:
作者: #javaStudy
板块: #开发调优
编号:
1310672帖子: https://linux.do/t/topic/1310672
时间: 2025-12-14 15:48:34
摘要:
目前有项目做的小程序,没有做原生的android、ios,主要还是考虑成本问题;
后面如果要做原生的,有什么快速的方式生成嘛,大老板给点实际经验
标题: 我开源了一个智能OCR工具:"不止于识别,更懂内容"
作者: #xstongxue
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1310705
时间: 2025-12-14 15:57:11
摘要:
作者: #xstongxue
板块: #资源荟萃
编号:
1310705帖子: https://linux.do/t/topic/1310705
时间: 2025-12-14 15:57:11
摘要:
为什么我们需要一个新的OCR工具?
在数字化时代,我们每天都在与各种文字打交道:扫描文档、截图内容、手写笔记、表格数据…
传统的 OCR 工具虽然能识别文字,但往往只是"看到"而不能"理解"。
想象一下这样的场景:
你需要从截图中快速提取各种类型(表格/手写体等)图片的内容
你遇到一张外文图片,想要翻译的同时保持原有的格式和语境
你拍了一张复杂的财务报表,不仅想提取文字,还想让AI帮你分析数据趋势
你有一份手写的会议记录,希望不仅转成文字,还能自动整理成结构化的会议纪要
这就是 XS-VLM-OCR 诞生的原因——我们不只是在做OCR,而是在构建一个智能视觉语言理解系统。
不只是识别,更是理解
多模型智能引擎
Qwen-VL系列:阿里云全系列视觉语言模型,支持Qwen-VL-Plus/Max/235B-VL等
GLM-4V系列:智谱AI的多模态大模型,支持GLM-4.5V/4.6V
PaddleOCR-VL:百度飞桨OCR-VL系列,支持PaddleOCR-VL
自定义适配器:支持接入任何与 OpenAPI 兼容的多模态大模型
Tesseract离线:经典 OCR 引擎,无网络依赖
智能提示词系统
内置丰富的提示词模板,让 AI 真正理解你的需求:
识别类提示词
通用识别:请识别图片中的所有文字内容,保持原有格式
表格识别:请将图片中的表格转换为Markdown格式
公式识别:请识别图片中的数学公式,输出LaTeX格式
手写识别:请识别手写文字,注意字迹模糊的部分
证件识别:请提取身份证/护照等证件的关键信息
翻译类提示词
中英互译:请将图片中的文字翻译成中文/英文
多语言翻译:请识别语言并翻译成目标语言
保持格式翻译:翻译时保持原有的排版和格式
专业术语翻译:这是技术文档,请注意专业术语的准确性
解答类提示词
题目解答:这是一道数学/物理题,请给出详细解答过程
代码解释:请解释这段代码的功能和逻辑
图表分析:请分析图表数据并总结关键趋势
文档总结:请总结文档的核心内容和要点
整理类提示词
结构化输出:请将内容整理成JSON
标题: newapi可以重试掉报错的,但是空回怎么办?
作者: #谢谢不吃香菜
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1310711
时间: 2025-12-14 15:59:46
摘要:
作者: #谢谢不吃香菜
板块: #开发调优
编号:
1310711帖子: https://linux.do/t/topic/1310711
时间: 2025-12-14 15:59:46
摘要:
如题,莫名其妙空回。。。从那个。使用日志可以看出来是空回的