LinuxDo 新帖推送
179 subscribers
249K photos
310K links
Download Telegram
标题: 除了中国与美国其他国家的大模型怎么样?
作者: #猫大
板块: #搞七捻三
编号: 1310635
帖子: https://linux.do/t/topic/1310635
时间: 2025-12-14 15:43:05
摘要:
总是看见国内的一些大模型和美国的一些大模型,其他国家的好像很少看见
标题: 学校搞得gpt5.2体验点 好抽象呀
作者: #辉夜姬
板块: #搞七捻三
编号: 1310649
帖子: https://linux.do/t/topic/1310649
时间: 2025-12-14 15:45:32
摘要:
标题: 说实话,我想不到这场AI军备竞赛中谷歌输的理由...
作者: #木瓜蛋白酶Tea🎋
板块: #搞七捻三
编号: 1310650
帖子: https://linux.do/t/topic/1310650
时间: 2025-12-14 15:45:49
摘要:
模型层:有目前第一梯队的多模态闭源模型和开源模型,在生物学领域也是近乎垄断的AlphaFold
应用层:谷歌全家桶、搜索引擎、AndroidOS。google已经接入了AI overviews
数据来源和用户来源:目前访问量最大的网站,google.com 和 youtube.com,移动端操作系统AndroidOS
带宽费用:谷歌提前购买了大量的暗光纤,带宽成本近乎为零
硬件层:连openai都来租用的TPU集群算力,训练超大模型的最佳选择,不依赖英伟达
…(其他待补充)
标题: antigravity 配合chrome agent 前端开发是独一档
作者: #devinfan
板块: #开发调优
编号: 1310658
帖子: https://linux.do/t/topic/1310658
时间: 2025-12-14 15:46:36
摘要:
最近做一个项目的重构,发现可以配合chrome 的antigravity 插件,反重力可以直接操作chrome 实时查看修改的结果,这一点太牛了。
之前codex和claude 修改前端的显示style或者ui 的具体布局还是会摸不到头脑,现在gemini-3 可以直接截图,查看UI显示,然后反馈修改。太牛了
标题: 关于小程序开发未来如何快速转成android、ios甚至是鸿蒙
作者: #javaStudy
板块: #开发调优
编号: 1310672
帖子: https://linux.do/t/topic/1310672
时间: 2025-12-14 15:48:34
摘要:
目前有项目做的小程序,没有做原生的android、ios,主要还是考虑成本问题;
后面如果要做原生的,有什么快速的方式生成嘛,大老板给点实际经验
标题: 我开源了一个智能OCR工具:"不止于识别,更懂内容"
作者: #xstongxue
板块: #资源荟萃
编号: 1310705
帖子: https://linux.do/t/topic/1310705
时间: 2025-12-14 15:57:11
摘要:
为什么我们需要一个新的OCR工具?
在数字化时代,我们每天都在与各种文字打交道:扫描文档、截图内容、手写笔记、表格数据…
传统的 OCR 工具虽然能识别文字,但往往只是"看到"而不能"理解"。
想象一下这样的场景:


你需要从截图中快速提取各种类型(表格/手写体等)图片的内容
你遇到一张外文图片,想要翻译的同时保持原有的格式和语境
你拍了一张复杂的财务报表,不仅想提取文字,还想让AI帮你分析数据趋势
你有一份手写的会议记录,希望不仅转成文字,还能自动整理成结构化的会议纪要


这就是 XS-VLM-OCR 诞生的原因——我们不只是在做OCR,而是在构建一个智能视觉语言理解系统。
不只是识别,更是理解
多模型智能引擎


Qwen-VL系列:阿里云全系列视觉语言模型,支持Qwen-VL-Plus/Max/235B-VL等
GLM-4V系列:智谱AI的多模态大模型,支持GLM-4.5V/4.6V
PaddleOCR-VL:百度飞桨OCR-VL系列,支持PaddleOCR-VL
自定义适配器:支持接入任何与 OpenAPI 兼容的多模态大模型
Tesseract离线:经典 OCR 引擎,无网络依赖


智能提示词系统
内置丰富的提示词模板,让 AI 真正理解你的需求:
识别类提示词
通用识别:请识别图片中的所有文字内容,保持原有格式
表格识别:请将图片中的表格转换为Markdown格式
公式识别:请识别图片中的数学公式,输出LaTeX格式
手写识别:请识别手写文字,注意字迹模糊的部分
证件识别:请提取身份证/护照等证件的关键信息

翻译类提示词
中英互译:请将图片中的文字翻译成中文/英文
多语言翻译:请识别语言并翻译成目标语言
保持格式翻译:翻译时保持原有的排版和格式
专业术语翻译:这是技术文档,请注意专业术语的准确性

解答类提示词
题目解答:这是一道数学/物理题,请给出详细解答过程
代码解释:请解释这段代码的功能和逻辑
图表分析:请分析图表数据并总结关键趋势
文档总结:请总结文档的核心内容和要点

整理类提示词
结构化输出:请将内容整理成JSON
标题: newapi可以重试掉报错的,但是空回怎么办?
作者: #谢谢不吃香菜
板块: #开发调优
编号: 1310711
帖子: https://linux.do/t/topic/1310711
时间: 2025-12-14 15:59:46
摘要:
如题,莫名其妙空回。。。从那个。使用日志可以看出来是空回的
标题: 哈基米写代码 TW,HK 竟然默认是国家
作者: #admln
板块: #搞七捻三
编号: 1310728
帖子: https://linux.do/t/topic/1310728
时间: 2025-12-14 16:03:23
摘要:
标题: (依旧免费谷歌注册)喵喵公益站下午放送。
作者: #忆冰Yibing
板块: #搞七捻三
编号: 1310738
帖子: https://linux.do/t/topic/1310738
时间: 2025-12-14 16:06:32
摘要:
没有谷歌账号但是又不想买或者自己注册遇到发验证码问题的佬友们,不要再浪费号码验证次数了,快点来喵喵站,直接上手就能登录,喵。
如果你的手机号码已经提示无法使用或者次数过多,请借用身边人的手机号码,喵喵这里只要能发验证码,佬友们很大概率能收到,私信喵喵**(邮箱名)+(昵称)+(密码)+(手机号码)**排队创建先到先得哦
标题: 我恨你Nextjs
作者: #多玩幻灵qwq
板块: #搞七捻三
编号: 1310750
帖子: https://linux.do/t/topic/1310750
时间: 2025-12-14 16:08:37
摘要:
Vibe coding 的时候挎挎往上堆,成型速度超级快
近一周看下来人傻了,一堆服务全部中招
CVE-2025-66478 (critical)
CVE-2025-55184 (high)
CVE-2025-55183 (medium)
CVE-2025-67779 (high)
全中
一个月只放半天我还得摁着脑袋修
我在学校都得找机会摸电脑修
我操了
标题: chatgpt 可以用apple 的礼品卡支付吗?
作者: #CaroLe
板块: #搞七捻三
编号: 1310752
帖子: https://linux.do/t/topic/1310752
时间: 2025-12-14 16:08:53
摘要:
chatgpt 可以用apple 的礼品卡支付吗?
标题: 豆包ai的播客功能
作者: #雅舍谈吃
板块: #搞七捻三
编号: 1310767
帖子: https://linux.do/t/topic/1310767
时间: 2025-12-14 16:12:13
摘要:
豆包ai的播客功能真的很惊讶了,试了两本书,还没有听完感觉还不错。
而且音频这一块的话,应该是拿啦小宇宙一部分主播的音频授权,我这种听惯了播客的感觉巨舒服。而且还根据不同的书和资料的类型选择不同的播客主播蛮用心的。
但是,这个ai播客真的没有什么重点,一点小事bb半天。
标题: 有什么可以方便负载均衡的面板吗? 打算ix (便宜) + iepl (贵)混着来
作者: #babyface
板块: #开发调优
编号: 1310772
帖子: https://linux.do/t/topic/1310772
时间: 2025-12-14 16:13:28
摘要:
iepl太贵了,ix便宜不稳定,所以想两种混着来,主要ix,ix延迟到一定条件就自动切换iepl,各位大佬知道有什么面板方便管理的吗?
标题: 为什么cherry的有些提供商能删有些删不了
作者: #小白
板块: #搞七捻三
编号: 1310776
帖子: https://linux.do/t/topic/1310776
时间: 2025-12-14 16:15:04
摘要:
好像这里除开a会用到,其余的根本都用不到,只有什么o3能删掉,太多提供商有时候找起来太麻烦了,为什么不能每一个都能让用户选择是否删掉呢
标题: 幸运!!!签到nice
作者: #每天嘻嘻嘻
板块: #搞七捻三
编号: 1310780
帖子: https://linux.do/t/topic/1310780
时间: 2025-12-14 16:15:22
摘要:
第一次签到处9.99的啊!!!
感谢@jason_wong1佬的wong公益站!!!
标题: 酒馆可用的comfyui:z-image工作流
作者: #chjs
板块: #搞七捻三
编号: 1310781
帖子: https://linux.do/t/topic/1310781
时间: 2025-12-14 16:15:25
摘要:
想在酒馆里头使用 z-image 生图,但是发现酒馆默认的 workflow 无法使用 z-image,因为 z-image 本身不带 clip,必须使用 qwen 或者其他自带clip的模型。
论坛和搜索引擎找了一圈没找到,丢到 ai 中一顿摸索,终于搞出了一个可以在酒馆中使用的 workflow。
主要就是需要强制在酒馆流中加入clip加载qwen。
具体将下面的代码中:ID16这个节点的"clip_name": "qwen_3_4b.safetensors"替换成你们自己的模型即可,其他按照官方webui配置即可。
{
"4": {
"inputs": {
"seed": "%seed%",
"steps": "%steps%",
"cfg": "%scale%",
"sampler_name": "%sampler%",
"scheduler": "%scheduler%",
"denoise": 1,
"model": [
"15",
0
],
"positive": [
"19",
0
],
"negative": [
"9",
0
],
"latent_image": [
"5",
0
]
},
"class_type": "KSampler",
"_meta": {
"title": "K采样器"
}
},
"5": {
"inputs": {
"width": "%width%",
"height": "%height%",
"batch_size": 1
},
"class_type": "EmptyLatentI
标题: 三天花了$240
作者: #wuang
板块: #搞七捻三
编号: 1310791
帖子: https://linux.do/t/topic/1310791
时间: 2025-12-14 16:17:30
摘要:
我这几天在cursor的花费已经到了240了,估计还不够,应该能到400左右

看下佬友们的花费
标题: gpt5.2thinking思考了20个小时还在思考
作者: #shahed shafen
板块: #搞七捻三
编号: 1310817
帖子: https://linux.do/t/topic/1310817
时间: 2025-12-14 16:23:13
摘要:
如图,我本来只是想试试生成个ppt,一开始我还以为这只是一次普普通通的测试…
标题: 请教各位大佬,Gemini显示这个 必须重新建号了嘛
作者: #意逍遥
板块: #搞七捻三
编号: 1310825
帖子: https://linux.do/t/topic/1310825
时间: 2025-12-14 16:24:54
摘要:
请教各位大佬,Gemini显示这个 必须重新建号了嘛
标题: 【求助】大四学生第一次出来实习租房,求佬友们传授避坑经验
作者: #绿豆猫
板块: #搞七捻三
编号: 1310855
帖子: https://linux.do/t/topic/1310855
时间: 2025-12-14 16:31:42
摘要:
萌新求助!马上要开启实习生活了,第一关就是租房。
坐标成都,预算1000左右。
经常在网上刷到退房时房东提灯定损,或者中介跑路的新闻,有点瑟瑟发抖。
想问问各位佬友:

看房的时候有哪些细节是必须检查的?(隔音?家具?)
一般是押一付三还是押一付一?
有没有那种“一旦听到这句话,赶紧跑”的中介话术?

还没开始赚钱,希望能守住钱包,求各位指点迷津!