LinuxDo 新帖推送
179 subscribers
249K photos
310K links
Download Telegram
标题: 不是 你真薅我啊?
作者: #Sanyela
板块: #搞七捻三
编号: 1310599
帖子: https://linux.do/t/topic/1310599
时间: 2025-12-14 15:34:40
摘要:
你这批量注册真以为我查不到嘛
标题: oiioii这个产品,我觉得,就是我们自己做自己动漫的时候,在搭配suno就是一部动漫!
作者: #方盾CHEN
板块: #搞七捻三
编号: 1310604
帖子: https://linux.do/t/topic/1310604
时间: 2025-12-14 15:37:00
摘要:
这两天要不是因为积分限制,我都可以做一个动漫了,国内动漫反正现在重要剧情也就五六分钟。
suno音乐制作主题曲,就是一个人人当导演的时代,有一些镜头花时间去抽奖,抽不出来删除重新生成即可。我今天分享了100多个激活码,明天社区就会有最少1000的分裂激活码,我的目的达到了也就不在发了。
加油未来的导演们,这个就是一次机会,在目前失业潮和副业之间这个就是机会
标题: 目前使用codex5.2和opus4.5的习惯
作者: #Imaxwel
板块: #搞七捻三
编号: 1310607
帖子: https://linux.do/t/topic/1310607
时间: 2025-12-14 15:37:18
摘要:
codex5.2 xhigh实在是太慢了,一个小rpa项目全局日志重构,动不动就给你搞27分钟,现在每次只在吃饭上桌前或者上洗手间之前把提示词准备好敲下去。其他时候vibe coding都是用OPus 4.5了 
话说论坛佬友指路薅的kiro pro+的本月2500额度的调用太耐用了,根本用不完
感觉Codex的好处是考虑比较全面,一般需要全面修改的时候,才用codex,不得不等结果的时候就刷一会儿各大论坛等结果。
标题: 用了10年的显示器才发现要用DP线
作者: #ytsingshao
板块: #搞七捻三
编号: 1310629
帖子: https://linux.do/t/topic/1310629
时间: 2025-12-14 15:42:04
摘要:
当年买了个4K显示器就一直插着HDMI线,开高分辨率就一直感觉卡卡的,潜意识认为显卡分辨率过高显卡吃不消,慢慢的,显卡也从980到了3060,问题依旧,常年开着2K分辨率倒也相安无事。
前两天显示器突然泛白,排查一遍确认显示器问题,准备换掉,鬼使神差查询该显示器优缺点,被告知高分辨率只支持DP线,于是接上之后,丝滑的世界重新向我打开了大门,妈耶
这和插在集显没啥区别了…
人果然无法触及理解之外的东西,思考的惯性真可怕。
标题: 除了中国与美国其他国家的大模型怎么样?
作者: #猫大
板块: #搞七捻三
编号: 1310635
帖子: https://linux.do/t/topic/1310635
时间: 2025-12-14 15:43:05
摘要:
总是看见国内的一些大模型和美国的一些大模型,其他国家的好像很少看见
标题: 学校搞得gpt5.2体验点 好抽象呀
作者: #辉夜姬
板块: #搞七捻三
编号: 1310649
帖子: https://linux.do/t/topic/1310649
时间: 2025-12-14 15:45:32
摘要:
标题: 说实话,我想不到这场AI军备竞赛中谷歌输的理由...
作者: #木瓜蛋白酶Tea🎋
板块: #搞七捻三
编号: 1310650
帖子: https://linux.do/t/topic/1310650
时间: 2025-12-14 15:45:49
摘要:
模型层:有目前第一梯队的多模态闭源模型和开源模型,在生物学领域也是近乎垄断的AlphaFold
应用层:谷歌全家桶、搜索引擎、AndroidOS。google已经接入了AI overviews
数据来源和用户来源:目前访问量最大的网站,google.com 和 youtube.com,移动端操作系统AndroidOS
带宽费用:谷歌提前购买了大量的暗光纤,带宽成本近乎为零
硬件层:连openai都来租用的TPU集群算力,训练超大模型的最佳选择,不依赖英伟达
…(其他待补充)
标题: antigravity 配合chrome agent 前端开发是独一档
作者: #devinfan
板块: #开发调优
编号: 1310658
帖子: https://linux.do/t/topic/1310658
时间: 2025-12-14 15:46:36
摘要:
最近做一个项目的重构,发现可以配合chrome 的antigravity 插件,反重力可以直接操作chrome 实时查看修改的结果,这一点太牛了。
之前codex和claude 修改前端的显示style或者ui 的具体布局还是会摸不到头脑,现在gemini-3 可以直接截图,查看UI显示,然后反馈修改。太牛了
标题: 关于小程序开发未来如何快速转成android、ios甚至是鸿蒙
作者: #javaStudy
板块: #开发调优
编号: 1310672
帖子: https://linux.do/t/topic/1310672
时间: 2025-12-14 15:48:34
摘要:
目前有项目做的小程序,没有做原生的android、ios,主要还是考虑成本问题;
后面如果要做原生的,有什么快速的方式生成嘛,大老板给点实际经验
标题: 我开源了一个智能OCR工具:"不止于识别,更懂内容"
作者: #xstongxue
板块: #资源荟萃
编号: 1310705
帖子: https://linux.do/t/topic/1310705
时间: 2025-12-14 15:57:11
摘要:
为什么我们需要一个新的OCR工具?
在数字化时代,我们每天都在与各种文字打交道:扫描文档、截图内容、手写笔记、表格数据…
传统的 OCR 工具虽然能识别文字,但往往只是"看到"而不能"理解"。
想象一下这样的场景:


你需要从截图中快速提取各种类型(表格/手写体等)图片的内容
你遇到一张外文图片,想要翻译的同时保持原有的格式和语境
你拍了一张复杂的财务报表,不仅想提取文字,还想让AI帮你分析数据趋势
你有一份手写的会议记录,希望不仅转成文字,还能自动整理成结构化的会议纪要


这就是 XS-VLM-OCR 诞生的原因——我们不只是在做OCR,而是在构建一个智能视觉语言理解系统。
不只是识别,更是理解
多模型智能引擎


Qwen-VL系列:阿里云全系列视觉语言模型,支持Qwen-VL-Plus/Max/235B-VL等
GLM-4V系列:智谱AI的多模态大模型,支持GLM-4.5V/4.6V
PaddleOCR-VL:百度飞桨OCR-VL系列,支持PaddleOCR-VL
自定义适配器:支持接入任何与 OpenAPI 兼容的多模态大模型
Tesseract离线:经典 OCR 引擎,无网络依赖


智能提示词系统
内置丰富的提示词模板,让 AI 真正理解你的需求:
识别类提示词
通用识别:请识别图片中的所有文字内容,保持原有格式
表格识别:请将图片中的表格转换为Markdown格式
公式识别:请识别图片中的数学公式,输出LaTeX格式
手写识别:请识别手写文字,注意字迹模糊的部分
证件识别:请提取身份证/护照等证件的关键信息

翻译类提示词
中英互译:请将图片中的文字翻译成中文/英文
多语言翻译:请识别语言并翻译成目标语言
保持格式翻译:翻译时保持原有的排版和格式
专业术语翻译:这是技术文档,请注意专业术语的准确性

解答类提示词
题目解答:这是一道数学/物理题,请给出详细解答过程
代码解释:请解释这段代码的功能和逻辑
图表分析:请分析图表数据并总结关键趋势
文档总结:请总结文档的核心内容和要点

整理类提示词
结构化输出:请将内容整理成JSON
标题: newapi可以重试掉报错的,但是空回怎么办?
作者: #谢谢不吃香菜
板块: #开发调优
编号: 1310711
帖子: https://linux.do/t/topic/1310711
时间: 2025-12-14 15:59:46
摘要:
如题,莫名其妙空回。。。从那个。使用日志可以看出来是空回的
标题: 哈基米写代码 TW,HK 竟然默认是国家
作者: #admln
板块: #搞七捻三
编号: 1310728
帖子: https://linux.do/t/topic/1310728
时间: 2025-12-14 16:03:23
摘要:
标题: (依旧免费谷歌注册)喵喵公益站下午放送。
作者: #忆冰Yibing
板块: #搞七捻三
编号: 1310738
帖子: https://linux.do/t/topic/1310738
时间: 2025-12-14 16:06:32
摘要:
没有谷歌账号但是又不想买或者自己注册遇到发验证码问题的佬友们,不要再浪费号码验证次数了,快点来喵喵站,直接上手就能登录,喵。
如果你的手机号码已经提示无法使用或者次数过多,请借用身边人的手机号码,喵喵这里只要能发验证码,佬友们很大概率能收到,私信喵喵**(邮箱名)+(昵称)+(密码)+(手机号码)**排队创建先到先得哦
标题: 我恨你Nextjs
作者: #多玩幻灵qwq
板块: #搞七捻三
编号: 1310750
帖子: https://linux.do/t/topic/1310750
时间: 2025-12-14 16:08:37
摘要:
Vibe coding 的时候挎挎往上堆,成型速度超级快
近一周看下来人傻了,一堆服务全部中招
CVE-2025-66478 (critical)
CVE-2025-55184 (high)
CVE-2025-55183 (medium)
CVE-2025-67779 (high)
全中
一个月只放半天我还得摁着脑袋修
我在学校都得找机会摸电脑修
我操了
标题: chatgpt 可以用apple 的礼品卡支付吗?
作者: #CaroLe
板块: #搞七捻三
编号: 1310752
帖子: https://linux.do/t/topic/1310752
时间: 2025-12-14 16:08:53
摘要:
chatgpt 可以用apple 的礼品卡支付吗?
标题: 豆包ai的播客功能
作者: #雅舍谈吃
板块: #搞七捻三
编号: 1310767
帖子: https://linux.do/t/topic/1310767
时间: 2025-12-14 16:12:13
摘要:
豆包ai的播客功能真的很惊讶了,试了两本书,还没有听完感觉还不错。
而且音频这一块的话,应该是拿啦小宇宙一部分主播的音频授权,我这种听惯了播客的感觉巨舒服。而且还根据不同的书和资料的类型选择不同的播客主播蛮用心的。
但是,这个ai播客真的没有什么重点,一点小事bb半天。
标题: 有什么可以方便负载均衡的面板吗? 打算ix (便宜) + iepl (贵)混着来
作者: #babyface
板块: #开发调优
编号: 1310772
帖子: https://linux.do/t/topic/1310772
时间: 2025-12-14 16:13:28
摘要:
iepl太贵了,ix便宜不稳定,所以想两种混着来,主要ix,ix延迟到一定条件就自动切换iepl,各位大佬知道有什么面板方便管理的吗?
标题: 为什么cherry的有些提供商能删有些删不了
作者: #小白
板块: #搞七捻三
编号: 1310776
帖子: https://linux.do/t/topic/1310776
时间: 2025-12-14 16:15:04
摘要:
好像这里除开a会用到,其余的根本都用不到,只有什么o3能删掉,太多提供商有时候找起来太麻烦了,为什么不能每一个都能让用户选择是否删掉呢
标题: 幸运!!!签到nice
作者: #每天嘻嘻嘻
板块: #搞七捻三
编号: 1310780
帖子: https://linux.do/t/topic/1310780
时间: 2025-12-14 16:15:22
摘要:
第一次签到处9.99的啊!!!
感谢@jason_wong1佬的wong公益站!!!
标题: 酒馆可用的comfyui:z-image工作流
作者: #chjs
板块: #搞七捻三
编号: 1310781
帖子: https://linux.do/t/topic/1310781
时间: 2025-12-14 16:15:25
摘要:
想在酒馆里头使用 z-image 生图,但是发现酒馆默认的 workflow 无法使用 z-image,因为 z-image 本身不带 clip,必须使用 qwen 或者其他自带clip的模型。
论坛和搜索引擎找了一圈没找到,丢到 ai 中一顿摸索,终于搞出了一个可以在酒馆中使用的 workflow。
主要就是需要强制在酒馆流中加入clip加载qwen。
具体将下面的代码中:ID16这个节点的"clip_name": "qwen_3_4b.safetensors"替换成你们自己的模型即可,其他按照官方webui配置即可。
{
"4": {
"inputs": {
"seed": "%seed%",
"steps": "%steps%",
"cfg": "%scale%",
"sampler_name": "%sampler%",
"scheduler": "%scheduler%",
"denoise": 1,
"model": [
"15",
0
],
"positive": [
"19",
0
],
"negative": [
"9",
0
],
"latent_image": [
"5",
0
]
},
"class_type": "KSampler",
"_meta": {
"title": "K采样器"
}
},
"5": {
"inputs": {
"width": "%width%",
"height": "%height%",
"batch_size": 1
},
"class_type": "EmptyLatentI