LinuxDo 新帖推送
187 subscribers
253K photos
316K links
Download Telegram
标题: 最近很火的那个谐音游戏,可以测一下各家模型的识图能力和中文谐音能力,笑死了
作者: #thehuan
板块: #搞七捻三
编号: 1576628
帖子: https://linux.do/t/topic/1576628
时间: 2026-02-07 15:58:53
摘要:
原图是这个,猜3个字词语

这是答案
spoiler
接下来是各家模型的表现,首先登场的是gpt5.2无思考模式

回答错误!
豆包回答正确,并且思考过程很有意思

gemini 3 pro一如既往的强

qwen3 max 框框想了一大堆,回答错误

这是gork专家模式,想了很久,回答正确,但连了网,不排除是联网得到的答案

这是minimax,回答正确!思考过程简洁明确,厉害

这是GLM-4.7,笑死

最后附上一些题,大家可以自行测试

这是谐音梗 (click for more details)
标题: 有什么ios app 能接公益站的
作者: #fall into the abyss
板块: #搞七捻三
编号: 1576639
帖子: https://linux.do/t/topic/1576639
时间: 2026-02-07 16:01:18
摘要:
好用的app 好看的~
标题: Claude code Max 拼车,有没有要拼的
作者: #Aa..26552
板块: #搞七捻三
编号: 1576648
帖子: https://linux.do/t/topic/1576648
时间: 2026-02-07 16:03:53
摘要:
找 Claude code Max 一块拼车的,有没有一起要拼的,还有位置
标题: 【请教佬们】网络小说的阅读有哪些渠道,抑或是有哪些作品推荐~
作者: #小胡
板块: #读书成诗
编号: 1576650
帖子: https://linux.do/t/topic/1576650
时间: 2026-02-07 16:04:06
摘要:
近日看了几部动态漫,放空大脑,代入主角,发现还是挺上头的,回顾后,发现这些视频大多数源自于网络小说或者漫画,得益于现在的AI,帮助到了业内人员,动态漫愈来愈多。
由于以往我接触网络文学(小说/漫画)比较少,继而我好奇,大家平日里是否阅读过什么网络小说,都是以什么渠道下载/看的网络小说,有没有什么推荐作品?
最后通过我最近看的几部作一个简单观感分享:
我看的几个作品无一不是让我感受到了主角的“爽”,若自己代入主角的世界,我会很想看下去,究竟会发生什么。
无论是借助于系统还是借助于主角的天赋,开挂也好,暴富也好,其所有内容都是与日常生活的平淡所不一样,有的还融合了推理、校园生活、冒险、奇幻修仙战斗等要素,有的作品对角色的塑造十分细腻,进而让我十分向往那个世界并成为那个主角,再加上剧情的反转,所以几个小时沉迷其中就在所难免了。
不过可惜的是,许多网络小说的内容十分长,我看的几个视频都是10-20个小时,我感觉已经很长了,但是似乎原作小说的进度还未过半,看久了就容易发现视频后续套路都相似,缺少那种惊喜感。
若让我认真思考回忆其剧情、框架,我估计已经记不住太多,甚至可能1天前看的内容都忘得差不多了,不过要是有对的上自己兴趣的主题,花几个小时当一回视频里的主角,也不失为一种放松的选择
标题: 哪里能用chatgpt pro
作者: #railway
板块: #开发调优
编号: 1576657
帖子: https://linux.do/t/topic/1576657
时间: 2026-02-07 16:05:59
摘要:
除了chatgpt team和pro会员,还有什么方法可以使用chatgpt pro吗
标题: 分享视觉检测有意向行人,播报欢迎光临的方案
作者: #sug
板块: #开发调优
编号: 1576663
帖子: https://linux.do/t/topic/1576663
时间: 2026-02-07 16:07:33
摘要:
之前写了一篇关于这方面方案的咨询,如何通过摄像头画面判断是否有人靠近
但是感觉都差强人意一些,于是经过几天的现场实测,采用了这样的方案
物理设备:固定机位的摄像头,无测距功能,放置在自助xx机器身上,桌面环境或周边
现场环境:酒店大堂,普通商店,亦或是路边街道
需求:对路过有意向从而靠近机器的行人进行欢迎语播报和介绍
实机部署方案:采用face_detection_yunet_2023mar模型进行人脸识别,频率为每0.5秒检测一次,当第一次检测到人脸时,需持续至2.5秒后仍能检测到,则视为有效顾客,播报欢迎语。当连续十秒未能检测到人脸后,则重置状态
相对于行人检测的优点来说,yunet模型适配性好,并且速度很快,误检率极低,在低画质摄像头上的表现非常好,通过人脸朝向更能精准捕捉到意向客人,同时,由于人脸大小较为均匀,亦可通过对检测到的人脸矩形框面积进行模糊的距离判定,可在一定程度上控制播报时机
还有什么可精进的欢迎补充讨论
标题: 佬友们,推荐办理哪个平台的虚拟U卡钱包性价比比较高
作者: #WvRt
板块: #搞七捻三
编号: 1576664
帖子: https://linux.do/t/topic/1576664
时间: 2026-02-07 16:07:42
摘要:
接触Ai这么久了,慢慢的涉及到境外支付的问题,好多地方银联都不支持而且感觉特别麻烦 ,有佬友推荐搞一个虚拟钱包,我自己去看了一下YouTube和b站上很多教程,目前来看很多博主推荐欧易,币安,Bitget,这几个平台较多,所以我想请问各位见多识广的佬友们,就单纯的当个支付工具用最好是推荐哪个平台呢 !
标题: RAG知识库还有搞头吗?
作者: #windgo
板块: #开发调优
编号: 1576669
帖子: https://linux.do/t/topic/1576669
时间: 2026-02-07 16:08:57
摘要:
项目背景
由于业务需求,团队需处理海量的电子文档。单个表单涉及的 PDF 数量通常在 1000 至 5000 份不等。自 2025 年 12 月启动知识库项目以来,我们在几个月的实战中遇到了以下瓶颈:

超长文档解析难:部分文档页数过多,解析速度极慢,且极易触发内存溢出(OOM)。
工程图纸识别精度低:项目中包含大量工程图纸,通用解析工具常将其误识别为普通图片,导致要素提取缺失或严重失真。
多格式兼容性差:用户上传的文件涵盖 PDF、图片、CAD 及 Office 办公文档。虽然 PDF 解析相对成熟,但对于超多列的复杂 Excel 表单,解析效果堪称“灾难”。
深度问答可靠性不足:对于高难度的逻辑推理问答,单纯依赖通用 LLM 的语义检索往往难以达到业务精度要求。
其他长尾问题:如离线部署环境下的资源分配、响应延迟等。


选型调研与避坑指南
考虑到研发周期,我们优先对市面主流的开源 RAG 框架进行了评测,以下是各产品的实测反馈:
1. RAGFlow
地位:RAG 领域的重量级框架。
核心优势:

多租户架构:具备完善的团队/租户权限管理。
工作流编排:支持灵活的问答流程定制。
DeepDoc:其自研的解析神器,是目前对复杂文档适配度较高的方案之一。

实测痛点:

精度与性能平衡:面对复杂图纸时要素遗漏较多。CPU 模式解析极慢,GPU 模式虽有提升但仍非实时;且由于是内部框架,二次开发门槛较高。
OCR 适配:第三方 OCR 引擎接入尚处于实验阶段,底层仍高度依赖内置引擎。
幻觉问题:纯向量检索难以应对结构化查询,需引入 MCP(Model Context Protocol)结合 SQL 查询来增强。

开源协议:Apache License 2.0。
2. Dify
地位:生态最丰富、上手门槛最低的 RAG 平台。
核心优势:极其出色的流程编排与插件功能,支持外挂 RAGFlow 知识库。
实测痛点:

知识库“偏科”:Dify 的核心在于 Agent 编排,其自带的文档切割与索引功能相对基础。虽可通过插件强化,但需投入额外开发精力。

商业限制(需留意):

其修改版的 Apache 2.0 协议规定:禁止未经授权运营多租户 SaaS;必须保留 UI 标识。
结论:若需多租户或深度去标识化商用,必须通过 API 接入自研前端。

3. Yuxi-Know(语析)
特点:界面友好,符合国人逻辑。
实测痛点:OCR 引擎对接方案较为生涩,虽然选项多,但实际落地效果不佳,更适合处理中短篇幅的简单文档。
开源协议:MIT(极度友好)。
4. Weknora (腾讯)
特点:模块化架构,融合多模态预处理,大厂出品。
实测痛点:OCR 引擎内聚程度过高,几乎无法灵活切换或自定义识别逻辑,改造难度大。
开源协议:MIT。
5. AnythingLLM
特点:功能全家桶,内置 TTS/STT,开箱即用体验好。
实测痛点:OCR 依旧是短板,面对专业领域的重度文档显得力不从心。
开源协议:MIT。

核心痛点汇总

OCR 解析能力的“资源与精度”悖论:在离线部署的有限硬件資源下,难以同时满足“高速度”与“高精度”的解析需求。
混合检索与统计分析缺失:业务问答不只是语义匹配,往往涉及大量数据库统计(Chat2SQL)。纯 RAG 方案在处理这类问题时容易“抓瞎”。


OCR 专项分析




方案
优点
缺点
适用场景




MinerU
结构化还原(Markdown)效果好,支持 VLM 模式。
内存开销极大(3000页PDF可达100G+),离线部署资源成本极高。
对精度有极致要求的离线单任务。


DeepDoc
适配广,针对 RAG 场景优化。
复杂图纸易遗漏,解析效率随页数增加线性变慢。
通用文档解析。


Paddle/Rapid
部署轻量,GPU/CPU 兼容性好。
缺乏对文档版面还原(Layout Analysis)的深度支持。
简单文字识别。


VLM/大模型类
逻辑理解能力最强。
成本高、受限于上下文窗口,难以处理千页以上的超长文档。
关键要素精准抽提。




总结与反思
目前项目处于“深水区”:通用框架在面对工业级、超长、复杂版面文档时,均出现了明显的边际效应。
下一步我们可能需要跳出“全盘依赖开源框架”的思维:

解耦解析层:建立独立的 OCR 解析集群,将长文档切片并行处理,并引入 VLM 进行关键要素校准。
强化 MCP 架构:不再强求 LLM 读懂整个 Excel,而是通过 Agent 调用 SQL 插件进行数据分析。
标题: 登顶之后,只剩下睡意 😴
作者: #疯狂驴驴
板块: #搞七捻三
编号: 1576672
帖子: https://linux.do/t/topic/1576672
时间: 2026-02-07 16:10:24
摘要:
下文由人工编写但经过AI润色,但真实性百分比

不知道这里有没有人玩过 《开局托儿所》 这个小游戏。之前同事安利给我,我就随手试了试。
结果很快就发现:我是真的没什么游戏天赋,手眼完全跟不上,最高也就 120 多分。
但作为一个 Developer,我当然不服。于是我花了两天写了一个最基础的自动化脚本,周末高强度测试了一波(可能脚本还不够强,也没完全自动化),最高也只是提升到 130 多。
后来我慢慢意识到:我已经不在玩游戏了,我在做“仿真 + 策略优化”。
我把整个棋盘抽象成一个可模拟环境,用笔记本一秒能跑几十局。凭感觉加上查资料,我前后做了六七个策略,其中一个表现不错,平均分能稳定在 105 左右。这时候“最高分”已经没意义了,分数变成了统计学意义上的指标。
当然故事还没结束。
随着模拟越来越多,我开始发现这个游戏并不简单:在常见的搜索算法下,它的搜索空间大得离谱。于是我做了大量实验,又结合了一些灵光一现的分析,最终设计出一个新的策略。
这个策略的平均分直接拉到 113 左右,远超之前所有版本。
再回到真实游戏里——经过这么长时间折腾,我也把操作部分做到了完全自动化。新策略在实战里表现非常稳定,基本几局就能跑到 140+,最高甚至到了 150+。


我看到 GitHub 上也有一些类似的小脚本,但用起来不太顺手,所以干脆把自己的实现整理出来分享一下:



github.com






GitHub - xx025/rs10env: RS10 board game env (Gymnasium + PyTorch) and...

RS10 board game env (Gymnasium + PyTorch) and heuristic strategies












老实说,我现在这个策略应该还不是最强的——肯定有大佬还有更猛的想法,只是没公开。欢迎交流、PR、或者分享你们的策略思路。
标题: 各位佬友们觉得花小钱办大事的东西物品服务都有哪些?
作者: #DWSMAX
板块: #搞七捻三
编号: 1576683
帖子: https://linux.do/t/topic/1576683
时间: 2026-02-07 16:14:15
摘要:
花中钱也行,主要是觉得花了特别值得的,或者解决了大问题的,快来分享一下。
标题: 求助,手机复制ai发的代码容易出问题
作者: #chancat
板块: #搞七捻三
编号: 1576684
帖子: https://linux.do/t/topic/1576684
时间: 2026-02-07 16:14:18
摘要:
最近和chatgpt 搞代码到github ,但是发现总出错,最后排除查才发现
,是手机复制的代码有问题,
会出现 如,被红线标注,
缩进层级被破坏
空格被替换成 Tab
全角符号混入
行尾符或不可见字符混入F
编辑器自动对齐/缩进错位 等, ,我把代码复制贴到记事本,或者在线格式化了都没用还照样的,切输入法也这样,估计是系统剪切板。。
想请问各位佬友,有没有遇到这样情况或者有解决方案的?。
标题: 我有时喜欢用claude官网请求问题,但是为啥总是这样
作者: #夜无忧
板块: #搞七捻三
编号: 1576690
帖子: https://linux.do/t/topic/1576690
时间: 2026-02-07 16:18:36
摘要:
我切换了很多个机场 感觉没有一个稳定的。

gemini和gpt 都没问题。
佬知道这是为什么吗?
我觉得claude的网页聊天回答问题比claude code cli回答问题更快更全面也更好看,甚至知识体验到4.5 也比4.6的cli回答的好(主观感受)
标题: 汗庭金卡先到先得
作者: #hdisk0
板块: #福利羊毛
编号: 1576701
帖子: https://linux.do/t/topic/1576701
时间: 2026-02-07 16:22:23
摘要:
分享剩余三张金卡先到先得。
标题: 求宝可梦旅途第二季的资源
作者: #linker_ai
板块: #资源荟萃
编号: 1576711
帖子: https://linux.do/t/topic/1576711
时间: 2026-02-07 16:25:58
摘要:
腾讯视频只有44集。精灵宝可梦XY2_34_动漫_高清完整版视频在线观看_腾讯视频
标题: gpt疑似测试新模型?
作者: #小白
板块: #开发调优
编号: 1576712
帖子: https://linux.do/t/topic/1576712
时间: 2026-02-07 16:26:38
摘要:
跟ais很想
标题: 分享一个免费在线畅玩经典复古游戏 / 模拟器游戏
作者: #Simshen
板块: #资源荟萃
编号: 1576717
帖子: https://linux.do/t/topic/1576717
时间: 2026-02-07 16:29:25
摘要:
Retro Games





复古游戏 - 免费在线畅玩经典复古游戏 / 模拟器游戏

在线免费畅玩红白机(FC)、超任(SFC)、世嘉(MD)、Neo Geo、GB、GBA、N64、PS1/PSX和街机等模拟器怀旧复古游戏!免费在线游玩,或免费下载复古游戏ROMs