LinuxDo 新帖推送 – Telegram

LinuxDo 新帖推送

187 subscribers

253K photos

316K links

Download Telegram

About

Blog

Apps

Platform

LinuxDo 新帖推送

187 subscribers

LinuxDo 新帖推送

标题: 最近很火的那个谐音游戏，可以测一下各家模型的识图能力和中文谐音能力，笑死了
作者: #thehuan
板块: #搞七捻三
编号: 1576628
帖子: https://linux.do/t/topic/1576628
时间: 2026-02-07 15:58:53
摘要:

原图是这个，猜3个字词语

这是答案
spoiler
接下来是各家模型的表现，首先登场的是gpt5.2无思考模式

回答错误！
豆包回答正确，并且思考过程很有意思

gemini 3 pro一如既往的强

qwen3 max 框框想了一大堆，回答错误

这是gork专家模式，想了很久，回答正确，但连了网，不排除是联网得到的答案

这是minimax，回答正确！思考过程简洁明确，厉害

这是GLM-4.7，笑死 

最后附上一些题，大家可以自行测试

这是谐音梗 (click for more details)

2 views08:01

LinuxDo 新帖推送

标题: 有什么ios app 能接公益站的
作者: #fall into the abyss
板块: #搞七捻三
编号: 1576639
帖子: https://linux.do/t/topic/1576639
时间: 2026-02-07 16:01:18
摘要:

好用的app 好看的~

2 views08:04

LinuxDo 新帖推送

标题: Claude code Max 拼车，有没有要拼的
作者: #Aa..26552
板块: #搞七捻三
编号: 1576648
帖子: https://linux.do/t/topic/1576648
时间: 2026-02-07 16:03:53
摘要:

找 Claude code Max 一块拼车的，有没有一起要拼的，还有位置

2 views08:06

LinuxDo 新帖推送

标题: 【请教佬们】网络小说的阅读有哪些渠道，抑或是有哪些作品推荐~
作者: #小胡
板块: #读书成诗
编号: 1576650
帖子: https://linux.do/t/topic/1576650
时间: 2026-02-07 16:04:06
摘要:

近日看了几部动态漫，放空大脑，代入主角，发现还是挺上头的，回顾后，发现这些视频大多数源自于网络小说或者漫画，得益于现在的AI，帮助到了业内人员，动态漫愈来愈多。
由于以往我接触网络文学（小说/漫画）比较少，继而我好奇，大家平日里是否阅读过什么网络小说，都是以什么渠道下载/看的网络小说，有没有什么推荐作品？
最后通过我最近看的几部作一个简单观感分享:
我看的几个作品无一不是让我感受到了主角的“爽”，若自己代入主角的世界，我会很想看下去，究竟会发生什么。
无论是借助于系统还是借助于主角的天赋，开挂也好，暴富也好，其所有内容都是与日常生活的平淡所不一样，有的还融合了推理、校园生活、冒险、奇幻修仙战斗等要素，有的作品对角色的塑造十分细腻，进而让我十分向往那个世界并成为那个主角，再加上剧情的反转，所以几个小时沉迷其中就在所难免了。
不过可惜的是，许多网络小说的内容十分长，我看的几个视频都是10-20个小时，我感觉已经很长了，但是似乎原作小说的进度还未过半，看久了就容易发现视频后续套路都相似，缺少那种惊喜感。
若让我认真思考回忆其剧情、框架，我估计已经记不住太多，甚至可能1天前看的内容都忘得差不多了，不过要是有对的上自己兴趣的主题，花几个小时当一回视频里的主角，也不失为一种放松的选择

2 views08:07

LinuxDo 新帖推送

标题: 哪里能用chatgpt pro
作者: #railway
板块: #开发调优
编号: 1576657
帖子: https://linux.do/t/topic/1576657
时间: 2026-02-07 16:05:59
摘要:

除了chatgpt team和pro会员，还有什么方法可以使用chatgpt pro吗

1 view08:07

LinuxDo 新帖推送

标题: 分享视觉检测有意向行人，播报欢迎光临的方案
作者: #sug
板块: #开发调优
编号: 1576663
帖子: https://linux.do/t/topic/1576663
时间: 2026-02-07 16:07:33
摘要:

之前写了一篇关于这方面方案的咨询，如何通过摄像头画面判断是否有人靠近
但是感觉都差强人意一些，于是经过几天的现场实测，采用了这样的方案
物理设备：固定机位的摄像头，无测距功能，放置在自助xx机器身上，桌面环境或周边
现场环境：酒店大堂，普通商店，亦或是路边街道
需求：对路过有意向从而靠近机器的行人进行欢迎语播报和介绍
实机部署方案：采用face_detection_yunet_2023mar模型进行人脸识别，频率为每0.5秒检测一次，当第一次检测到人脸时，需持续至2.5秒后仍能检测到，则视为有效顾客，播报欢迎语。当连续十秒未能检测到人脸后，则重置状态
相对于行人检测的优点来说，yunet模型适配性好，并且速度很快，误检率极低，在低画质摄像头上的表现非常好，通过人脸朝向更能精准捕捉到意向客人，同时，由于人脸大小较为均匀，亦可通过对检测到的人脸矩形框面积进行模糊的距离判定，可在一定程度上控制播报时机
还有什么可精进的欢迎补充讨论

1 view08:09

LinuxDo 新帖推送

标题: 佬友们，推荐办理哪个平台的虚拟U卡钱包性价比比较高
作者: #WvRt
板块: #搞七捻三
编号: 1576664
帖子: https://linux.do/t/topic/1576664
时间: 2026-02-07 16:07:42
摘要:

接触Ai这么久了,慢慢的涉及到境外支付的问题，好多地方银联都不支持而且感觉特别麻烦 ，有佬友推荐搞一个虚拟钱包，我自己去看了一下YouTube和b站上很多教程，目前来看很多博主推荐欧易，币安，Bitget，这几个平台较多，所以我想请问各位见多识广的佬友们，就单纯的当个支付工具用最好是推荐哪个平台呢 ！

1 view08:09

LinuxDo 新帖推送

标题: RAG知识库还有搞头吗？
作者: #windgo
板块: #开发调优
编号: 1576669
帖子: https://linux.do/t/topic/1576669
时间: 2026-02-07 16:08:57
摘要:

项目背景
由于业务需求，团队需处理海量的电子文档。单个表单涉及的 PDF 数量通常在 1000 至 5000 份不等。自 2025 年 12 月启动知识库项目以来，我们在几个月的实战中遇到了以下瓶颈：

超长文档解析难：部分文档页数过多，解析速度极慢，且极易触发内存溢出（OOM）。
工程图纸识别精度低：项目中包含大量工程图纸，通用解析工具常将其误识别为普通图片，导致要素提取缺失或严重失真。
多格式兼容性差：用户上传的文件涵盖 PDF、图片、CAD 及 Office 办公文档。虽然 PDF 解析相对成熟，但对于超多列的复杂 Excel 表单，解析效果堪称“灾难”。
深度问答可靠性不足：对于高难度的逻辑推理问答，单纯依赖通用 LLM 的语义检索往往难以达到业务精度要求。
其他长尾问题：如离线部署环境下的资源分配、响应延迟等。


选型调研与避坑指南
考虑到研发周期，我们优先对市面主流的开源 RAG 框架进行了评测，以下是各产品的实测反馈：
1. RAGFlow
地位：RAG 领域的重量级框架。
核心优势：

多租户架构：具备完善的团队/租户权限管理。
工作流编排：支持灵活的问答流程定制。
DeepDoc：其自研的解析神器，是目前对复杂文档适配度较高的方案之一。

实测痛点：

精度与性能平衡：面对复杂图纸时要素遗漏较多。CPU 模式解析极慢，GPU 模式虽有提升但仍非实时；且由于是内部框架，二次开发门槛较高。
OCR 适配：第三方 OCR 引擎接入尚处于实验阶段，底层仍高度依赖内置引擎。
幻觉问题：纯向量检索难以应对结构化查询，需引入 MCP（Model Context Protocol）结合 SQL 查询来增强。

开源协议：Apache License 2.0。
2. Dify
地位：生态最丰富、上手门槛最低的 RAG 平台。
核心优势：极其出色的流程编排与插件功能，支持外挂 RAGFlow 知识库。
实测痛点：

知识库“偏科”：Dify 的核心在于 Agent 编排，其自带的文档切割与索引功能相对基础。虽可通过插件强化，但需投入额外开发精力。

商业限制（需留意）：

其修改版的 Apache 2.0 协议规定：禁止未经授权运营多租户 SaaS；必须保留 UI 标识。
结论：若需多租户或深度去标识化商用，必须通过 API 接入自研前端。

3. Yuxi-Know（语析）
特点：界面友好，符合国人逻辑。
实测痛点：OCR 引擎对接方案较为生涩，虽然选项多，但实际落地效果不佳，更适合处理中短篇幅的简单文档。
开源协议：MIT（极度友好）。
4. Weknora (腾讯)
特点：模块化架构，融合多模态预处理，大厂出品。
实测痛点：OCR 引擎内聚程度过高，几乎无法灵活切换或自定义识别逻辑，改造难度大。
开源协议：MIT。
5. AnythingLLM
特点：功能全家桶，内置 TTS/STT，开箱即用体验好。
实测痛点：OCR 依旧是短板，面对专业领域的重度文档显得力不从心。
开源协议：MIT。

核心痛点汇总

OCR 解析能力的“资源与精度”悖论：在离线部署的有限硬件資源下，难以同时满足“高速度”与“高精度”的解析需求。
混合检索与统计分析缺失：业务问答不只是语义匹配，往往涉及大量数据库统计（Chat2SQL）。纯 RAG 方案在处理这类问题时容易“抓瞎”。


OCR 专项分析




方案
优点
缺点
适用场景




MinerU
结构化还原（Markdown）效果好，支持 VLM 模式。
内存开销极大（3000页PDF可达100G+），离线部署资源成本极高。
对精度有极致要求的离线单任务。


DeepDoc
适配广，针对 RAG 场景优化。
复杂图纸易遗漏，解析效率随页数增加线性变慢。
通用文档解析。


Paddle/Rapid
部署轻量，GPU/CPU 兼容性好。
缺乏对文档版面还原（Layout Analysis）的深度支持。
简单文字识别。


VLM/大模型类
逻辑理解能力最强。
成本高、受限于上下文窗口，难以处理千页以上的超长文档。
关键要素精准抽提。




总结与反思
目前项目处于“深水区”：通用框架在面对工业级、超长、复杂版面文档时，均出现了明显的边际效应。
下一步我们可能需要跳出“全盘依赖开源框架”的思维：

解耦解析层：建立独立的 OCR 解析集群，将长文档切片并行处理，并引入 VLM 进行关键要素校准。
强化 MCP 架构：不再强求 LLM 读懂整个 Excel，而是通过 Agent 调用 SQL 插件进行数据分析。

2 views08:09

LinuxDo 新帖推送

标题: 登顶之后，只剩下睡意 😴
作者: #疯狂驴驴
板块: #搞七捻三
编号: 1576672
帖子: https://linux.do/t/topic/1576672
时间: 2026-02-07 16:10:24
摘要:

下文由人工编写但经过AI润色，但真实性百分比

不知道这里有没有人玩过 《开局托儿所》 这个小游戏。之前同事安利给我，我就随手试了试。
结果很快就发现：我是真的没什么游戏天赋，手眼完全跟不上，最高也就 120 多分。
但作为一个 Developer，我当然不服。于是我花了两天写了一个最基础的自动化脚本，周末高强度测试了一波（可能脚本还不够强，也没完全自动化），最高也只是提升到 130 多。
后来我慢慢意识到：我已经不在玩游戏了，我在做“仿真 + 策略优化”。
我把整个棋盘抽象成一个可模拟环境，用笔记本一秒能跑几十局。凭感觉加上查资料，我前后做了六七个策略，其中一个表现不错，平均分能稳定在 105 左右。这时候“最高分”已经没意义了，分数变成了统计学意义上的指标。
当然故事还没结束。
随着模拟越来越多，我开始发现这个游戏并不简单：在常见的搜索算法下，它的搜索空间大得离谱。于是我做了大量实验，又结合了一些灵光一现的分析，最终设计出一个新的策略。
这个策略的平均分直接拉到 113 左右，远超之前所有版本。
再回到真实游戏里——经过这么长时间折腾，我也把操作部分做到了完全自动化。新策略在实战里表现非常稳定，基本几局就能跑到 140+，最高甚至到了 150+。


我看到 GitHub 上也有一些类似的小脚本，但用起来不太顺手，所以干脆把自己的实现整理出来分享一下：

  

      github.com
  

  
    
  

  GitHub - xx025/rs10env: RS10 board game env (Gymnasium + PyTorch) and...

    RS10 board game env (Gymnasium + PyTorch) and heuristic strategies


  

  
    
    
  

  


老实说，我现在这个策略应该还不是最强的——肯定有大佬还有更猛的想法，只是没公开。欢迎交流、PR、或者分享你们的策略思路。

2 views08:11

LinuxDo 新帖推送

标题: 各位佬友们觉得花小钱办大事的东西物品服务都有哪些？
作者: #DWSMAX
板块: #搞七捻三
编号: 1576683
帖子: https://linux.do/t/topic/1576683
时间: 2026-02-07 16:14:15
摘要:

花中钱也行，主要是觉得花了特别值得的，或者解决了大问题的，快来分享一下。

2 views08:14

LinuxDo 新帖推送

标题: 求助，手机复制ai发的代码容易出问题
作者: #chancat
板块: #搞七捻三
编号: 1576684
帖子: https://linux.do/t/topic/1576684
时间: 2026-02-07 16:14:18
摘要:

最近和chatgpt 搞代码到github ,但是发现总出错，最后排除查才发现
,是手机复制的代码有问题，
会出现 如，被红线标注，
缩进层级被破坏
空格被替换成 Tab
全角符号混入
行尾符或不可见字符混入F
编辑器自动对齐/缩进错位  等， ，我把代码复制贴到记事本，或者在线格式化了都没用还照样的，切输入法也这样，估计是系统剪切板。。
想请问各位佬友，有没有遇到这样情况或者有解决方案的?。

2 views08:14

LinuxDo 新帖推送

标题: 我有时喜欢用claude官网请求问题，但是为啥总是这样
作者: #夜无忧
板块: #搞七捻三
编号: 1576690
帖子: https://linux.do/t/topic/1576690
时间: 2026-02-07 16:18:36
摘要:

我切换了很多个机场 感觉没有一个稳定的。

gemini和gpt 都没问题。
佬知道这是为什么吗？
我觉得claude的网页聊天回答问题比claude code cli回答问题更快更全面也更好看，甚至知识体验到4.5 也比4.6的cli回答的好（主观感受）

2 views08:19

LinuxDo 新帖推送

标题: 汗庭金卡先到先得
作者: #hdisk0
板块: #福利羊毛
编号: 1576701
帖子: https://linux.do/t/topic/1576701
时间: 2026-02-07 16:22:23
摘要:

分享剩余三张金卡先到先得。

2 views08:25

LinuxDo 新帖推送

标题: 求宝可梦旅途第二季的资源
作者: #linker_ai
板块: #资源荟萃
编号: 1576711
帖子: https://linux.do/t/topic/1576711
时间: 2026-02-07 16:25:58
摘要:

腾讯视频只有44集。精灵宝可梦XY2_34_动漫_高清完整版视频在线观看_腾讯视频

1 view08:27

LinuxDo 新帖推送

标题: gpt疑似测试新模型？
作者: #小白
板块: #开发调优
编号: 1576712
帖子: https://linux.do/t/topic/1576712
时间: 2026-02-07 16:26:38
摘要:

跟ais很想

1 view08:27

LinuxDo 新帖推送

标题: 分享一个免费在线畅玩经典复古游戏 / 模拟器游戏
作者: #Simshen
板块: #资源荟萃
编号: 1576717
帖子: https://linux.do/t/topic/1576717
时间: 2026-02-07 16:29:25
摘要:

Retro Games
  

  
    

复古游戏 - 免费在线畅玩经典复古游戏 / 模拟器游戏

  在线免费畅玩红白机(FC)、超任(SFC)、世嘉(MD)、Neo Geo、GB、GBA、N64、PS1/PSX和街机等模拟器怀旧复古游戏！免费在线游玩，或免费下载复古游戏ROMs

2 views08:30