LinuxDo 新帖推送

标题: 有没有用手机上的豆包输入法在电脑上输入的方案？
作者: #fmvp742637
板块: #开发调优
编号: 1576608
帖子: https://linux.do/t/topic/1576608
时间: 2026-02-07 15:51:34
摘要:

电脑上的豆包输入法感觉非常慢，而手机上的非常快。所以我在想能不能用手机作为语音输入端，然后把输出的内容同步到电脑上？
我的设想是，在手机上有一个 APP，带有文本框，可以用豆包输入法输入文本。然后这个 APP 可以实时将文本传到电脑上，并自动复制进电脑的剪贴板。这样我只需要在手机上说好一段话，然后在电脑上按一下 Ctrl V 就可以了。
甚至进一步，如果有什么工具可以让手机端的文本框实时传到电脑上，并实时输入到目前电脑光标所在的文本框，就更好了。
由于涉及到电脑和手机的配对，所以最好不要每次开机都要重新配对一下，尽可能每次开机都自动配对。

1 view07:53

LinuxDo 新帖推送

标题: 【开源项目】腾讯元宝口令互助池 - 来薅腾讯羊毛（2.17截止）
作者: #维尔汀
板块: #开发调优
编号: 1576616
帖子: https://linux.do/t/topic/1576616
时间: 2026-02-07 15:53:59
摘要:

项目简介
腾讯元宝口令红包活动持续一周了，互刷口令太繁琐了，于是我写了这个口令互助池，大家可以：

上传自己的口令，分享给他人
随机获取别人的口令，领取红包
自动爬虫从贴吧采集口令（24小时不间断）

核心理念：我为人人，人人为我 
这时候发布确实是有些晚了，但说不定明年可以旧瓶装新酒。

 在线体验
已部署地址：http://111.229.5.230:18080/

 无需注册登录
 完全匿名使用
 实时更新口令池


 Github地址
地址：GitHub - Vhfuhv/YuanBao-Share: 一个简单匿名的腾讯元宝红包口令分享平台。上传你的口令，获取他人的口令，一起分享好运！

 功能特性
1. 智能口令分发

优先级机制：优先分发用户上传的口令，爬虫口令作为补充
IP过滤：不会获取到自己上传的口令
防重复：每个口令最多被展示3次（符合元宝规则）

2. 自动爬虫系统

双策略爬取：

方案1：每30分钟爬取指定帖子的最新口令
方案2：每1小时爬取元宝吧首页前10个帖子


时间过滤：只采集20分钟内的新口令
智能清理：每小时清理过期口令，每天0点重置

3. 用户体验

一键复制：点击即可复制口令
报告无效：发现无效口令可直接删除
实时统计：显示当前可用口令数量
限流保护：防止滥用（每分钟最多获取20次）


 碎碎念
抽了几天下班后的时间总是完成了。
我也不知道百度什么时候又会抽风，给我加个安全验证。总之，我尽力解决吧。
感谢@Xeron的前端支持。

1 view07:56

LinuxDo 新帖推送

标题: 只有我升级了 Gemini CLI 然后发现 3 Pro 模型没了吗？
作者: #jinhy
板块: #搞七捻三
编号: 1576620
帖子: https://linux.do/t/topic/1576620
时间: 2026-02-07 15:55:18
摘要:

咋回事儿啊佬友们，有人知道没

1 view07:56

LinuxDo 新帖推送

标题: Codex输入时分词
作者: #PongPong
板块: #开发调优
编号: 1576621
帖子: https://linux.do/t/topic/1576621
时间: 2026-02-07 15:56:26
摘要:

大家好，我想请教一个问题。我在使用 Codex 输入时，经常是按 Control + Space，但随后删除时往往会一下子删掉一大片内容。相比之下，Claude 就很正常，删除时只删一个词或词组。我想知道，有没有办法让 Codex 也采用这种类似 Claude Code 的分词（删除）方式？

1 view07:58

LinuxDo 新帖推送

标题: 千万别再叫我 Western Digital！请叫WD！
作者: #Davon
板块: #前沿快讯
编号: 1576625
帖子: https://linux.do/t/topic/1576625
时间: 2026-02-07 15:58:09
摘要:

他们在官网中，宣布将使用全新商标Logo，日后将不再使用 Western Digital，请叫它WD。与此同时，WD将会启用全新的商标 Logo，象征公司在运营、财务和战略层面的转型。当中也提到说，在日常沟通中人们很习惯将 Western Digital 称为 WD，甚至连员工也只会说在WD上班。

1 view07:58

LinuxDo 新帖推送

标题: 最近很火的那个谐音游戏，可以测一下各家模型的识图能力和中文谐音能力，笑死了
作者: #thehuan
板块: #搞七捻三
编号: 1576628
帖子: https://linux.do/t/topic/1576628
时间: 2026-02-07 15:58:53
摘要:

原图是这个，猜3个字词语

这是答案
spoiler
接下来是各家模型的表现，首先登场的是gpt5.2无思考模式

回答错误！
豆包回答正确，并且思考过程很有意思

gemini 3 pro一如既往的强

qwen3 max 框框想了一大堆，回答错误

这是gork专家模式，想了很久，回答正确，但连了网，不排除是联网得到的答案

这是minimax，回答正确！思考过程简洁明确，厉害

这是GLM-4.7，笑死 

最后附上一些题，大家可以自行测试

这是谐音梗 (click for more details)

2 views08:01

LinuxDo 新帖推送

标题: 有什么ios app 能接公益站的
作者: #fall into the abyss
板块: #搞七捻三
编号: 1576639
帖子: https://linux.do/t/topic/1576639
时间: 2026-02-07 16:01:18
摘要:

好用的app 好看的~

2 views08:04

LinuxDo 新帖推送

标题: Claude code Max 拼车，有没有要拼的
作者: #Aa..26552
板块: #搞七捻三
编号: 1576648
帖子: https://linux.do/t/topic/1576648
时间: 2026-02-07 16:03:53
摘要:

找 Claude code Max 一块拼车的，有没有一起要拼的，还有位置

2 views08:06

LinuxDo 新帖推送

标题: 【请教佬们】网络小说的阅读有哪些渠道，抑或是有哪些作品推荐~
作者: #小胡
板块: #读书成诗
编号: 1576650
帖子: https://linux.do/t/topic/1576650
时间: 2026-02-07 16:04:06
摘要:

近日看了几部动态漫，放空大脑，代入主角，发现还是挺上头的，回顾后，发现这些视频大多数源自于网络小说或者漫画，得益于现在的AI，帮助到了业内人员，动态漫愈来愈多。
由于以往我接触网络文学（小说/漫画）比较少，继而我好奇，大家平日里是否阅读过什么网络小说，都是以什么渠道下载/看的网络小说，有没有什么推荐作品？
最后通过我最近看的几部作一个简单观感分享:
我看的几个作品无一不是让我感受到了主角的“爽”，若自己代入主角的世界，我会很想看下去，究竟会发生什么。
无论是借助于系统还是借助于主角的天赋，开挂也好，暴富也好，其所有内容都是与日常生活的平淡所不一样，有的还融合了推理、校园生活、冒险、奇幻修仙战斗等要素，有的作品对角色的塑造十分细腻，进而让我十分向往那个世界并成为那个主角，再加上剧情的反转，所以几个小时沉迷其中就在所难免了。
不过可惜的是，许多网络小说的内容十分长，我看的几个视频都是10-20个小时，我感觉已经很长了，但是似乎原作小说的进度还未过半，看久了就容易发现视频后续套路都相似，缺少那种惊喜感。
若让我认真思考回忆其剧情、框架，我估计已经记不住太多，甚至可能1天前看的内容都忘得差不多了，不过要是有对的上自己兴趣的主题，花几个小时当一回视频里的主角，也不失为一种放松的选择

2 views08:07

LinuxDo 新帖推送

标题: 哪里能用chatgpt pro
作者: #railway
板块: #开发调优
编号: 1576657
帖子: https://linux.do/t/topic/1576657
时间: 2026-02-07 16:05:59
摘要:

除了chatgpt team和pro会员，还有什么方法可以使用chatgpt pro吗

1 view08:07

LinuxDo 新帖推送

标题: 分享视觉检测有意向行人，播报欢迎光临的方案
作者: #sug
板块: #开发调优
编号: 1576663
帖子: https://linux.do/t/topic/1576663
时间: 2026-02-07 16:07:33
摘要:

之前写了一篇关于这方面方案的咨询，如何通过摄像头画面判断是否有人靠近
但是感觉都差强人意一些，于是经过几天的现场实测，采用了这样的方案
物理设备：固定机位的摄像头，无测距功能，放置在自助xx机器身上，桌面环境或周边
现场环境：酒店大堂，普通商店，亦或是路边街道
需求：对路过有意向从而靠近机器的行人进行欢迎语播报和介绍
实机部署方案：采用face_detection_yunet_2023mar模型进行人脸识别，频率为每0.5秒检测一次，当第一次检测到人脸时，需持续至2.5秒后仍能检测到，则视为有效顾客，播报欢迎语。当连续十秒未能检测到人脸后，则重置状态
相对于行人检测的优点来说，yunet模型适配性好，并且速度很快，误检率极低，在低画质摄像头上的表现非常好，通过人脸朝向更能精准捕捉到意向客人，同时，由于人脸大小较为均匀，亦可通过对检测到的人脸矩形框面积进行模糊的距离判定，可在一定程度上控制播报时机
还有什么可精进的欢迎补充讨论

1 view08:09

LinuxDo 新帖推送

标题: 佬友们，推荐办理哪个平台的虚拟U卡钱包性价比比较高
作者: #WvRt
板块: #搞七捻三
编号: 1576664
帖子: https://linux.do/t/topic/1576664
时间: 2026-02-07 16:07:42
摘要:

接触Ai这么久了,慢慢的涉及到境外支付的问题，好多地方银联都不支持而且感觉特别麻烦 ，有佬友推荐搞一个虚拟钱包，我自己去看了一下YouTube和b站上很多教程，目前来看很多博主推荐欧易，币安，Bitget，这几个平台较多，所以我想请问各位见多识广的佬友们，就单纯的当个支付工具用最好是推荐哪个平台呢 ！

1 view08:09

LinuxDo 新帖推送

标题: RAG知识库还有搞头吗？
作者: #windgo
板块: #开发调优
编号: 1576669
帖子: https://linux.do/t/topic/1576669
时间: 2026-02-07 16:08:57
摘要:

项目背景
由于业务需求，团队需处理海量的电子文档。单个表单涉及的 PDF 数量通常在 1000 至 5000 份不等。自 2025 年 12 月启动知识库项目以来，我们在几个月的实战中遇到了以下瓶颈：

超长文档解析难：部分文档页数过多，解析速度极慢，且极易触发内存溢出（OOM）。
工程图纸识别精度低：项目中包含大量工程图纸，通用解析工具常将其误识别为普通图片，导致要素提取缺失或严重失真。
多格式兼容性差：用户上传的文件涵盖 PDF、图片、CAD 及 Office 办公文档。虽然 PDF 解析相对成熟，但对于超多列的复杂 Excel 表单，解析效果堪称“灾难”。
深度问答可靠性不足：对于高难度的逻辑推理问答，单纯依赖通用 LLM 的语义检索往往难以达到业务精度要求。
其他长尾问题：如离线部署环境下的资源分配、响应延迟等。


选型调研与避坑指南
考虑到研发周期，我们优先对市面主流的开源 RAG 框架进行了评测，以下是各产品的实测反馈：
1. RAGFlow
地位：RAG 领域的重量级框架。
核心优势：

多租户架构：具备完善的团队/租户权限管理。
工作流编排：支持灵活的问答流程定制。
DeepDoc：其自研的解析神器，是目前对复杂文档适配度较高的方案之一。

实测痛点：

精度与性能平衡：面对复杂图纸时要素遗漏较多。CPU 模式解析极慢，GPU 模式虽有提升但仍非实时；且由于是内部框架，二次开发门槛较高。
OCR 适配：第三方 OCR 引擎接入尚处于实验阶段，底层仍高度依赖内置引擎。
幻觉问题：纯向量检索难以应对结构化查询，需引入 MCP（Model Context Protocol）结合 SQL 查询来增强。

开源协议：Apache License 2.0。
2. Dify
地位：生态最丰富、上手门槛最低的 RAG 平台。
核心优势：极其出色的流程编排与插件功能，支持外挂 RAGFlow 知识库。
实测痛点：

知识库“偏科”：Dify 的核心在于 Agent 编排，其自带的文档切割与索引功能相对基础。虽可通过插件强化，但需投入额外开发精力。

商业限制（需留意）：

其修改版的 Apache 2.0 协议规定：禁止未经授权运营多租户 SaaS；必须保留 UI 标识。
结论：若需多租户或深度去标识化商用，必须通过 API 接入自研前端。

3. Yuxi-Know（语析）
特点：界面友好，符合国人逻辑。
实测痛点：OCR 引擎对接方案较为生涩，虽然选项多，但实际落地效果不佳，更适合处理中短篇幅的简单文档。
开源协议：MIT（极度友好）。
4. Weknora (腾讯)
特点：模块化架构，融合多模态预处理，大厂出品。
实测痛点：OCR 引擎内聚程度过高，几乎无法灵活切换或自定义识别逻辑，改造难度大。
开源协议：MIT。
5. AnythingLLM
特点：功能全家桶，内置 TTS/STT，开箱即用体验好。
实测痛点：OCR 依旧是短板，面对专业领域的重度文档显得力不从心。
开源协议：MIT。

核心痛点汇总

OCR 解析能力的“资源与精度”悖论：在离线部署的有限硬件資源下，难以同时满足“高速度”与“高精度”的解析需求。
混合检索与统计分析缺失：业务问答不只是语义匹配，往往涉及大量数据库统计（Chat2SQL）。纯 RAG 方案在处理这类问题时容易“抓瞎”。


OCR 专项分析




方案
优点
缺点
适用场景




MinerU
结构化还原（Markdown）效果好，支持 VLM 模式。
内存开销极大（3000页PDF可达100G+），离线部署资源成本极高。
对精度有极致要求的离线单任务。


DeepDoc
适配广，针对 RAG 场景优化。
复杂图纸易遗漏，解析效率随页数增加线性变慢。
通用文档解析。


Paddle/Rapid
部署轻量，GPU/CPU 兼容性好。
缺乏对文档版面还原（Layout Analysis）的深度支持。
简单文字识别。


VLM/大模型类
逻辑理解能力最强。
成本高、受限于上下文窗口，难以处理千页以上的超长文档。
关键要素精准抽提。




总结与反思
目前项目处于“深水区”：通用框架在面对工业级、超长、复杂版面文档时，均出现了明显的边际效应。
下一步我们可能需要跳出“全盘依赖开源框架”的思维：

解耦解析层：建立独立的 OCR 解析集群，将长文档切片并行处理，并引入 VLM 进行关键要素校准。
强化 MCP 架构：不再强求 LLM 读懂整个 Excel，而是通过 Agent 调用 SQL 插件进行数据分析。

2 views08:09

LinuxDo 新帖推送

标题: 登顶之后，只剩下睡意 😴
作者: #疯狂驴驴
板块: #搞七捻三
编号: 1576672
帖子: https://linux.do/t/topic/1576672
时间: 2026-02-07 16:10:24
摘要:

下文由人工编写但经过AI润色，但真实性百分比

不知道这里有没有人玩过 《开局托儿所》 这个小游戏。之前同事安利给我，我就随手试了试。
结果很快就发现：我是真的没什么游戏天赋，手眼完全跟不上，最高也就 120 多分。
但作为一个 Developer，我当然不服。于是我花了两天写了一个最基础的自动化脚本，周末高强度测试了一波（可能脚本还不够强，也没完全自动化），最高也只是提升到 130 多。
后来我慢慢意识到：我已经不在玩游戏了，我在做“仿真 + 策略优化”。
我把整个棋盘抽象成一个可模拟环境，用笔记本一秒能跑几十局。凭感觉加上查资料，我前后做了六七个策略，其中一个表现不错，平均分能稳定在 105 左右。这时候“最高分”已经没意义了，分数变成了统计学意义上的指标。
当然故事还没结束。
随着模拟越来越多，我开始发现这个游戏并不简单：在常见的搜索算法下，它的搜索空间大得离谱。于是我做了大量实验，又结合了一些灵光一现的分析，最终设计出一个新的策略。
这个策略的平均分直接拉到 113 左右，远超之前所有版本。
再回到真实游戏里——经过这么长时间折腾，我也把操作部分做到了完全自动化。新策略在实战里表现非常稳定，基本几局就能跑到 140+，最高甚至到了 150+。


我看到 GitHub 上也有一些类似的小脚本，但用起来不太顺手，所以干脆把自己的实现整理出来分享一下：

  

      github.com
  

  
    
  

  GitHub - xx025/rs10env: RS10 board game env (Gymnasium + PyTorch) and...

    RS10 board game env (Gymnasium + PyTorch) and heuristic strategies


  

  
    
    
  

  


老实说，我现在这个策略应该还不是最强的——肯定有大佬还有更猛的想法，只是没公开。欢迎交流、PR、或者分享你们的策略思路。

2 views08:11

About

Blog

Apps

Platform