linux.do
21.8K subscribers
133K photos
202 videos
133 files
274K links
linux.do最新话题和热议话题
Download Telegram
北京朝阳租房平台中介推荐

佬们,刚来北京,需要租一个房子,我看了自如、安居客这两个平台,网上关于这两个平台的评价均不太好,自己也找了几个中介感觉像坑人的,有没有有经验得佬给推荐一下靠谱得平台和中介?

12 posts - 8 participants

Read full topic

via LINUX DO - 最新话题 (author: 穆柒)
有无佬做过微信小程序会员卡组件相关的内容

微信小程序会员卡组件要调出来必须要认证开放平台的开发者账号么

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 诺 陈)
刚BOSS投了简历,测试岗位

人在上海,对面是苏州的;HR说只有一轮面试,并且只能是线下;这个就让我困惑了,看了官网,也是卖产品、服务的;客户有企业、政务这种

佬友们,给个建议?

苏州的就业行情怎么样呀,IT这块测试的

5 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 小新)
Google邮箱注册

前两天发现自己之前注册的Google邮箱长时间没使用,被锁住了,然后重新注册发现需要扫码验证,发现可以使用claude网页版登录中页面中的注册,没有任何验证,一次性注册了三个,有佬友说可能是节点的原因,我使用的是US的。水一篇。

22 posts - 12 participants

Read full topic

via LINUX DO - 最新话题 (author: wangyiyi1)
Deepseek 团队开源 3B 的 DeepSeek-OCR

此前也有询问过deepseek团队网页为什么支持识别图片 和 pdf等文档,

得到的结果是 仅支持识别图片和文档中的文字内容,并将这个内容构建上下文给到v3模型进行整理和回复。

并不不同于传统的ocr模型,团队回复的是针对性做了处理和优化,看来这次是看到本尊了。

相关的权重和论文都已经开源,感兴趣的可以去了解一些。

在10倍压缩比下,模型的OCR准确率达到了96%以上,即使是20倍压缩比时,准确率也能维持在60%左右。

DeepSeek-OCR的模型结构包括两个主要部分:DeepEncoder和MoE解码器。其中,DeepEncoder是核心组件,负责将输入图像压缩为视觉标记。这个编码器能处理高分辨率图像,同时保持低的计算需求。它采用了一种混合模型结构,结合了窗口注意力和全局注意力,能够根据需要处理不同分辨率的图像。解码器部分使用了MoE(Mixture of Experts)架构,它通过从多个专家中选择一部分来进行解码,从而在保证准确率的同时提高了处理效率。

对比其他现有的OCR模型,DeepSeek-OCR的优势在于它使用了更少的视觉标记,达到了更高的效率。例如,在OmniDocBench测试中,它使用了100个视觉标记就能超越需要256个标记的GOT-OCR2.0,而MinerU2.0使用7000多个标记的情况下,DeepSeek-OCR也能以不到800个标记的量取得更好的表现。

数据标注部分使用的是paddleocr,也是出息了,给蹭到热度了
huggingface.co

deepseek-ai/DeepSeek-OCR · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.
github.com

DeepSeek_OCR_paper.pdf

7 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: Safphere)

Invalid media:
image
image
image
image
image
image
image
image
image
image
总是眨眼是怎么回事

不知道为啥,跟别人说话眼睛总是眨个不停,除此之外好像也没有其他症状了,跟爸妈说话的时候就不会眨的那么厉害

9 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: JackeyLove)
在wsl中使用codex,配置playwright连接远程浏览器调试

最近在折腾codex安装页面远程调试,用的总不顺心。
想着有没有连接本地已启动的浏览器实时让大模型操作浏览页面,查看文档支持dcp协议,刚好可以使用,废话不多说。

codex配置文件
vim ~/.codex/config.toml


第一种:如果你只是想使用基础版本
[mcp_servers.playwright]
command = "npx"
args = ["@playwright/mcp@latest","--isolated","--no-sandbox"]


第二种:wsl中连接windows外部浏览器

需要注意的是wsl和外部系统网络保持畅通
1、windows启动chrome浏览器和端口监听,–user-data-dir设置用户目录
"C:\\Program Files\\Google\\Chrome\\Application\\chrome.exe" --remote-debugging-port=9222 --user-data-dir="C:\\chrome_dev" --remote-debugging-address=0.0.0.0

1.5、确认端口监听状态
在 Windows PowerShell 中执行:
netstat -ano | findstr 9222

输出类似于
TCP 127.0.0.1:9222 0.0.0.0:0 LISTENING 12345

2、在wsl中找到windows主机IP
cat /etc/resolv.conf | grep nameserver

输出类似nameserver 172.21.48.1

3、测试连接
curl <http://172.21.48.1:9222/json/version>
请求返回有json,获取webSocketDebuggerUrl

{ "Browser": "Chrome/135.0.7049.85", "Protocol-Version": "1.3", "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/135.0.0.0 Safari/537.36", "V8-Version": "13.5.212.10", "WebKit-Version": "537.36 (@1e112499da812a1dde62101ed601dcb93024aaff)", "webSocketDebuggerUrl": "ws://172.21.48.1:9222/devtools/browser/35a1c7e5-c863-49c1-bf13-ec6d88717a20" }

4、配置mcp,使用cdp协议【重点注意webSocketDebuggerUrl】
[mcp_servers.playwright]
command = "npx"
args = ["@playwright/mcp@latest","--cdp-endpoint","ws://172.21.48.1:9222/devtools/browser/35a1c7e5-c863-49c1-bf13-ec6d88717a20"]

args = ["@playwright/mcp@latest","--extension"]
env = {"PLAYWRIGHT_MCP_EXTENSION_TOKEN"= "VoEiMWAeXItxwYrmmpWh0mdXSVheDbm_v4s1zxXQN3I"}


其他环境网络相关

如果你wsl环境网络原因安装不上,根据可以编辑.bashrc。根据Linux系统版本【可能是.bash文件自行判断】
添加到用户环境变量

export UV_INDEX=http://mirrors.aliyun.com/pypi/simple
export UV_DEFAULT_INDEX=http://mirrors.aliyun.com/pypi/simple
export npm_config_registry=https://registry.npmmirror.com


加载新配置后再尝试安装命令
source ~/.bashrc
执行help命令,确认wsl中已安装好依赖
> npx @playwright/mcp@latest --help


其他注意事项:

1、需要注意的是浏览器每次启动的webSocketDebuggerUrl都不一样,如果有变动需要更新里面的token,是有点麻烦。
2、另外官方有–extension参数支持,说在浏览器安装拓展就可以连接已运行的浏览器实例(edge,chrome),我在wsl下测试没跑通,如果成功了的大佬可以分享一下。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 拖拉机)
佬友们,pplx 是挂了吗

perplexity.ai是挂了吗?用 us 节点,前一秒还能回答,后面就报错了
这是封号了还是ip 问题哦

12 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: sunfly)

Invalid media: image
哪位神人把cursor都搞崩了,接口都500了

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: fly me)

Invalid media: image
cursor/perplexity崩溃

perplexity核心功能崩溃

cursor登录

11 posts - 8 participants

Read full topic

via LINUX DO - 最新话题 (author: openff)

Invalid media:
image
image
【招聘】广州越秀 5年+工作经验 java开发 15-25K

主要职责

1. 系统设计与开发: 负责公司核⼼业务系统的架构设计、模块开发、代码编写和单元测试,确保系统的⾼可
⽤、⾼性能和⾼扩展性。
2. 技术难题攻关: 解决系统开发、运维过程中遇到的关键技术难题和性能瓶颈,提供有效的技术解决⽅案。
3. 代码质量与评审: 主导或参与代码审查,确保团队代码规范、⾼质量、可维护性强,并能有效辅导中级开发
⼯程师。
4. 性能优化: 持续对现有系统进⾏性能分析、容量评估和优化,提升系统效率和⽤户体验。
5. 技术预研与落地: 跟踪业界前沿技术(如云原⽣、微服务、Service Mesh等),并能在合适的业务场景中进
⾏技术选型、预研和推⼴落地。
6. 协作与沟通: 与产品经理、测试⼯程师、运维⼯程师等紧密协作,确保项⽬按时、⾼质量地交付。
任职要求

必需条件

1. 经验背景: 计算机科学或相关专业本科及以上学历,5-8年及以上⼤型分布式、⾼并发系统的后端开发经验。
2. Java核⼼技能:∙精通Java语⾔及JVM原理,包括内存模型、多线程编程、并发处理、性能调优等。∙精通
Spring Boot、Spring Cloud、MyBatis等主流开源框架,并深⼊了解其核⼼原理和机制。
3. Go语⾔技能: 具备⾄少1年以上的Go语⾔项⽬开发经验,熟悉Go的并发模型、常⽤框架和⼯具链。
4. 数据库与中间件:∙熟练掌握MySQL等关系型数据库的设计、优化和故障处理。∙熟练使⽤⼀种或多种NoSQL
数据库,如Redis、MongoDB、Elasticsearch等。∙熟悉常⽤消息中间件,如Kafka、RabbitMQ、RocketMQ
的⼯作原理和使⽤场景。
5. 分布式技术: 深⼊理解微服务架构,具有实际的微服务拆分、治理和分布式事务(如Seata、TCC、 Saga)
实践经验。
6. 运维与部署: 熟悉Docker容器化技术,了解Kubernetes(K8s)的基本概念和使⽤,具有CI/CD流⽔线的实
践经验。

优先考虑

1. 熟悉使用AI开发,对AI编程有较为深度的了解和使用
2. 有在Java和Go之间进⾏技术选型或重构迁移的实战经验。
3. 具备良好的技术⽂档撰写能⼒。
4. 具备⼀定的⽹络与⽹络安全知识,了解TCP/IP、HTTP/HTTPS等协议,对常⻅Web安全漏洞(如OWASP Top 10)有基本认知,并在开发中有相应的防范意识与实践
5. 有从0到1主导或深度参与⼤型系统架构设计的经验。

主营零信任,还有微隔离、DDI、SASE组网加速。实话实说阶段性会加班,大小休…

有兴趣的佬友们可以发一下简历

7 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: xiaomaolv)
超快讯deepseek发布新模型狙击百度

deepseek也发布了自己的OCR模型
跑分

仓库链接
github.com

GitHub - deepseek-ai/DeepSeek-OCR: Contexts Optical Compression

Contexts Optical Compression

不知道和百度的比咋样

10 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: Ningbainb)

Invalid media:
image
image
image
华住还有个金卡

华住会员要过期了,分手后没啥用了。还有个金卡,领的说一声,以防后面的人不知道

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: yakisama)

Invalid media:
image
image
droid不能登陆了?

我弹不出用谷歌账号登陆的界面

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Cazean)
有没有研究过新blue引擎的佬友,请教个问题

登录器配置好了打开没反应,正常应该下载更新文件,有没有懂的佬友帮忙解答一下,谢谢了🙏🙏🙏
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: liaoge)

Invalid media:
image
image
求高质量号商

如题所示,想找号商 😃

3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 石 马)
老农的packycode使用感受说实话挺差的

目前A社确实在大量封号,但是作为中转站的运营上,在处理这个售后的时候,我觉得体验感很差,虽然有QQ群在维护售后,很多人在里面聊天,一进去就是几百条,一些重要的信息都看不见,小车经常使用不了,我买的是包月套餐,但是一搞半天用不了,最近频发,也没有售后主动来说给我们延期套餐,或者说把这个包月给我们转换为余量,不过期的那种,完全浪费了我包月套餐时间

12 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: shmilyxwx)
佬们知道ping32这个软件吗?

我一起摸鱼的朋友今天说他们老板给他们装了这个软件,一查发现是防止泄密的软件,但是还有监控屏幕的功能, 可随时截图或录屏,这下没法安心摸鱼了。而他说除了知道老板来安装才知道这个软件,在电脑上完全不知道软件在哪,没一点痕迹。哎,只能用手机摸了。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 闰土)
据说 gemini 3 要发了 $2x

比claude良心~
效果很赞

6 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: Greatcc)
[翻译开源项目]Anthropics/skills中文版本-CC技巧学习指南

github.com

GitHub - LeastBit/Anthropics_skills_zh-CN: Anthropics/skills中文学习版本

Anthropics/skills中文学习版本

亲爱的开发者们,我刚刚完成了 Anthropic Skills 即claude有关CC的使用仓库 的全量中文化整理,欢迎前往我的译文仓库(保留原始目录结构,并采用“英文名称_中文名称”的命名方式)免费下载使用。无论你想快速了解 Claude 技能体系的最佳实践,还是需要直接上手 Word/PDF/PPTX/XLSX 处理脚本,这份中文版都能帮你省去大量摸索时间。

亮点速览:

🧩 原汁原味的官方示例:完整保留算法艺术、品牌规范、Slack GIF、MCP 服务器等全部技能。
📄 文档技能全译本:OOXML、docx-js、HTML 转 PPT 流程、PDF 表单填写等高级指南均已翻译补充。
📦️ 即取即用:学习后即可在 Claude Code、Claude.ai 或 API 中运用,快速体验技能生态。

如果你正在搭建企业内部 Copilot、需要示例脚本做二次开发,或者想学习 Anthropic 的技能设计模式,这份中文版资料会是绝佳起点。欢迎点赞、转发或 PR,一起把更多高质量的中文 AI 开发资料带给社区!
附有站内佬公益站白嫖指南
白嫖指南 (click for more details)
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Rourou Li)

Invalid media: image