linux.do
21.8K subscribers
133K photos
202 videos
133 files
275K links
linux.do最新话题和热议话题
Download Telegram
deepseekocr2发布了,是不是为多模态铺路?

我们提出了 DeepSeek-OCR 2,以研究一种新型编码器 ——DeepEncoderV2 的可行性,该编码器能够根据图像语义动态重新排序视觉令牌。传统的视觉 - 语言模型(VLMs)在输入到大型语言模型(LLMs)时,总是按照固定的光栅扫描顺序(从左上角到右下角)处理视觉令牌,并使用固定的位置编码。然而,这与人类的视觉感知相矛盾,人类的视觉感知遵循由内在逻辑结构驱动的灵活且语义连贯的扫描模式。特别是对于布局复杂的图像,人类视觉会表现出具有因果信息的顺序处理方式。受这种认知机制的启发,DeepEncoder V2 旨在赋予编码器因果推理能力,使其能够在基于大型语言模型进行内容解读之前,智能地重新排序视觉令牌。本研究探索了一种新范式:是否可以通过两个级联的一维因果推理结构有效实现二维图像理解,从而提供一种新的架构方法,有望实现真正的二维推理。代码和模型权重可在http://github.com/deepseek-ai/DeepSeek-OCR-2公开获取。

9 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: sd d)

Invalid media:
image
image
有佬推荐claude code的中转商吗?

量大管饱的那种,性价比高一些,稳定一些,最好不降智的。

15 posts - 12 participants

Read full topic

via LINUX DO - 最新话题 (author: kuyoeku)
【韭菜收割】AI博主发视频号做中转站把人引流到微信群收割

避雷这种模型混合掺假+利用开源项目收割微信群的人erlich.fun

Erlich Liu - 个人网站

Erlich Liu的个人网站 - 全栈开发者,产品经理

9 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: LLL ZG)

Invalid media:
image
image
codex vscode上下文

求问佬们,这个上下文用完,是不是要新开对话框呢?
3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 哈基米南北路多)

Invalid media: image
2026年测测你是什么马?

起因是抖音上看到一个 如下的图片

感觉挺有意思 我就想 这加上测评会不会更好玩

于是乎Claude code 启动!!!

撸出来一个纯前端的玩意出来

效果差不多是这样的

自我感觉可能有点意思 也没啥技术在里面 索性开源
github.com

GitHub - ChengX3/cenima: 2026玩梗项目 你是神马?

2026玩梗项目 你是神马?

想玩的可以自行搭建

属性我也是搜来的 时间主要画在了找图片和名字

14 posts - 12 participants

Read full topic

via LINUX DO - 最新话题 (author: ChengX3)

Invalid media:
image
image
image
image
image
image
给佬友们看看陪伴我6年的老伙计

19年配的主机(amd3600+1660ti),一直使用到今年的年中,玩了好多单机游戏,大表哥2、2077、gta5、老头环、魂3、只狼、黑猴、快递模拟器等等

配了台新主机后就闲置了(主要是没地方放了)

买了个3d打印的支架,改成开放式itx,没想到刚刚好可以放在我桌子的音箱上面,装了个linux准备跑点东西玩玩

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 原神高手)

Invalid media: image
有没有可以自部署的文档管理系统?

佬们,我的需求就是,在线写一些教程类的文档,文档里面可以下载附件,然后写好的文档可以通过链接分享出去,最好是可以部署到自己服务器的,有这种系统吗?

5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: teamoo)
富可敌国有微信/支付宝的支付方式么

公司这边没法用visa卡付

9 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: Dax)
网络代理问题

佬们,我使用Flclash的时候上午都一切正常,下午突然就是国内的都访问不了了,国外的还能访问?倒反天罡了,它会报错TLS connect error:error:0A000126:SSL routines:unexpected eof while reading

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Imzl Zl)
公司内部资源外发共享方法

现在公司内部有大量的发版包要发到外网,外网客户那边去下载。单个项目产物大概30G 左右。现在是使用百度网盘的方式上传,导致最近联通双线网盘都被限制上传数据。 现在想要寻求一种既便宜又能应对这个问题的方法,求佬友们请教

36 posts - 14 participants

Read full topic

via LINUX DO - 最新话题 (author: 猪娃娃)
这里是 Kimi 月之暗面,今天我们开源 Kimi K2.5,带来全新视觉理解、代码和 Agent 集群能力


The soul never thinks without a mental image. 灵魂如果没有图像,就无法思考。

Aristotle De Anima
今天,我们发布并开源 Kimi K2.5 模型:

它是 Kimi 迄今最智能的模型,在 Agent、代码、图像、视频及一系列通用智能任务上取得开源 state-of-the-art 表现。
也是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。
我们相信,更智能、更全能,代码能力更强的模型,有助于推动技术平权,让更多人从中受益:
Kimi K2.5 让智能更加触手可及。通过将视觉理解与推理、代码、Agent 等能力结合,K2.5 降低了用户与 AI 的交互门槛:当语言难以准确描述时,可拍照、截图或录屏传给 Kimi,突破文字表达的限制。
Kimi K2.5 让人人精通 Office。K2.5 模型将 Kimi Agent 能力扩展到日常办公领域,开始掌握 Word、Excel、PPT、PDF 等常用软件的中高阶技能,助用户直接交付准专业水平的办公文档。

我们相信,AI Agent 将赋予每个人「超能力」。就像人类社会一样,要处理真正复杂的工作需要协作一样。K2.5 首次引入了「Agent 集群」能力,让 K2.5 学会自主创建自己的「分身」,按需组成不同角色的团队,并行工作,团队作战,获得 10 倍、100 倍的效率提升。

131 posts - 120 participants

Read full topic

via LINUX DO - 最新话题 (author: Kimi_Moonshot)

Invalid media: image
耗时两周,让AI写了个文字小游戏

最近流行先做个垃圾出来,于是就有了 onegame.ai 纯AI写的,我一行代码都没有。

现在放的三个模型都是阿里百炼送的1Mtoken免费额度,如果生成失败可能是额度用完了,就添加自定义模型吧,自定义模型虽然存储在本地,但是连接socket服务器的时候还是需要把api和api_key传给服务器,服务器虽然不做存储(连接socket后放内存里使用,断开就注销)但不保证绝对安全(比如中间人攻击什么的),请自行选择。

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: OC)

Invalid media: image
GPT不降智的 家宽IP在哪买 求大佬给我个地址

7 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: escanor)
codex的plan的推理等级固定为中等?是好还是坏?

我还是喜欢xhig
固定为中等。。我怎么感觉一步错,步步错,如果计划都没有做好,实施的也是错误的方向
Fixing main and make plan mode reasoning effort medium (#9980) · openai/codex@509ff1c · GitHub

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 猫优优)
支付宝新年集福早鸟活动今日开始了

1.27-2.2进入支付宝搜“集福”进入活动页可以领取早鸟卡,2.3开始在集福页面可以兑换稀有福卡

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 烧水器煎鸡蛋)
CPA 接入多个 codex team 账号,路由策略选哪个好?

我知道 Antigravity 是选择轮询,但是 codex 选哪个模式好?

4 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: ilvsx)

Invalid media: image
还有两日飞升

6 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: asuka)

Invalid media: image
记一次通过哈基米解决自己电脑连接wong佬公益站cc的问题,希望能帮助遇到问题的佬

昨天 Wong 佬放出福利后,今天刚好有需要要用 Claude ,但是一启动发现连接失败(如图)。但是没有更新最新版 Claude Code 前是可以正常使用的(可能是我手机开热点的问题???:tieba_004: )。

首先前往 Wong 佬公益站首页的常见问题板块查询,发现该问题被标注为用户自身网络配置问题

随后通过询问哈基米发现是代理配置问题,我按照哈基米的建议在打开 Claude 前,先运行代理配置命令:set HTTPS_PROXY=http://127.0.0.1:7890 执行后成功打开 Claude,也是成功开启了对话。

为了彻底解决这个,哈基米建议我在 PowerShell 中进行更全面的代理配置(将 7890 替换为自身实际代理端口):

powershell
# 设置 HTTP 和 HTTPS 代理
$Env:HTTP_PROXY="http://127.0.0.1:7890"
$Env:HTTPS_PROXY="http://127.0.0.1:7890"

# 告诉 Node.js 忽略证书错误(Claude 基于 Node 开发,此步骤关键)
$Env:NODE_TLS_REJECT_UNAUTHORIZED="0"

但是实际上并没有解决这个问题。

于是我就想着用Claude来解决这个问题,cc给我的建议是在系统环境变量中添加对应代理配置项
image

按照建议配置完成后再次尝试启动,问题也是终于解决啦。

希望我的方法能帮助到遇到相同问题的佬们。:tieba_001:

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: BD2025)

Invalid media:
image
image
拼多多领取8折、75折、7折券和5元无门槛红包

在拼多多首页搜索栏输入“年货节大促”,进入会场。
中间有个签到,点击一下,
第一天可以领取8折券,第二天75折,第三天7折,第四天5元无门槛

5 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 4382sdf)

Invalid media: image
求助:有能够使用Nano banana pro 的平台生成图片吗?想多人使用平台界面生成图片。可充值

有个小项目需要利用谷歌的香蕉模型生成训练样本,大概10个人,调用平台界面生成,有朋友能够推荐一下服务平台吗?

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 天才周)