LinuxDo 新帖推送
188 subscribers
254K photos
317K links
Download Telegram
标题: 长文有没有目录/大纲?
作者: #Black名單
板块: #运营反馈
编号: 1609927
帖子: https://linux.do/t/topic/1609927
时间: 2026-02-12 23:23:11
摘要:
阅读咱们站的精品长文很爽
但是有没有目录或者大纲呢?
毕竟有些文章太长了,能通过目录或者大纲直接跳到自己想看的位置就好了
标题: 千问火爆期间下单方法
作者: #寒暄
板块: #福利羊毛
编号: 1609930
帖子: https://linux.do/t/topic/1609930
时间: 2026-02-12 23:24:58
摘要:
千问请客,   奶茶水果零食、盒马天猫超市都能用免单卡~ 你现在有 21 张千问免单卡可用(价值25元/张)。   每邀请 1 位新朋友来千问,   还可再领 1 张免单卡。   邀请好友。   当前你的地址是:xxxxxx(点击修改),   帮我点xxx
地址不用改,光改点xxx就行,直接复制发过去就行,看见有佬友分享其他办法也分享下
标题: 【慢讯】小红书开源改图模型FireRed-Image-Edit,在多个评测集中达到SOTA
作者: #M77
板块: #前沿快讯
编号: 1609940
帖子: https://linux.do/t/topic/1609940
时间: 2026-02-12 23:29:27
摘要:
技术报告
GitHub仓库
Demo
权重后续开源
不得不说,AI时代,数据就是金矿啊,只要有数据、舍得花钱,就算是一个原本没技术背景的公司,也能够做出一个SOTA模型。
标题: 阿里Ovis2.6开源发布
作者: #longlong
板块: #前沿快讯
编号: 1609941
帖子: https://linux.do/t/topic/1609941
时间: 2026-02-12 23:29:48
摘要:
阿里国际 AI 团队(AIDC-AI)近正式发布并开源了 Ovis2.6 系列模型。这是 Ovis 系列多模态大模型的最新重大迭代。
1. 核心定位:极致的文字渲染与 OCR 能力
Ovis2.6 最显著的进化在于其对视觉文字的处理能力。它旨在解决多模态模型在复杂排版、长文本 OCR 以及图像中文字生成(Text Rendering)方面的短板。

高保真文字渲染: 7B 参数规模的 Ovis-Image 在文字生成精度上表现惊人。在 CVTG-2K 榜单上,其 Word Accuracy 达到 0.9200,超越了参数量更大的 Qwen-Image (0.8288) 甚至 GPT-4o (0.8569)。
长文本 OCR 优势: 针对海报、Banner、UI 原型、信息图表等文字密集场景进行了深度优化,尤其在中文长文本渲染得分(LongText-Bench-ZN: 0.964)上处于行业领先地位。

2. 引入“思维链”推理(Thinking Mode)
延续了 Ovis2.5 以来的核心特性,Ovis2.6 进一步强化了反射式推理(Reflective Reasoning):

可解释推理: 模型在回答复杂多模态问题前,会先进行类似 DeepSeek-R1 的逻辑思考(输出在 <think> 标签内)。
性能与权衡: 用户可以通过设置 thinking_budget 来控制推理步数,在低延迟与高准确度之间切换。这一机制显著提升了模型在 STEM 题目、复杂表格分析和多图对比中的逻辑表现。

3. 开源生态与部署

模型规格: 发布了包括 2B、7B(Ovis-Image)、9B 等不同规模的模型,旨在实现“小模型、大性能”,支持在单张消费级显卡上高效运行。
开源地址: * GitHub: AIDC-AI/Ovis

Hugging Face: 提供了全系列的权重下载与在线 Demo 体验。
(AIDC-AI/Ovis2.6-30B-A3B · Hugging Face)


工具支持: 已支持 vLLM 推理框架,并有社区提供的 ComfyU
标题: 虚拟现实感觉好恐怖
作者: #K
板块: #搞七捻三
编号: 1609951
帖子: https://linux.do/t/topic/1609951
时间: 2026-02-12 23:34:20
摘要:
就是不知道怎么的,虚拟现实感觉与世隔绝就很恐怖,就像是
黑客帝国
瓦利
这些电影
人类完全进入虚拟太恐怖了
meta 是说要完全进入 虚拟世界
但是我看了苹果的他们没说虚拟现实 vr 而是增强现实 ar
不知道有什么差别
但是我感觉现实世界的不完美才是最完美的
虚拟现实的那种恐怖我不懂怎么说
就是
活着没意义 没挑战还是怎么的
标题: 如果豆包的语音可以破限?emmmm
作者: #mofas
板块: #搞七捻三
编号: 1609954
帖子: https://linux.do/t/topic/1609954
时间: 2026-02-12 23:35:55
摘要:
咱就是说,如果豆包的语音可以破限,搞点颜色,emmmm
我都不敢想,那得多刺激!
标题: nas佬进来帮帮小弟,影视方面。
作者: #Chenyang xi
板块: #开发调优
编号: 1609958
帖子: https://linux.do/t/topic/1609958
时间: 2026-02-12 23:38:24
摘要:
佬们,入了飞牛nas,现在想搞个影视,老婆主要看爱优腾的综艺和电视剧,可能要付费,自己偶尔看看美剧,短剧,电影等等。有啥办法能用好飞牛nas,制作自己的影视资源库,让我老婆爱上用nas,想看啥电视剧只要一点就全部下载完了,包括要会员的。毕竟老婆满意了,我买nas的花呗才有出处。新人nas求帮助。听说了bt站,bt站这种爱优腾刚上线的电视剧啥的齐嘛?复杂吗操作。
标题: MiniMax-M2.5正式发布 超越GLM-5
作者: #fengchris
板块: #前沿快讯
编号: 1609961
帖子: https://linux.do/t/topic/1609961
时间: 2026-02-12 23:40:25
摘要:
标题: vscode的codex插件ui好呆能改吗?
作者: #cabudon
板块: #开发调优
编号: 1609962
帖子: https://linux.do/t/topic/1609962
时间: 2026-02-12 23:41:13
摘要:
如图,这啥命令都看不出来,全挤在一起,更关键的是把我文件列表位置占了都不知道咋改
这种ui设计,不给ai所有权限、自动选是才显得呆啊
像claude code的插件就好很多
标题: DeepSeek 感觉搜索还是一般呐
作者: #白日星梦DSD
板块: #搞七捻三
编号: 1609963
帖子: https://linux.do/t/topic/1609963
时间: 2026-02-12 23:42:31
摘要:
deepseek





来自分享的对话 - DeepSeek

这是一个很有深度的问题。大型语言模型(LLM)与人类语言习惯的差异,根源不在于“语法错误”,而在于**语言生成机制的底层逻辑完全不同**。只要理解了这种差异,改善甚至“人性化”这个局面是完全可能的。 我们可以分三步来看:**为什么不同 → 能否改善 → 怎么改善**。 --- ### 一、 为什么如此不同?—— 概率与意图的博弈 人类说话是**意图驱动**的,而LLM是**概率驱动**的。这导致了几个核心差异: 1. **从0到1 vs 从1到N** - **人类**:说话前通常心里...












对于这组对话:

首先,如果我不提醒他使用搜索工具,甚至只提醒“可以使用工具”,他都没有运用搜索的意识,特别还是查询时间这种实时的东西。
其次,看他阅读的内容:

单看其中一个: 01:00 on Thursday, 12 February, 2026 in Canada - TimeNow.pk

这里显示了这是多久以前的讯息,由此可以推断出当前时间,但 DS 没有,说明他可能没有阅读网页内容。
注意到将上文的链接删掉后缀: https://timenow.pk
这玩意能直接显示当前时间,但 DS 没看。
下一组对话:

可以得出的信息:

DS 没有明确知道自己的代号
完全没有 V4 的概念和其信息
搜索网页不读其中内容

就这样
标题: 大佬们 目前国产新发布的大模型 哪个医疗和健康能力比较强大的
作者: #苍牙
板块: #搞七捻三
编号: 1609965
帖子: https://linux.do/t/topic/1609965
时间: 2026-02-12 23:43:50
摘要:
佬们 我是准备用cherry在本地创建医疗知识库 然后进行医疗和保健方面的问答 我想问问哪个模型靠谱一些