LinuxDo 新帖推送
185 subscribers
253K photos
316K links
Download Telegram
标题: 【木子狸的指北指南】11 翻译模型自部署的选择与测评
作者: #木子不是木子狸
板块: #运营反馈
编号: 1708306
帖子: https://linux.do/t/topic/1708306
时间: 2026-03-08 16:53:54
摘要:
测评基础信息
本地部署测试机器使用 Mac mini M4 16g 进行多模型翻译测试。
使用LMStudio来作为模型下载和管理的平台。
这里只是为了简洁,同时可以获取输出token数和输出时间。
边界和要求
由于是自部署模型,所以需要兼顾模型的大小和翻译能力。同时还需要考虑在一些比较长的上下文下的翻译能力。
这里有限考虑参数量较小的开源模型——16g mac最好是14b参数及以下的。
筛选了现在 ollama 上的Popular排行中的 199 个模型,排除其中带cloud标签的模型,和 14b 以上的模型还剩余 130 个。
模型筛选

模型 (click for more details)
由于一些模型较老和主要负责的功能不同,所以我选取了以下模型。

mistralai/ministral-3-3b
liquid/lfm2.5-1.2b
qwen/qwen3.5-9b (Q4_K_M)-- 慢 建议翻译一次后存储
lmstudio-community/Qwen3.5-0.8B-GGUF
deepseek/deepseek-r1-0528-qwen3-8b
lmstudio-community/Qwen3.5-4B-GGUF – 慢 建议翻译一次后存储
qwen/qwen3-4b-thinking-2507 – 慢 建议翻译一次后存储
zai-org/glm-4.6v-flash – 慢 建议翻译一次后存储
HY-MT1.5-1.8B-GGUF

测试集
https://linux.do/guidelines

整个社区准则内容,将其分割为JSON文件,然后开发了一个自动化调用AI的脚本用来获得输出,token数,输出时间等等,汇总到excel的文件中,然后后续再进行处理。


github.com






GitHub - mu-zi-lee/tranlate-model-benchmark: 用于Linux Do的翻译模型测评项目

用于Linux Do的翻译模型测评项目
标题: 有没感觉opencode很慢?
作者: #ltxlong
板块: #开发调优
编号: 1708310
帖子: https://linux.do/t/topic/1708310
时间: 2026-03-08 16:54:06
摘要:
环境:
win + opencode web + omo + codex5.3xhigh
怎么可以设置opencode使用特点的工具来搜索?
听说ripgrep、fast-context很快,我安装了,但没有自动使用过,我看执行过程都是使用grep、glob,ast-grep也很少触发,需要怎么配置吗?还是直接在提示词里说明使用?还是有什么方法来提速?
标题: 手写代码也是一种健身吗?
作者: #stevessr backup
板块: #搞七捻三
编号: 1708321
帖子: https://linux.do/t/topic/1708321
时间: 2026-03-08 16:56:22
摘要:
那我手指用坏了算什么?
标题: 【求助】Saas项目的人声/背景音解决方案
作者: #korgo
板块: #开发调优
编号: 1708329
帖子: https://linux.do/t/topic/1708329
时间: 2026-03-08 16:59:25
摘要:
最近给自己的小组捣鼓了一个翻译工具,都搞得7788了,发现没有适合saas的人声/背景音的模型。
1.没有办法本地部署模型,只能部署到服务器上,但服务器却只有2核4G,还包含了其他工具模块,即便模型能部署,估计并发也是完蛋了。
2.接API是最好的方式应该,但我找不到只提供分离功能的API。。。
3.租个GPU服务器,又有点小题大做了,何况我这玩意不盈利啊,把我卖了不够买个GPU服务器的。
4.我唯一能想到的办法就是找一台亚太的2-4G服务器,单独跑一个轻量的模型。
路断了…没招了…
标题: augment(byok)的 edit-file不可修改文件问题要怎么解决呀?
作者: #LHL
板块: #开发调优
编号: 1708340
帖子: https://linux.do/t/topic/1708340
时间: 2026-03-08 17:01:39
摘要:
标题: 关于cc中读取pdf的疑问(有时可以有时不行)
作者: #muyidan
板块: #搞七捻三
编号: 1708342
帖子: https://linux.do/t/topic/1708342
时间: 2026-03-08 17:01:52
摘要:
各位佬友,我是一个约等于纯小白的新手,最近在使用claude code命令行读取pdf文件时有一些疑问
就是有些文档可以读取,有些文档总是提示没有权限
gpt解答的一些方案我尝试过一些,想问下这个是文档的原因吗(我打开没有任何要求输入密码啊),还是说我的变量配置存在一些问题呢

这是不可以读取的文件

这是可以读取的文件
使用的都是anyrouter的api,感谢各位佬友
标题: 有点纠结想开一个Kimi的Andante会员
作者: #RefractionHikari
板块: #搞七捻三
编号: 1708363
帖子: https://linux.do/t/topic/1708363
时间: 2026-03-08 17:04:20
摘要:
看了半天都没有看明白这个会员权益,莫名其妙,我就是想调用一下k2.5的模型,不知道会员有没有额度什么的,但是哪里都不说,也不知道这个提速提额是什么意思

平时就是用Cherry Studio然后对话之类的。需要速度和稳定性所以直接氪金放弃公益站了。
标题: 为什么大家都在聊team封号,没人说plus封号
作者: #李豆
板块: #开发调优
编号: 1708364
帖子: https://linux.do/t/topic/1708364
时间: 2026-03-08 17:04:22
摘要:
因为正常来说 可以同时绑定一个team  一个plus试用。  plus产量应该跟team差不多(或者略低),为什么没人说plus封号  因为基本不风控吗