标题: 我們三 ~~~
作者: #善解人意屬實有點害羞
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151678
时间: 2025-11-09 22:40:59
摘要:
作者: #善解人意屬實有點害羞
板块: #开发调优
编号:
1151678帖子: https://linux.do/t/topic/1151678
时间: 2025-11-09 22:40:59
摘要:
标题: 新人水贴求赞
作者: #🐾
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151684
时间: 2025-11-09 22:44:31
摘要:
作者: #🐾
板块: #搞七捻三
编号:
1151684帖子: https://linux.do/t/topic/1151684
时间: 2025-11-09 22:44:31
摘要:
想升级,发个帖求一下赞
标题: Ai的API调用提问
作者: #任先生
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151694
时间: 2025-11-09 22:47:57
摘要:
作者: #任先生
板块: #搞七捻三
编号:
1151694帖子: https://linux.do/t/topic/1151694
时间: 2025-11-09 22:47:57
摘要:
想问问各佬图一二的API模式要如何填写
图三的API主机和路径如何填写
而图四软件又只要API地址,又应该如何填写
最后类似于图五图六的后面变动的基址改动了什么,应该如何修改
标题: 暗号5L6LXDSH 4KQVVUBU XWS21FYG V40V6IB9 N63MC2ON LAB7IX21 6XRLAJJR QL9SME1U QEMF6PGK WFGKA93V
作者: #SuperXiaoai
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1151706
时间: 2025-11-09 22:50:34
摘要:
作者: #SuperXiaoai
板块: #福利羊毛
编号:
1151706帖子: https://linux.do/t/topic/1151706
时间: 2025-11-09 22:50:34
摘要:
站点 super-yi.com
q群 1060621032
对不起,我真的很懒
标题: DeepSeek缓存命中真好玩
作者: #luckyln07x
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151708
时间: 2025-11-09 22:52:23
摘要:
作者: #luckyln07x
板块: #搞七捻三
编号:
1151708帖子: https://linux.do/t/topic/1151708
时间: 2025-11-09 22:52:23
摘要:
还挺便宜
标题: 不愧是百度,GOV都敢直接要钱
作者: #Tech_Sky
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151710
时间: 2025-11-09 22:52:39
摘要:
作者: #Tech_Sky
板块: #搞七捻三
编号:
1151710帖子: https://linux.do/t/topic/1151710
时间: 2025-11-09 22:52:39
摘要:
详见:http://www.shmh.gov.cn/shmh/bmfw/index.html
对此我只能用一个表情回复:
标题: openai兼容的本地嵌入模型服务(fastAPI+transformers)
作者: #kkkqkx
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151713
时间: 2025-11-09 22:53:14
摘要:
作者: #kkkqkx
板块: #开发调优
编号:
1151713帖子: https://linux.do/t/topic/1151713
时间: 2025-11-09 22:53:14
摘要:
前情提要
之前我在搓一个代码库索引的项目,过程中我需要本地部署了all-mini-lm模型来验证分段效果。虽然ollama、vllm已经提供了解决方案,但是ollama、vllm有些太重了,而且ollama的批处理优化的并不好,这2个对纯cpu的优化也不怎么样。
github上同类的项目基本上都是为正经的llm设计的,对嵌入模型的考虑较少,对批处理也基本上没有考虑。
考虑到多数人的设备并没有那么强大,跑跑嵌入模型实际上可能还更有用。因此,我就顺手搓了个fastAPI+transformers的项目,用于提供v1/embeddings和v1/models端点。模型支持直接从hagging face拉取,也支持直接导入本地的safetensors。
项目地址为 kkkqkx123/openaiAPI-transformers-embedLM: A openai embedding api provider building with transformers and FastAPI
核心优势
本项目特别适合以下场景:
高并发嵌入服务:需要处理大量并发嵌入请求的应用
实时文本分析:需要低延迟嵌入向量生成的实时系统
成本敏感环境:希望在有限硬件资源下获得最佳性能
OpenAI 生态集成:需要与现有 OpenAI API 客户端无缝集成
微服务架构:作为文本处理微服务嵌入现有系统
本项目已经有了比较完善的批处理支持、日志系统,也提供了灵活的配置选项。
纯cpu、本地环境下我已经跑过了,已经没问题了。至于对gpu的支持完全是ai写的,由于我根本没有gpu,需要的佬友只能自己调了。V我GPU也行。
docker目前还是实验性质的。不过这项目似乎也没必要部署在docker上,如果有佬友需要的话我再去调试一下。
另外,前面提到的代码库索引估计还要不少时间才能搓出来。我采用的是ast解析+向量嵌入+图索引的形式。等我搓好以后也发出来给大家试毒用用。想了解的话也可以先去我的仓库里看看。
标题: 好表情,使我想起……
作者: #stevessr
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151715
时间: 2025-11-09 22:53:23
摘要:
作者: #stevessr
板块: #搞七捻三
编号:
1151715帖子: https://linux.do/t/topic/1151715
时间: 2025-11-09 22:53:23
摘要:
hiro……
标题: [开源] EveryTalk 1.6.2更新 提供免费Gemini2.5系模型 支持Gemini TTS(这个没用)
作者: #Qoney
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151718
时间: 2025-11-09 22:54:04
摘要:
作者: #Qoney
板块: #开发调优
编号:
1151718帖子: https://linux.do/t/topic/1151718
时间: 2025-11-09 22:54:04
摘要:
github.com
GitHub - roseforljh/EveryTalk: 君子爱财,取之有道
君子爱财,取之有道
1、支持Gemini TTS(没啥用,写了UI不舍得删随便搞得)
2、添加默认文本模型(Gemini2.5系 除了pro 每天只有50次调用次数 其他无限制)
3、优化上滑卡顿体验
4、多处UI视觉优化
5、删除图像模式下ai生成得图像3天自动删除的逻辑
6、多处bug修复
7、解决一些安全问题
8、优化、增强了自动获取模型的逻辑(无视http)并且加强了交互逻辑
因为一直用的debug版本调式,用的人也少我这个app,所以免费提供了Gemini模型(主要是Gemini网页的12个月 的账号我有4个,我用不完,直接反代出来+一些其他地方的反代(abs和cli),Gemini2了一堆,但是用却是一直在用gpt5和claude4.5),release版本有啥bug我也不知道…免费的凑合用吧
标题: 求推荐屏幕翻译软件
作者: #すみれ す
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151743
时间: 2025-11-09 23:03:13
摘要:
作者: #すみれ す
板块: #搞七捻三
编号:
1151743帖子: https://linux.do/t/topic/1151743
时间: 2025-11-09 23:03:13
摘要:
android有什么好用的屏幕翻译软件?可以在用Reddit或x的时候方便翻译,或者其他软件的时候,不想把系统设置成中文,已root
标题: 谁有claude pro 4个月免费试用的申请方法,付费请教
作者: #terry
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1151754
时间: 2025-11-09 23:06:10
摘要:
作者: #terry
板块: #福利羊毛
编号:
1151754帖子: https://linux.do/t/topic/1151754
时间: 2025-11-09 23:06:10
摘要:
谁有claude pro 4个月免费试用的申请方法,付费请教
标题: 上L站上不去了?
作者: #任先生
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151755
时间: 2025-11-09 23:06:25
摘要:
作者: #任先生
板块: #搞七捻三
编号:
1151755帖子: https://linux.do/t/topic/1151755
时间: 2025-11-09 23:06:25
摘要:
为什么上L站老是弹这个了?
标题: 问下大佬们超微X10SDV-16C-TLN2F板载的万兆电和X550比如何?
作者: #Jaco3426
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151770
时间: 2025-11-09 23:11:47
摘要:
作者: #Jaco3426
板块: #搞七捻三
编号:
1151770帖子: https://linux.do/t/topic/1151770
时间: 2025-11-09 23:11:47
摘要:
准备把pciex16拆成x8x8再拓展四个25G或10G,如果板载的万兆电还可以就不拓展万兆电了,毕竟发热太大,改散热也麻烦。查了一下官网并没有写板载万兆电的具体型号。
另外问一下QL411x2和CX4121在RouterOS里免驱吗?
有没有知道的老哥解答一下,万分感谢~
标题: 记录解决拨号上网不能使用魔法的神奇bug
作者: #gjx1
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151771
时间: 2025-11-09 23:11:57
摘要:
作者: #gjx1
板块: #开发调优
编号:
1151771帖子: https://linux.do/t/topic/1151771
时间: 2025-11-09 23:11:57
摘要:
被这个问题困扰了整整一个周末,照着AI的步骤试过了所有方案,DNS,虚拟网卡,路由配置…结果绕了一大圈发现根本不是校园网的问题,而是win7到win11系列都没有修复的拨号bug,那就是你不能把你的宽带连接名称命名为中文。。。
希望能帮到以后同样遇到这个问题的佬友吧