LinuxDo 新帖推送
188 subscribers
254K photos
317K links
Download Telegram
标题: Ai的API调用提问
作者: #任先生
板块: #搞七捻三
编号: 1151694
帖子: https://linux.do/t/topic/1151694
时间: 2025-11-09 22:47:57
摘要:
想问问各佬图一二的API模式要如何填写


图三的API主机和路径如何填写
而图四软件又只要API地址,又应该如何填写


最后类似于图五图六的后面变动的基址改动了什么,应该如何修改
标题: 暗号5L6LXDSH 4KQVVUBU XWS21FYG V40V6IB9 N63MC2ON LAB7IX21 6XRLAJJR QL9SME1U QEMF6PGK WFGKA93V
作者: #SuperXiaoai
板块: #福利羊毛
编号: 1151706
帖子: https://linux.do/t/topic/1151706
时间: 2025-11-09 22:50:34
摘要:
站点 super-yi.com
q群 1060621032
对不起,我真的很懒
标题: DeepSeek缓存命中真好玩
作者: #luckyln07x
板块: #搞七捻三
编号: 1151708
帖子: https://linux.do/t/topic/1151708
时间: 2025-11-09 22:52:23
摘要:
还挺便宜
标题: 不愧是百度,GOV都敢直接要钱
作者: #Tech_Sky
板块: #搞七捻三
编号: 1151710
帖子: https://linux.do/t/topic/1151710
时间: 2025-11-09 22:52:39
摘要:
详见:http://www.shmh.gov.cn/shmh/bmfw/index.html
对此我只能用一个表情回复:
标题: openai兼容的本地嵌入模型服务(fastAPI+transformers)
作者: #kkkqkx
板块: #开发调优
编号: 1151713
帖子: https://linux.do/t/topic/1151713
时间: 2025-11-09 22:53:14
摘要:
前情提要
之前我在搓一个代码库索引的项目,过程中我需要本地部署了all-mini-lm模型来验证分段效果。虽然ollama、vllm已经提供了解决方案,但是ollama、vllm有些太重了,而且ollama的批处理优化的并不好,这2个对纯cpu的优化也不怎么样。
github上同类的项目基本上都是为正经的llm设计的,对嵌入模型的考虑较少,对批处理也基本上没有考虑。
考虑到多数人的设备并没有那么强大,跑跑嵌入模型实际上可能还更有用。因此,我就顺手搓了个fastAPI+transformers的项目,用于提供v1/embeddings和v1/models端点。模型支持直接从hagging face拉取,也支持直接导入本地的safetensors。
项目地址为 kkkqkx123/openaiAPI-transformers-embedLM: A openai embedding api provider building with transformers and FastAPI
核心优势
本项目特别适合以下场景:

高并发嵌入服务:需要处理大量并发嵌入请求的应用
实时文本分析:需要低延迟嵌入向量生成的实时系统
成本敏感环境:希望在有限硬件资源下获得最佳性能
OpenAI 生态集成:需要与现有 OpenAI API 客户端无缝集成
微服务架构:作为文本处理微服务嵌入现有系统

本项目已经有了比较完善的批处理支持、日志系统,也提供了灵活的配置选项。
纯cpu、本地环境下我已经跑过了,已经没问题了。至于对gpu的支持完全是ai写的,由于我根本没有gpu,需要的佬友只能自己调了。V我GPU也行。
docker目前还是实验性质的。不过这项目似乎也没必要部署在docker上,如果有佬友需要的话我再去调试一下。
另外,前面提到的代码库索引估计还要不少时间才能搓出来。我采用的是ast解析+向量嵌入+图索引的形式。等我搓好以后也发出来给大家试毒用用。想了解的话也可以先去我的仓库里看看。
标题: 好表情,使我想起……
作者: #stevessr
板块: #搞七捻三
编号: 1151715
帖子: https://linux.do/t/topic/1151715
时间: 2025-11-09 22:53:23
摘要:
hiro……
标题: [开源] EveryTalk 1.6.2更新 提供免费Gemini2.5系模型 支持Gemini TTS(这个没用)
作者: #Qoney
板块: #开发调优
编号: 1151718
帖子: https://linux.do/t/topic/1151718
时间: 2025-11-09 22:54:04
摘要:
github.com






GitHub - roseforljh/EveryTalk: 君子爱财,取之有道

君子爱财,取之有道












1、支持Gemini TTS(没啥用,写了UI不舍得删随便搞得)
2、添加默认文本模型(Gemini2.5系 除了pro 每天只有50次调用次数 其他无限制)
3、优化上滑卡顿体验
4、多处UI视觉优化
5、删除图像模式下ai生成得图像3天自动删除的逻辑
6、多处bug修复
7、解决一些安全问题
8、优化、增强了自动获取模型的逻辑(无视http)并且加强了交互逻辑
因为一直用的debug版本调式,用的人也少我这个app,所以免费提供了Gemini模型(主要是Gemini网页的12个月 的账号我有4个,我用不完,直接反代出来+一些其他地方的反代(abs和cli),Gemini2了一堆,但是用却是一直在用gpt5和claude4.5),release版本有啥bug我也不知道…免费的凑合用吧
标题: 求推荐屏幕翻译软件
作者: #すみれ
板块: #搞七捻三
编号: 1151743
帖子: https://linux.do/t/topic/1151743
时间: 2025-11-09 23:03:13
摘要:
android有什么好用的屏幕翻译软件?可以在用Reddit或x的时候方便翻译,或者其他软件的时候,不想把系统设置成中文,已root
标题: 谁有claude pro 4个月免费试用的申请方法,付费请教
作者: #terry
板块: #福利羊毛
编号: 1151754
帖子: https://linux.do/t/topic/1151754
时间: 2025-11-09 23:06:10
摘要:
谁有claude pro 4个月免费试用的申请方法,付费请教
标题: 上L站上不去了?
作者: #任先生
板块: #搞七捻三
编号: 1151755
帖子: https://linux.do/t/topic/1151755
时间: 2025-11-09 23:06:25
摘要:
为什么上L站老是弹这个了?
标题: 问下大佬们超微X10SDV-16C-TLN2F板载的万兆电和X550比如何?
作者: #Jaco3426
板块: #搞七捻三
编号: 1151770
帖子: https://linux.do/t/topic/1151770
时间: 2025-11-09 23:11:47
摘要:
准备把pciex16拆成x8x8再拓展四个25G或10G,如果板载的万兆电还可以就不拓展万兆电了,毕竟发热太大,改散热也麻烦。查了一下官网并没有写板载万兆电的具体型号。
另外问一下QL411x2和CX4121在RouterOS里免驱吗?
有没有知道的老哥解答一下,万分感谢~
标题: 记录解决拨号上网不能使用魔法的神奇bug
作者: #gjx1
板块: #开发调优
编号: 1151771
帖子: https://linux.do/t/topic/1151771
时间: 2025-11-09 23:11:57
摘要:
被这个问题困扰了整整一个周末,照着AI的步骤试过了所有方案,DNS,虚拟网卡,路由配置…结果绕了一大圈发现根本不是校园网的问题,而是win7到win11系列都没有修复的拨号bug,那就是你不能把你的宽带连接名称命名为中文。。。
希望能帮到以后同样遇到这个问题的佬友吧
标题: windsurf 新注册的账号积分额度为0是什么原因?
作者: #baixiaochong
板块: #开发调优
编号: 1151783
帖子: https://linux.do/t/topic/1151783
时间: 2025-11-09 23:15:46
摘要:
如图,有没有佬知道什么情况?如何破解?
标题: 【求职求助贴】二本Java后端,4年对日外包经验,想跳一线城市,迷茫求指路!
作者: #Rekii
板块: #非我莫属
编号: 1151801
帖子: https://linux.do/t/topic/1151801
时间: 2025-11-09 23:18:08
摘要:
各位佬友周末好!
我是一名2021年毕业的普通二本计算机专业男生,毕业后一直在老家太原的一家对日开发公司工作。从2021年公司不到100人,到现在已经发展到100多人。
下面是我的一些工作情况和现状:
基本信息:


部门:Java Web 后端


日常工作:

70%的时间在阅读日文技术文档
30%的时间在写代码和修复Bug



薪资待遇:

月到手收入:6000元(含绩效)
年中 + 年终奖:共12000元
去年总收入:8.4万元

工时安排:

正常下班,周末双休
平时加班没有加班费,周末调休
每月有一次可能需要通宵上线
项目高峰期偶尔需要加班到晚上9点以后

今年薪资涨了700元,明年预计也会涨几百元。总体看来,一年下来大概能攒个4-5万,但感觉自己的上升空间有限。
因此,我现在希望能跳槽到一线城市,特别是广州或者上海,寻找更有挑战和发展空间的工作。
目前的技术栈:

框架:主要使用Struts,偶尔接触Spring相关组件

最近我一直在刷猎聘,但是觉得自己的技术栈和市场上的一些岗位要求不太匹配。
我该如何准备,才能顺利在广州或上海找到一份Java后端的工作呢?
大家有什么建议或者经验可以分享吗?