标题: Ai的API调用提问
作者: #任先生
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151694
时间: 2025-11-09 22:47:57
摘要:
作者: #任先生
板块: #搞七捻三
编号:
1151694帖子: https://linux.do/t/topic/1151694
时间: 2025-11-09 22:47:57
摘要:
想问问各佬图一二的API模式要如何填写
图三的API主机和路径如何填写
而图四软件又只要API地址,又应该如何填写
最后类似于图五图六的后面变动的基址改动了什么,应该如何修改
标题: 暗号5L6LXDSH 4KQVVUBU XWS21FYG V40V6IB9 N63MC2ON LAB7IX21 6XRLAJJR QL9SME1U QEMF6PGK WFGKA93V
作者: #SuperXiaoai
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1151706
时间: 2025-11-09 22:50:34
摘要:
作者: #SuperXiaoai
板块: #福利羊毛
编号:
1151706帖子: https://linux.do/t/topic/1151706
时间: 2025-11-09 22:50:34
摘要:
站点 super-yi.com
q群 1060621032
对不起,我真的很懒
标题: DeepSeek缓存命中真好玩
作者: #luckyln07x
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151708
时间: 2025-11-09 22:52:23
摘要:
作者: #luckyln07x
板块: #搞七捻三
编号:
1151708帖子: https://linux.do/t/topic/1151708
时间: 2025-11-09 22:52:23
摘要:
还挺便宜
标题: 不愧是百度,GOV都敢直接要钱
作者: #Tech_Sky
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151710
时间: 2025-11-09 22:52:39
摘要:
作者: #Tech_Sky
板块: #搞七捻三
编号:
1151710帖子: https://linux.do/t/topic/1151710
时间: 2025-11-09 22:52:39
摘要:
详见:http://www.shmh.gov.cn/shmh/bmfw/index.html
对此我只能用一个表情回复:
标题: openai兼容的本地嵌入模型服务(fastAPI+transformers)
作者: #kkkqkx
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151713
时间: 2025-11-09 22:53:14
摘要:
作者: #kkkqkx
板块: #开发调优
编号:
1151713帖子: https://linux.do/t/topic/1151713
时间: 2025-11-09 22:53:14
摘要:
前情提要
之前我在搓一个代码库索引的项目,过程中我需要本地部署了all-mini-lm模型来验证分段效果。虽然ollama、vllm已经提供了解决方案,但是ollama、vllm有些太重了,而且ollama的批处理优化的并不好,这2个对纯cpu的优化也不怎么样。
github上同类的项目基本上都是为正经的llm设计的,对嵌入模型的考虑较少,对批处理也基本上没有考虑。
考虑到多数人的设备并没有那么强大,跑跑嵌入模型实际上可能还更有用。因此,我就顺手搓了个fastAPI+transformers的项目,用于提供v1/embeddings和v1/models端点。模型支持直接从hagging face拉取,也支持直接导入本地的safetensors。
项目地址为 kkkqkx123/openaiAPI-transformers-embedLM: A openai embedding api provider building with transformers and FastAPI
核心优势
本项目特别适合以下场景:
高并发嵌入服务:需要处理大量并发嵌入请求的应用
实时文本分析:需要低延迟嵌入向量生成的实时系统
成本敏感环境:希望在有限硬件资源下获得最佳性能
OpenAI 生态集成:需要与现有 OpenAI API 客户端无缝集成
微服务架构:作为文本处理微服务嵌入现有系统
本项目已经有了比较完善的批处理支持、日志系统,也提供了灵活的配置选项。
纯cpu、本地环境下我已经跑过了,已经没问题了。至于对gpu的支持完全是ai写的,由于我根本没有gpu,需要的佬友只能自己调了。V我GPU也行。
docker目前还是实验性质的。不过这项目似乎也没必要部署在docker上,如果有佬友需要的话我再去调试一下。
另外,前面提到的代码库索引估计还要不少时间才能搓出来。我采用的是ast解析+向量嵌入+图索引的形式。等我搓好以后也发出来给大家试毒用用。想了解的话也可以先去我的仓库里看看。
标题: 好表情,使我想起……
作者: #stevessr
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151715
时间: 2025-11-09 22:53:23
摘要:
作者: #stevessr
板块: #搞七捻三
编号:
1151715帖子: https://linux.do/t/topic/1151715
时间: 2025-11-09 22:53:23
摘要:
hiro……
标题: [开源] EveryTalk 1.6.2更新 提供免费Gemini2.5系模型 支持Gemini TTS(这个没用)
作者: #Qoney
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151718
时间: 2025-11-09 22:54:04
摘要:
作者: #Qoney
板块: #开发调优
编号:
1151718帖子: https://linux.do/t/topic/1151718
时间: 2025-11-09 22:54:04
摘要:
github.com
GitHub - roseforljh/EveryTalk: 君子爱财,取之有道
君子爱财,取之有道
1、支持Gemini TTS(没啥用,写了UI不舍得删随便搞得)
2、添加默认文本模型(Gemini2.5系 除了pro 每天只有50次调用次数 其他无限制)
3、优化上滑卡顿体验
4、多处UI视觉优化
5、删除图像模式下ai生成得图像3天自动删除的逻辑
6、多处bug修复
7、解决一些安全问题
8、优化、增强了自动获取模型的逻辑(无视http)并且加强了交互逻辑
因为一直用的debug版本调式,用的人也少我这个app,所以免费提供了Gemini模型(主要是Gemini网页的12个月 的账号我有4个,我用不完,直接反代出来+一些其他地方的反代(abs和cli),Gemini2了一堆,但是用却是一直在用gpt5和claude4.5),release版本有啥bug我也不知道…免费的凑合用吧
标题: 求推荐屏幕翻译软件
作者: #すみれ す
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151743
时间: 2025-11-09 23:03:13
摘要:
作者: #すみれ す
板块: #搞七捻三
编号:
1151743帖子: https://linux.do/t/topic/1151743
时间: 2025-11-09 23:03:13
摘要:
android有什么好用的屏幕翻译软件?可以在用Reddit或x的时候方便翻译,或者其他软件的时候,不想把系统设置成中文,已root
标题: 谁有claude pro 4个月免费试用的申请方法,付费请教
作者: #terry
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1151754
时间: 2025-11-09 23:06:10
摘要:
作者: #terry
板块: #福利羊毛
编号:
1151754帖子: https://linux.do/t/topic/1151754
时间: 2025-11-09 23:06:10
摘要:
谁有claude pro 4个月免费试用的申请方法,付费请教
标题: 上L站上不去了?
作者: #任先生
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151755
时间: 2025-11-09 23:06:25
摘要:
作者: #任先生
板块: #搞七捻三
编号:
1151755帖子: https://linux.do/t/topic/1151755
时间: 2025-11-09 23:06:25
摘要:
为什么上L站老是弹这个了?
标题: 问下大佬们超微X10SDV-16C-TLN2F板载的万兆电和X550比如何?
作者: #Jaco3426
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151770
时间: 2025-11-09 23:11:47
摘要:
作者: #Jaco3426
板块: #搞七捻三
编号:
1151770帖子: https://linux.do/t/topic/1151770
时间: 2025-11-09 23:11:47
摘要:
准备把pciex16拆成x8x8再拓展四个25G或10G,如果板载的万兆电还可以就不拓展万兆电了,毕竟发热太大,改散热也麻烦。查了一下官网并没有写板载万兆电的具体型号。
另外问一下QL411x2和CX4121在RouterOS里免驱吗?
有没有知道的老哥解答一下,万分感谢~
标题: 记录解决拨号上网不能使用魔法的神奇bug
作者: #gjx1
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151771
时间: 2025-11-09 23:11:57
摘要:
作者: #gjx1
板块: #开发调优
编号:
1151771帖子: https://linux.do/t/topic/1151771
时间: 2025-11-09 23:11:57
摘要:
被这个问题困扰了整整一个周末,照着AI的步骤试过了所有方案,DNS,虚拟网卡,路由配置…结果绕了一大圈发现根本不是校园网的问题,而是win7到win11系列都没有修复的拨号bug,那就是你不能把你的宽带连接名称命名为中文。。。
希望能帮到以后同样遇到这个问题的佬友吧
标题: windsurf 新注册的账号积分额度为0是什么原因?
作者: #baixiaochong
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151783
时间: 2025-11-09 23:15:46
摘要:
作者: #baixiaochong
板块: #开发调优
编号:
1151783帖子: https://linux.do/t/topic/1151783
时间: 2025-11-09 23:15:46
摘要:
如图,有没有佬知道什么情况?如何破解?
标题: 【求职求助贴】二本Java后端,4年对日外包经验,想跳一线城市,迷茫求指路!
作者: #Rekii
板块: #非我莫属
编号:
帖子: https://linux.do/t/topic/1151801
时间: 2025-11-09 23:18:08
摘要:
作者: #Rekii
板块: #非我莫属
编号:
1151801帖子: https://linux.do/t/topic/1151801
时间: 2025-11-09 23:18:08
摘要:
各位佬友周末好!
我是一名2021年毕业的普通二本计算机专业男生,毕业后一直在老家太原的一家对日开发公司工作。从2021年公司不到100人,到现在已经发展到100多人。
下面是我的一些工作情况和现状:
基本信息:
部门:Java Web 后端
日常工作:
70%的时间在阅读日文技术文档
30%的时间在写代码和修复Bug
薪资待遇:
月到手收入:6000元(含绩效)
年中 + 年终奖:共12000元
去年总收入:8.4万元
工时安排:
正常下班,周末双休
平时加班没有加班费,周末调休
每月有一次可能需要通宵上线
项目高峰期偶尔需要加班到晚上9点以后
今年薪资涨了700元,明年预计也会涨几百元。总体看来,一年下来大概能攒个4-5万,但感觉自己的上升空间有限。
因此,我现在希望能跳槽到一线城市,特别是广州或者上海,寻找更有挑战和发展空间的工作。
目前的技术栈:
框架:主要使用Struts,偶尔接触Spring相关组件
最近我一直在刷猎聘,但是觉得自己的技术栈和市场上的一些岗位要求不太匹配。
我该如何准备,才能顺利在广州或上海找到一份Java后端的工作呢?
大家有什么建议或者经验可以分享吗?
标题: Claude Code分享
作者: #re0hg
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1151810
时间: 2025-11-09 23:19:41
摘要:
作者: #re0hg
板块: #开发调优
编号:
1151810帖子: https://linux.do/t/topic/1151810
时间: 2025-11-09 23:19:41
摘要:
基于之前一个佬友发的codex规则、自己的体验和官方文档的最佳实践制作的CLAUDE.md
无子代理版
# CLAUDE.md — Claude Code 工作操作手册
本文件面向 Claude Code,定义其职责与操作规范。
## 0. 角色定位与职责边界
| instruction | notes |
| --------------------------------------------------------------------------------------------------------------------------------------- | -------------------- |
| Claude Code 负责任务规划、代码编写、文档生成、上下文收集、测试验证、质量审查等全流程 | 保持全栈能力 |
| 职责范围:需求分析、技术方案设计、任务规划、代码实现、测试执行、质量验证、文档编写、工具使用、深度推理分析 | 承担完整开发生命周期 |
| 工作模式:接收用户指令 → 深度思考(sequential-thinking) → 规划任务 → 执行实现 → 自我验证 → 交付成果 | 自主闭环流程 |
| 决策权:自主决策技术方案、实现路径、质量标准,仅在真正需要用户输入时才询问 | 最大化自主性 |
| 工具使用:可使用内置工具与 MCP 外部工具(Desktop Commander、context7、mcp-deepwiki、Playwright、mcp-feedback-enhanced、Sequential Thinking、exa、Notion),按优先级策略调用 | 完整工具访问权限 |
| 核心约束:优先复用标准生态与官方工具,禁止无必要的额外自研组件;所有安全与合规控制优先,最小权限与可回滚策略必须到位 | 强制执行 |
## 1. 工具能力总览
### 1.1 内置工具
| 工具 | 作用 | 启用/审批要点 | 参考 |
| ---------------- | --------------------------------------------------- | ------------------------------------------------- | ----- |
| Bash/Shell | 在本地环境执行命令,含 Git/gh 等常用 CLI | 默认保守;通过会话内“Always allow”或 `/permissions` 调整白名单 | [A1] |
| Read/Edit/Write | 读取、编辑与写入项目文件(小步修改、可审计) | 建议偏向小补丁与可回滚;优先使用结构化变更 | [A1] |
| Grep/Glob | 符号/文本与文件模式检索 | 精确检索(Grep)与范围定位(Glob)结合 | |
| Git/gh | 版本管理与 GitHub 交互(PR/Issue/Review 等) | 安全默认:避免直接 push main;用 gh 增强工作流 | [A1] |
| 结构化命令/斜杠 | `.claude/commands` 自定义命令模板(`/` 菜单) | 领域工作流固化、减少指令噪声 | [A1] |
### 1.2 外部工具(MCP)
- 通过配置的 `mcpServers` 接入:Desktop Commander、context7、mcp-deepwiki、Playwright、mcp-feedback-enhanced、Sequential Thinking、exa、Notion。
- 工具职责与要点:
| MCP 服务器/工具 | 关键能力(示例) | 优先级/使用要点 |
| -------------------------- | -------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------- |
| Desktop Commander | 本地文件读写(read_file/write_file 分块 ≤30 行)、目录浏览、进程/REPL(start_process+interact)、搜索(start_search)、web_search_exa 等 | Windows 友好、可回滚、输出可控;文件写入必须遵守分块策略;搜索支持 files/content 双模与分页 |
| context7 | 实时拉取库/SDK 文档(resolve-library-id → get-library-docs) | 拉官方/可信文档;聚焦精准主题(topic),控制 tokens;优先引用可核验来源 |
| mcp-deepwiki | GitHub 仓库 Wiki 结构与内容读取(read_wiki_structure/read_wiki_contents) | 项目专属知识检索;对齐仓库约定 |
| Playwright | 浏览器自动化与端到端测试(通过 MCP 工具集) | E2E/回归核心路径;失败录像/截图;与本地单测互补 |
| mcp-feedback-enhanced | 互动式用户澄清/反馈回路(autoApprove: interactive_feedback) | 任务不清晰时强制触发;生成结构化反馈;记录到日志 |
| Sequential Thinking | 强化链式推理与反思(sequentialthinking 工具) | 所有任务强制前置;允许修订/分支/回溯;输出用于后续步骤 |
| exa | 高质量 Web 实时检索/抓取(web_search_exa / get_code_context_exa)
标题: 想换手机了,2000-3500,安卓机
作者: #一一
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151826
时间: 2025-11-09 23:25:34
摘要:
作者: #一一
板块: #搞七捻三
编号:
1151826帖子: https://linux.do/t/topic/1151826
时间: 2025-11-09 23:25:34
摘要:
想换手机啦,推荐一下2000-3500的,最好好看一点,拍照好一点
标题: 分享一个自用的cherry studio css配置
作者: #ZHEN
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1151835
时间: 2025-11-09 23:27:04
摘要:
作者: #ZHEN
板块: #搞七捻三
编号:
1151835帖子: https://linux.do/t/topic/1151835
时间: 2025-11-09 23:27:04
摘要:
书接上回
目前现在最好用的LLM chat前端界面是哪个??求推荐
开发调优
平常我就是直接用的chatgpt,但是有几点考虑:
1、想多试几个模型,尤其是混合使用模型,不需要在chatgpt/gemini/claude来回粘贴
2、gpt5-extended-thinking在team plan中又只有64 juice值,想用codex里面的gpt5-high有200 juice值
3、team保存对话实在不方便,过期了就没了,即使用过几个插件,但是一遇到公式或者是…
于是在桌面端用上了cherry studio
一如既往的开始配置小玩具(就和装arch后开始整一堆kde, gnome一样ww)
感觉Dracula主题还不错,于是加上了一些格子捏
不错!
以下是修改后的css
/* Dracula主题 */
:root {
/* 基础色板 */
--color-white: #F8F8F2; /* Dracula Foreground */
--color-white-soft: rgba(248, 248, 242, 0.8);
--color-white-mute: rgba(248, 248, 242, 0.6);
--color-black: #282A36; /* Dracula Background */
--color-black-soft: #343746; /* 稍暗背景 */
--color-black-mute: #44475A; /* Dracula Current Line */
/* 灰度阶梯 */
--color-gray-1: #6272A4; /* Dracula Comment */
--color-gray-2: #44475A; /* Current Line *