标题: RAG实战:自制了一个Memos AI,分享一下过程中遇到的坑
作者: #diyun
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/956005
时间: 2025-09-14 14:31:18
摘要:
作者: #diyun
板块: #开发调优
编号:
956005帖子: https://linux.do/t/topic/956005
时间: 2025-09-14 14:31:18
摘要:
Github上有一个很知名的项目,叫做Memos,不知道站里的佬友们用的多不多。这是一个开源且轻量级的自托管笔记服务,我用不上太花里胡哨的功能,而Memos这种随记随走的风格我也很喜欢(说起来算是国产优秀笔记flomo的替代品)。
在用了好几年后,我瞅着这些笔记,突然一个念头油然而生,这不正是当下我最完美的 RAG (检索增强生成) 数据集吗? 如果能让 AI 来理解和检索我的笔记,我岂不是拥有了一个真正懂我的个人 AI 助手?
我的风格是说干就干,熬了几天就把它的初版给干出来了。但是我没想到,其实整个过程比我想象的要曲折,充满了各种坑。今天开这篇文章,就是要记录并分享一下我踩过的这些坑,和过程中想到的一些解决方案,希望也能给大家一点启发。另外我这里没有教程,因为代码都是AI写的,所以只谈思路,不聊代码。
第一个坑:向量模型
万事开头难,第一个难题就是向量模型(Embedding Model)的选择。最省事的方案当然是直接调用 OpenAI或者国内厂商的 Embedding API。简单、高效,效果还好。但当我估算了一下我现有笔记的量,以及未来每天增量的同步成本,我默默地看了一眼我的钱包……钱包一紧,我开始担心免费额度是否 hold 住,长期使用的成本我也估算不来,心里没底,对于我这个人项目来说,感觉是不够“经济适用”。
于是我转向了本地部署开源模型,简单的向AI询问了一下,便让AI帮我部署了一套本地支持 CUDA 加速的模型,毕竟“快”是第一生产力。在我的开发机上,一切顺利,性能杠杠的。
但是,这里总是要有个但是,当我的 Memos AI 终于跑起来时,我兴奋地问了它一个问题。我知道有一条笔记肯定能回答,但结果却让我大失所望——最相关的那条笔记内容毫无踪影。
我深入排查(深入问AI)后发现,问题出在向量搜索的局限性上。我的那条笔记,开头有几个与问题匹配的中文关键词,但笔记的主体内容是一大段代码。对于向量模型来说,它看到了开头的几个中文词,觉得有点相关,但它看到后面大段的、与问题语义完全不同的代码时,它认为这条笔记的整体“语义”和我的问题相去甚
标题: 今天更新了一下 chrome 直接炸了
作者: #thahao
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/956007
时间: 2025-09-14 14:32:23
摘要:
作者: #thahao
板块: #开发调优
编号:
956007帖子: https://linux.do/t/topic/956007
时间: 2025-09-14 14:32:23
摘要:
网页白屏,控制台蓝屏
标题: 关于armbian系统装1panel无法外部访问
作者: #小佬弟
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/956009
时间: 2025-09-14 14:32:57
摘要:
作者: #小佬弟
板块: #搞七捻三
编号:
956009帖子: https://linux.do/t/topic/956009
时间: 2025-09-14 14:32:57
摘要:
大佬们,想问下我给机顶盒刷了armbian系统装了1panel面板,为什么他的外部地址ipv6无法访问,我也把地址解析到cloudfare了还是访问不了,求助大佬。
标题: 抽一个augment Token
作者: #狮子 红
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/956010
时间: 2025-09-14 14:33:08
摘要:
作者: #狮子 红
板块: #福利羊毛
编号:
956010帖子: https://linux.do/t/topic/956010
时间: 2025-09-14 14:33:08
摘要:
抽奖主题:自用的augment token,赠予佬友
到期时间:一周
奖品详情:
[奖品 1]:augment token
活动时间:
开始时间:2025-09-14 15:00:00
截止时间:2025-09-14 22:00:00
参与方式:
在本帖下 点赞 + 回复。
抽奖规则:
每位用户仅允许参与一次。
使用 Linux.do 官方抽奖工具 随机抽取中奖者。
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
所有规则及抽奖结果由活动发起人和论坛 管理团队 最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人
标题: 话说中奖了系统不会提示吗
作者: #shklrt
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/956011
时间: 2025-09-14 14:33:36
摘要:
作者: #shklrt
板块: #搞七捻三
编号:
956011帖子: https://linux.do/t/topic/956011
时间: 2025-09-14 14:33:36
摘要:
我看贴主好像一天前就在找我了 一直没联系到我才发给我私信
标题: 震惊!!!新来的前端比我厉害,我的代码基本上都是ai生成这咋搞
作者: #white_little2237
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/956038
时间: 2025-09-14 14:49:05
摘要:
作者: #white_little2237
板块: #搞七捻三
编号:
956038帖子: https://linux.do/t/topic/956038
时间: 2025-09-14 14:49:05
摘要:
今天面试的前端,技术是比我厉害的,编程思维理解业务能力都很强,这让我那坨屎山很有危机感啊。虽然招她们进来是为了重构我的代码,但她们要借鉴我的代码这就有点难崩了,后续时不时就来问我。
标题: codex 提示词分享.让他不在偷懒~~~~~
作者: #Mci77777
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/956049
时间: 2025-09-14 14:57:23
摘要:
作者: #Mci77777
板块: #搞七捻三
编号:
956049帖子: https://linux.do/t/topic/956049
时间: 2025-09-14 14:57:23
摘要:
codex 开始用吧
mcp:Codex 配置大杂烩,涵盖MCP安装、调用规则、自动模式解决方案等【缝合系列】
总结 (click for more details)
标题: 捡到了一个augment token
作者: #狮子 红
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/956052
时间: 2025-09-14 14:59:07
摘要:
作者: #狮子 红
板块: #福利羊毛
编号:
956052帖子: https://linux.do/t/topic/956052
时间: 2025-09-14 14:59:07
摘要:
augment token 抽奖
多余一个自用的,分享给佬友用
标题: Qoder定价出了,佬友们怎么看
作者: #HOX2333
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/956061
时间: 2025-09-14 15:06:18
摘要:
作者: #HOX2333
板块: #开发调优
编号:
956061帖子: https://linux.do/t/topic/956061
时间: 2025-09-14 15:06:18
摘要:
看来专业版对齐的是Cursor,定价为**$20/月**。
不过这Pro+也太粗暴了,三倍用量,价格也三倍(按国内厂商习惯,不应该给点优惠的嘛 )
免费试用变为1000了:2-Week Pro Trial with 1,000 Credits
标题: OCBC管理费现在是什么政策?
作者: #秦坤
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/956062
时间: 2025-09-14 15:07:34
摘要:
作者: #秦坤
板块: #福利羊毛
编号:
956062帖子: https://linux.do/t/topic/956062
时间: 2025-09-14 15:07:34
摘要:
我现在只留了MSA和GSA这两个账户,请问合理吗,就这样放着就可以吗,需要往里边存点钱吗
https://gifyu.com/image/bTVIv
标题: 原来搞西贝的老罗都是为了自己啊
作者: #lking
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/956069
时间: 2025-09-14 15:12:51
摘要:
作者: #lking
板块: #搞七捻三
编号:
956069帖子: https://linux.do/t/topic/956069
时间: 2025-09-14 15:12:51
摘要:
为了流量就不说了,但没想到是更多的为自己
李国庆表示不要一棍子把预制菜打死,老罗也说了不是反对预制菜,只需给消费者知情权,自己去西贝吃了,对口感很满意,但同意老罗的观点“价格贵了”,希望价格更亲民,猜测老罗这一波的商业布局可能要推预制方便面、现炒机器人。
标题: 湖北农行必得立减金保底3.6
作者: #xiangzi111
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/956071
时间: 2025-09-14 15:14:01
摘要:
作者: #xiangzi111
板块: #福利羊毛
编号:
956071帖子: https://linux.do/t/topic/956071
时间: 2025-09-14 15:14:01
摘要:
微信扫描二维码领取立减金
标题: 「佬友问答」如何有效调教DeepSeek
作者: #xiaojz
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/956081
时间: 2025-09-14 15:20:31
摘要:
作者: #xiaojz
板块: #搞七捻三
编号:
956081帖子: https://linux.do/t/topic/956081
时间: 2025-09-14 15:20:31
摘要:
各位佬们,我想问一下DeepSeek经常不听我的要求乱删除/修改我的要求我想问各位佬们,如何有效调教DeepSeek
标题: 继续做自然语言分析,看看boss直聘要求AI开发者的详细要求
作者: #liangdabiao
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/956084
时间: 2025-09-14 15:21:50
摘要:
作者: #liangdabiao
板块: #开发调优
编号:
956084帖子: https://linux.do/t/topic/956084
时间: 2025-09-14 15:21:50
摘要:
上次做了一般性的统计描述分析:
boss直聘究竟要求佬们的AI技术是哪些方面呢?不妨做一个数据分析
开发调优
boss直聘究竟要求佬们的AI技术是哪些方面呢?不妨做一个数据分析看看,很多都是AI辅助,所以只能截图看看,详细的数据和分析我会上传到github分享:
分析的类似这种需求形式:
一、职位概述作为大模型智能体技术专家,负责设计、开发和优化对话系统中的智能体解决方案,解决领域专业问题。
二、岗位职责1、设计并实现基于大模型的智能体架构,支撑机器人及其他硬件载体的本体控制,以及各类生活、教育类服务…
这次继续做自然语言分析,看看boss直聘要求AI开发者的详细:
我们要更细分,普通开发者,中级开发者,高级开发者 分别的详细要求情况:
普通开发者:(20k )
本科:
职责:
技能要求:
硕士:
职责:
技能要求:
中级开发者:(35k )
本科:
职责:
技能要求:
硕士:
职责:
技能要求:
高级开发者:(35k+)
本科:
职责:
技能要求:
硕士博士:
职责:
技能要求:
什么团队在招聘:
普通工资:
中等工资:
高工资:
薪资福利情况: