RAG 召回率低?可能是知识库分段没做好!求问大佬们的经验
各位做 RAG 的小伙伴们,最近在搞知识库的时候遇到个问题,想请教一下大家:
向量库召回率不太行,初步排查可能是知识库的分段方式有问题。比如,一段太长或者分段不合理,导致模型检索不到关键信息。
想问大家几个问题:
1 、知识库文档一般用什么格式? 比如纯文本、Markdown ,还是结构化 JSON ?哪种更适合 RAG ?
2 、怎么分段比较合理? 是按段落分,还是按章节分?有没有什么技巧能保证上下文连贯性?
3 、如果文档里有代码、图表或者多模态内容,怎么处理? 直接丢进去,还是得额外处理?目前我尝试在 dify 中通过最大 4000tokens 进行分段,但效果不好,可能是因为上下文断了( pdf 、Markdown 无法很好的分段,因为上下文是有关联的)。
有没有现成的分段策略可以参考?或者有没有工具/库能自动优化分段?欢迎分享!感谢大佬们~ 🙏
- - - - - -- - - - - -
暂无回复
2025-04-23 21:41:53
各位做 RAG 的小伙伴们,最近在搞知识库的时候遇到个问题,想请教一下大家:
向量库召回率不太行,初步排查可能是知识库的分段方式有问题。比如,一段太长或者分段不合理,导致模型检索不到关键信息。
想问大家几个问题:
1 、知识库文档一般用什么格式? 比如纯文本、Markdown ,还是结构化 JSON ?哪种更适合 RAG ?
2 、怎么分段比较合理? 是按段落分,还是按章节分?有没有什么技巧能保证上下文连贯性?
3 、如果文档里有代码、图表或者多模态内容,怎么处理? 直接丢进去,还是得额外处理?目前我尝试在 dify 中通过最大 4000tokens 进行分段,但效果不好,可能是因为上下文断了( pdf 、Markdown 无法很好的分段,因为上下文是有关联的)。
有没有现成的分段策略可以参考?或者有没有工具/库能自动优化分段?欢迎分享!感谢大佬们~ 🙏
- - - - - -- - - - - -
暂无回复
2025-04-23 21:41:53
支付宝有没有能自动转账或者扣款的服务或者小程序?
如题,淘宝店被罚了 2000 保证金,因为绑定支付宝那时候没钱所以没扣成。然后所有订单账期是延长 15 天的,所以目前账户余额是不可用的,保证金也扣不走。
往支付宝里转了 1 元看了下,发现扣保证金不是只要账户有钱就秒扣,是有时间间隔的,所以我想有没有一种东西能只要支付宝里有钱就转走的,让淘宝扣不走我账户里的钱。
目前账户里的余额还有几天能可用,而且还有资金在入账,所以想趁这几天找到能把钱再淘宝扣款之前转走的方法,大家支个招。
- - - - - -- - - - - -
暂无回复
2025-04-23 21:41:31
如题,淘宝店被罚了 2000 保证金,因为绑定支付宝那时候没钱所以没扣成。然后所有订单账期是延长 15 天的,所以目前账户余额是不可用的,保证金也扣不走。
往支付宝里转了 1 元看了下,发现扣保证金不是只要账户有钱就秒扣,是有时间间隔的,所以我想有没有一种东西能只要支付宝里有钱就转走的,让淘宝扣不走我账户里的钱。
目前账户里的余额还有几天能可用,而且还有资金在入账,所以想趁这几天找到能把钱再淘宝扣款之前转走的方法,大家支个招。
- - - - - -- - - - - -
暂无回复
2025-04-23 21:41:31
二手 99 新 14 寸 MacbookPro M4Pro(14+20) 48+512 纳米玻璃 15700 算好价吗?
想创业,然后资金链断裂,工作室倒闭了。
武汉本地自提,上门看货最好。外地的话可以聊聊看,我得考虑下害怕被骗。成色很新,几乎只有一个小划痕之类的,充电次数 10 次以内,激活日期 2025 年的。具体机器可能情况有所不同,需要的朋友可以联系我
14 寸-MacbookPro M4Pro(14+20 核满血) 48+512 纳米玻璃 价格 15700
14 寸-MacbookPro M4Pro(14+20 核满血) 48+512 价格 15200
16 寸-MacbookPro M4Pro(14+20 核满血) 48+512 价格 17000
14 寸-MacbookPro M4(10+10 核满血) 32+1T 价格 12500
想创业,然后资金链断裂,工作室倒闭了。
武汉本地自提,上门看货最好。外地的话可以聊聊看,我得考虑下害怕被骗。成色很新,几乎只有一个小划痕之类的,充电次数 10 次以内,激活日期 2025 年的。具体机器可能情况有所不同,需要的朋友可以联系我
14 寸-MacbookPro M4Pro(14+20 核满血) 48+512 纳米玻璃 价格 15700
14 寸-MacbookPro M4Pro(14+20 核满血) 48+512 价格 15200
16 寸-MacbookPro M4Pro(14+20 核满血) 48+512 价格 17000
14 寸-MacbookPro M4(10+10 核满血) 32+1T 价格 12500
手机坏了,头一次感觉这么的孤独无助
手机不小心掉进水里了,黑屏开不了机,也没有备用机,突然发现整个世界谁也联系不上,在这座城市里只有自己一个人,除了父母外,不知道任何人的号码。跑去了附近的维修店,维修员看我着急,张口要了一千,说不修就算了,咬咬牙,维修员给了个备用机让我登了支付宝,只能付完了钱,然后明天去取。
虽然只是个小事情,但发生点紧急情况的时候,感觉自己在这个城市里如此的孤立无援。平时再怎么一个人都没啥感觉,但这个时候,孤独与无助被无限地放大。
确实要弄个备用机了,没手机真的是寸步难行,回家后上淘宝查了下这种情况维修只要一百多,孤独无助的时候真的是任人宰割啊。
- - - - - -- - - - - -
lemos1235:一千块能买新手机了。
1StpKlosr2Me:话说你这也太好拿捏了
2025-04-23 21:41:02
手机不小心掉进水里了,黑屏开不了机,也没有备用机,突然发现整个世界谁也联系不上,在这座城市里只有自己一个人,除了父母外,不知道任何人的号码。跑去了附近的维修店,维修员看我着急,张口要了一千,说不修就算了,咬咬牙,维修员给了个备用机让我登了支付宝,只能付完了钱,然后明天去取。
虽然只是个小事情,但发生点紧急情况的时候,感觉自己在这个城市里如此的孤立无援。平时再怎么一个人都没啥感觉,但这个时候,孤独与无助被无限地放大。
确实要弄个备用机了,没手机真的是寸步难行,回家后上淘宝查了下这种情况维修只要一百多,孤独无助的时候真的是任人宰割啊。
- - - - - -- - - - - -
lemos1235:一千块能买新手机了。
1StpKlosr2Me:话说你这也太好拿捏了
2025-04-23 21:41:02
感觉大部分人有点毛病,但又不知道是哪里的毛病
特别是,随着年龄的增长,我感觉很多人活的越来越像一个 NPC 。
---
比如读书,很多人读完了就把书丢开了。
```
问:书里的诗词是哪个朝代的诗人写的?
答:不知道。
问:书里的某个观点你怎么看?
答:没什么看法。
```
总之就是 99%的东西没搞懂,但是看完了。
---
比如招聘,
```
问:失业三个月为什么不行?
HR:三个月找不到工作说明能力不行。
问:面试不是通过了吗?
```
HR 也感觉不对,但是既然整个行业都这么做,那我也不要。
---
比如股票,
```
朋友:牛回速归!
你:买买买!
```
半年后,血本无归。质问朋友,
```
你:不是说牛市吗?
朋友:是牛市啊,你怎么亏的?
你:不知道,玩了几次,后面越亏越多。
朋友:军工你怎么看?
你:不知道。
朋友:医疗行业你怎么看?
你:不知道。
```
啥也不知道,但是就是觉得自己能赚钱。
---
**总结**
这种现象怎么说呢,跟学历高低还没有关系。最重要的是还跟病毒一样,一传染就是一大批人。
我有种错觉,有时候跟不同的人交流的时候,我甚至怀疑他们是不是同一个人复制粘贴出来的?思维模式一模一样。
不知道这个算不算原因:[长大后的无趣来源于好奇与想象力的丧失]( https://v2ex.com/t/1127396)
特别是,随着年龄的增长,我感觉很多人活的越来越像一个 NPC 。
---
比如读书,很多人读完了就把书丢开了。
```
问:书里的诗词是哪个朝代的诗人写的?
答:不知道。
问:书里的某个观点你怎么看?
答:没什么看法。
```
总之就是 99%的东西没搞懂,但是看完了。
---
比如招聘,
```
问:失业三个月为什么不行?
HR:三个月找不到工作说明能力不行。
问:面试不是通过了吗?
```
HR 也感觉不对,但是既然整个行业都这么做,那我也不要。
---
比如股票,
```
朋友:牛回速归!
你:买买买!
```
半年后,血本无归。质问朋友,
```
你:不是说牛市吗?
朋友:是牛市啊,你怎么亏的?
你:不知道,玩了几次,后面越亏越多。
朋友:军工你怎么看?
你:不知道。
朋友:医疗行业你怎么看?
你:不知道。
```
啥也不知道,但是就是觉得自己能赚钱。
---
**总结**
这种现象怎么说呢,跟学历高低还没有关系。最重要的是还跟病毒一样,一传染就是一大批人。
我有种错觉,有时候跟不同的人交流的时候,我甚至怀疑他们是不是同一个人复制粘贴出来的?思维模式一模一样。
不知道这个算不算原因:[长大后的无趣来源于好奇与想象力的丧失]( https://v2ex.com/t/1127396)
[全职]广州 - 元图互动 - iOS 高级工程师
元图互动 - iOS 高级工程师
薪资:20 ~ 30k
[岗位职责]
1 、负责元图 iOS 端游戏核心模块的设计、开发和维护工作
2 、参与产品需求讨论,制定合理的技术方案,根据需求进行开发,保障开发质量和交付时效
3 、负责解决 iOS 客户端中的技术难题,并优化产品性能
4 、负责对新技术的研究和尝试,推动 iOS 客户端技术的发展
[岗位要求]
1 、大学本科及以上学历,计算机相关专业,3-5 年 i0S 开发工作经验
2 、精通 Swift +OC 编程语言,熟悉 iOS 开发框架和常用第三方库
3 、熟悉常用的数据结构和算法、熟悉网络通信机制及常用数据传输协议
4 、熟悉 iOS 性能优化和内存优化技术,有较强的问题定位和解决能力
5 、富有激情,抗压能力强,具有强烈的责任心与团队合作精神,良好的沟通能力
6 、对新技术有浓厚兴趣,具备自主学习和快速学习能力,能够不断提升自己的技术水平
7 、对产品和代码质量有极致的追求,技术方案和设计原则有较深刻的理解
8 、有海外项目经验优先
**如果有意向,可以发送简历到** wangyiying@pixo.fun
元图互动 - iOS 高级工程师
薪资:20 ~ 30k
[岗位职责]
1 、负责元图 iOS 端游戏核心模块的设计、开发和维护工作
2 、参与产品需求讨论,制定合理的技术方案,根据需求进行开发,保障开发质量和交付时效
3 、负责解决 iOS 客户端中的技术难题,并优化产品性能
4 、负责对新技术的研究和尝试,推动 iOS 客户端技术的发展
[岗位要求]
1 、大学本科及以上学历,计算机相关专业,3-5 年 i0S 开发工作经验
2 、精通 Swift +OC 编程语言,熟悉 iOS 开发框架和常用第三方库
3 、熟悉常用的数据结构和算法、熟悉网络通信机制及常用数据传输协议
4 、熟悉 iOS 性能优化和内存优化技术,有较强的问题定位和解决能力
5 、富有激情,抗压能力强,具有强烈的责任心与团队合作精神,良好的沟通能力
6 、对新技术有浓厚兴趣,具备自主学习和快速学习能力,能够不断提升自己的技术水平
7 、对产品和代码质量有极致的追求,技术方案和设计原则有较深刻的理解
8 、有海外项目经验优先
**如果有意向,可以发送简历到** wangyiying@pixo.fun
独立开发是否要遵守黑暗森林法则?
最近我们 w2solo 社区搞完第三次北京线下活动,交流了很多,有一个我自认为的“常识”被打破,那就是独立开发也应该遵守黑暗森林法则,相信了解三体的人都知道,黑暗森林法则说的是,这个宇宙之所以这么“寂静”,是因为每个文明都是带枪的猎人,**谁都不敢冒头,谁先冒头,就先干掉谁**,三体人就这么被罗辑给威胁了保持长时间的和平。
这个常识在此之前,我是深刻的认同的,因为做产品抄袭可太普遍了,深怕自己的好点子被别人剽窃走了,自己做了个寂寞,**现在我说,你真太看得起自己了**,如果被抄袭,那至少说明,你做的产品是真的有人认同的,而且是很强的认同才会让别人也付出努力,毕竟开发一个产品不是一件容易的事情,而且如果缺少跟人沟通,那你做的产品很容易陷入自己局限的思维。**我们应该努力扩展增量,而不是想办法搞存量竞争,特别是我们作为小小的独立开发者,一个月挣个几万收入已是很满足了,完全到不了存量竞争的状态。**
我就经常陷入这样的困境,就是当我想到一个点子的时候,我极其兴奋,夜不能寐,深怕与人说,好像发现了一个宝贝,别人看一眼就没了一样,就像 wedock ,刚开始的时候我真觉得这个想法可太有创意了,我当时除了做搜索,还做了记事本、计算器、书签等小组件,在实际上线后,和用户沟通,以及和[w2solo]( https://w2solo.com)里面很多人沟通后,大部分功能都被我砍掉了,无比累赘,而且这个产品是在我做完之后才舍得跟别人分享,但其实,到现在我已经在社区还有 V2EX 社区上完全分享了[wedock]( https://wedock.net),真的有人抄袭吗?其实没有,真的是我想多了,据 w2solo 群主李唐公开数据,他六百万注册用户,他说还能做很大的提升,在这个记账领域这么红海的市场,仍然有很大的空间可以提升,说明市场真的很大,是自己多虑了,现在总结来看,是自己的格局太低了,这种观念反而影响了产品往正确的轨道上去走。**就算有抄袭的,中国这个市场,世界这个市场,也足够你分的一杯羹,所以应当选择开放的心态面对**
就像前几天和 w2solo 群主李唐交流,我又有一个新想法了,就是做一个人脉关系管理 App ,被首富深度 pass 了,盈利模式无法跑通,顶多是一个自娱自乐的工具,但没沟通之前,我都在幻想以后我就是下一个小马哥了,好尴尬呀 ̄□ ̄||,下面这张图是我想的关于人脉关系管理的几点构思,还专门问了 AI ,从我的角度,我非常需要与越来越多的牛逼的人建立联系,以扩展我提升思维、获取流量的可能性,但对于首富他们这类已经站在很高的位置的人来看,完全不必要,他们认为只要有微信管理就好了,再做一个 app 来维护很麻烦。
这就是站在我的角度和他的角度看不一样带来的结果,后面我也想过,这个产品是极其难以操作的事情,漫长又难以实现营收,不如不做,不如维护一个列表,我接受了,内心归于平静哈哈哈

**有好的想法,最好在你的人脉圈子中多多交流,事前验证,才能少走弯路,如果你真的想保密,那么你可以跟你毕竟信任的人去沟通,切记埋头苦干。**
最近我们 w2solo 社区搞完第三次北京线下活动,交流了很多,有一个我自认为的“常识”被打破,那就是独立开发也应该遵守黑暗森林法则,相信了解三体的人都知道,黑暗森林法则说的是,这个宇宙之所以这么“寂静”,是因为每个文明都是带枪的猎人,**谁都不敢冒头,谁先冒头,就先干掉谁**,三体人就这么被罗辑给威胁了保持长时间的和平。
这个常识在此之前,我是深刻的认同的,因为做产品抄袭可太普遍了,深怕自己的好点子被别人剽窃走了,自己做了个寂寞,**现在我说,你真太看得起自己了**,如果被抄袭,那至少说明,你做的产品是真的有人认同的,而且是很强的认同才会让别人也付出努力,毕竟开发一个产品不是一件容易的事情,而且如果缺少跟人沟通,那你做的产品很容易陷入自己局限的思维。**我们应该努力扩展增量,而不是想办法搞存量竞争,特别是我们作为小小的独立开发者,一个月挣个几万收入已是很满足了,完全到不了存量竞争的状态。**
我就经常陷入这样的困境,就是当我想到一个点子的时候,我极其兴奋,夜不能寐,深怕与人说,好像发现了一个宝贝,别人看一眼就没了一样,就像 wedock ,刚开始的时候我真觉得这个想法可太有创意了,我当时除了做搜索,还做了记事本、计算器、书签等小组件,在实际上线后,和用户沟通,以及和[w2solo]( https://w2solo.com)里面很多人沟通后,大部分功能都被我砍掉了,无比累赘,而且这个产品是在我做完之后才舍得跟别人分享,但其实,到现在我已经在社区还有 V2EX 社区上完全分享了[wedock]( https://wedock.net),真的有人抄袭吗?其实没有,真的是我想多了,据 w2solo 群主李唐公开数据,他六百万注册用户,他说还能做很大的提升,在这个记账领域这么红海的市场,仍然有很大的空间可以提升,说明市场真的很大,是自己多虑了,现在总结来看,是自己的格局太低了,这种观念反而影响了产品往正确的轨道上去走。**就算有抄袭的,中国这个市场,世界这个市场,也足够你分的一杯羹,所以应当选择开放的心态面对**
就像前几天和 w2solo 群主李唐交流,我又有一个新想法了,就是做一个人脉关系管理 App ,被首富深度 pass 了,盈利模式无法跑通,顶多是一个自娱自乐的工具,但没沟通之前,我都在幻想以后我就是下一个小马哥了,好尴尬呀 ̄□ ̄||,下面这张图是我想的关于人脉关系管理的几点构思,还专门问了 AI ,从我的角度,我非常需要与越来越多的牛逼的人建立联系,以扩展我提升思维、获取流量的可能性,但对于首富他们这类已经站在很高的位置的人来看,完全不必要,他们认为只要有微信管理就好了,再做一个 app 来维护很麻烦。
这就是站在我的角度和他的角度看不一样带来的结果,后面我也想过,这个产品是极其难以操作的事情,漫长又难以实现营收,不如不做,不如维护一个列表,我接受了,内心归于平静哈哈哈

**有好的想法,最好在你的人脉圈子中多多交流,事前验证,才能少走弯路,如果你真的想保密,那么你可以跟你毕竟信任的人去沟通,切记埋头苦干。**
分享一个自己开发的开源安卓 GPT 助手软件: GPT Assistant
这个项目其实已经在我的课余时间一点点开发了很久了,陆续收到过一些关注,不过最近做了一些比较重要的更新,所以想来这里再跟大家分享一下。
目前安卓端的 GPT 客户端很多是主打桌面端的项目用跨平台框架开发的,虽然该有的聊天功能都有,但并没有和系统功能深度融合起来,很难达到“智能助手”的程度。
我这个项目最核心的想法就是希望通过原生开发将 GPT 与安卓的硬软件更紧密地融合起来,实现一个“移动智能助手”的职责,而不仅限于聊天功能。这个项目的主要特性包括:
- **多场景文件处理**:通过拍照 / 相册 / 分享 / 打开 / 拖拽上传,支持图片 / TXT / PDF / DOCX / PPTX / XLSX 文件
- **支持联网**:按需抓取网页内容发送给 GPT
- **全局快捷入口**:音量键唤起 / 状态栏快捷键 / 跨应用划词调起
- **智能模板**:通过模板实现各种用途的专用助手,并为每个模板自由定制界面(自定义下拉选框和输入框)
- **多接口语音输入输出**:华为 / 百度 / Whisper / Google / 系统 TTS
- **完全开源**:通过 OpenAI API (或其兼容接口)提供服务,不收取任何费用
典型使用场景包括:
- 临时产生了一些问题想问 GPT ,通过音量键直接唤起本软件直接进行语音输入,再按一下音量键就可以发送,然后获得语音回复。全程不需要点屏幕,甚至不需要看屏幕。
- 想知道面前的东西是什么,直接通过本软件拍照上传问 GPT 。同理还可以实现 OCR 、拍照翻译、拍照解题等。
- 微信/QQ 收到文档快捷发送给 GPT 进行总结和提问
- 通过跨应用拖拽,可以接收来自分屏或小窗的其他应用的文档,还可以从华为超级中转站、多屏协同等类似应用中拖入一堆来自不同地方的不同类型文件
- 支持全局上下文菜单调起,实现全局划词翻译等功能
文档解析目前其实还是有一定的限制,包括:
- 没有实现 RAG ,文档内容会完整发给 GPT ,Token 消耗较多且受上下文窗口限制
- 只能抓取文档中的文本,图片会被忽略
- 只能支持有 x 结尾的新版 Office 格式,旧版的二进制格式(如.doc )还无法解析
以上就是对我的项目的简要介绍,更详细的说明可以在项目主页找到,GitHub 和 Gitee 同步更新。
- GitHub:[https://github.com/Skythinker616/gpt-assistant-android]( https://github.com/Skythinker616/gpt-assistant-android)
- Gitee: [https://gitee.com/skythinker/gpt-assistant-android]( https://gitee.com/skythinker/gpt-assistant-android)
这个项目会持续更新,欢迎大家提 Issue ,如果觉得有帮助的话还请给一个 Star 呀~
这个项目其实已经在我的课余时间一点点开发了很久了,陆续收到过一些关注,不过最近做了一些比较重要的更新,所以想来这里再跟大家分享一下。
目前安卓端的 GPT 客户端很多是主打桌面端的项目用跨平台框架开发的,虽然该有的聊天功能都有,但并没有和系统功能深度融合起来,很难达到“智能助手”的程度。
我这个项目最核心的想法就是希望通过原生开发将 GPT 与安卓的硬软件更紧密地融合起来,实现一个“移动智能助手”的职责,而不仅限于聊天功能。这个项目的主要特性包括:
- **多场景文件处理**:通过拍照 / 相册 / 分享 / 打开 / 拖拽上传,支持图片 / TXT / PDF / DOCX / PPTX / XLSX 文件
- **支持联网**:按需抓取网页内容发送给 GPT
- **全局快捷入口**:音量键唤起 / 状态栏快捷键 / 跨应用划词调起
- **智能模板**:通过模板实现各种用途的专用助手,并为每个模板自由定制界面(自定义下拉选框和输入框)
- **多接口语音输入输出**:华为 / 百度 / Whisper / Google / 系统 TTS
- **完全开源**:通过 OpenAI API (或其兼容接口)提供服务,不收取任何费用
典型使用场景包括:
- 临时产生了一些问题想问 GPT ,通过音量键直接唤起本软件直接进行语音输入,再按一下音量键就可以发送,然后获得语音回复。全程不需要点屏幕,甚至不需要看屏幕。
- 想知道面前的东西是什么,直接通过本软件拍照上传问 GPT 。同理还可以实现 OCR 、拍照翻译、拍照解题等。
- 微信/QQ 收到文档快捷发送给 GPT 进行总结和提问
- 通过跨应用拖拽,可以接收来自分屏或小窗的其他应用的文档,还可以从华为超级中转站、多屏协同等类似应用中拖入一堆来自不同地方的不同类型文件
- 支持全局上下文菜单调起,实现全局划词翻译等功能
文档解析目前其实还是有一定的限制,包括:
- 没有实现 RAG ,文档内容会完整发给 GPT ,Token 消耗较多且受上下文窗口限制
- 只能抓取文档中的文本,图片会被忽略
- 只能支持有 x 结尾的新版 Office 格式,旧版的二进制格式(如.doc )还无法解析
以上就是对我的项目的简要介绍,更详细的说明可以在项目主页找到,GitHub 和 Gitee 同步更新。
- GitHub:[https://github.com/Skythinker616/gpt-assistant-android]( https://github.com/Skythinker616/gpt-assistant-android)
- Gitee: [https://gitee.com/skythinker/gpt-assistant-android]( https://gitee.com/skythinker/gpt-assistant-android)
这个项目会持续更新,欢迎大家提 Issue ,如果觉得有帮助的话还请给一个 Star 呀~
写了个玩具项目: LLM 对比测试平台,同时对比如 OpenAI、DeepSeek、Gemini 等平台 LLM 回答质量、响应速度
一个用于比较多个大型语言模型( LLM )性能和响应质量的前端网页程序,具体项目介绍可以看 GitHub 地址
* GitHub 地址: https://github.com/PrintNow/LLM-Compare
* 预览地址(需要进行配置): https://llm-compare.nowtime.cc/
截图:
| 首页对话 | 配置 | 系统提示词 |
|-------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------|
|  |  |  |
### 🤔 为什么会有此项目?
因为工作项目中需要用到 LLM API 做一些功能,这时候就需要对比不同平台(如 ChatGPT 、DeepSeek 、Gemini 、阿里百炼、火山引擎等) LLM
实际表现能力如何(回答质量、响应速度),原本使用如 Chatbox 开不同对话进行测试,但是效率有点低(可能我没发现更好的用法),然后就有了本项目。
为了做这个项目大概分为以下步骤:
1. 脑子里大概想到的一个布局,然后用简单的画图工具画出一个草图
2. 通过 Cursor 工具进行提示、生成代码
3. 不断优化提示词有了本项目
4. 然后因为样式难看,就借鉴了一些项目 + AI 画了个图让 Cursor 还原
### ✨ 核心功能
- **多模型并行测试**:同时向多个 LLM 发送相同的系统提示语( System Prompt )和用户问题( User Prompt ),并比较它们的响应响应结果,每次对话**无上下文关联**,特别适合如调研不同平台 LLM 回答质量
- **会话管理**:创建、切换和删除多个会话
- **系统提示词定制**:为每个会话自定义系统提示词
- **性能指标**:显示响应时间和 Token 使用量关键指标
- **清晰的 UI**:直观的时间线设计,清晰区分不同对话组
### 🟩 结尾
本项目开箱即可使用,但是有一些功能是没有完善的比如新建对话的命名(因为感觉不是特别重要,就没有优先去做 😂),
后面会慢慢进行完善 : )
欢迎大家评论交流
一个用于比较多个大型语言模型( LLM )性能和响应质量的前端网页程序,具体项目介绍可以看 GitHub 地址
* GitHub 地址: https://github.com/PrintNow/LLM-Compare
* 预览地址(需要进行配置): https://llm-compare.nowtime.cc/
截图:
| 首页对话 | 配置 | 系统提示词 |
|-------------------------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------|
|  |  |  |
### 🤔 为什么会有此项目?
因为工作项目中需要用到 LLM API 做一些功能,这时候就需要对比不同平台(如 ChatGPT 、DeepSeek 、Gemini 、阿里百炼、火山引擎等) LLM
实际表现能力如何(回答质量、响应速度),原本使用如 Chatbox 开不同对话进行测试,但是效率有点低(可能我没发现更好的用法),然后就有了本项目。
为了做这个项目大概分为以下步骤:
1. 脑子里大概想到的一个布局,然后用简单的画图工具画出一个草图
2. 通过 Cursor 工具进行提示、生成代码
3. 不断优化提示词有了本项目
4. 然后因为样式难看,就借鉴了一些项目 + AI 画了个图让 Cursor 还原
### ✨ 核心功能
- **多模型并行测试**:同时向多个 LLM 发送相同的系统提示语( System Prompt )和用户问题( User Prompt ),并比较它们的响应响应结果,每次对话**无上下文关联**,特别适合如调研不同平台 LLM 回答质量
- **会话管理**:创建、切换和删除多个会话
- **系统提示词定制**:为每个会话自定义系统提示词
- **性能指标**:显示响应时间和 Token 使用量关键指标
- **清晰的 UI**:直观的时间线设计,清晰区分不同对话组
### 🟩 结尾
本项目开箱即可使用,但是有一些功能是没有完善的比如新建对话的命名(因为感觉不是特别重要,就没有优先去做 😂),
后面会慢慢进行完善 : )
欢迎大家评论交流
外企招聘,福利好,待遇优,急缺 ai 人才
# 北京弥特信息科技有限公司( Mete Dream Technology )招聘
## 🚀 公司简介
北京弥特信息科技有限公司( Mete Dream Technology )是一家专注于人工智能与计算机视觉技术研发用于社交领域的创新型科技企业。研发总部位于北京朝阳区酒仙桥,并在上海、厦门设有分公司,同时在日本设立设计部,泰国设立运营中心,总部位于新加坡。我们致力于通过前沿技术推动行业变革,打造世界级的技术产品。
---
## 📌 招聘职位
### 大模型算法专家
- **职位描述**:深度参与情感智能体的底层架构设计与上层应用开发,推动自主决策与多模态互动的创新。
- **工作地点**:北京
- **职位类型**:全职
### 大模型算法工程师
- **职位描述**:加入大模型研发团队,探索前沿技术,优化智能体的语义理解与任务规划能力。
- **工作地点**:北京
- **职位类型**:全职
### 3D 视觉算法专家
- **职位描述**:专注于 AI 计算机视觉与 3D 领域,推动大模型在 3D 美术、目标检测等方面的落地。
- **工作地点**:北京
- **职位类型**:全职
### 3D 视觉算法工程师
- **职位描述**:跟踪前沿视觉技术,助力公司 AI 内容生态发展,实现多模态学习与 3D 解决方案。
- **工作地点**:北京
- **职位类型**:全职
### 大模型/3D 视觉算法实习生
- **大模型算法方向**:参与智能体核心算法开发,助力智能体语义理解与交互体验升级。
- **3D 算法方向**:参与 AI 计算机视觉算法研发,探索前沿视觉技术并落地解决方案。
- **工作地点**:北京
- **职位类型**:实习
---
## 🏢 办公环境
- **研发总部**:北京朝阳区酒仙桥,现代化办公空间,配备高性能开发设备
- **特色设施**:办公室有 2 只猫作为工作陪伴伙伴,设有健身房和游戏房
- **分支机构**:上海、厦门分公司,日本设计部,泰国运营中心
- **国际化团队**:总部位于新加坡,汇聚全球技术人才
---
## 💼 福利待遇
- **薪资福利**:具有竞争力的薪资,具体面议
- **社保保障**:五险一金、补充商业保险
- **假期制度**:最高年假 15 天,每月一天带薪无条件病假
- **弹性工作**:标准工作时间 10:00-19:00 ( 8 小时),支持弹性工作制
- **健康生活**:健身房、各类兴趣俱乐部每周举办活动
- **萌宠陪伴**:办公室有两只猫咪员工随时治愈你的工作压力
- **休闲娱乐**:配备游戏房供员工放松休闲
- **成长发展**:提供技术培训、行业交流机会
- **团队建设**:定期组织技术沙龙、团队活动
---
## 📌 应聘方式
1. **投递简历**:请将简历发送至招聘邮箱:`carlo.jiang@bondee.com`,邮件标题注明"应聘职位+姓名"
2. **面试流程**:简历筛选 → 技术面试 → 终面 → Offer
3. **截止日期**:招满即止
---
⚡ **加入我们,和喵星人一起探索人工智能的未来!** 🐱🚀
# 北京弥特信息科技有限公司( Mete Dream Technology )招聘
## 🚀 公司简介
北京弥特信息科技有限公司( Mete Dream Technology )是一家专注于人工智能与计算机视觉技术研发用于社交领域的创新型科技企业。研发总部位于北京朝阳区酒仙桥,并在上海、厦门设有分公司,同时在日本设立设计部,泰国设立运营中心,总部位于新加坡。我们致力于通过前沿技术推动行业变革,打造世界级的技术产品。
---
## 📌 招聘职位
### 大模型算法专家
- **职位描述**:深度参与情感智能体的底层架构设计与上层应用开发,推动自主决策与多模态互动的创新。
- **工作地点**:北京
- **职位类型**:全职
### 大模型算法工程师
- **职位描述**:加入大模型研发团队,探索前沿技术,优化智能体的语义理解与任务规划能力。
- **工作地点**:北京
- **职位类型**:全职
### 3D 视觉算法专家
- **职位描述**:专注于 AI 计算机视觉与 3D 领域,推动大模型在 3D 美术、目标检测等方面的落地。
- **工作地点**:北京
- **职位类型**:全职
### 3D 视觉算法工程师
- **职位描述**:跟踪前沿视觉技术,助力公司 AI 内容生态发展,实现多模态学习与 3D 解决方案。
- **工作地点**:北京
- **职位类型**:全职
### 大模型/3D 视觉算法实习生
- **大模型算法方向**:参与智能体核心算法开发,助力智能体语义理解与交互体验升级。
- **3D 算法方向**:参与 AI 计算机视觉算法研发,探索前沿视觉技术并落地解决方案。
- **工作地点**:北京
- **职位类型**:实习
---
## 🏢 办公环境
- **研发总部**:北京朝阳区酒仙桥,现代化办公空间,配备高性能开发设备
- **特色设施**:办公室有 2 只猫作为工作陪伴伙伴,设有健身房和游戏房
- **分支机构**:上海、厦门分公司,日本设计部,泰国运营中心
- **国际化团队**:总部位于新加坡,汇聚全球技术人才
---
## 💼 福利待遇
- **薪资福利**:具有竞争力的薪资,具体面议
- **社保保障**:五险一金、补充商业保险
- **假期制度**:最高年假 15 天,每月一天带薪无条件病假
- **弹性工作**:标准工作时间 10:00-19:00 ( 8 小时),支持弹性工作制
- **健康生活**:健身房、各类兴趣俱乐部每周举办活动
- **萌宠陪伴**:办公室有两只猫咪员工随时治愈你的工作压力
- **休闲娱乐**:配备游戏房供员工放松休闲
- **成长发展**:提供技术培训、行业交流机会
- **团队建设**:定期组织技术沙龙、团队活动
---
## 📌 应聘方式
1. **投递简历**:请将简历发送至招聘邮箱:`carlo.jiang@bondee.com`,邮件标题注明"应聘职位+姓名"
2. **面试流程**:简历筛选 → 技术面试 → 终面 → Offer
3. **截止日期**:招满即止
---
⚡ **加入我们,和喵星人一起探索人工智能的未来!** 🐱🚀
一个以乐器为核心的交流论坛是否有搞头?
贴吧说白了,样子丑/ui 落后,目前感觉已经有点退环境了。
NGA 那种都比贴吧好看很多
目前乐器相关的内容,主要集中在 B 站、抖音这些视频网站,围绕 up 主创作内容,但是以用户交流为主的地方,几乎很难找到一些网站。
我觉得可能是,从业者过于传统,毕竟乐器在以前都是以线下为主的(现在也是),近些年才逐渐转移到网络线上。
也就是说,你看到一个乐器,想在网上找到一个圈子,都不算太容易/没有这样的好去处
---
乐器的整体概念上,是大同小异的,比如设置好几个板块,技巧教程、购买心得、日常练习分享
那么就复制粘贴,钢琴区、吉他区、小提琴区,古筝区、竹笛区、古琴区,全都可以这么套,一个论坛可以容纳多个群体。
人数以及需求上,是不太需要担心的,线下都那么多人,线上如果发展起来还能比线下少吗。只是目前为止,没有好去处,需求是一直存在的。
可能前期的运营需要费心费力一些,花一些心思去引流。
---
举一个例子,比如 linux 。do ,论坛质量真的做的很好吗?未必。
但是它提供了一个容纳人群的去处,流量和人数逐渐积累起来了。
(纯客观分析,无任何主观褒义贬义)
---
至于挣钱,可能是次要的,一旦能经过时间、产生积累,上限可能是很高的。
(比如说 v 站,几乎没有广告带货,但是已经成为在小众领域流量数一数二的论坛了)
---
一个设想,有条件的大佬真可以试试。
具有一定的(时间、精力、资金、技术)条件。
这玩意说到底是一个长线长期的投资,用户的积累、流量的积累,大概率 3 年以上才能看到明显效果。
需要一些技巧和设计,细节打磨、构思想法。
需要一些耐心。
一旦做起来,很有可能就是遥遥领先一大段身位。(当然,没做起来另说)
如果指望一年半载挣到快钱,不现实。
普通打工牛马还是先忙工作吧...
贴吧说白了,样子丑/ui 落后,目前感觉已经有点退环境了。
NGA 那种都比贴吧好看很多
目前乐器相关的内容,主要集中在 B 站、抖音这些视频网站,围绕 up 主创作内容,但是以用户交流为主的地方,几乎很难找到一些网站。
我觉得可能是,从业者过于传统,毕竟乐器在以前都是以线下为主的(现在也是),近些年才逐渐转移到网络线上。
也就是说,你看到一个乐器,想在网上找到一个圈子,都不算太容易/没有这样的好去处
---
乐器的整体概念上,是大同小异的,比如设置好几个板块,技巧教程、购买心得、日常练习分享
那么就复制粘贴,钢琴区、吉他区、小提琴区,古筝区、竹笛区、古琴区,全都可以这么套,一个论坛可以容纳多个群体。
人数以及需求上,是不太需要担心的,线下都那么多人,线上如果发展起来还能比线下少吗。只是目前为止,没有好去处,需求是一直存在的。
可能前期的运营需要费心费力一些,花一些心思去引流。
---
举一个例子,比如 linux 。do ,论坛质量真的做的很好吗?未必。
但是它提供了一个容纳人群的去处,流量和人数逐渐积累起来了。
(纯客观分析,无任何主观褒义贬义)
---
至于挣钱,可能是次要的,一旦能经过时间、产生积累,上限可能是很高的。
(比如说 v 站,几乎没有广告带货,但是已经成为在小众领域流量数一数二的论坛了)
---
一个设想,有条件的大佬真可以试试。
具有一定的(时间、精力、资金、技术)条件。
这玩意说到底是一个长线长期的投资,用户的积累、流量的积累,大概率 3 年以上才能看到明显效果。
需要一些技巧和设计,细节打磨、构思想法。
需要一些耐心。
一旦做起来,很有可能就是遥遥领先一大段身位。(当然,没做起来另说)
如果指望一年半载挣到快钱,不现实。
普通打工牛马还是先忙工作吧...