#mark #ai #llm #leaderboard
MTEB 是一个用于评估文本嵌入(Text Embedding)模型性能的基准测试集。这个榜单展示了不同模型在文本嵌入任务上的表现。
● https://huggingface.co/spaces/mteb/leaderboard
via Memos
MTEB 是一个用于评估文本嵌入(Text Embedding)模型性能的基准测试集。这个榜单展示了不同模型在文本嵌入任务上的表现。
● https://huggingface.co/spaces/mteb/leaderboard
via Memos
#tools #adguard
● https://github.com/AdGuardTeam/AdGuardBrowserExtension
adguard 浏览器插件版用起来不错, 适合一些轻量级的广告屏蔽需求
via Memos
● https://github.com/AdGuardTeam/AdGuardBrowserExtension
adguard 浏览器插件版用起来不错, 适合一些轻量级的广告屏蔽需求
via Memos
#mark
看到的一个非常不错的讲 deepseek v3 paper 的分析: https://www.youtube.com/watch?v=OM7Sa_BlDIk
包括 kv cache 都从 0 开始讲了, 很适合新手看
via Memos
看到的一个非常不错的讲 deepseek v3 paper 的分析: https://www.youtube.com/watch?v=OM7Sa_BlDIk
包括 kv cache 都从 0 开始讲了, 很适合新手看
via Memos
#llm
Bilibili 技术: 大模型推理加速的研究与分析
加速方案的主要思路
1 - 算子层优化:
● Operator Fusion:通过将多个算子融合为一个复杂算子,减少内存访存次数,加快计算速度。
● High-Performance Acceleration Library:使用如ONNX Runtime、TVM、cuBLAS、FasterTransformer等高性能加速库,优化常见的神经网络算子的计算性能。
● Layer Fusion:在多头注意力机制中,将所有操作合并到一个计算核中,减少数据传输并提高数学密度。
2 - 算法层优化:
● Quantization Techniques:使用精度更低的单位来表示模型的权重或激活值,以节省空间和加速模型推理速度。
● Speculative Decoding:通过使用一个简洁且反应迅速的小型模型来辅助解码,提升推理速度。
● Sharding Strategy Optimization:通过模型分片将不同部分的计算任务分布到多个设备上,减少单个设备的内存压力和计算瓶颈。
3 - 框架层优化:
● Contiguous Batching:通过在推理过程中保持请求的连续批量处理,减少上下文切换和内存调度带来的开销。
● PageAttention:优化Attention机制中的KV存储,减少内存占用,提高内存访问效率。
● TensorRT-LLM和MindelIE-LLM框架:通过支持多种Attention机制和流水线并行、跨层并行等技术,提高推理的吞吐量和响应速度。
via Memos
Bilibili 技术: 大模型推理加速的研究与分析
加速方案的主要思路
1 - 算子层优化:
● Operator Fusion:通过将多个算子融合为一个复杂算子,减少内存访存次数,加快计算速度。
● High-Performance Acceleration Library:使用如ONNX Runtime、TVM、cuBLAS、FasterTransformer等高性能加速库,优化常见的神经网络算子的计算性能。
● Layer Fusion:在多头注意力机制中,将所有操作合并到一个计算核中,减少数据传输并提高数学密度。
2 - 算法层优化:
● Quantization Techniques:使用精度更低的单位来表示模型的权重或激活值,以节省空间和加速模型推理速度。
● Speculative Decoding:通过使用一个简洁且反应迅速的小型模型来辅助解码,提升推理速度。
● Sharding Strategy Optimization:通过模型分片将不同部分的计算任务分布到多个设备上,减少单个设备的内存压力和计算瓶颈。
3 - 框架层优化:
● Contiguous Batching:通过在推理过程中保持请求的连续批量处理,减少上下文切换和内存调度带来的开销。
● PageAttention:优化Attention机制中的KV存储,减少内存占用,提高内存访问效率。
● TensorRT-LLM和MindelIE-LLM框架:通过支持多种Attention机制和流水线并行、跨层并行等技术,提高推理的吞吐量和响应速度。
via Memos
#llm #leaderboard
● 比较 LLM API 性能: https://artificialanalysis.ai/leaderboards/models
● 另一个比较 LLM price 的: https://countless.dev/
via Memos
● 比较 LLM API 性能: https://artificialanalysis.ai/leaderboards/models
● 另一个比较 LLM price 的: https://countless.dev/
via Memos
#mark
防止使用 US 节点时, Google 搜索时的时区错乱情况:
● https://www.google.com/preferences?hl=zh-CN⟨=1&prev=https://www.google.com/preferences?hl%3Dzh-CN
选择 搜索结果区域 为 香港 or 新加坡 (东 8 区)
via Memos
防止使用 US 节点时, Google 搜索时的时区错乱情况:
● https://www.google.com/preferences?hl=zh-CN⟨=1&prev=https://www.google.com/preferences?hl%3Dzh-CN
选择 搜索结果区域 为 香港 or 新加坡 (东 8 区)
via Memos
#obsidian #tools
● https://github.com/Canna71/obsidian-janitor
一个 obsidian 用于清理孤立文件、空文件、大文件和过期笔记的插件
via Memos
● https://github.com/Canna71/obsidian-janitor
一个 obsidian 用于清理孤立文件、空文件、大文件和过期笔记的插件
via Memos
#mark #language #bob
● https://github.com/GPT-language/gpt-tutor-for-chrome/blob/3c51f2d13773890de2a17319066758938b7181f8/src/common/services/Chinese.json
看到的一个挺好的语言翻译类的 prompt 合集, 可以给 Bob, 沉浸式翻译一类的自定义提供一些思路
目前我的 Bob 翻译插件的一个 Prompt:
via Memos
Invalid media: image
● https://github.com/GPT-language/gpt-tutor-for-chrome/blob/3c51f2d13773890de2a17319066758938b7181f8/src/common/services/Chinese.json
看到的一个挺好的语言翻译类的 prompt 合集, 可以给 Bob, 沉浸式翻译一类的自定义提供一些思路
目前我的 Bob 翻译插件的一个 Prompt:
role_setting: 请扮演一名经验丰富的英语单词学习教师,你这对门语言非常有研究,您清楚地知道如何帮助学生高效地理解这门语言中的表达。
user_instruction: 如果我的输入: "$query.text" 不是英语单词, 请你输出: "非英语单词", 否则, 针对该英语单词输出:
1. 最常见用法和场景
2. 2-3个同义表达及区别
3. 每种用法各举1个简单例句
不使用任何markdown符号
要求简短精炼,每部分1-2行
via Memos
Invalid media: image
#bob #plugin
简单搞了个 bob -> 欧路词典的插件: 在 https://github.com/yuhaowin/wordbook-bob-plugin 的基础上添加了一个 自动单词验证 的功能.
https://github.com/Lincest/wordbook-bob-plugin
via Memos
简单搞了个 bob -> 欧路词典的插件: 在 https://github.com/yuhaowin/wordbook-bob-plugin 的基础上添加了一个 自动单词验证 的功能.
https://github.com/Lincest/wordbook-bob-plugin
via Memos
#bb
支持账号系统的 cursor 居然连配置同步的能力都没有.
账号就是用来开通 API 权限的吗😂
● https://forum.cursor.com/t/sync-of-keybindings-and-settings/31/40
via Memos
支持账号系统的 cursor 居然连配置同步的能力都没有.
账号就是用来开通 API 权限的吗😂
● https://forum.cursor.com/t/sync-of-keybindings-and-settings/31/40
via Memos
#stt #tools
● https://tingwu.aliyun.com/
● https://www.feishu.cn/product/minutes
最近有语音转文字的需求, 试了一下 openai 的 whisper, 讯飞听见, 飞书妙记 和 阿里的通义听悟.
用起来体验如下:
1. 通义听悟对于中英混合的文本最好用, 并且免费大腕, 赠送的 500 小时额度也足够用了.
2. 然后是飞书妙记, 每个月免费 300min 额度也不错, 但是如果后续想用更多就必须升级商业版 50元/月无限使用, 感觉更多是面向企业用户和员工.
3. 最差的是讯飞听见, 每个月就给 20min 额度, 效果也比较一般.
----------------------
顺便推荐一个 macos 上的录音工具: https://github.com/lihaoyun6/QuickRecorder
可以实现在仅录制音频的情况下同时录制 系统声音+麦克风
via Memos
● https://tingwu.aliyun.com/
● https://www.feishu.cn/product/minutes
最近有语音转文字的需求, 试了一下 openai 的 whisper, 讯飞听见, 飞书妙记 和 阿里的通义听悟.
用起来体验如下:
1. 通义听悟对于中英混合的文本最好用, 并且免费大腕, 赠送的 500 小时额度也足够用了.
2. 然后是飞书妙记, 每个月免费 300min 额度也不错, 但是如果后续想用更多就必须升级商业版 50元/月无限使用, 感觉更多是面向企业用户和员工.
3. 最差的是讯飞听见, 每个月就给 20min 额度, 效果也比较一般.
----------------------
顺便推荐一个 macos 上的录音工具: https://github.com/lihaoyun6/QuickRecorder
可以实现在仅录制音频的情况下同时录制 系统声音+麦克风
via Memos
#bb
在试用了一众 "稍后读" 和 "剪藏" 软件后, 仍然找不到满意的, 于是花了 1 小时简单搞了个适合自己的 workflow:
1. 利用 singlefile 保存单页 html 作为快照
2. 上传到 dropbox 并获取分享链接 (可以直接点击查看快照页面)
3. AI 自动生成摘要和 tag
4. 上传到 Notion Database 进行保存
整个流程联动了 Telegram Bot, Dropbox 和 Notion
目前使用起来体验不错.
demo: https://www.youtube.com/watch?v=ohiGbkgyGCk
---
说一说目前市面上的剪藏软件个人不满意的地方:
1 - 快照使用「服务器采集」: cubox, pocket 等
这种方式的缺点就在于,对目前许多国内网站和应用来说,你不可能不登录不带 cookie 就能获取到一篇文章的内容,那么这样的采集方式受限就很大。
2 - 自带的「网页解析」或者「解析为 Markdown」: obsidian / upnote 等笔记软件的 clipper
不可能适配所有网站的格式,经常看比如 code block 等样式的时候解析出来就乱七八糟。
3 - 仅能保存 URL 的「稍后读」: raindrop 等
对于一些时刻可能下架的敏感内容,或者经常变动的网站,url 可能过一阵子就看不了了。
via Memos
在试用了一众 "稍后读" 和 "剪藏" 软件后, 仍然找不到满意的, 于是花了 1 小时简单搞了个适合自己的 workflow:
1. 利用 singlefile 保存单页 html 作为快照
2. 上传到 dropbox 并获取分享链接 (可以直接点击查看快照页面)
3. AI 自动生成摘要和 tag
4. 上传到 Notion Database 进行保存
整个流程联动了 Telegram Bot, Dropbox 和 Notion
目前使用起来体验不错.
demo: https://www.youtube.com/watch?v=ohiGbkgyGCk
---
说一说目前市面上的剪藏软件个人不满意的地方:
1 - 快照使用「服务器采集」: cubox, pocket 等
这种方式的缺点就在于,对目前许多国内网站和应用来说,你不可能不登录不带 cookie 就能获取到一篇文章的内容,那么这样的采集方式受限就很大。
2 - 自带的「网页解析」或者「解析为 Markdown」: obsidian / upnote 等笔记软件的 clipper
不可能适配所有网站的格式,经常看比如 code block 等样式的时候解析出来就乱七八糟。
3 - 仅能保存 URL 的「稍后读」: raindrop 等
对于一些时刻可能下架的敏感内容,或者经常变动的网站,url 可能过一阵子就看不了了。
via Memos