linux.do – Telegram

linux.do

21.3K subscribers

122K photos

196 videos

117 files

257K links

linux.do最新话题和热议话题

Download Telegram

About

Blog

Apps

Platform

21.3K subscribers

话说L站咋知道我生日的，还有个小蛋糕呢

68 posts - 66 participants

Read full topic

via LINUX DO - 热门话题 (author: LinLan)

24 views10:28

感觉降低倍率至0.25后，效果还是蛮明显的。

重新整了一下leaflow，发现单日数据屡创新高，不知道会不会突破55亿tokens/天

看了一下总数，重新开站到现在11天，也350亿tokens了，500亿的时候给大家发一波兑换码吧～

用户总人数也超过了7200人～水一波

83 posts - 69 participants

Read full topic

via LINUX DO - 热门话题 (author: Wong)

Invalid media:
image
image

25 views10:29

GeminiPro学生订阅难道不包括Gemini-CLI吗

忘情的vibe coding了一下午结果红字提醒额度用完20小时后重制我。。。 :distorted_face: :distorted_face: :distorted_face:

5 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 爆炸毛)

21 views10:34

[开源] AI 真的能够共情人类吗？我做了一个 AI 日记本

项目地址：GitHub - shuxueshuxue/ink-and-memory: A responsive AI notebook that helps you record and explore your life.
我自己部署的版本：Ink & Memory
大家好呀！这是我断断续续做了两个月的项目，也是自己的第一个带有一点点前端设计的项目。今年是 ai phd 刚入学，业余尝试做一些独立开发 ~

每个人的人生中难都免遇到很多 emo 时刻，这时候写日记不失为一种缓解负面情绪、理清生活现状的方式。但独自一人写作，没有人回应，会不会很孤独呢？于是我就做了这个项目，主要的功能是，在写作的过程中，Agent 会一个个地跳出来对写作的内容进行评论，来给人一点陪伴，或许也有思维的启发。还有毫不留情的批评。

大家可以试玩下，期待反馈哦。可以来找找茬，目前我们发现的问题包括但不限于回复空泛模糊、过于说教、忽略核心话题等。
此外，我的一个开发者工具的项目也在不断更新，欢迎来大家关注:

[开源项目] 我做了一个可视化 Spec 和 Context 管理工具开发调优

大家都说下一个开发范式是 Spec 驱动，其实我很久以前就和朋友讨论过，如果将每个功能点都用语言定义得非常清晰，技术架构、数据结构也都写好，那么 AI 是不是可以一次性就完成整个项目？然而实践告诉我们，大部分情况下都是不行的 - 其中不可控的因素太多，例如有时候 Spec 本身也不一定对，需要更新，如果 AI 盲目遵从反而做错了。除非是对技术栈非常熟悉且项目难度不大，否则 Spec 是很难完全…

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Jeffry)

Invalid media:
image
image

19 views10:34

multi-ocr-sdk：支持多种ocr引擎的pip包

项目介绍

● 开源地址 GitHub - B-Beginner/MULTI-OCR-SDK: A simple and efficient Python SDK for DeepSeek-OCR API

MULTI-OCR-SDK 是一个简单高效的 Python SDK，用于调用各类OCR API（现已支持deepseek-OCR、视觉模型VLM），可以高精度、高性能地将文档（PDF、图片）转换为 Markdown 文本。

使用

安装

# 通过pip安装
pip install multi-ocr-sdk
# 或者通过uv安装
uv add multi-ocr-sdk

VLM的基础用法

import os
from multi_ocr_sdk import VLMClient

API_KEY = "your_api_key_here"
BASE_URL = "http://your_url/v1/chat/completions"
file_path = "./examples/example_files/DeepSeek_OCR_paper_mini.pdf"

client = VLMClient(api_key=API_KEY, base_url=BASE_URL)

result = client.parse(
    file_path=file_path,
    prompt="你是一个ocr机器人，识别输入的文件内容，输出为markdown格式，尽可能保留图表等格式信息，你不需要评论概括文件内容，只需要输出就行",
    model="Qwen3-VL-8B",
    # timeout=100, # 可选参数，默认60s，如果文件很大，VLM需要处理很久，timeout需要设置长一些
    # dpi=60  # 可选参数，默认72，DPI越低，图片越糊，消耗的输入token越少，识别效果越差，自行调整至合适比例
    # pages=[1,2] # 可选参数，如果是处理单张图片或者单页pdf不需要这个参数，如果是处理多页pdf默认处理所有页，可以通过这个参数处理指定页

)
print(result)

deepseek-ocr的基础用法

from multi_ocr_sdk import DeepSeekOCR

client = DeepSeekOCR(
    api_key="your_api_key",
    base_url="https://api.siliconflow.cn/v1/chat/completions"  # 或您的提供商端点
)

# 简单文档
text = client.parse("invoice.pdf", mode="free_ocr")

# 复杂表格
text = client.parse("statement.pdf", mode="grounding")

# 自定义 DPI
text = client.parse("document.pdf", dpi=300)

背景故事

前一段时间deepseek发布了ocr模型，尝试了一下，非常好使
后来发现github上有人开发了deepseek-ocr-sdk，调用起来很方便，在此基础上提了一些需求，和原作者一起改吧改吧，加了些新功能

使用过程中发现硅基流动免费的ds-ocr很容易触发限制，而我又不打算氪金升级，如果换到其他第三方效果不太行（试了几个L站的第三方，体验不佳），于是想着能不能支持一些其他的ocr模型，比如qwen-ocr？

经过一番折腾，最终在原本的deepseek-ocr-sdk基础上进行了代码重构，现在支持了VLM，经过实测qwen3-vl-8b就能有很棒的效果

接下来会支持更多常用的ocr引擎，欢迎大家捉bug，提pr❤️

----------------------

本文永久保存链接： https://forum.beginner.center/t/topic/2505

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: fliper)

18 views10:34

我尼玛 Claude

吐了，我似乎掌握了必封号方法，现在美国时间是凌晨，这次肯定不是人工

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: mofas)

Invalid media: image

23 views10:34

cloudflare一片绿？？

这又是什么情况？

4 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: lysk797)

Invalid media: image

31 views10:34

求问cursor和augment的200刀套餐哪个更耐用一些？

augment 效果好一些，但是感觉 200 刀高强度使用不太够，cursor + ace mcp 也不错，但是不太清楚 200 刀套餐会不会更耐用一些

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: amojury)

36 views10:34

能把claude code 转到 windsurf cursor用吗，cli用着难受

有现成的吗，转换工具？

7 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: justindoit)

32 views10:34

肯德基和麦当劳的年卡推荐买哪个？好像麦当劳的要贵10块钱，但是好像大家都说麦当劳好吃？我感觉差别不大，两家的薯条都好好吃，蹭朋友的肯德基大神卡买的多，30多块钱块钱的套餐免配送费挺不错的。蹭的太多有点不好意思🌚，想自己买一个，想了解一下麦当劳的怎么样？你们觉得这两家哪些菜品比较好吃？

8 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: 木瓜蛋白酶Tea🎋)

29 views10:34

喵喵注谷歌册站将会长期经营下去

由于违反社区规则，占用公共资源，喵喵认识到自己错误，并且自罚继续研究谷歌强制绑定手机登录法，感谢对喵喵的批评。

8 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: 忆冰Yibing)

31 views10:34

推一个X上挺火的项目“人生K线”

仅供娱乐，AI算命不违规吧？感觉挺有趣的，没有aff，有兴趣的去玩玩
0xSakura樱花🌸 (@0xsakura666) / X

4 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: GPT-5)

34 views10:34

一个没啥用的公益api

https://www.dpapi.top/v1
sk-WBl1hk1i6EouPQRvtI0nSva3UsfzDzYzI1lUrc2Zfz5KFC3A
moonshotai/kimi-k2:free

tngtech/tng-r1t-chimera:free

z-ai/glm-4.5-air:free

8 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: fengsanle)

32 views10:34

莫非是我经受了前五个女人的考验变得聪慧了

7.3H了

这就打过第六章了？才打了两三次
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)

Invalid media:
image
image

30 views10:34

赛博撸猫小插件

（话题已被作者删除）

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: saltfish)

30 views10:34

crmeb的多商户商城JAVA版本

crmeb.com

高品质开源商城系统-CRMEB官网

CRMEB开源商城系统，围绕新零售、品牌连锁、商家入驻等多种商业模式，自主研发B2C商城系统、B2B2C多商户商城系统、连锁多门店商城系统、跨境电商系统等；应用于直播电商、社交新零售、商家入驻等多种应用场景，系统支持多语言、多端登录，代码开源、独立部署、永久免费升级。咨询：400-8888-794

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 小白菜)

Invalid media: image

36 views10:34

好容易兴奋一次，却一盆凉水 | FireDBG

firedbg.sea-ql.org

FireDBG - 🔥 Time Travel Visual Debugger for Rust

🔥 Time Travel Visual Debugger for Rust

看起来很炫酷，但是很久没更新了，vscode还有配套拓展……）但得配套

……rust课设）没得选 :distorted_face:

4 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: stevessr)

Invalid media: image

37 views11:03

Claude搓的赛博撸猫插件

via LINUX DO - 最新话题 (author: saltfish)

Claude搓的赛博撸猫插件

工位摸鱼中，让claude搓了个赛博撸猫插件，感觉画的猫猫很一般。 // ==UserScript==// @name 赛博撸猫// @namespace http://tampermonkey.net/// @version 2.3// @description 在任意网页上添加一只超可爱的虚拟猫咪，支持多部位互动// @author You// @match *://*/*// @grant GM_addStyle// @run-at document-end// ==/UserScript==(function()…

34 views11:03

你们的Codex在工作的时候会突然卡住么？

就比如这样，突然就一动不动了。

然后这种Prompting的工作状态栏也会消失不见：

ESC也没反应，要切换模型也切换不了，会提示正在工作中，不能切换模型。

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: b1ghawk119)

Invalid media:
image
image
image

42 views11:03

阿里cosyvoice3开源

Fun-CosyVoice3-0.5B-2512 · 模型库
之前上架阿里云很久了一直没开源，今天发现他在昨天12.15开源了
可能迫于智谱ASR的压力
预览音频官方链接： CosyVoice3.0

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: xy3)

28 views11:03

马上就有新的claude国内订阅方式了

claude现在开通了礼物赠送功能,直接购买订阅发送给某个账户.
可以选择x5 x20 一个月或者1年
https://claude.ai/gift

4 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Obsidian)

Invalid media: image

36 views11:03