linux.do
21.2K subscribers
120K photos
195 videos
117 files
254K links
linux.do最新话题和热议话题
Download Telegram
mac 软件 popClip 能卖吗

放弃 mac 了,popClip 的 license 能转卖吗?想卖了

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: msdone)
为什么https://ipqualityscore.com/ 不是免费一个月1000次吗

为什么说我余额不足

6 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 小白)
PaddleOCR-VL部署使用体验记录

前言

前阵子看到paddle发布SOTA的OCR模型,预览效果很nb,但看很少人去尝试使用。刚好公司有一些书籍类型的pdf(含公式,图片,表格等),内容双栏显示。使用场景够复杂了吧,也是日常会遇到的情况。于是就开始折腾部署PaddleOCR-VL模型。

配置

RTX6000(46G显存)

Windows11(配置wsl,Ubuntu-22.04)

python==3.12

确保wsl内的CUDA 版本必须大于或等于 12.6nvidia-smi查看)

开始操作

所有流程都在wsl中操作,包括python虚拟环境创建包安装等。我使用非Docker的方式安装

1.创建虚拟环境

conda create -n paddleocr python==3.12

2.安装paddle包
# 以下命令安装 CUDA 12.6 版本的 PaddlePaddle,对于其他 CUDA 版本以及 CPU 版本,请参考 https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html
python -m pip install paddlepaddle-gpu==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/


连续使用以下命令即可
python -m pip install -U "paddleocr[doc-parser]"
python -m pip install https://paddle-whl.bj.bcebos.com/nightly/cu126/safetensors/safetensors-0.6.2.dev0-cp38-abi3-linux_x86_64.whl


3.python代码(单个pdf文档)
from pathlib import Path
from paddleocr import PaddleOCRVL

input_file = "./your_pdf_file.pdf"
output_path = Path("./output")

pipeline = PaddleOCRVL()
output = pipeline.predict(input=input_file)

markdown_list = []
markdown_images = []

for res in output:
md_info = res.markdown
markdown_list.append(md_info)
markdown_images.append(md_info.get("markdown_images", {}))

markdown_texts = pipeline.concatenate_markdown_pages(markdown_list)

mkd_file_path = output_path / f"{Path(input_file).stem}.md"
mkd_file_path.parent.mkdir(parents=True, exist_ok=True)

with open(mkd_file_path, "w", encoding="utf-8") as f:
f.write(markdown_texts)

for item in markdown_images:
if item:
for path, image in item.items():
file_path = output_path / path
file_path.parent.mkdir(parents=True, exist_ok=True)
image.save(file_path)


4.完成到这部就可以运行了,第一次使用会下载模型比较慢。可能之前安装依赖中断过几次的原因,运行代码报错缺失系统依赖,错误日志丢ai解决即可。

我使用的文档是书中截取的三页内容,并非全书。消耗显存5.9G左右

效果

可以看到即使两栏内容,paddleocr也能很好的识别连接,公式使用latex,图表这里不知道为什么没识别成表格(官方演示效果)但还是完整保留下来了。有部分公式格式异常,导致公式没有正常渲染。后面写了脚本把二十多个pdf都进行ocr,占用显存44.5G。

结论

目前看效果已经非常好了,个人还没有做多模态检索,所以图片数据不是很重要,但确实已经很好的保留书籍的完整结构。这种文档结构识别再进行ocr的架构(类似于工作流)应该是未来OCR的方向了。

参考连接:使用教程 - PaddleOCR 文档

4 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 青草蛋糕)

Invalid media: image
[谷歌母公司 Alphabet 首度季度营收突破千亿美元]

2025-10-30 10:22:06

谷歌的母公司 Alphabet 日前公布了第三季度财报,展示了其核心广告业务和云计算部门的稳健增长,首次实现季度收入突破 1000 亿美元。尽管公司宣布将超出先前预期的数十亿美元进行支出,但投资者仍感到兴奋,股价在盘后交易中上涨。

Alphabet 在财报中提升了未来一年的资本支出预期,预计将投入 910 亿到 930 亿美元,几乎全部用于基础设施建设,例如数据中心,以支持日益重要的人工智能产品。这一预测较今年 2 月的 750 亿美元和 7 月修正后的 850 亿美元有了显著增加。

在第三季度,Alphabet 的总营收达到 1023.5 亿美元,超过了分析师平均预期的 998.9 亿美元。谷歌云服务依然是 Alphabet 增长最快的部门之一,受益于企业对 AI 驱动的基础设施和数据分析服务的强劲需求,第三季度营收为 151.6 亿美元,高于分析师预期的 147.2 亿美元。随着企业对 Vertex AI 和定制张量处理单元的使用增加,谷歌云正逐步缩小与竞争对手 Microsoft Azure 和 Amazon Web Services 之间的差距。

然而,在广告业务方面,Alphabet 面临着激烈的市场竞争,尤其是随着经济低迷可能导致广告支出的谨慎。尽管如此,分析师们认为,许多广告商可能会从一些实验性广告平台转向谷歌,以寻求更可靠的投资回报。

7 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: dharma)

Invalid media: image
Auto Tag SEO:WordPress插件用于优化tags描述提供可见性

参数介绍:https://blog.prompt2tool.com/auto-tag-seo/

使用z.ai来批量自动化为WP文章tags生成描述,提供SEO可见性

可在WP后台插件搜索Auto Tag SEO

也可下载:Auto Tag SEO – WordPress plugin | WordPress.org

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Prompt2Tool)

Invalid media: image
怎么有游戏的反作弊会检测AHK的(

受不了辣!之前用AHK做的麦克风静音软件用不了了

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 璨梦踏月)

Invalid media: image
求助,AI科技视频

佬们好。

求助一下佬们。关于人工智能,佬们有没有比较炫酷的视频,就是内种氛围很先进,很有科技氛围的视频。比如人工智能结合无人机,比如人工智能结合前沿技术,包括最近很火的编程工具之类,生成数字人之类的~ 求助佬们推荐一些!

跪谢各位佬!

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 黎明)
求助,如何查看指定时间的帖子

目前我只知道帖子如何按时间升降序排列。
从新到旧 LINUX DO - 新的理想型社区
从旧到新 LINUX DO - 新的理想型社区
各位佬,有查看指定时间帖子的方法吗?如查看当天的帖子,是需要添加什么参数吗?

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: gaolaogao)
如何解决Claude Cli在执行任务的时候,老弹出GIT的命令框,打断其他的操作

大佬们,如图

如何解决不让GIT弹框,我用ChatGPT、deepseek的方案全都实验了一遍,都无法阻止,GIT命令框弹出。
2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 王雷)

Invalid media: image
有没有马来西亚的家宽鸡

万能的佬友们,我又来求助了,有没有马来西亚的家宽鸡,用来做跨境。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: zwen)
求ai下棋软件

学校二课学分,要赢机器一次,好像搞不定啊,佬有没有什么软件可以帮我打
3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 炫彩小鱼干)

Invalid media: image
TG必备的搜索引擎,极搜帮你精准找到,想要的群组、频道、音乐 、视频

👇👇👇点击下方按钮,进行搜索
最近这个游戏特别火,我准备做一个相关网站

有没有佬友玩这个鸭子游戏的。帮我看下我应该往那个方面开发。

这个我做的:https://escapefromduckov.app/

目前已经做了三种语言:英文,中文,繁体。主要方向是各种图鉴数据。

42 posts - 27 participants

Read full topic

via LINUX DO - 热门话题 (author: 阿阳)

Invalid media:
image
image
image
打算做一个linux公益汇总导航

把公益站的api,酒馆,功能站还有github项目等都加进导航站,你们觉得怎么样,这周就可以做出来,也不用到处搜了
站内有个开源鉴权,可以做前置化的导航站登录,限制站内用户登录,不公开,怎么样
导航站和导航贴同步进行(贴子的分类和展示肯定是不如导航站清晰这个是无解的弊端)

起初的目的是导航站,但是防止L站被标定为恶意引流,打算同步新增导航帖,但是导航贴的更新肯定是没有站快的,只能定期更新

导航站链接以原站➕️原贴的双链接形式存在,防止站外偷偷导流 :tieba_001:

【开源】php-oauth-Linux.Do,可嵌入任意PHP项目的oauth认证前置页 文档共建
前言 这个项目构思好久之前就有了,一直没时间整,现在整好了,先说说它有啥用?能给任意php项目增加一个认证前置页面,能够限制访问用户的信任等级,比如使用某些php版本卡密发卡网,商品价格设置为0,但仅允许信任等级2以上用户领取。 开源地址 https://github.com/wang4386/php-oauth-Linux.Do界面速览 登录页面 [PixPin_2025-04-18_0…

56 posts - 36 participants

Read full topic

via LINUX DO - 热门话题 (author: 三七)
刚才突然要我去查学信网,顺便说说我曾经的一个同学

不查不知道一查吓一跳,一般人学位证书编号和学历证书编号后六位都是一样的,但我是不同的,我的学位比学历最后小三位数,已知学历编号是入学生成的,学位编号是毕业生成的,说明在上学的时候我前面有三个人退学了?
这就不得不给各位佬讲讲那个我大学退学的同学了,他的退学我记得是劝退,如果各位有兴趣听我给大家详细说说。
谨以此文怀念那些成长过程中与众不同的同学们吧,他们并不是坏人,或者,大多数都不是。

应佬友要求把下面更新的贴到这里,大家后来的都可以从这里看,如果觉得字太多,可以逐层看
想要一次性看完的点这里 (click for more details)
说实话,作为我个人,我也是要感谢每一位看过我写这段文字的人,我在锻炼我的表达能力,今年一月,我还深受抑郁症困扰,无法与人交流,然后我认识了我的女友,然后我开始了很多,重新接触社会,重新工作,重新和家里人坐下来好好谈,重新开始运动。我做了很多努力,有些有效果有些没有,但我还是先慢慢做下去。有很多佬夸我说写得好,我实打实的感谢你们每一位。我对文学确实很喜欢,但我也很怀疑自己是否能达到自己的期望,或许以后也不会。但我要说的重点不在这里。我要说的重点是,我现在正在变得更好。
这个故事是虚构的吗?不是,我今天早上公司突然需要我更新学历信息,但我发现学信网上怎么都找不到我的学位证书,我慌了,请了个假回家翻出来,发现编号和学历编号有出入,这才让我想起之前退学的一哥,我对一哥的态度,也在毕业这么多年后,才算是有一个完整的整理。我不是一个刻薄的人,但我也觉得我不够善良。人从现在看过去,总会有很多感慨,如果我当初那么做就好了,如果我没有那么做就好了,balabala一堆。写到这里有点耳鸣,那就祝大家身体健康,心灵安宁。然后我把这段也给我女朋友看了,她对我一直很鼓励。总之,祝大家开心。

127 posts - 49 participants

Read full topic

via LINUX DO - 热门话题 (author: horie)

Invalid media: image
【抽奖】packycode还活着,十月不易啊(10 份 50usd 余额)

10 月总结:比 8 月更艰难的一月

10 月份的情况比 8 月更为艰难。
a 社再次采取不合理措施,频繁出现周限和封号问题。
我们被迫从订阅制转为按量计费,同时砍掉了拼车服务。
整个 10 月,不是在补号,就是在补号的路上,确实不容易。


技术与架构调整

● 后端语言
过去我们的后端完全由 Rust 编写。
考虑到开发效率与业务,目前已调整为 Go + Rust 的组合。
Rust 在稳定性方面表现出色,但业务开发速度偏慢,Go 的加入提高了整体迭代效率。
● 主站迁移
PackyCode 主站现已迁移至我们二次开发的 NewAPI(已获得商业授权)。
作为统一的 API Gateway,减少了从零编写业务逻辑的工作量,也方便后续迭代

----------------------

套餐与价格更新

codex:codex.packycode.com

● Codex 套餐
因 OpenAI 调整,我们对新套餐进行了相应下调。
当前新套餐为 60 元 / 每天 60 美元额度,老套餐未到期未激活的不受影响,仍保留原有配置。

Packyapi:www.packyapi.com

● PackyAPI 按量价格 基准价格:1:1 Claude Code(CC):无倍率 Codex:0.1 折 AWS 渠道:2.5 倍

----------------------

希望后续能够稳定下来,我们会继续优化架构与产品逻辑。

抽奖截止时间:10 月 31 日 17:00
奖品:Packyapi 50usd额度

神秘代码:VW50

452 posts - 451 participants

Read full topic

via LINUX DO - 热门话题 (author: 宙斯)
1
刘德华为什么能永葆青春活力?

闲来无事跟大家聊聊时下最流行的健康的问题。
自鸿蒙之时,盘古开天劈地,怎么健康地活着就成了生物的首要问题。
所谓病从口入,每天早晚刷牙。牙膏我只用中华为的就是这个响亮的名字。
我注重饮食健康,日常食用小米等粗粮。现在日子好过了,年年有余大嘴也不用挨饿。
膳食均衡,水果也要吃,饭后吃个苹果是非常好的佳品,让人直呼无敌。
听力健康也很重要,避免长时间处于吵闹环境,比如打雷军号同时响起,那声音分贝受不了。
短途出行可以考虑步行,比起乘坐汽车健康又环保。
保重好我们的身体,享平安卓越人生,跟垃圾生活告别。
你们觉得这些做法怎么样?一起来说说你的看法吧。

257 posts - 229 participants

Read full topic

via LINUX DO - 热门话题 (author: Neo)
明天团建去喽

就两天还占一天的周末 🥲算了能玩就行

iframe (External Player - 哔哩哔哩嵌入式外链播放器)

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 李白)
原来Falcon Alpha就是SWE-1.5啊

(话题已被作者删除)

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: linjinpeng)
我开发了个极简的LLM提供商编辑器

Github: GitHub - MatrixAges/ai-sdk-panel: The config panel for ai sdk.
Demo: AI SDK Panel

做过好几个 AI 应用,发现自己一直在重复造轮子,为每个 AI 应用都开发一套 LLM 提供商编辑器。

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 1yasa)

Invalid media:
image
image
image
image
image