标题: [开源] 做了一个用LLM来OCR的工具,欢迎各位佬友使用!
作者: #RUD
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1888946
时间: 2026-04-03 12:46:55
摘要:
作者: #RUD
板块: #开发调优
编号:
1888946帖子: https://linux.do/t/topic/1888946
时间: 2026-04-03 12:46:55
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
github.com
GitHub - RRRRUDDDD/LLM_OCR
通过在 GitHub 上创建帐户来为 RRRRUDDDD/LLM_OCR 开发做出贡献。
做这个项目的起因是我自己有 ocr 大量文本的需求,现在多模态大模型的 ocr 效果确实非常好,准确率高,速度也还行,但是市面上并没有很好的工具,于是就自己做了个,欢迎各位佬友使用并提出意见。
可识别的图片格式基本覆盖了日常会使用到的格式,也对 pdf 直接上传做了适配,可以直接用 pdf 来上传。支持直接复制,markdown,txt,word 四种导出方式。
移动端和 pc 端也都做了适配,方便日常使用。
最后,感谢 L 站和 L 站的佬友们,没有站内的公益站,就没有这个项目。opus4.6 太牛了!
标题: 有人用阿里的accio吗
作者: #翼风 慕
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1888951
时间: 2026-04-03 12:47:58
摘要:
作者: #翼风 慕
板块: #搞七捻三
编号:
1888951帖子: https://linux.do/t/topic/1888951
时间: 2026-04-03 12:47:58
摘要:
试用了PC端的,感觉比养什么虾方便很多
标题: 移动端app开发用什么编译器?
作者: #船神
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1888957
时间: 2026-04-03 12:48:32
摘要:
作者: #船神
板块: #搞七捻三
编号:
1888957帖子: https://linux.do/t/topic/1888957
时间: 2026-04-03 12:48:32
摘要:
我是java开发。但我现在要开发一款app。之前java开发的时候用的编译器是idea。没开发过app。佬佬们,app开发有没有编译器推荐呀
标题: 为什么我们的团队还没有真正用起 AI Coding
作者: #上车 函予
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1888958
时间: 2026-04-03 12:48:36
摘要:
作者: #上车 函予
板块: #搞七捻三
编号:
1888958帖子: https://linux.do/t/topic/1888958
时间: 2026-04-03 12:48:36
摘要:
帖子无了,再发一个
我们是一个位于三线城市的国企开发团队。
大部分人使用 AI,依然仅仅使用 Web Chat 做一些信息检索,或者借助插件完成简单的 Tab 补全。
而对于 AI CLI、AI IDE 这类工具,大家基本都处于听说过、试过一点,很少在具体的工作中使用。
为什么没有深入使用 AI Coding
信息成本
对于大部分团队成员来说,获取 AI 的信息成本其实很高。
也许大家听说过 Codex、Claude Code 之类的工具,但这些工具在国内并不能直接获取和使用。
至于国内一些可以免费试用的产品,在实际体验中又不尽人意。
学习成本
目前在项目中使用 AI Coding,无论是 CLI 还是 IDE,都需要掌握一些新的概念,比如项目上下文、MCP、Skill、Agent 等。
这些概念本身并不复杂,但这些概念和其他已有的开发概念不同,这是一种个性化的概念。
项目上下文还可以是明确的项目架构、约束、风格等等通用的上下文。但这些也很难在不同的项目中完整复用。
至于是 MCP、Skill、Agent等,更像是个人开发理念和习惯的整合,即使有大佬分享的模板,也需要根据自己的实际情况进行调整。
所以问题往往不是“学不会”,而是“在实际工作中没有足够的精力去不断的调整和优化”。
沟通成本
这是一个很有意思的问题。
我们是一个小团队,大家都做过需求采集、需求分析、功能设计这些事儿,但很多都停留在口头上。
但是当需要和 AI 协作时,你需要适应完全不同的沟通方式,这是完全不同的体验。尤其是在缺少文档、注释、规范的老项目中。
难以描述的上下文,需要不断调整的 plan,总是需要多轮对话以小步快跑的方式进行沟通。
这恰恰是与以往开发完全不同的方式,需要脱离现有的舒适区。
而我们的开发任务并不繁重,大多数时候都是简单的功能实现,或者老项目的维护。
因此对于很多团队成员来说,和 AI 沟通了半天,还不如自己上手写得快。
费用成本
公司目前并不会为了让团队成员使用 AI Coding 额外支付费用。
对于我们这种三线城市的小团队成员来说,如果要为了获得更好的模型效果而自己额外付费。
只会让并不富裕的收入,更加雪上加霜。
AI Coding 采用门槛确实高
对于一个资源有限的小团队来说,使用 AI Coding 有几个无法跨越的门槛:
难以获得
难以上手
成本高昂
写在最后
AI Coding 不是一个能够脱离环境谈论的空想问题。
一线城市的大厂团队、预算充足的创业团队、我们这种三线城市的国企开发团队,都会给出不同的答案。
这些答案并没有对错之分,我们只是基于当前的环境,做出了适合当下的选择。
标题: spaceship是不是会注意搜索过的域名
作者: #Kami958
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1888960
时间: 2026-04-03 12:49:02
摘要:
作者: #Kami958
板块: #搞七捻三
编号:
1888960帖子: https://linux.do/t/topic/1888960
时间: 2026-04-03 12:49:02
摘要:
这鸡贼的spaceship,昨天无论搜了几个域名,昨天都放购物车了,今天想买发现已经被注册了 还说不会记录和统计域名搜索记录
标题: ⚠️警惕新型诈骗!远程面试/接私单的佬友们注意了!最近这类诈骗貌似越来越多,看来是不少人中招了。
作者: #精神点儿 别丢份儿
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1888962
时间: 2026-04-03 12:49:24
摘要:
作者: #精神点儿 别丢份儿
板块: #搞七捻三
编号:
1888962帖子: https://linux.do/t/topic/1888962
时间: 2026-04-03 12:49:24
摘要:
标题: 怎么这么多推广的
作者: #conger
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1888982
时间: 2026-04-03 12:54:35
摘要:
作者: #conger
板块: #搞七捻三
编号:
1888982帖子: https://linux.do/t/topic/1888982
时间: 2026-04-03 12:54:35
摘要:
吃完饭回来刷一会论坛,全是推广的,文案一模一样,也没讨论点,也没使用感受啥的,纯浪费站内资源
标题: 佬友们,终于上2了,昨天一晚没睡好
作者: #PD
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1888990
时间: 2026-04-03 12:55:25
摘要:
作者: #PD
板块: #搞七捻三
编号:
1888990帖子: https://linux.do/t/topic/1888990
时间: 2026-04-03 12:55:25
摘要:
来到L站好久了,15天前加入后狂水15天,我成了。。
标题: 等级为三级了会不会掉到两级
作者: #dyh2002
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889001
时间: 2026-04-03 12:57:57
摘要:
作者: #dyh2002
板块: #搞七捻三
编号:
1889001帖子: https://linux.do/t/topic/1889001
时间: 2026-04-03 12:57:57
摘要:
想问一下各位佬友 如果l站的等级到三级之后 长时间不活跃 这个等级还会掉到两级吗 还是一直在三级
标题: 我用3090单卡测试了一下gemma4-26b-a4b-it
作者: #neoone
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1889002
时间: 2026-04-03 12:58:08
摘要:
作者: #neoone
板块: #开发调优
编号:
1889002帖子: https://linux.do/t/topic/1889002
时间: 2026-04-03 12:58:08
摘要:
3090因为显存的问题普遍较高,于是将显卡功率限制为78%,温度也限制在78度,将26b-a4b 完全加载入显存,实际跑下来75tps没问题,速度快的话有时候能近百。可怕的是不仅速度快,回答问题的质量也相当令人满意。编码我没有测试,试验了一下网页翻译,速度快,质量高。值得从qwen3.5切换过来。
标题: 大家对unix了解多少?
作者: #Leo Lee
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889003
时间: 2026-04-03 12:58:12
摘要:
作者: #Leo Lee
板块: #搞七捻三
编号:
1889003帖子: https://linux.do/t/topic/1889003
时间: 2026-04-03 12:58:12
摘要:
想做个小调查,不知道大家对计算机历史(比如AT&T Bell Labs那些)了解多少?
标题: 部署了gemma4:26B,在12G 显存 32 内存的机器上,跑的很流畅
作者: #发量不多程序猿
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1889004
时间: 2026-04-03 12:58:12
摘要:
作者: #发量不多程序猿
板块: #开发调优
编号:
1889004帖子: https://linux.do/t/topic/1889004
时间: 2026-04-03 12:58:12
摘要:
刚用 ollmma 部署了gemma4:26B,在12G 显存 32 内存的机器上,跑的非常流畅,下面试试 31B,是不是要实现token 自由了,可惜L 站不能上传视频
标题: Claude最让我震撼的一次,不是写代码,而是做行业调研
作者: #林子
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889009
时间: 2026-04-03 12:59:03
摘要:
作者: #林子
板块: #搞七捻三
编号:
1889009帖子: https://linux.do/t/topic/1889009
时间: 2026-04-03 12:59:03
摘要:
事情的起点是:发小来跟我说有朋友要拉他一起做某种天然物质颜料的品牌,不缺资金也不缺资源,各项条件听起来能搞成的概率挺大,他在考虑要不要一起干,来找我讨论。
作为这个行业的外行人,我第一次听说这个产品类别,直觉上这个市场规模可能比较小。我自己的业务最近有些起色,也挺忙,没打算深入调研,聊了会儿劝他再去多深入了解下。
晚上回到家打开电脑跟claude讨论完个产品活动的方案,想起这事儿,随手给claude和chatgpt都发了句指令:
对天然物质颜料这个产品类别做个市场调研,当前市场规模如何、用户群体、发展阶段、主要品牌等,尤其是中国的情况。聚焦在用于传统艺术创作的天然矿物颜料这个细分市场。
然后!5分钟后claude就给我个小惊喜!这份报告对于我这样一个有商业常识但没有行业知识的人,瞬间就补齐了基本行业信息,已经完全够我给出建议了:虽然在涨但市场规模过小、产品价格过高以致用户人群非常小、供应链不好搞。出于热爱可以搞,出于赚钱就算了。
(ChatGPT那份报告不如这份,排版上也远没有这个美…)
我立马把这份报告和我的结论发给了发小。发小第一反应是:这报告有点牛逼啊!说得有道理啊。要不,你先把那个出报告的工具推荐给我一下!我感觉有点厉害!
我:哈哈哈哈哈哈哈 这重点转移得是不是有点快
报告原文如下,说实话我是真有点惊艳的,我刚工作那会儿做的调研报告可能也就这个水平,而且没有个两天出不来。