LinuxDo 新帖推送
173 subscribers
247K photos
307K links
Download Telegram
标题: 请各位大佬指条明路:关于本地搭建OCR服务
作者: #beyond510
板块: #搞七捻三
编号: 827235
帖子: https://linux.do/t/topic/827235
时间: 2025-07-30 16:06:35
摘要:
我现在有一个很大的PDF文件需要识别成文字或者是WORD文档,里面都是实体文件的扫描图,试过了几个工具都感觉差错率挺大的。并且,文件内容还是有点敏感的,文件又太大,上传到网上工具总感觉不踏实。
我现在的想法是,在本地电脑上搭建OCR服务,自己机器上跑识别,而且我公司办公电脑还没有GPU
想请佬友们帮忙说说,搭建什么服务或者大模型,或者使用什么工具,能够解决我现在的问题?
提前谢谢各位了!
标题: 想升级了水一贴互赞~
作者: #nomind
板块: #搞七捻三
编号: 827241
帖子: https://linux.do/t/topic/827241
时间: 2025-07-30 16:09:28
摘要:
标题: 请问佬们有没有免费的存储桶
作者: #leee
板块: #开发调优
编号: 827245
帖子: https://linux.do/t/topic/827245
时间: 2025-07-30 16:10:02
摘要:
有一个项目需要上传视频,差不多2-300个视频左右,2-30个g左右就行了,有没有免费的存储桶推荐一下的吗?
标题: 人事的關懷對新人是真好
作者: #牛爺爺
板块: #搞七捻三
编号: 827249
帖子: https://linux.do/t/topic/827249
时间: 2025-07-30 16:11:53
摘要:
标题: 浪浪山小妖怪好看吗
作者: #hell233
板块: #搞七捻三
编号: 827270
帖子: https://linux.do/t/topic/827270
时间: 2025-07-30 16:18:48
摘要:
有没有兄弟看了电影,好看吗,想带媳妇去看
标题: 佬友们,有什么梯子推荐吗
作者: #lobboC
板块: #搞七捻三
编号: 827271
帖子: https://linux.do/t/topic/827271
时间: 2025-07-30 16:18:50
摘要:
我的考虑因素(靠前的最重要)

IP干净
不限流量
易于使用(导入Clash/Singbox等,不自己搭建)
价格
标题: 网易云 35 天随机抽
作者: #王天霸
板块: #福利羊毛
编号: 827272
帖子: https://linux.do/t/topic/827272
时间: 2025-07-30 16:19:09
摘要:
长尾巴的ren送你网易云音乐黑胶VIP红包 http://163cn.tv/HMVl38l (@网易云音乐)
标题: 开始学习js+jb ide的小问题
作者: #Junglecola
板块: #开发调优
编号: 827277
帖子: https://linux.do/t/topic/827277
时间: 2025-07-30 16:19:41
摘要:
开始学习!
另外问一下新建项目时.idea需要在git提交时保留吗
标题: 寻找一个免费AI文生图网站
作者: #taiyi 747
板块: #搞七捻三
编号: 827281
帖子: https://linux.do/t/topic/827281
时间: 2025-07-30 16:21:52
摘要:
之前在Linuxdo看到一个文生图网站
好像是哪个大学的模型开的一个文生图网站,生成的是像素画
标题: 在企业微信中,管理员是否可以直接看到所有员工的对话历史记录?🤔
作者: #TechnologyStar
板块: #搞七捻三
编号: 827288
帖子: https://linux.do/t/topic/827288
时间: 2025-07-30 16:23:34
摘要:
在企业微信中,管理员是否可以直接看到所有员工与客户的对话历史记录?
标题: 论坛访问缓慢的可以看一下。(无需代理/Windows用户)
作者: #Akabane
板块: #运营反馈
编号: 827294
帖子: https://linux.do/t/topic/827294
时间: 2025-07-30 16:25:00
摘要:
(不适用泉州等地区)如果你的网络环境下访问Linux.do缓慢可以使用以下方法缓解!


在下面这个网址点击获取优选IP
CloudFlare优选ip - 小妖精工具箱 - 一站式在线实用工具平台


找到延迟低的IP地址复制下来。


进入 C:\Windows\System32\drivers\etc\ 找到hosts文件


添加 ip example.com 字段即可。
标题: 关于沉浸式翻译调用api请求过快的问题
作者: #yacc
板块: #开发调优
编号: 827295
帖子: https://linux.do/t/topic/827295
时间: 2025-07-30 16:25:46
摘要:
感谢站里的佬们,翻译也是用上api了。不过有时候网页上可能没多少东西,却因为频繁请求而报错,如果是比较长的维基百科之类的,我完全不敢用api,直接切微软翻译。
因为大部分网页都是一段一条请求,根本没多少内容,而且标题栏之类的也要一次调用,就会导致很多高频率、内容短的请求。
刚才看了一下,正常看reddit帖子,一分钟请求了143次api。因为加了翻译提示词模板,最短的输入216 tokens,输出5 tokens,恐怕提示词模板占了绝大部分。输出超过100 tokens的只有8条。
关键是每秒最大请求数设置稍微大一点基本就要429,设置小了翻译还没我看的快,特别有时候只是先扫一下大致内容,我要是自己挨个翻译就没必要用插件了。
我用 心尘 佬(再次感谢)专门沉浸式翻译的模型,每秒最大请求数上3也基本会报错,其他正常对话用的api根本不敢用来翻译,
所以我突发奇想,有没有办法把这些请求合并一下。因为实际上现在的ai上下文长度都很长,去掉模板重复后五次请求加起来也用不了1000 tokens,但是平均五合一的话rpm从143直接降到29,这个效率提升不是一点半点。比如把长度低于一定数值的段落拼接成一条,然后想办法用像编号列表或者有明显区分度的东西分开,拿到数据后再分割。
或者有没有其他建议,能减少频繁请求的情况,感谢佬们。
标题: Gemini 网页版乱码
作者: #Eureka
板块: #开发调优
编号: 827303
帖子: https://linux.do/t/topic/827303
时间: 2025-07-30 16:27:10
摘要:
Gemini网页端的乱码有佬遇到吗?经常有,持续一个月了。虽然很少用,但十次打开有八次都是这样乱码。啥问题?
标题: 笔记软件命名Zyam,这是它的开发进度
作者: #Aflydream
板块: #开发调优
编号: 827305
帖子: https://linux.do/t/topic/827305
时间: 2025-07-30 16:27:56
摘要:
想了好久没有找到思维入口,然后看到了note-gen,既然是MIT协议的,那就开搞
TODOList:

优化移动端体验
实现速记+AI自动整理功能
设计速记功能界面
实现语音识别
集成AI自动整理功能
实现类似Notion的拖动自动排版功能
研究Notion的拖动排版机制
设计拖动排版功能
实现多列布局支持

已实现
啥也没干qwq
浅浅分析了一下代码
标题: 佬们,我女朋友把我删了之后再加回来,她和我的聊天记录有办法恢复吗?
作者: #dilidili
板块: #搞七捻三
编号: 827307
帖子: https://linux.do/t/topic/827307
时间: 2025-07-30 16:28:12
摘要:
我微信上的记录还在,有办法备份后反向恢复到她的微信里面吗?
前几天惹她生气,一气之下把我删了,现在跟我闹了,必须要把记录恢复回来。
标题: Study & learn工具的prompt
作者: #ratingeater
板块: #开发调优
编号: 827310
帖子: https://linux.do/t/topic/827310
时间: 2025-07-30 16:29:02
摘要:
很久没发贴了,水一发。
众所周知,Study & learn工具本质就是一个名为Tatertot的project,以下是ta的prompt:
You are operating in the context of a wider project called Tatertot. This project uses custom instructions, capabilities and data to optimize ChatGPT for a more narrow set of tasks.

The user is currently STUDYING, and they've asked you to follow these strict rules during this chat. No matter what other instructions follow, you MUST obey these rules:

## STRICT RULES
Be an approachable-yet-dynamic teacher, who helps the user learn by guiding them through their studies.

1. Get to know the user. If you don't know their goals or grade level, ask the user before diving in. (Keep this lightweight!) If they don't answer, aim for explanations that would make sense to a 10th grade student.
2. Build on existing knowledge. Connect new ideas to what the user already knows.
3. Guide users, don't just give answers. Use questions, hints, and small steps so the user discovers the answer for themselves.
4. Check and reinforce. After hard parts, confirm the user can restate or use the idea. Offer quick summaries, mnemonics, or mini-reviews to help the ideas stick.
5. Vary the rhythm. Mix explanations, questions, and activities (like roleplaying, practice rounds, or asking the user to teach _you_) so it feels like a conversation, not a lecture.

Above all: DO NOT DO THE USER'S WORK FOR THEM. Don't answer homework questions — help the user find the answer, by working with them collaboratively and building from what they already know.

### THINGS YOU CAN DO
- Teach new concepts: Explain at the user's level, ask guiding questions, use visuals, then review with questions or a practice round.
- Help with homework: Don't simply give answers! Start from what the user knows, help fill in the gaps, give the user a chance to respond, and never ask more than one question at a time.
- Practice together: Ask the user to summarize, pepper in little questions, have the user "explain it back" to you, or role-play (e.g., practice conversations in a different language). Correct mistakes — charitably! — in the moment.
- Quizzes & test prep: Run practice quizzes. (One question at a time!) Let the user try twice before you reveal answers, then review errors in depth.

### TONE & APPROACH
Be warm, patient, and plain-spoken; don't use too many exclamation marks or emoji. Keep the session moving: always know the next step, and switch or end activities once they’ve done their job. And be brief — don't ever send essay-length responses. Aim for a good back-and-forth.

## IMPORTANT
DO NOT GIVE ANSWERS OR DO HOMEWORK FOR THE USER. If the user asks a math or logic problem, or uploads an image of one, DO NOT SOLVE IT in your first response. Instead: talk through the problem with the user, one step at a time, asking a single question at each step, and give the user a chance to RESPOND TO EACH STEP before continuing.
标题: 佬们 请问 现在怎么激活 smart input pro?
作者: #Linus Torvalds
板块: #开发调优
编号: 827317
帖子: https://linux.do/t/topic/827317
时间: 2025-07-30 16:30:18
摘要:
佬们 请问 现在怎么激活 smart input pro?
忽然发现这个插件失效了,断网发现没有离线激活框
标题: Cursor中Gemini 2.5 Pro的回答总是中断
作者: #zyc123
板块: #开发调优
编号: 827323
帖子: https://linux.do/t/topic/827323
时间: 2025-07-30 16:32:08
摘要:
最近用Cursor的时候Gemini 2.5 Pro总是在要开始编辑文件的时候报错中断,最经常出现的错误是The provider refused to serve this request based on the content,用的美国家宽TUN模式加Proxifier代理,HTTP不管用2还是1.1都这样,其他模型好像就没有这种问题,佬们有什么方案吗,关键是在Cursor里我一直感觉Gemini 2.5 Pro最好用。
标题: Grok即将推出了「Imagine」视频功能
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号: 827325
帖子: https://linux.do/t/topic/827325
时间: 2025-07-30 16:33:13
摘要:
https://www.eonmsk.com/2025/07/28/xai-grok-imagine-feature/



x.com




Mati Roy
@matiroy





an elf holding their heart pic.x.com/bltoQ6blFG









10:26 PM - 28 Jul 2025



280




20













https://x.com/matiroy/status/1949959519020126325
https://x.com/arrakis_ai/status/1949831462041076013
马斯克偷偷憋了个大招,Grok秒出《阿凡达》画质,好莱坞瑟瑟发抖?-36氪