标题: BabyVision:仅Gemini 3 Pro超过了人类3岁小孩的视觉理解水平
作者: #Cybertronmt
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1440774
时间: 2026-01-13 15:08:00
摘要:
作者: #Cybertronmt
板块: #前沿快讯
编号:
1440774帖子: https://linux.do/t/topic/1440774
时间: 2026-01-13 15:08:00
摘要:
最近有网友搞了一个视觉理解能力的评测:GitHub - UniPat-AI/BabyVision: We introduce BabyVision, a benchmark revealing the infancy of AI vision.
只有Gemini 3 Pro超过了人类3岁小孩的水平:
评测原理很简单,就是让大模型去做一些“找不同”“连连看”“走迷宫”之类的视觉理解题目:
目前看来大模型对抽象的理解还是比较弱的
标题: 文档转书籍工具,可以将 PDF、Word 等文档转换成 EPUB 电子书【求助】Windows 上 Electron 项目无法启动,require('electron') 返回 exe 路径字符串
作者: #去去毒
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1440775
时间: 2026-01-13 15:08:11
摘要:
作者: #去去毒
板块: #开发调优
编号:
1440775帖子: https://linux.do/t/topic/1440775
时间: 2026-01-13 15:08:11
摘要:
前言
大家好,我最近在开发一个桌面应用——文档转书籍工具,可以将 PDF、Word 等文档转换成 EPUB 电子书。
项目地址:GitHub - ququdu18cm/wendang-zhuanshu
功能都写好了,代码也构建成功了,但在 Windows 11 上死活启动不起来,折腾了一个多星期,实在没辙了,特来求助各位大佬。
项目简介
这是一个 AI 驱动的文档转书籍系统,功能包括:
支持 PDF、Word、Markdown、HTML 等多种格式导入
AI 智能章节识别
AI 内容人性化改写
OCR 图片文字识别(支持多语言)
EPUB 电子书生成
Calibre 集成(可转 MOBI、PDF、AZW3)
技术栈:Electron 28.3.3 + React 18.3.1 + TypeScript 5.3.3 + Vite
问题描述
运行 pnpm dev 时,构建成功但 Electron 启动失败:
> electron-vite dev
vite v5.2.13 building SSR bundle for development...
✓ built in 1.5s
build the electron main process successfully
start electron app...
TypeError: Cannot read properties of undefined (reading 'whenReady')
at Object.<anonymous> (dist\main\index.js:70:14)
根本原因
经过深入调试,发现了一个诡异的问题:
问题代码
// src/main/index.ts
const { app, BrowserWindow } = require('electron');
app.whenReady().then(() => { // 报错:app is undefined
console.log('Electron started!');
});
标题: 晕了,为什么一个系统里还要塞进一个n8n?
作者: #tomas07
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1440781
时间: 2026-01-13 15:08:38
摘要:
作者: #tomas07
板块: #开发调优
编号:
1440781帖子: https://linux.do/t/topic/1440781
时间: 2026-01-13 15:08:38
摘要:
为什么一个系统里还要塞进一个n8n?
领导要求的,为啥?好管理吗?还是n8n当做工作流,可以前端面板去管理??
要怎么办?
标题: 川普任委内瑞拉总统
作者: #leoz
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1440793
时间: 2026-01-13 15:09:39
摘要:
作者: #leoz
板块: #前沿快讯
编号:
1440793帖子: https://linux.do/t/topic/1440793
时间: 2026-01-13 15:09:39
摘要:
Truth Social
Donald J. Trump (@realDonaldTrump)
川普任委内瑞拉总统居然真的能发生
标题: 人生还能这么活啊,推荐个up,阿泉有只费曼
作者: #Dao WuMing
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1440796
时间: 2026-01-13 15:09:42
摘要:
作者: #Dao WuMing
板块: #搞七捻三
编号:
1440796帖子: https://linux.do/t/topic/1440796
时间: 2026-01-13 15:09:42
摘要:
【从985到流浪汉,从顶尖人才到离经叛道,他却活成了所有人憧憬的样子-哔哩哔哩】 https://b23.tv/6Wwrzsc
每次看这个采访都有种"哇,这个人好不一样"的感觉,从他的谈吐,精神面貌上都能感觉到一种活力。
标题: 求助,开通美国券商账户,怎么弄海外居住或工作证明?小红书上的花钱帮弄靠谱吗,据说是ps的
作者: #oe
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1440800
时间: 2026-01-13 15:09:59
摘要:
作者: #oe
板块: #搞七捻三
编号:
1440800帖子: https://linux.do/t/topic/1440800
时间: 2026-01-13 15:09:59
摘要:
新人,没见到有相关模块讨论美股,不知道是不是不允许讨论,如果不允许马上删除
标题: 你们kiro还好么
作者: #岛屿可以找到海
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1440810
时间: 2026-01-13 15:11:42
摘要:
作者: #岛屿可以找到海
板块: #搞七捻三
编号:
1440810帖子: https://linux.do/t/topic/1440810
时间: 2026-01-13 15:11:42
摘要:
我的2kiro的api,这会疯狂截断啊,你们kiro还好么
标题: 个人维护的ai少量工具陆续开源,欢迎大家来pr,skill,mcp,agent,hook,plugin
作者: #soulx
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1440819
时间: 2026-01-13 15:12:34
摘要:
作者: #soulx
板块: #资源荟萃
编号:
1440819帖子: https://linux.do/t/topic/1440819
时间: 2026-01-13 15:12:34
摘要:
github.com
GitHub - z-soulx/ai-toolkit: my ai-toolkit
my ai-toolkit
标题: 建议社区标签添加时要同时添加其标签的描述、含义
作者: #最上川
板块: #运营反馈
编号:
帖子: https://linux.do/t/topic/1440821
时间: 2026-01-13 15:12:45
摘要:
作者: #最上川
板块: #运营反馈
编号:
1440821帖子: https://linux.do/t/topic/1440821
时间: 2026-01-13 15:12:45
摘要:
前言:社区标签向3级佬友开放新增
现在的标签:
建议是社区标签添加时
要同时添加标签的描述、含义,添加解释能快速了解其意思作为帖子的快速内容补充。
标题: 又是盘中富贵的一天
作者: #Chenyuan New
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1440823
时间: 2026-01-13 15:12:50
摘要:
作者: #Chenyuan New
板块: #搞七捻三
编号:
1440823帖子: https://linux.do/t/topic/1440823
时间: 2026-01-13 15:12:50
摘要:
如题,早上小挣600,收盘变亏300,凭运气挣评实力亏出去
标题: 这是多大仇怨啊?
作者: #遇事开心
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1440824
时间: 2026-01-13 15:13:09
摘要:
作者: #遇事开心
板块: #搞七捻三
编号:
1440824帖子: https://linux.do/t/topic/1440824
时间: 2026-01-13 15:13:09
摘要:
标题: 图片识别编辑工具求推荐
作者: #takatorury🛡
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1440827
时间: 2026-01-13 15:13:37
摘要:
作者: #takatorury🛡
板块: #开发调优
编号:
1440827帖子: https://linux.do/t/topic/1440827
时间: 2026-01-13 15:13:37
摘要:
可以识别ai生图(包含文字的)后图片所有细微的元素,转为可编辑的一个个元素,最好可以导入亿图图示
标题: 有没有关于构音障碍方面研究的佬啊
作者: #wmz
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1440879
时间: 2026-01-13 15:19:57
摘要:
作者: #wmz
板块: #开发调优
编号:
1440879帖子: https://linux.do/t/topic/1440879
时间: 2026-01-13 15:19:57
摘要:
一个朋友 博士课题是这个。现在遇到瓶颈了。需要一些帮助。。
或者有没有可能联系到华为的声音修复团队的能不能提供一些帮助。
标题: 2026年底佬们觉得ai开发能发展到那种程度
作者: #miaoxiansheng
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1440892
时间: 2026-01-13 15:20:47
摘要:
作者: #miaoxiansheng
板块: #开发调优
编号:
1440892帖子: https://linux.do/t/topic/1440892
时间: 2026-01-13 15:20:47
摘要:
本人从2025年初古法开发到2025年底的ai开发
态度也是从质疑 → 惊讶 → 依赖 → 焦虑 → 习以为常
标题: 是codex还是claude code呢?
作者: #ZRainbow
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1440897
时间: 2026-01-13 15:21:36
摘要:
作者: #ZRainbow
板块: #开发调优
编号:
1440897帖子: https://linux.do/t/topic/1440897
时间: 2026-01-13 15:21:36
摘要:
对,我有一个Google Ultra。
Antigravity代点claude opus,除了酒馆,还是拿来开发用
gpt大善人最近白嫖的次数特别多,嫖了好多号,开发项目现在基本上就是在用codex进行,够够的用。
但是还是这山望着那山高,看大家特别喜欢claude code,心痒痒。
想问大家做一下比较,是代出Antigravity用claude code,还是乖乖codex呢?
找了一下论坛,基本上没有这方面的答案。就只有模棱两可的说claude codex优化比较好,codex时间运行长。
求求开发大佬来个痛快!
spoiler
标题: 为什么工作中,感觉项目是后端开发,前端只是一个兼职的感觉
作者: #MARKOK-B
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1440915
时间: 2026-01-13 15:23:16
摘要:
作者: #MARKOK-B
板块: #搞七捻三
编号:
1440915帖子: https://linux.do/t/topic/1440915
时间: 2026-01-13 15:23:16
摘要:
因为和前端对接,有点恼火了。 今天自己用AI处理了一些前端的问题,最后还剩两个问题,就给前端了。他就问我这两点怎么搞,我让他去问现场顾问。然后在群里问的需求的时候,我还要在边上打辅助,协助他去了解应该怎么做。给我的感觉这个项目后端得什么都要管,前端只是个兼职得感觉。
标题: 求!!!少走弯路学习skill,mcp,agent的教程
作者: #nuv
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1440920
时间: 2026-01-13 15:23:37
摘要:
作者: #nuv
板块: #搞七捻三
编号:
1440920帖子: https://linux.do/t/topic/1440920
时间: 2026-01-13 15:23:37
摘要:
一枚小白想0->1的系统学习一下skill,mcp,agent相关白嫖教程 ,学习后并能够自己写出简单的小工具,求各路仙人指路