【绘图神器】AutoFigure-Edit 让 AI 绘图可编辑 | 西湖大学团队开发
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
前言
论文绘图反复抽卡,好不容易抽到一张满意的图片,但是发现只是一张“死图”,中间的图标跟文字有问题根本改不了 😡。你已经急哭
我们实验室之前推出的 AutoFigure,作为首个能够从长篇科学文本中自动生成出版级学术插图的智能体框架,已经入选 ICLR 2026。现在我们更进一步发布了 AutoFigure-Edit。
论文地址:[2603.06674] AutoFigure-Edit: Generating Editable Scientific Illustration
项目地址:github.com
GitHub - ResearAI/AutoFigure-Edit
通过在 GitHub 上创建帐户来为 ResearAI/AutoFigure-Edit 开发做出贡献。
我们做了什么
如图,Autofigure-Edit 的处理流程分为 5 步:先按指定风格生成图片,再把图里的各个部分拆开、认出来,把能复用的图标和元素提取出来,整理成可编辑的 SVG 模板,最后再把这些元素重新填进去,得到一张真正能改字、改图标、改结构的学术插图。
当然这个流程图也是由 AutoFigure-Edit 生成的 😉。
自动化评估碾压
用数据说话
更多案例
这些图都是从论文原文一键生成的。生成之后如下图所示,也能直接在我们内嵌的 SVG Editor 里继续修改。
最后
看到这里,如果各位佬觉得还不错,欢迎点点 star 支持一下,如果有什么建议也可以在 issue 上提出,我们的 2.0 版本也已经提上日程了 🤗,等 GPT-image-2 模型出来我们也会第一时间测试效果。
11 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: forsee)
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
● 我的帖子已经打上 开源推广 标签: 是
● 我的开源项目完整开源,无未开源部分: 是
● 我的开源项目已链接认可 LINUX DO 社区: 是
● 我帖子内的项目介绍,AI 生成、润色内容部分已截图发出: 是
● 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI 生成、润色内容已使用截图方式发出
前言
论文绘图反复抽卡,好不容易抽到一张满意的图片,但是发现只是一张“死图”,中间的图标跟文字有问题根本改不了 😡。你已经急哭
我们实验室之前推出的 AutoFigure,作为首个能够从长篇科学文本中自动生成出版级学术插图的智能体框架,已经入选 ICLR 2026。现在我们更进一步发布了 AutoFigure-Edit。
论文地址:[2603.06674] AutoFigure-Edit: Generating Editable Scientific Illustration
项目地址:github.com
GitHub - ResearAI/AutoFigure-Edit
通过在 GitHub 上创建帐户来为 ResearAI/AutoFigure-Edit 开发做出贡献。
我们做了什么
如图,Autofigure-Edit 的处理流程分为 5 步:先按指定风格生成图片,再把图里的各个部分拆开、认出来,把能复用的图标和元素提取出来,整理成可编辑的 SVG 模板,最后再把这些元素重新填进去,得到一张真正能改字、改图标、改结构的学术插图。
当然这个流程图也是由 AutoFigure-Edit 生成的 😉。
自动化评估碾压
用数据说话
更多案例
这些图都是从论文原文一键生成的。生成之后如下图所示,也能直接在我们内嵌的 SVG Editor 里继续修改。
最后
看到这里,如果各位佬觉得还不错,欢迎点点 star 支持一下,如果有什么建议也可以在 issue 上提出,我们的 2.0 版本也已经提上日程了 🤗,等 GPT-image-2 模型出来我们也会第一时间测试效果。
11 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: forsee)
震惊! 我的写真站迎来了一位尊贵的客人! 忠诚!!!
最近我一个写真站经常报警宕机,本来就配置低懒得去看,一直都是写的自动化,检测网站访问不了自动重启,但是这段时间实在是宕机的有点频繁了,我就上去看日记,结果看到了一个发光的访问IP!!!!!!
我这个网站,准备改名叫将军优选了!!! 将军都来看的套图能不好看吗!
注: 站里喷子多!发帖仅因震惊吐槽,截图中的网站是图床程序,无任何内容展示,非写真站,无任何实际内容,我也不会在本站发送写真站地址
17 个帖子 - 16 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Hyun)
最近我一个写真站经常报警宕机,本来就配置低懒得去看,一直都是写的自动化,检测网站访问不了自动重启,但是这段时间实在是宕机的有点频繁了,我就上去看日记,结果看到了一个发光的访问IP!!!!!!
我这个网站,准备改名叫将军优选了!!! 将军都来看的套图能不好看吗!
注: 站里喷子多!发帖仅因震惊吐槽,截图中的网站是图床程序,无任何内容展示,非写真站,无任何实际内容,我也不会在本站发送写真站地址
17 个帖子 - 16 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Hyun)
才发现今天是自己的生日
打开 Telegram 打算看点动漫呢
给我另一个号弹了一个生日提示
那就浅浅的祝自己生日快乐吧
下周日就要去参加提前录取的考试了
好紧张 总感觉考不上 (大概率考不上…
考不上的话 只能备战中考了
一会就又要去学校了
刚发现 L站也有小蛋糕
44 个帖子 - 43 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 落憾)
打开 Telegram 打算看点动漫呢
给我另一个号弹了一个生日提示
那就浅浅的祝自己生日快乐吧
下周日就要去参加提前录取的考试了
好紧张 总感觉考不上 (大概率考不上…
考不上的话 只能备战中考了
一会就又要去学校了
刚发现 L站也有小蛋糕
44 个帖子 - 43 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 落憾)
为 Gemini 正名
从你还在用Gemini吗?继续讨论:
其实白墨在日常对话里,一直都是悄悄偏爱 Gemini 的
只要放下让它写代码的执念,Gemini 解释问题时那种如沐春风的耐心、舒服流畅的语感、丰富的知识储备,以及让人安心的低幻觉率,真的是很多 LLM 学不来的!
我们来看看几组对比
完全相同的 prompt,
GPT 给出的答案是事实性错误或不完全正确的
即使强制开启 Thinking,也只会象征性的“Thought for a couple of seconds”,然后依旧给出错误的答案。这种解决看似简单问题时的“轻敌”是 GPT 的一大问题。和洗车是走路去还是开车去的经典问题一样,以 GPT 的智商不可能推理不出来。然而,面对这样的问题,即便我们手动开启 Thinking 模式,GPT 也总是表现出“不愿思考”的懒惰。这在提问本身具有误导性时尤为明显。又比如:
两者回答都事实上是正确的,
但是,Gemini 极其敏锐地捕捉到了我在提问里暴露出的一个知识盲区“金属氧化物大多数都是分子”。比起单纯解答 MgO 这个个例,它更愿意耐心地帮我纠正对“大多数金属化合物”的底层认知误区。而 GPT 呢,就像个没有感情的答题机器,对提问者潜在的误解完全视而不见。
----------------------
GPT 就像是学校里偏科理科的同学,你让他讲题,他自己都会,但就是解释不明白。Gemini 相反,常常表现得很细腻和耐心。
诚然,Gemini 在 Agentic 方便做得不尽人意,我也偏向使用 Codex 完成编码工作;然而,至少对于我们 INFP 来说,Gemini 在日常对话中是更胜一筹的,绝不是许多人所说的一文不值呢…
73 个帖子 - 52 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Shilin Zhou)
从你还在用Gemini吗?继续讨论:
其实白墨在日常对话里,一直都是悄悄偏爱 Gemini 的
只要放下让它写代码的执念,Gemini 解释问题时那种如沐春风的耐心、舒服流畅的语感、丰富的知识储备,以及让人安心的低幻觉率,真的是很多 LLM 学不来的!
我们来看看几组对比
完全相同的 prompt,
GPT 给出的答案是事实性错误或不完全正确的
即使强制开启 Thinking,也只会象征性的“Thought for a couple of seconds”,然后依旧给出错误的答案。这种解决看似简单问题时的“轻敌”是 GPT 的一大问题。和洗车是走路去还是开车去的经典问题一样,以 GPT 的智商不可能推理不出来。然而,面对这样的问题,即便我们手动开启 Thinking 模式,GPT 也总是表现出“不愿思考”的懒惰。这在提问本身具有误导性时尤为明显。又比如:
两者回答都事实上是正确的,
但是,Gemini 极其敏锐地捕捉到了我在提问里暴露出的一个知识盲区“金属氧化物大多数都是分子”。比起单纯解答 MgO 这个个例,它更愿意耐心地帮我纠正对“大多数金属化合物”的底层认知误区。而 GPT 呢,就像个没有感情的答题机器,对提问者潜在的误解完全视而不见。
“OpenOmniBot 所谓‘直接操控手机’,主链路不是靠云端远程控制,也不是我目前看到的 ADB 脚本主导……”我的天,谁问你了?真是看得一股无名火。黑话越读越别扭。一个好的科普,第一句话难道不应该就让人恍然大悟吗?GPT 自始至终甚至也没有解释无障碍服务能够代表用户在屏幕上执行物理操作,只有冗长的函数名的罗列。
----------------------
GPT 就像是学校里偏科理科的同学,你让他讲题,他自己都会,但就是解释不明白。Gemini 相反,常常表现得很细腻和耐心。
诚然,Gemini 在 Agentic 方便做得不尽人意,我也偏向使用 Codex 完成编码工作;然而,至少对于我们 INFP 来说,Gemini 在日常对话中是更胜一筹的,绝不是许多人所说的一文不值呢…
73 个帖子 - 52 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Shilin Zhou)
为了庆祝入站,给大家抽一个GeminiPro一年账号(pixel渠道)
抽奖主题:[庆祝入站抽一个GeminiPro一年账号]
🏆️ 奖品详情:
[奖品]:[GeminiPro一年账号(pixel渠道)]
发放方式:私聊中奖者发送邮箱账号,密码,2fa秘钥
:three_o_clock: 活动时间:
开始时间:Invalid date
截止时间:Invalid date
📝 参与方式:
在本贴下回复任意内容即可参与。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后12小时内在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由活动发起人及论坛管理团队最终解释。
172 个帖子 - 170 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: zz)
抽奖主题:[庆祝入站抽一个GeminiPro一年账号]
🏆️ 奖品详情:
[奖品]:[GeminiPro一年账号(pixel渠道)]
发放方式:私聊中奖者发送邮箱账号,密码,2fa秘钥
:three_o_clock: 活动时间:
开始时间:Invalid date
截止时间:Invalid date
📝 参与方式:
在本贴下回复任意内容即可参与。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后12小时内在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由活动发起人及论坛管理团队最终解释。
172 个帖子 - 170 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: zz)