LinuxDo 新帖推送
177 subscribers
248K photos
308K links
Download Telegram
标题: 【开源推广】更好用的Danbooru标签模糊搜索引擎
作者: #凉宫秋月
板块: #资源荟萃
编号: 2105035
帖子: https://linux.do/t/topic/2105035
时间: 2026-05-03 21:53:35
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
我承诺以下正文中的每一个字都是我手工打的,无任何AI内容

DanbooruSearchOnline 项目介绍



立即使用


Github链接(含使用指南)


这是一个专用于Danbooru数据库(以下简称D站)标签的搜索引擎。Danbooru数据库是一个二次元图片数据库,常用于二次元风格文生图模型的训练,当然,你也可以用它来自己看图。
该数据库通过「标签」来检索图片。其中的标签多为格式化的英文甚至日语罗马音,这导致我们中国用户在检索标签时存在困难。目前,市面上存在的搜索引擎主要有以下几点问题:

跨语言障碍: 该数据库中标签多为英语或日语罗马音标签,传统机器翻译很难在语境中获得正确结果。例如,机器翻译很可能将「水手服」翻译为「sailor suit」,而用户实际上想要的标签大概是「serafuku」。
反向查询需求: 现存的搜索引擎往往是需要用户输入准确的标签,然后搜索引擎告诉用户这个标签的相关信息。然而,在实践中,用户脑中有一个模糊的概念,希望知道准确的标签名称,才是更迫切的需求。例如,用户希望画出「紧身衣勒紧皮肤产生的凹陷」,但是很可能并不知道这有一个专用标签。
概念扩展和头脑风暴: 现有的检索方案往往只有粗略分类。用户可能想要搜索关于「中国风古装」或者「天空」的大量标签,以进行头脑风暴辅助绘图。或者,用户想要在绘图时根据标签的相关性提升绘图质量。
大语言模型打标辅助: 有时用户可能会利用大语言模型辅助书写标签。然而大语言模型对D站数据库的知识有限,很可能出现幻觉而提供虚假的标签。


针对以上四个需求,我开发了这款 DanbooruOnlineSear
标题: 小米打发乞丐呢?
作者: #JamesHo
板块: #搞七捻三
编号: 2105048
帖子: https://linux.do/t/topic/2105048
时间: 2026-05-03 21:58:08
摘要:
小米故意的吧, 就给我5元额度。。

虽然我一直是小米黑, 雷布斯啥时候知道的呢。。。
标题: 为什么翻盖手机和全面屏平板在一起出现?
作者: #我素黑块
板块: #搞七捻三
编号: 2105058
帖子: https://linux.do/t/topic/2105058
时间: 2026-05-03 21:59:41
摘要:
《天真与闪电》(日语:甘々と稲妻;英语:Sweetness and Lightning)是由雨隠ギド创作的一部漫画。

原作介绍
原作在讲谈社的《good!AFTERNOON》2013年3月号(2月7日发售)~2018年9月号(8月7日发售)连载。获得“这本漫画真厉害!2014”男性篇第8名。
在高中担任数学老师的犬冢公平是位单亲爸爸,半年前妻子过世后便独力抚养5岁的女儿犬冢䌷希,不过厨艺很差的他,每次都只能让䌷希吃难吃的便当。
某天他带䌷希去赏花时,遇到一位因为便当太好吃而流下眼泪的少女.饭田小鸟,并得知她母亲开了一家料理店。
在偶然之下三人开始一同做饭且享用,为爱制作的料理与周遭邂逅的各种人事物,交织出温馨感人的桌边物语。来自萌娘百科



有了平板,为什么不用全面屏手机?
标题: 第一次看周杰伦需要注意啥呀
作者: #JayLi1024
板块: #搞七捻三
编号: 2105072
帖子: https://linux.do/t/topic/2105072
时间: 2026-05-03 22:01:56
摘要:
被主办方做局了,没开到好位置,唉,但是也算比较中间的位置,没有前排可惜了点。
想问问第一次看演唱会需要注意什么
标题: GPT-5.5是真强啊,价格这么贵不是没有原因的
作者: #Robin
板块: #搞七捻三
编号: 2105075
帖子: https://linux.do/t/topic/2105075
时间: 2026-05-03 22:02:31
摘要:
前一段时间高强度使用4.6 opus,对opus的套路也算是比较了解了,从表面上的机灵程度来看opus 4.6确实一骑绝尘,但有一个问题是opus天生似乎不太愿意说太多话。最近用GPT-5.5发现这玩意输出长度非常长,同样的提示词长度能是opus的5倍。
其实输出长度的问题我在5.1的时候就发现了,不过那个时候有点啰嗦的意味,但是现在的GPT-5.5属于发生了质变,输出长度的优势让阅读有了一种酣畅淋漓的感觉。虽然机灵程度还不及opus 4.6,但是论务实程度实打实是压了A\一头。
正好最近opus渠道没了,丝滑回归OpenAI。
标题: kim2.6评测第一名,国产跟上了,还超越了
作者: #hzx2185
板块: #开发调优
编号: 2105088
帖子: https://linux.do/t/topic/2105088
时间: 2026-05-03 22:04:26
摘要:
单词宝石拼图。十位模特参赛。结果出乎大多数人的预料。来自中国初创公司Moonshot AI的开放权重模型Kimi K2.6以22个赛点、7-1-0的成绩彻底赢得了挑战。小米的MiMo V2-Pro位居第二。 GPT-5.5 排名第三。 Claude Opus 4.7 获得第五名。来自西方前沿实验室的每个模型都低于前两名。
标题: 虽然但是,好多佬友进中转的第一件事就是测模型
作者: #DanielSilver
板块: #搞七捻三
编号: 2105100
帖子: https://linux.do/t/topic/2105100
时间: 2026-05-03 22:07:14
摘要:
经常能看见一列表的同步请求,每个模型都过一遍。。。。
标题: 有什么项目能把pro号里面的5.5pro反代吗
作者: #桐人
板块: #搞七捻三
编号: 2105123
帖子: https://linux.do/t/topic/2105123
时间: 2026-05-03 22:11:30
摘要:
如题,准备和朋友一起拼一个Pro5x,他也想用Pro模型,所以想问问有没有什么项目能反代出来到codex里面用。
标题: AI总是把我代码里的中文字符串里的中文引号改成英文引号有没有什么办法呀?
作者: #淼畔
板块: #开发调优
编号: 2105136
帖子: https://linux.do/t/topic/2105136
时间: 2026-05-03 22:13:16
摘要:
我代码里原来写好的字符串里的中文引号,让他帮我改完代码之后,原来有的中文引号都变成了英文引号,我没看清楚,项目上线了才发现。。模型用的是DeepSeek V4,flash和pro都这样。而且我就算给他中文原文是用的中文引号,他抄一遍到代码里就变成英文的引号了。有没有佬友遇到过的?
标题: 问下这个视频里面妹子是谁? 用了AI也找不到
作者: #ori
板块: #搞七捻三
编号: 2105138
帖子: https://linux.do/t/topic/2105138
时间: 2026-05-03 22:13:32
摘要:
https://www.douyin.com/user/self?from_tab_name=main&modal_id=7624732060527636389&showSubTab=video&showTab=favorite_collection
标题: 来一个模型横向测评,这次不测coding,测一下是通用agent能力
作者: #xiaomao
板块: #开发调优
编号: 2105145
帖子: https://linux.do/t/topic/2105145
时间: 2026-05-03 22:14:17
摘要:
自己项目实际跑的测试,agent基座是pi sdk
一个单次分析规划子agent,涉及大量工具调用形成结构化文档
实际的pi workspace和上游文件,结构分是测试文件自己生成,内容分是gpt5.5逐个读取生成内容打分。

测试文件prompt:和打分脚本

全部由codex自己策划实施。
归档.zip (24.3 KB)
标题: 一种奇特的生物
作者: #猫猫团子
板块: #搞七捻三
编号: 2105174
帖子: https://linux.do/t/topic/2105174
时间: 2026-05-03 22:18:34
摘要:
长这么大,第一次见到活着的火鸡很新奇
这些火鸡是散养的,非常自由,也很温顺,来往的孩子会停下来摸摸它们,它们就淡淡地驻足,被摸
标题: 相亲女生回消息慢是不是凉了
作者: #pink
板块: #搞七捻三
编号: 2105178
帖子: https://linux.do/t/topic/2105178
时间: 2026-05-03 22:19:04
摘要:
五一回老家相亲了一个女生,相亲完加了微信,回家后给她发消息经常过一个小时才回,这种就是女生不想继续的意思吗