all about duxiu tools
1.26K subscribers
16 photos
51 files
33 links
Download Telegram
https://open-slum.org/
这个网站可以监测几个影子图书馆目前的服务器状况
【如何给shadowlibrary_dll添加OCR功能】

shadowlibrary_dll中有个shadow_pipline.py
其中有个zip_to_book函数
看起来一坨,实际上把日志和异常处理去掉就只剩
def zip_to_book(book_input):
'''
输入: 一个ShadowBook对象或一个ShadowBook对象列表
输出: 在用户指定的pdf路径生成对应的pdf
'''
book_list = []
if(not isinstance(book_input, list)):
book_list.append(book_input)
else:
book_list = book_input
start_time = time.time()
for book in book_list:
extract(book) #解压
decrypt(book) #解密PDG
generate_pdf(book) #生成pdf
cache_clean(book) #删除临时文件
return book.state, book.error, book.password, book.bookinfo


只需在decrypt后边加上ocr的功能就可以了。
    for book in book_list: 
extract(book)
decrypt(book)
ocr(book)
generate_pdf(book)
cache_clean(book)


每个book对象都有image_list属性
image_list中存储着解密后的图片列表,列表中每张图都是一个元组
[(原始pdg对象, 解密后图片路径),(原始pdg对象, 解密后图片路径),(原始pdg对象, 解密后图片路径),……]

所以ocr函数里边应该像这样:
for pdg, image in book.image_list:
ocr(image)
通知:知识无罪复活了
【ShadowLibrary_dllv0.3.3】
+ v0.3.3
+ 修复部分书籍目录功能页与PDG不匹配的问题
******************************************
+ v0.3.2
+ 修复读秀8.0目录套娃问题
******************************************
+ v0.3.1
+ 提高了pdf转换速度
+ pdf体积更小了
+ 转换速度提升约四倍,转换后pdf体积缩小两倍
+ 修复了一个小错误
******************************************
v0.3.0
+ 支持zip直接转换成pdf
+ 可以命令行运行,也可以作为库调用
+ 根据pdg列表自动添加默认目录
+ 如果压缩包内有bookcontents.dat,则添加bookcontents中的目录
+ 读取bookinfo.dat信息,将其中的书名、ssid作为pdf的文件名
+ 自动检测缺页并补充缺页,不会因为缺页导致书签页码混乱了
+ 支持除6xH之外的PDG转换
+ 整理全书页面大小,让页面宽度一致,等比例缩放。
+ 修复了极少数图片宽度异常问题
+ 解压时根据频率TOP21尝试密码
+ 改为使用7z.exe解压

## 安装
环境要求 python 3.12.0及以上
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

## 使用
#### 在命令行使用ShadowLibrary_dll
python shadowlibrary.py -c 压缩包或包含压缩包的文件夹 -o pdf存放路径 -p 进程数

-c -o -p 都不是必须的,如果没有提供则读取config.ini中的参数。

就是说,这样也可以
python shadowlibrary.py


示例。直接执行会在pdf文件夹生成\[SophIA]99999999_五毒俱全转换测试文件3.0.zip对应的pdf
python shadowlibrary.py -c .\test\



#### 通过源码调用ShadowLibrary_dll
!!!通过源码调用时!!!
你可以把ShadowLibrary_dllv0.3.3里的东西一股脑全拷贝到你的开发目录里
示例代码见example.py
执行之后可以在当前目录下生成[SophIA]99999999_五毒俱全转换测试文件3.0.zip对应的pdf
默认会在命令行显示log,可以将config.ini中的console_log置为0,关闭控制台log



https://send.vis.ee/download/b352619708a17bd0/#IM3yP6nkXrPBrGjKdrGU7Q
提取密码:ICokabMF
解压密码:QaBzpId1pQe1hLzoar2hKJz
大佬的密码表 丰富 存下备用 ↑
# 【ShadowLibrary_dllv0.3.4】

## v0.3.4

+ 支持meta.xml解析
+ 增加PDG格式统计功能
+ 增加文件检测功能(默认关闭) 包括压缩包损坏、空包、密码检测,MD5检测。记录相关数据
+ 改进日志逻辑
+ 改进解压逻辑
+ 修复有些文件路径带空格导致的问题
+ 更新密码表

******************************************

## v0.3.3

+ 修复部分书籍目录功能页与PDG不匹配的问题

******************************************

## v0.3.2

+ 修复读秀8.0目录套娃问题

******************************************

## v0.3.1

+ 提高了pdf转换速度
+ pdf体积更小了
+ 转换速度提升约四倍,转换后pdf体积缩小两倍
+ 修复了一个小错误

******************************************

## v0.3.0

+ 支持zip直接转换成pdf
+ 可以命令行运行,也可以作为库调用
+ 根据pdg列表自动添加默认目录
+ 如果压缩包内有bookcontents.dat,则添加bookcontents中的目录
+ 读取bookinfo.dat信息,将其中的书名、ssid作为pdf的文件名
+ 自动检测缺页并补充缺页,不会因为缺页导致书签页码混乱了
+ 支持除6xH之外的PDG转换
+ 整理全书页面大小,让页面宽度一致,等比例缩放。
+ 修复了极少数图片宽度异常问题
+ 解压时根据频率TOP21尝试密码
+ 改为使用7z.exe解压

## 安装

环境要求 python 3.12.0及以上

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple


## 使用

### 在命令行使用ShadowLibrary_dll

python shadowlibrary.py -c 压缩包或包含压缩包的文件夹 -o pdf存放路径 -p 进程数


-c -o -p 都不是必须的,如果没有提供则读取config.ini中的参数。

就是说,这样也可以

python shadowlibrary.py


示例。直接执行会在pdf文件夹生成\[SophIA]99999999_五毒俱全转换测试文件3.0.zip对应的pdf

python shadowlibrary.py -c .\test\


### 通过源码调用ShadowLibrary_dll

!!!通过源码调用时!!!
你可以把ShadowLibrary_dllv0.3.0里的东西一股脑全拷贝到你的开发目录里
示例代码见example.py
执行之后可以在当前目录下生成[SophIA]99999999_五毒俱全转换测试文件3.0.zip对应的pdf
默认会在命令行显示log,可以将config.ini中的console_log置为0,关闭控制台log

### 关于批量检查功能

当批量检查开启时,不会合成pdf,也不会解密图片,只检测压缩包。
默认不开启




https://send.vis.ee/download/24cdda0e10a354ea/#JqItlXNWzhI1L6JEQiUUAA
提取密码:qbNwmXvtfWCs
解压密码:FU4QZN7AvCiUewTTW
大佬最新密码表↓(高频表是依据最近流行的读秀8排的)
all about duxiu tools
自动解压合成PDF.zip
有大佬提供了这个软件的密码表↓ (大家可以查看files 收集本频道的全部密码表 因为没有对全部zip做测试 所以还不能提供一个简洁的终极密码表 )
[SophIA][11492]读秀8.0元数据.7z
6.2 MB
更新 把后来解密的部分也加进去了
# 【ShadowLibrary_dllv0.3.5h】

## v0.3.5h

+ 更新密码表,目前最全的密码表
+ 增加书签插件接口
+ 再次提高单进程转换速度
+ 优化多核性能,多进程速度比前一个版本快5倍
+ 增加自定义开关:线程锁开关(默认开启),PDG检查开关(默认开启),插件开关(默认关闭)。关闭均会获得一定的性能提升。

******************************************

## v0.3.4

+ 支持meta.xml解析
+ 增加PDG格式统计功能
+ 增加文件检测功能(默认关闭) 包括压缩包损坏、空包、密码检测,MD5检测。记录相关数据
+ 改进日志逻辑
+ 改进解压逻辑
+ 修复有些文件路径带空格导致的问题
+ 更新密码表

******************************************

## v0.3.3

+ 修复部分书籍目录功能页与PDG不匹配的问题

******************************************

## v0.3.2

+ 修复读秀8.0目录套娃问题

******************************************

## v0.3.1

+ 提高了pdf转换速度
+ pdf体积更小了
+ 转换速度提升约四倍,转换后pdf体积缩小两倍
+ 修复了一个小错误

******************************************

## v0.3.0

+ 支持zip直接转换成pdf
+ 可以命令行运行,也可以作为库调用
+ 根据pdg列表自动添加默认目录
+ 如果压缩包内有bookcontents.dat,则添加bookcontents中的目录
+ 读取bookinfo.dat信息,将其中的书名、ssid作为pdf的文件名
+ 自动检测缺页并补充缺页,不会因为缺页导致书签页码混乱了
+ 支持除6xH之外的PDG转换
+ 整理全书页面大小,让页面宽度一致,等比例缩放。
+ 修复了极少数图片宽度异常问题
+ 解压时根据频率TOP21尝试密码
+ 改为使用7z.exe解压

## 安装

环境要求 python 3.12.0及以上

conda create -n shadowlib python=3.12.0
conda activate shadowlib
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple


## 使用

### 在命令行使用ShadowLibrary_dll

python shadowlibrary.py -c 压缩包或包含压缩包的文件夹 -o pdf存放路径 -p 进程数


-c -o -p 都不是必须的,如果没有提供则读取config.ini中的参数。

就是说,这样也可以

python shadowlibrary.py


示例。
直接执行会在pdf文件夹生成\[SophIA]99999999_五毒俱全转换测试文件3.0.zip对应的pdf

python shadowlibrary.py -c .\test\


### 通过源码调用ShadowLibrary_dll

!!!通过源码调用时!!!
你可以把ShadowLibrary_dllv0.3.0里的东西一股脑全拷贝到你的开发目录里
执行之后可以在当前目录下生成[SophIA]99999999_五毒俱全转换测试文件3.0.zip对应的pdf
默认会在命令行显示log,可以将config.ini中的console_log置为0,关闭控制台log

#### 最简单的调用

simple.py

#### 多进程调用

multiprocess.py





### 关于批量检查功能

当批量检查开启时,不会合成pdf,也不会解密图片,只检测压缩包。
默认不开启

### 如何添加书签插件

1、打开config.ini,将其中的插件开关置为1

plugin_flag    =1


2、修改shadowlibrary_dll\plugin\book_info.py。具体怎么改看里边的注释。

3、然后去转换一个压缩包试试。




下载链接: https://send.cyberjake.xyz/download/0158566fe49097d9/#-81QiUS409M8-jGPQEtNhw
解压密码:FxHyEiwzB86OGx5YHIvj1