ALA数据分析|高质量数据集|图书|电子书工具
1.28K subscribers
161 photos
76 files
82 links
搜索中文互联网所有公开的电子书,批量转换读秀压缩包:https://t.me/shadowlib
Download Telegram
[SophIA][12GB]booksearch.7z.001
1.4 GB
现在全部功能集成到shadowlib 点击下载
可搜索的书籍更多,体积更小,速度更快。安装包仅需300MB,安装后大约2-3GB。
【科学文库元数据分析】
包含1951年-2024年的书
数量最多的前六类书是:工业、计算机、经济、地球科学、临床医学、数学。

详细分析看这里
数据在这里

密码:r9u54a2F8Ma3JiigfsD4
👍1
【压缩包密码破解】
标准库无法解密的压缩包有897个,其中CRC32加密870个,AES加密27个。
无法解密的压缩包列表以及详细分析看这里

解密的方法

1、用更大的密码本跑。没啥希望,绝大部分密码我都跑过了,除非能找到很冷门的密码。
2、去成品盘找替代品,找ssid相同,但是没加密的包。特征是ssid相同,但MD5不同。AES加密只能用这种方法。
3、明文攻击,只针对CRC32加密。
基本思想:已知压缩包内有bookinfo.dat,可以构造一个和压缩包内bookinfo.dat一样的文件,以此破解整个压缩包。
约束:构造出的bookinfo.dat,满足两个条件,大小和CRC要和压缩包内相同。
构造出bookinfo.dat用相同的压缩算法去压缩,得到明文。
通过比较两个压缩包相同位置不同的12个字节,就可以还原出3个key,绕过密码提取出所有的文件。
然后使用https://github.com/kimci86/bkcrack 破解

bookinfo示例在这里
1😁1
【书签分析补充-ssid分布】
统计书签ssid前两位和前三位的分布情况。

上次的详细分析在这里
补充分析在这里
👍2