手上有一本比较厚(接近700面)的非正规出版物(通讯录)想要电子化。之前 Twitter 上的 shuanglin 介绍过一个淘宝上的此类服务,提供 600dpi 超高清扫描,拆书5分/面,但是由于书已经带来美国,另外其内容中有大量PII,因此想说自己先在家拿扫描仪在不拆书的情况下试试看。
由于书很厚,因此比较自然的做法便是把书展直接放到扫描仪的扫描平面上。一试发现果然自己做有不少的坑。
我用的这台 HP OfficeJet 4630 的扫描软件本身提供了自动找到扫描的纸张边界并将其旋转正的功能,此外也会自动调整白平衡和对比度来获得比较好的效果。然而,如果不把书拆开的话,由于书厚度的原因,靠近书脊的部分和扫描平面的距离会比较远,这会导致扫描传感器无法正确对焦,这会导致这些区域的字迹变得模糊,在书靠近中间部分,这种现象会由于两边的自重都不够把书脊压到足够靠近扫描仪传感器而进一步加剧,此时在上面再放一本厚书可以部分缓解,但中间大约4-6列的文字清晰度仍然会差到无法有效进行OCR,也比较影响阅读。
另一方面,由于书使用的纸张比较薄,因此纸张背面的文字会稍微渗过来一些。直接阅读时这一问题影响不太大,但扫描后这一现象就非常明显了。由于两面都做扫描,我认为这一问题可以通过将纸张另一面的内容翻转,选中其中最黑的区域之后将这一形状作为蒙版放到背面扫描数据中,对蒙版选中区域做阈值过滤(此区域中只接受最接近黑色的那部分颜色),或是直接将纸上超过某一阈值的黑色过滤出来再做增强的方法来改善。
如此一来,看上去最好的办法还是把书给拆开扫描了。现在比较不确定的问题是扫描仪的 ADF 对于这种略有年代又比较软的纸是不是很容易卡纸,此外,由于这款扫描仪并没有直接进行双面扫描的能力,也会给后续处理带来一些困难。
由于书很厚,因此比较自然的做法便是把书展直接放到扫描仪的扫描平面上。一试发现果然自己做有不少的坑。
我用的这台 HP OfficeJet 4630 的扫描软件本身提供了自动找到扫描的纸张边界并将其旋转正的功能,此外也会自动调整白平衡和对比度来获得比较好的效果。然而,如果不把书拆开的话,由于书厚度的原因,靠近书脊的部分和扫描平面的距离会比较远,这会导致扫描传感器无法正确对焦,这会导致这些区域的字迹变得模糊,在书靠近中间部分,这种现象会由于两边的自重都不够把书脊压到足够靠近扫描仪传感器而进一步加剧,此时在上面再放一本厚书可以部分缓解,但中间大约4-6列的文字清晰度仍然会差到无法有效进行OCR,也比较影响阅读。
另一方面,由于书使用的纸张比较薄,因此纸张背面的文字会稍微渗过来一些。直接阅读时这一问题影响不太大,但扫描后这一现象就非常明显了。由于两面都做扫描,我认为这一问题可以通过将纸张另一面的内容翻转,选中其中最黑的区域之后将这一形状作为蒙版放到背面扫描数据中,对蒙版选中区域做阈值过滤(此区域中只接受最接近黑色的那部分颜色),或是直接将纸上超过某一阈值的黑色过滤出来再做增强的方法来改善。
如此一来,看上去最好的办法还是把书给拆开扫描了。现在比较不确定的问题是扫描仪的 ADF 对于这种略有年代又比较软的纸是不是很容易卡纸,此外,由于这款扫描仪并没有直接进行双面扫描的能力,也会给后续处理带来一些困难。
PSA: 「EVUS中文网」 并不是美国政府官方网站,而是一家收费不菲的中介机构。目前美国政府对于EVUS登记并不收费。
家里有老人准备来美国探亲的话务必避免让父母自行填写,以防上当。
家里有老人准备来美国探亲的话务必避免让父母自行填写,以防上当。
https://blog.delphij.net/posts/2024/08/credit-freeze/
洛杉矶时报报道,骇客可能窃取了全部美国人的社会安全号。 https://www.latimes.com/business/story/2024-08-13/hacker-claims-theft-of-every-american-social-security-number
我个人觉得这事可能实际上 #影响不大 ,毕竟大家的全都漏了就等于大家都没漏,在意这个事的商家肯定会增强防范。不过,如果有意去锁定自己的信用记录的话,可以去三家信用记录公司去分别做:
Experian: https://www.experian.com/freeze/center.html
Equifax: https://www.equifax.com/personal/credit-report-services/credit-freeze/
TransUnion: https://www.transunion.com/credit-freeze
当然,这三家机构的草台班子也是罄竹难书的水平,这都2024年了,竟然没有任何一家实现了FIDO2 2FA。
除此之外,还应在国税局启用身份保护验证码 IP PIN,网址是 https://www.irs.gov/identity-theft-fraud-scams/get-an-identity-protection-pin
以及移民局 E-verify 锁定: https://www.e-verify.gov/employees/employee-self-services/mye-verify/self-lock
本文中上述实际需要填写身份信息的网址均以完整形式呈现,尽管这些网站均采用了 https, 但在填写信息之前请再次仔细确认这些网站确实属于与之对应的机构,以免发生次生灾害。
洛杉矶时报报道,骇客可能窃取了全部美国人的社会安全号。 https://www.latimes.com/business/story/2024-08-13/hacker-claims-theft-of-every-american-social-security-number
我个人觉得这事可能实际上 #影响不大 ,毕竟大家的全都漏了就等于大家都没漏,在意这个事的商家肯定会增强防范。不过,如果有意去锁定自己的信用记录的话,可以去三家信用记录公司去分别做:
Experian: https://www.experian.com/freeze/center.html
Equifax: https://www.equifax.com/personal/credit-report-services/credit-freeze/
TransUnion: https://www.transunion.com/credit-freeze
当然,这三家机构的草台班子也是罄竹难书的水平,这都2024年了,竟然没有任何一家实现了FIDO2 2FA。
除此之外,还应在国税局启用身份保护验证码 IP PIN,网址是 https://www.irs.gov/identity-theft-fraud-scams/get-an-identity-protection-pin
以及移民局 E-verify 锁定: https://www.e-verify.gov/employees/employee-self-services/mye-verify/self-lock
本文中上述实际需要填写身份信息的网址均以完整形式呈现,尽管这些网站均采用了 https, 但在填写信息之前请再次仔细确认这些网站确实属于与之对应的机构,以免发生次生灾害。
delphij's Chaos
PSA: 如何给自己的信用记录上锁
根据洛杉矶时报报道,骇客可能窃取了全部美国人的社会安全号。
社会安全号码(Social Security Number, SSN)是依据 42 U.S.C. § 405(c)(2) 发给一部分美国纳税人(包括公民、永久居民,以及有工作许可的临时居住在美国的人员)的一个九位数字。
目前,这个号码是由社会保障署(Social Security Administration)发给这些纳税人的,
尽管社会安全号码的设计本意是帮助社会保障署区分这些纳税人的,但由于它是由联邦机构签发的终生不变的数字,
因此它成了事…
社会安全号码(Social Security Number, SSN)是依据 42 U.S.C. § 405(c)(2) 发给一部分美国纳税人(包括公民、永久居民,以及有工作许可的临时居住在美国的人员)的一个九位数字。
目前,这个号码是由社会保障署(Social Security Administration)发给这些纳税人的,
尽管社会安全号码的设计本意是帮助社会保障署区分这些纳税人的,但由于它是由联邦机构签发的终生不变的数字,
因此它成了事…
TransUnion的app认为其账户密码只能有最多15个字符,而网站上则没有此限制。家住圣何塞的李先生觉得自己已经快被该公司用最粗的marker笔在名字旁边写上「刺儿头」拉黑了。
HealthEquity发来贺电说他们准备发一个新的卡给我,该卡将取代以前长期分开的HSA、LPFSA的多张卡片,尽管我不久之前刚刚才激活了他们发来的新的卡片。他们提到,这张卡将具备自动优先从类似LPFSA支取眼科/牙科医疗费用的能力,并认为这是对于之前卡片的重大升级。
可是,可是啊,咱就是说,看医生的时候您也不是跟保险紧密集成的,这卡这么多年了,我就从来没有去医生那里直接划过啊……难道真的有人直接用FSA/HSA的卡去结算吗?
可是,可是啊,咱就是说,看医生的时候您也不是跟保险紧密集成的,这卡这么多年了,我就从来没有去医生那里直接划过啊……难道真的有人直接用FSA/HSA的卡去结算吗?
今天有小伙伴问起一个尖锐的问题:卖房时已婚人士自住房的五十万美元资本利得豁免是否会随通货膨胀调整?
从直觉上,我印象中过去十几年这个数字没有任何变化,不过还是查了一下相关法条(26 U.S.C. § 121),发现果然这个数字是直接通过立法来指定的,没有提通货膨胀的事。
另一个有点惊讶的事实是,看了一下合众国法典第二十六编,发现连里根时期的1986税改法案居然也是以补丁,而不是像1954税改那样直接整体替换原税法来实现的。(上届政府的2017则更是在1986税法基础上的小修小补)。
从直觉上,我印象中过去十几年这个数字没有任何变化,不过还是查了一下相关法条(26 U.S.C. § 121),发现果然这个数字是直接通过立法来指定的,没有提通货膨胀的事。
另一个有点惊讶的事实是,看了一下合众国法典第二十六编,发现连里根时期的1986税改法案居然也是以补丁,而不是像1954税改那样直接整体替换原税法来实现的。(上届政府的2017则更是在1986税法基础上的小修小补)。
https://youtu.be/UXA-Af-JeCE xkcd What If有自己的YouTube channel了 #TIL
YouTube
Could you survive a nanosecond on the Sun?
Get a copy of What If? 2 and Randall’s other books at: https://xkcd.com/books
More serious answers to absurd questions at: https://what-if.xkcd.com/
What would happen if you spent a nanosecond on the surface of the sun? Would it warm you up, burn you to…
More serious answers to absurd questions at: https://what-if.xkcd.com/
What would happen if you spent a nanosecond on the surface of the sun? Would it warm you up, burn you to…