duangsuse::Echo

咳咳.... 马上继续写书去算了（ #Java 真的是时间永远不够用
看起来我打算加入的章节，这次恐怕都没有时间加入了呢。

这个星期主要是看了三本书，先说说基本感想。

《手把手教你学 FPGA 设计》：巨好评 👍👍
作者果不其然是真·高手啊！况且现在敢入、能入电子工业和无线电的人大概是少数吧，当初进入已经非常了不起了，现在又来教下一辈，还是以这么通透的理解层次！

而且他还在华为海思半导体公司加入了新一代无线通讯技术（貌似是 4G 或以上？）跳频 OFDM 无线多地址通讯系统的研发，他技术行文的简洁性也透露着自己的实力、例子也举的非常合适，非常符合工程实践，有 SDRAM[1]、UART[2]、VGA[3]、LED[4] 显示温度计、边缘扫描图像处理硬件等，但是书居然只有两百多面，而且算法（Verilog 硬件描述语言）还写全了！这个 PLD 教学真可以说是中国第一简单实用快速！

—
[1]: SDRAM: 同步[6]动态随机访问存储器，Synchronized Dynamic Random Access Memory，它是一种易失性(volatile)存储器，和 SRAM （静态）的区别是因为内部晶体管电荷保存时间有限，必须按照固定频率刷新才能保证内部数据不会丢失，而 SRAM 就不需要；一般来说高质量的存储用途（比如缓存）会使用 SRAM，因为它不需要浪费时间去进行刷新操作
不都用 SRAM 的原因是它太贵了，DRAM 一个晶体管就可以实现的存储容量（比如 1* bit） SRAM 要六个 🤪 体积大，而且用户买不起。
[2]: UART: 通用异步收发传输器，Universal Asynchronous Receive Transmit
这娃是传输字符用的（类比 TTY），嵌入式开发里一般用它调试目标板子。[5]
[3]: VGA: 最开始由 IBM 设计的视频接口标准“视频图形阵列”，Video Graphics Array
[4]: 发光二极管，这里指 “8” LED 阵列式数值显示用的元件

[5]: 板子一般指单片机或者嵌入式片上系统；
最开始我把 UART 误解为“通用并行设备总线”了（伪造 USB，通用串行设备总线，误）
[6]: 同步是指和其他器件（一般是微处理器、微控制器）的时钟节拍信号同步对齐
—

《零起点 Python 机器学习快速入门》：中评 😐
作者是一个做中文字库的（字王工作室），自产有《中华大字库》、TopQuant 足彩分析等，也是一个其他信息行业奠基者的角色，（对我来说）是个先辈，但是他对程序设计的理解有点独特但不是很深刻，书上的图示、算法接口资料还比较齐全，
示例数据集主要讲的是 Iris 爱丽丝花卉子种属数据集，以及一个 CCPP 发电厂电力输出数据集。

全本书讲了 sklearn (scikit)、Pandas、Matplotlib 的使用，当然没有提到 Numpy、Numba、OpenCL、OpenMP、PyCUDA 等高性能计算库的使用（“黑箱”教学），但是提了名字

算法没有讲太多算法细节，只是给你几个封装函数做学习、测试数据切分 (ai_data_cut)、学习 (mx_*)、回归 (predict 方法)、测试 (ai_acc_xed) （用于判断数据预测的准确率，就是对 test 数据集，准备好预测到的结果，取实际 test 的结果，判断 (误差小于目标 k 的结果项目份数/总份数)）

前面还教你如何进行『分类名称』“矢量”化（就不在这里喷这个名词使用的错误了[1]，虽然可能不是他自己最开始用的）...
这里不吐槽任何槽点，但是本书的槽点还是很多的，看上 100 面大概能找到十七八个，不过不得不说对于机器学习入门来说这本书也不错（即使里面有些文字我打算专门吐槽一下...）。
再者，因为我这里绝对没有任何其他的机器学习书了...

《持续轻量级 JavaEE 开发》：好评 👍
作者们都是 RedHat JBoss 多项目的资深工程师、项目经理什么的，面向对象编程大师。

然后马上要放暑假了，真是 🎉
GeekApk 又有一次复活的机会了，正好我最近在看 JavaEE，刚对 EE 那些真的是有点复杂的依赖注入、Observer、Interceptor、单元测试、Service locator pattern、反射元编程和声明(annotations) 有点感觉了
打算弄点大新闻出来 🐸

—
[1]: 矢量化：这里是指，对于一个数据表（书上的是 Iris 种属分类）
如果要学习（数据分析）的一项是（可能不可导、不可进行传统统计概率数值运算的）聚合量（product type）比如一个 str （char 的 homogenous product type）那就先将其『标号化』、学习，再在回归的时候映射回来
矢量，在物理上是有方向的量[2]，数学上（尤其线性代数）矢量化是指把矩阵转化为线性序列的形式，请问这里它的宾语（目标）是指『这个数据表 pandas.DataFrame』呢？还是 Python 的 built-in type str 呢？
不管怎么样，看起来都有点不太对吧？哈？算了....

vec(A) = {
  a[1,1], ..., a[m,1],
  a[1,2], ..., a[m,2],
  a[1,n], ..., a[m,n] }(^T

简而言之就是把 2x2 矩阵 { a b;; c d } 变成元组 [ a c b d ], 看上面的递推式子也知道了

缺点当然是很明显的，比如 Iris 分类器的例子，作者就这么对三种种属『“矢量化”』了一波（取的『编号』，虽然那实际上是逼近的参数之一.... 都是 1,2,3 这种），Linear regression 的结果很差很辣鸡，只比随机三选一好一点。
然而实际上可以多准确呢？同数据集 KNN 分类器（K-最近邻分类法，最简单的机器学习算法之一，特征聚合映射到 N 维空间判距离上 k 最近邻中数目最多的分类，用作者的话，当然我觉得还行的就是『物以类聚』）学习后给出的判断准确率是 100%！

何况，作者『映射』分类预测结果回来（实际上没有映射回 str，但这里和我说的实际上是一个情况）的时候使用的（浮点）算法是直接 truncate 掉小数部分然后 if else if.... （不如 switch ....），还不如四舍五入好呢（不要忘记了这个『矢量』实际上代表的是一个分类！）

作者自己的确是做数据分析的，可是他对编程的理解.... 我觉得真的不是特别值得学习

我可没有随便对自己完全不理解的东西乱说话，至少我能找到一篇文章给我背书：
Conmajia::CodeProject::前馈全连接神经网络和函数逼近、时间序列预测、手写数字识别
这里面没有 Python 书里作者所谓的『矢量化』，但只是学习模型的不同而已（线性回归 vs. 人工神经网络），不过 Sklearn 有 one-hot encoding 的实现，作者还是要用『矢量化』定 1,2,3，明明说都到『CPU 加法器』的级别了，却连二进制都没注意到，也真是服气了....

>>>

from sklearn import preprocessing

>>>

le = preprocessing.LabelEncoder()

>>>

le.fit([1, 2, 2, 6])

LabelEncoder()
>>>

le.classes_

array([1, 2, 6])

[2]：第一次的时候搞错了... 物理上那个是向量，基本无关的东西

Wikipedia

视频图形阵列

視訊圖形陣列（英語：Video Graphics Array，缩写：VGA）是IBM的一個使用類比訊號的電腦顯示標準，在1987年随IBM PS/2系列计算机推出。VGA是大多数PC制造商所遵循的最后一个IBM图形标准，几乎1990年后的所有PC图形硬件都最低支持VGA。

51 viewsduangsuse /'dʊɔːŋ sjuːz/ | [⃪PLD, FPλ], edited 07:38