Data Science Archive
1.72K subscribers
1 photo
113 links
小熊猫的个人工具收纳箱,还包括一些零碎的笔记,大概会有这些:

* 有趣/有价值/SOTA的会议论文和代码分享
* 自然语言处理,计算机视觉,语音信号领域进展
* Kaggle 和其他算法竞赛经验
* 反作弊,搜索和个性化推荐算法产品的工程化
* 统计学习,矩阵计算,贝叶斯相关的工具
* 可视化、算法服务相关的存储、并行和分布式计算工具

希望我收集的信息也可以帮到你,如果有其他建议,或者寻找工作机会,都可以给我发邮件: jinyzho@microsoft.com
Download Telegram
Channel created
Channel photo updated
一个历史悠久的 ML 工具库,Shogun(将军)。
http://shogun-toolbox.org/examples/latest/index.html
关于机器学习系统线上部署的一些问题,隐患和思考,虽然是 NIPS 2015,但是对现在的大部分问题依旧有很强的借鉴意义。https://papers.nips.cc/paper/5656-hidden-technical-debt-in-machine-learning-systems.pdhttp:/martin.zinkevich.org/rules_of_ml/rules_of_ml
动态构建知识图谱,看起来是整合一个 SQuAD 和其他离散状态,这里的离散状态包括了每个entity的representation,比如词性,位置等等。于是机器在做阅读理解的时候,一句一句往下读,entity 的状态就会更新。来自 UMass 和 MSR Montreal。
paper: https://arxiv.org/abs/1810.05682
基于 LSTM 构建语言模型,然后用作输入法,以前有看到过一个韩国人做的,这次作者来自东京大学和 CMU,数据集是日语的 BCCWJ。其实是2016年的工作,但是语言模型放进输入法还是一个挺自然的事情,看起来还是挺有意思。
paper:https://arxiv.org/pdf/1810.09309.pdf
code:https://github.com/yohokuno/neural_ime