duangsuse::Echo
712 subscribers
4.24K photos
127 videos
583 files
6.46K links
import this:
美而不丑、明而不暗、短而不凡、长而不乱,扁平不宽,读而后码,行之天下,勿托地上天国。
异常勿吞,难过勿过,叹一真理。效率是很重要,盲目最是低效。
简明是可靠的先验,不是可靠的祭品。
知其变,守其恒,为天下式;穷其变,知不穷,得地上势。知变守恒却穷变知新,我认真理,我不认真。

技术相干订阅~
另外有 throws 闲杂频道 @dsuset
转载频道 @dsusep
极小可能会有批评zf的消息 如有不适可退出
suse小站(面向运气编程): https://WOJS.org/#/
Download Telegram
#math 🌝🌚《知识》
duangsuse::Echo
#zhihu 你怎么看回形针PaperClip《和 10 个批评者一块视频聊天》? - duangsuse的回答 - 知乎 https://www.zhihu.com/question/423360626/answer/2336787754 为中文互联网科普一切技术、公开财报、上央视时没人称赞你,等到你一被“拉下神坛” “戴上公知帽”,各种疑点分析就来了,境外金主和技术外援就出现了——大家都这样,你凭什么不一样。 你说话叫剧本的公关行为,继续发视频叫隐瞒过错,活着叫还能发帖,死了“人人叫好”,回形针曾经…
https://t.me/dsuses/5066 #zhihu
然而死去的战士终究是战士,他伤口上嗡嗡重复的苍蝇终究竟不过是苍蝇

是的夹带私货很可怕。没有人能发现苍蝇的“污点”。在过去实近200期动画正片里努力做战士,在「团结」的中国却终究是要有今天,“苍蝇不叮无缝的蛋” “别以为「中国人」好欺骗”,利用订正失误、精查团队血统、捕风捉影罗列恨国『罪名』,于是苍蝇和正常人各种自媒体,这么随意的给2016起200期视频一秒秒设计的场景渐变定性,是美国间谍。

这群自媒体还真是从渺小变伟大啊,在他们漠不关心的领域拳打脚踢 质问黑白,国安机关没行文 媒体就开始罗列断章 标题党“事实”地乱叫 ,能摧毁一切的团结,真励志,很像民族精神呢!

今年『干燥工厂』实体还没查封,就是他清白最好的证据。至于什么营销号卖车卖药卖气愤的 说是没查到位还有举报 或者早已被实锤,随他说去吧,保守晚节。比你拿嘴查得好

你们就没有怀疑过,回形针再蠢也怎么敢故意搞两面做派 阳奉阴违,故意激怒网民,他可是做过无数话题的科普的,就是间谍也不会在舆论下玩脱吧。当年的确有人把网民当傻子,但不是回形针。

骂不死比你牛的真罪恶,骂死无辜的。 西化可怕,随口断定人为“私货”发视频的,更可怕。

👇 #js #zhihu 以1分钱为单位记整数是基本常识
确实反映到计科基础教育缺失,因为都有1.25秒这种小数点概念;但大家意识不到要克制不用%1后的1e-10小数位 避免偏差

这个人基于toFixed(n) 即 floor(it*k)/k ,k=10**n 混淆字符串,却没意识到JS这么设计正是为避免他这种瞎设计系统的计算
https://mivik.gitee.io/2021/life/dream/#oi #life 节选
我站起来时只能有一句“我拿到了提高组二等奖”,然后眼睛避着教练坐下去。后来教练单独谈话的时候问了个问题:

“你觉得你和那些拿一等奖的同学比有什么优势?”

是啊,那些没有优势的人,终点就是被淘汰。我也记不起当时说了什么,但这个问题至今还在我心中徘徊。

不知怎么的最后是被选进去了。不过这中间有件趣事。因为各个教练是在争夺学生的,然后信息教练让我去找 lzy(当时他是一营分数第一)。我和 deco(当时我并不认识他)一路,关键也不知道往哪儿找,瞎逛着碰见一个人,问了下他知不知道 lzy 在哪儿,那人:“我就是啊!”不过后来知道他已经被物理教练收了(貌似当时物理是比信息“有权势”的),于是也不了了之。话说如果 lzy 当初来信竞的话,今年应该得有三个集训队吧。

几次的联赛都是在电子科大考的。对生活只有学校和家两点的我,这无疑是新奇而令人兴奋的。当时初中的时候,在酒店看到几个穿着成都七中校服的学生,想着“我还考个啥啊”这样,最终荣获了提高组二等奖。
羽毛的小白板
你乎推的什么垃圾东西 https://zhuanlan.zhihu.com/p/459724428
所以非常感谢大家关注动苏~ 尽管我写的太少、太难懂,但我会努力的! 🙏
#algorithm #oi 字串-状态机
KMP是求 "abc".indexOf("bc") 即strstr的算法,单个子串搜索。最简解 (s,ss)=>rng(0,n(s)-n(ss)).find(i=> s.slice(i).startsWith(ss) ) ;即i于0~n-nSs 的所有ss可能位试等
find(s,ss){for(i in 0~n-m)for(j in 0~m){if(s[i+j]!=ssj)break if(j==m)yes} ;no}

要懂KMP,先听前缀树Trie的故事。若需搜索多个子串,strstr只能1次找1个,它只能比对一个ss,但针对相同前缀字符(好比嵌套文件夹 逐步深入) 可以组嵌套{}避免从0再试。
Trie=(t0,kv)=>{let t,k,K,v; for([k,v]of kv){t=t0;for(K of k){if(!t[K])t[K]={} ;t=t[K]} t['\0']=v } }
Trie(t0={}, "bin ban bun bah".split(' ').map((k,i)=>[k,"兵班崩巴"[i] ] ))

注意t0嵌套结构。可写批量替换 rep=s=>buildStr(ad=>{let t=t0,K,v; for(K of s){t=t[K];if(!t)t=t0,ad(K); if(v=t['\0'])ad(v),t=t0 }})
buildStr=f=>{let s='';f(c=>s+=c);return s}
于是可 rep("bahbunbinban")

也可玩个花的:将嵌套字典编号为状态转移表;行=状态号 列=字符-新态 组
cell=[], nb=t=>{let d=[],k;
if(k=t['\0'])return k; for(k in t)d.push(k,nb(t[k])) ;return cell.push(d)-1}


OI常用这个cell,n行列=最长字串长,ASCII符集长
也可以把'\0'压缩掉,只有创路遇t属值时t={['\0']:t,}再继续走,我之前一个放弃的web字典就这;当然我现在用后缀树了。C++无值序时hash表(std::unord_map)更好

但我们没想过性能。若找"abc" 而 t0=abd bcd ,c!=d 时t=t0 ,再从t="a.."开始缩小集合,可b不会有第二次,对"abcd" 则bcd也无法匹配了。当然可 for-of 变i++,每t=t0 记位置,若失配跳回'a'后1字,"bcd"能见

你肯定稀奇,编程的if 为啥没有“无匹配”的问题——if 总有else或同{}后随项。 只要给"a.."等所有节点加else分支,它就知道失配回退哪,"abd"里b回退到从t0 走同前缀的"bcd"子树,a回t0,.. 。这其实和rep() 是一个流程,它叫AC自动机。

KMP是AC的简版。"cadcab" 对前后缀里重复串设置正确的fail指针,"cadca" 的ca是在t0可达的前缀,故失配移到dc.. 重试

未完待续,(注意我也在理解 NFA DFA 这些,虽说我能讲些基础的,却知道不多)

aho-corasick algorithm 应该就是AC(有 fail 回路的 Trie 匹配

大概就是 e[s[i++]||key.next()]._empty= 同前缀的e’ 这样 ,例如 abc:1, bd:2 的子串匹配 "abd" 时,会往回走1次
螺莉莉的黑板报: #tencent #wechat #web
【悲报】微信他们组造的新浏览器内核 xweb 已经出现在了 Android 设备上,检查 UA 如果出现了 xweb 表示您中奖了
我今天修了一整天这个 bug,然后发现特么是因为我手机上跑了一个 Chromium 78,还是微信他们自己造的内核……张小龙汝母炸矣!


debugmm.qq.com/?forcex5=true
吃完后去 debugtbs.qq.com 自测

Astrian Zheng:
只要大家都不用,微信就那我们没办法
duangsuse::Echo
#cg #python 要展示100个人头像的最好方法是瓷块式拼合,再在上面盖层mask,像"Meta","Google"大字样,使部分头像变黑,但一些人的头像就比较黑,如果能让它们处在mask更黑的地方,岂不更好? imwall.py mask.png *.png 首项宽高很低,其后图宽高统一,试以lum(img)为目标将其后图像瓷砖排列。 class 砖图: def 入(im,网)#以网格项(x,y,w,h) im.crop 出列表,记下i-xy对应 def 返(a)#paste 回旧图原位…
#js 🤔 先音高-后时间 扒谱工具Hachiko的继任者设计终于简易了
之前需同步修改mid序列-渲染,它不可单向,要复制粘贴音符就更难了;钢琴卷帘在右,如今考虑到播放,导出并不频繁,锁定100px=1秒,添加放大系数*k和*1/k 来转化x,w长度,录制时.5s scrollLeft,width+ .5k 而note{left:w-len} 就圈定了音符时长;播放即对光标后延时-激活&关闭,对齐,Oscillator,重复此程序。
按S键切音高,A键标尾。 之前一直未设好的是「歌词组」,即合并多行一起录制。其实歌词只是提示, 起始mm:ss -音高-时缓 才是真录的东西,所以完全以文本格式按mm:ss行切存’录制组‘ 做(组号);根本没有组合并之类问题

然而我已没时间实践这个,23号就是某人生日
我研究了一下《嘉宾》 确实如某些批评者(歌词真的有问题么.. 要求真高)所言属流行歌曲, 3大段1小段 构成的,最大一段重复3次;旋律改下词就看不出相同了,其实比其他歌好扒些

pip install hachiko-bapu
https://glowmem.com/archives/giantmidi-usage
https://editor.themidimaker.com/ midieditor.org
甚至 https://www.mobilefish.com/services/midi_maker/midi_maker.php 这种“工具”
嘉宾
赤羽
完蛋了, 对着原唱调的参,时间完全乱了…… 😭

#music 还好工程文件刚才被 SV2 自动删了 🤪 😂 它自动恢复的,没提示保存!.. 肯定要重做

对着xx调参/画线真的是最糟糕的做法, 原唱已经有人声了,你照着它“合唱”是会搞乱的

本来做这个一半是学唱(我五音不全) 一半是给 js 动画提供ppt时间线,我看这个吻合度,已经没救了。
Audio
合唱版也挺过分( 很好听,下次别唱了

● archlinux
State: degraded
Jobs: 0 queued
Failed: 1 units
Since: Tue 2022-01-11 17:00:33 CST; 1 month 0 days ago

为了傅里叶变换等 奇奇怪怪的内容, 电脑开了一个月了.. 大概迟早要好好梳理一下,究竟什么任务真的要完成
duangsuse::Echo
我太阳,才发现这个别人能发博文的东西,我竟然连标题和名字都没起,试运行成功贴上就pass了…… 这不是在线教SICP(程序的构造和解释)吗🤪 #lisp #fp #zhihu #statement 放到以前我绝对搞大新闻一样,就像之前仿造(但也没成功)Lice 时专门建了项目画了logo,然后文档拼缀别人的,最后模板代码写完不会了 🙈 但说起来,元编程最后也不过是编程。你了解编程语言,很好,但语言只是载体,美丽的、各种各样的应用才是我们的最终目的。 你能写编译器,很好,但也不过是完成了文本模式和树遍历,加上一些理论。…
#cs #statement #recommend 过去杂谈
计算机科学的讨论,好像是只收集晨露的人和饮水的「普通人」

晨露的每一粒、每个专有名词都是原理的侧面。就像对企鹅与鸵鸟,强化了鸟的一部分,却存在相似的周期和度量衡;对于算法,则存在相同的输入输出和差异化中间数据
水的每一滴,都有相似和不同的形态成分。相似成分像晨露,人却无法将其分离,甚至不觉得可能分离
喜欢晨露的人、喜欢水的人,都搞不清微小迷茫或庞大 都只是水而已;厉害或老土,只是附加的情感

水不喝,就可以有很多形态花样;而对真正想研究「水」的人,掌握交换互通的技术,晨露和饮水有何区别、原理或巨型有多难,都是无谓的问题。
编程的核心不是思想,而是语言。思想不独立于语言而存在,一切抽象归于文本,却应是最反映本质的文本。语言能做帮大家少走弯路的设计,这比折磨人和计算机的面向报错编程更值得、更有力

知道原理的缘由、知道堆砌的模式,是『编程语言』人对自己必须的要求。 空有原理或疲于堆砌都不能帮助程序走向更好,优美的「语义」才是最初目的。
有露水到饮用水的「语言和工具」,才能看清各种层级的目的,把美与高效融为一体

在刚才的故事里,饮用和观赏外的统一目的并不存在。 语言并不是目的,但能为其目的优化;语言不是唯一的,有选面向人或计算机
编程就是一件既要识大体,又应顾小局的事。 爱好语言,未必要做编译器。 PLT是种方法,方法是比程序乃至框架要「大」的方案

说到底语言并不存在,存在的只有编码集和思想。语言就是编码的哲学,只是它简化于人的思想和目的
与其说我是研究语言,不如说是在概况一类问题。这没什么了不起,因为问题间相同点很少——但这就是我爱做的,即便领域有这样或那样的约定俗成。
编程是把领域联起来,变成一个大领域晾出去;好的程序直观反映其处理数据的结构;程序集处理、代码亦数据;特例不比规律特殊 ,这些都是对某类代码段的优评,但只是「语言」内一瞥。解决问题的方法有很多,转化代码、描述程序、发布代码,有没有计算机意义的问题,都是语言能优化的问题。 好比算法于计算机。语言即智慧

明明能用 rect(xywh)x step 30 这样的定义,为什么要 ctx.draw_(x,y,..) 呢?明明是用来处理绘制,叫ctx干什么? 代码里类似的地方数不胜数,
只因为懂了OOP和物理VecN,懂内存与复制、重绘队列于线协程,才知道自己代码的责任和hack,因此知道最适合的命名;语言人,不死板

作为最大的领悟应该是做过一切后能发现其「简单」,就像物理式一样 I=UR,E=mc^2 ,创新和表象千变万化、运行期数据不可捉摸,不可或缺之原理恒常如新。这简单却不能是自我陶醉,对知识放下傲气,用踏实的语言描述优美的事物概念
所以像编程语言那样的东西我又不先弄了,转而弄些绘制和数处的应用、从 Stream RWer到二进制值绑定的框架等等
Forwarded from Solidot
计算机科学家证明为什么更大的神经网络表现更好

2022-02-11 17:35

人类多亏有对生拇指。但就算演化给了我们更多的拇指,情况也不会有太大的改善。每只手有一个拇指就足够了。神经网络不是这样,神经网络是执行类人任务的先进人工智能系统。随着它们变得更大,它们就能掌握更多。这会让旁观者大吃一惊。基本的数学结果表明,网络应该只需要这么大,但是现代神经网络的规模通常会远超出预测的需求——这种情况被称为过度参数化。在 12 月会议 NeurIPS 上发布的 一篇论文中,微软研究院的 Sébastien Bubeck 和斯坦福大学的 Mark Sellke 为规模放大成功背后的奥秘提出了一种新的解释。他们表明,神经网络必须比传统预期的大得多,才能避免某些基本问题。这一发现为一个持续了几十年的问题提供了一般性的见解。对神经网络规模的标准预期来自对它们如何记忆数据的分析。但要了解记忆,我们必须首先了解网络的作用。神经网络的一项常见任务是识别图像中的对象。研究人员首先为其提供许多图像和对象标签,训练它学习两者之间的相关性。之后网络将正确识别它看过的图像中的对象。换句话说,训练使网络记住数据。更值得注意的是,一旦网络记住了足够多的训练数据,它就能以不同程度的准确度预测它从未见过的物体的标签。后一个过程被称为泛化。
duangsuse::Echo
赤羽 – 嘉宾
之前对动画的设计是「每行词动画页面模板」,现在发现它很难实现精确的落字…… 这种切分设计的做法非常鸡肋,我要手动拼合歌词时间、切分歌词,只为进场下项元素;也不能退场
anim() 函数早已经不难了,现在是以一个有序动画队列做每页内歌词行的渐变
但其实也是挺麻烦的。 每页ppt还有背景动画进退场;幸好有CSS动画帮加背景模板的动画 ,web真是太厉害啦
#zhihu #python #code https://www.zhihu.com/question/430688755/answer/2344167773
https://www.cnblogs.com/ruhai/p/10820578.html

#algorithm 快速排序把列表二分至仅1项,分前先以大小移位partition ;合并排序也分至仅1项,完后保持有序 merge 。分别是基于 partition 1->N 和 merge N->1 子集分治法
读取次数O(nlogn) ,n 是每拆分层项数, log n 是层数(如4=分2层)

还有些算法推荐大家了解: Delauny三角剖分, MST树,kD树 . #GLSL 上面也有一些
https://zhuanlan.zhihu.com/p/375542978
https://zhuanlan.zhihu.com/p/42331420 #opencv Subdiv2D
jb.svp
83.6 KB
https://resource.dreamtonics.com/download/ 欢迎大家试用K华大佬的 SV~ #vocaloid