地母系审美流行、年入百万的新兴职业“人生教练”爆火,花式《花束般的恋爱》二创狂欢 | 瞰见周报
最近手感不错,写了《花束》二创相关...
如今,恋爱也讲门当户对,先筛选地域、收入和职业再谈感情,“凤凰男”配不上“江浙沪独生女”,同样“拆二代”也不要“外地人”,中国式的爱情离不开社会叙事,即便是离散如原子化的个体背后也有沉重的乡土印记。
我们很难在国内拍出远离身份认同的“轻量化”感情:北上广难有《花束般的恋爱》,但有《装腔启示录》和《爱情神话》……
最近手感不错,写了《花束》二创相关...
如今,恋爱也讲门当户对,先筛选地域、收入和职业再谈感情,“凤凰男”配不上“江浙沪独生女”,同样“拆二代”也不要“外地人”,中国式的爱情离不开社会叙事,即便是离散如原子化的个体背后也有沉重的乡土印记。
我们很难在国内拍出远离身份认同的“轻量化”感情:北上广难有《花束般的恋爱》,但有《装腔启示录》和《爱情神话》……
#程序员
Distil-Whisper:让语音识别的速度提高 5.8 倍,参数减少 51%,准确度保持在 99%。
Whisper 在语音识别方面表现卓著,但是它有一个明显的缺点:训练出来的小模型支持的语言比较少,而大模型推理速度又很慢。如果你有海量的数据需要处理,或者对实时性要求略高,那使用 Whisper 可能会让你比较头疼。
你可以使用工程手段来加速推理,例如将语音分片后并发处理然后合并结果,但这里涉及到本地计算资源瓶颈的问题,以及合并分片时容错处理的问题,工程复杂度比较高。
《Distil-Whisper: Robust Knowledge Distillation via Large-Scale Pseudo Labelling
》,https://arxiv.org/abs/2311.00430,这篇文论提到了一个优化方案,它使用 Whisper 的 Large-v2 model 生成了一系列的 soft targets(也就是概率分布),然后复制 Whisper 网络的第一层和最后一层解码器,最后生成了一个更小、更快效果更好的蒸馏模型 Distil-Whisper。论文数据写的是:速度提高了 5.8 倍,参数减少了 51%,准确度保持在 99%。
这个模型的效果之所以不错,主要还是得益于训练数据的完备,它结合了九个公开可用的语音识别数据集,合并后包含 21170 小时的语音数据,涵盖超过 18260 名说话者和 10 个不同的领域;自从 Whisper 大力出奇迹(它从互联网爬取了 68w 小时的数据,未公开)以后,相信后续语音领域的论文都会配置更庞大的数据集。
Distil-Whisper 目前开源在 Hugging Face 上,模型地址:https://huggingface.co/distil-whisper/distil-large-v2,同时还提供了一个可在线测试的 Demo:https://huggingface.co/spaces/Xenova/distil-whisper-web,这个 Demo 会把模型下载到本地,然后通过 WebGPU 直接在网页上跑起来,测试了下效果,还是挺不错的。
目前仅支持英文,如果想让它支持中文,需要使用同样海量的中文语料数据,重新做一次知识蒸馏,但我觉得即便是这样做,效果也不一定好,因为 Whisper 本身对中文、韩语等支持就不太优秀,这个信息可以从 Whisper 的论文中找到数据支撑。
下面这个视频是 Whisper 和 Distil-Whisper 的对比效果:
Invalid media: video
Distil-Whisper:让语音识别的速度提高 5.8 倍,参数减少 51%,准确度保持在 99%。
Whisper 在语音识别方面表现卓著,但是它有一个明显的缺点:训练出来的小模型支持的语言比较少,而大模型推理速度又很慢。如果你有海量的数据需要处理,或者对实时性要求略高,那使用 Whisper 可能会让你比较头疼。
你可以使用工程手段来加速推理,例如将语音分片后并发处理然后合并结果,但这里涉及到本地计算资源瓶颈的问题,以及合并分片时容错处理的问题,工程复杂度比较高。
《Distil-Whisper: Robust Knowledge Distillation via Large-Scale Pseudo Labelling
》,https://arxiv.org/abs/2311.00430,这篇文论提到了一个优化方案,它使用 Whisper 的 Large-v2 model 生成了一系列的 soft targets(也就是概率分布),然后复制 Whisper 网络的第一层和最后一层解码器,最后生成了一个更小、更快效果更好的蒸馏模型 Distil-Whisper。论文数据写的是:速度提高了 5.8 倍,参数减少了 51%,准确度保持在 99%。
这个模型的效果之所以不错,主要还是得益于训练数据的完备,它结合了九个公开可用的语音识别数据集,合并后包含 21170 小时的语音数据,涵盖超过 18260 名说话者和 10 个不同的领域;自从 Whisper 大力出奇迹(它从互联网爬取了 68w 小时的数据,未公开)以后,相信后续语音领域的论文都会配置更庞大的数据集。
Distil-Whisper 目前开源在 Hugging Face 上,模型地址:https://huggingface.co/distil-whisper/distil-large-v2,同时还提供了一个可在线测试的 Demo:https://huggingface.co/spaces/Xenova/distil-whisper-web,这个 Demo 会把模型下载到本地,然后通过 WebGPU 直接在网页上跑起来,测试了下效果,还是挺不错的。
目前仅支持英文,如果想让它支持中文,需要使用同样海量的中文语料数据,重新做一次知识蒸馏,但我觉得即便是这样做,效果也不一定好,因为 Whisper 本身对中文、韩语等支持就不太优秀,这个信息可以从 Whisper 的论文中找到数据支撑。
下面这个视频是 Whisper 和 Distil-Whisper 的对比效果:
Invalid media: video
#产品知识库
掌握以下这些设计原则,先不说能不能设计出好的作品,至少审美水平一定是可以提高的!
亲密性
将相关的元素组织在一起,使他们看起来是一个组,而非散乱彼此无关。
视觉有序性
要让读者的视觉路径是有序的,有明确的起点和终点,而非来回横跳,没有起始的。
对齐
让元素之间通过某种方式对齐,形成一条隐形的线,另外,左对齐和右对齐比居中对齐更好用,因为它们能够形成一条更硬的线,看起来效果更明显,一个页面最好只用一只对齐方式。
当然,在整体遵循对齐原则的基础上,可以通过某些元素打破对齐,从而达到刺激眼球的效果,但是既然打破就不会畏畏缩缩,要打破得足够彻底,如果只是稍微偏离一些,就会让人感觉像是错误。
重复
设计的某些方面需要在整个作品中重复。重复元素可能是一种粗字体、一条粗线、某个项目符号、颜色、设计要素、某种格式、空间关系等。读者能看到的任何方面都可以作为重复元素。视觉的重复可以让作品的各部分连接在一起,从而达到风格的统一,而不是彼此孤立。
对比
对比是为页面增加视觉效果的最有效的途径,也是在不同元素之间建立一种有组织的层次结构最有效方法。要记住一个重要规则:要想实现有效的对比,对比就必须强烈。千万不要畏畏缩缩。如果对比不够强烈,就会变成冲突,看起来非常难受,比如白色和浅灰色,让人感觉是失误导致的。
创建中心点
在页面上放一个很大、有趣而且明显的东西。如果能让读者的视线停在这个中心点上,他们往往更有可能阅读其余的文本。
留白
留白比密密麻麻铺满元素更能够吸引眼球驻足。留白也是对比的一种方式,在非常拥挤的页面上突然留下一些白,就能够让这个地方脱颖而出,吸引读者的注意。
掌握以下这些设计原则,先不说能不能设计出好的作品,至少审美水平一定是可以提高的!
亲密性
将相关的元素组织在一起,使他们看起来是一个组,而非散乱彼此无关。
视觉有序性
要让读者的视觉路径是有序的,有明确的起点和终点,而非来回横跳,没有起始的。
对齐
让元素之间通过某种方式对齐,形成一条隐形的线,另外,左对齐和右对齐比居中对齐更好用,因为它们能够形成一条更硬的线,看起来效果更明显,一个页面最好只用一只对齐方式。
当然,在整体遵循对齐原则的基础上,可以通过某些元素打破对齐,从而达到刺激眼球的效果,但是既然打破就不会畏畏缩缩,要打破得足够彻底,如果只是稍微偏离一些,就会让人感觉像是错误。
重复
设计的某些方面需要在整个作品中重复。重复元素可能是一种粗字体、一条粗线、某个项目符号、颜色、设计要素、某种格式、空间关系等。读者能看到的任何方面都可以作为重复元素。视觉的重复可以让作品的各部分连接在一起,从而达到风格的统一,而不是彼此孤立。
对比
对比是为页面增加视觉效果的最有效的途径,也是在不同元素之间建立一种有组织的层次结构最有效方法。要记住一个重要规则:要想实现有效的对比,对比就必须强烈。千万不要畏畏缩缩。如果对比不够强烈,就会变成冲突,看起来非常难受,比如白色和浅灰色,让人感觉是失误导致的。
创建中心点
在页面上放一个很大、有趣而且明显的东西。如果能让读者的视线停在这个中心点上,他们往往更有可能阅读其余的文本。
留白
留白比密密麻麻铺满元素更能够吸引眼球驻足。留白也是对比的一种方式,在非常拥挤的页面上突然留下一些白,就能够让这个地方脱颖而出,吸引读者的注意。
👍3❤1
#产品知识库
最近再次开始沉迷多邻国,他们真的挺有意思
1.通知发送策略
根据 CEO 在 TED 的演讲分享,有几个亮点:
1)连续签到的展示
有超过100万的日活用户连续签到天数在365天以上,连续签到最久的是日本人
2)通知发送时机:
- 如果连续 7 天忽视通知,第 7 天会发一个通知告知之后不会再发送,第 7 天反而会有更多的用户打开
- 通知的最佳发送时间是在上一次使用后的 24 小时。因为前一天有空,今天同样的时间也大概率有空
另外,还有个有意思的点是连胜 30 天会解锁隐藏图标。对于这里,个人觉得最大的作用是,当你在 30 天之后,某天没有如期打卡,通知里的应用图标是橙色的,会更显眼更 emergency 的感觉
2.情绪的传递设计 - 小组件 “你完全不学是吗”
通过文案+组件人物的状态传递情绪,安装小组件的学习者中有一半至少维持了六个月的连续学习记录
他们写的一个设计思路挺有意思的:https://blog.duolingo.com/widget-feature/
3.分级排行榜
学习意愿↑-》每天打卡↑-》进入高等级分组排行榜-》分组互卷
更会每天打卡,因为排行榜前 7 位才能到下一个等级。越到后面越卷
促进卷的手段也很明确:
每个单元结束,经验+80,远高于日常小单元。并且还能获得 15min 经验值 double的 buff。这个使用时长又上来了
ps:他们有web 版是我没想到的,EDM 的链接是跳转到web
最近再次开始沉迷多邻国,他们真的挺有意思
1.通知发送策略
根据 CEO 在 TED 的演讲分享,有几个亮点:
1)连续签到的展示
有超过100万的日活用户连续签到天数在365天以上,连续签到最久的是日本人
2)通知发送时机:
- 如果连续 7 天忽视通知,第 7 天会发一个通知告知之后不会再发送,第 7 天反而会有更多的用户打开
- 通知的最佳发送时间是在上一次使用后的 24 小时。因为前一天有空,今天同样的时间也大概率有空
另外,还有个有意思的点是连胜 30 天会解锁隐藏图标。对于这里,个人觉得最大的作用是,当你在 30 天之后,某天没有如期打卡,通知里的应用图标是橙色的,会更显眼更 emergency 的感觉
2.情绪的传递设计 - 小组件 “你完全不学是吗”
通过文案+组件人物的状态传递情绪,安装小组件的学习者中有一半至少维持了六个月的连续学习记录
他们写的一个设计思路挺有意思的:https://blog.duolingo.com/widget-feature/
3.分级排行榜
学习意愿↑-》每天打卡↑-》进入高等级分组排行榜-》分组互卷
更会每天打卡,因为排行榜前 7 位才能到下一个等级。越到后面越卷
促进卷的手段也很明确:
每个单元结束,经验+80,远高于日常小单元。并且还能获得 15min 经验值 double的 buff。这个使用时长又上来了
ps:他们有web 版是我没想到的,EDM 的链接是跳转到web
👍9