#程序员
OpenAI 开源的 Whisper 大模型,https://github.com/openai/whisper,基本上解决了 ASR (Automatic Speech Recognition)的问题,包括语音识别、翻译、VAD 检测等,其效果与各大厂收费的产品相比,不相上下,也算是作为一个搅局者加入到了整个市场。
云厂商识别 1 小时的语音,标价大概在 1~3 元(参考国内云厂商计费),而 Whisper,最大的模型也就是 1.5B 参数(tiny 仅 39M,大小 ~1Gb),本地部署也就消耗下电费。
关于 Whisper 模型,《Robust Speech Recognition via Large-Scale Weak Supervision》,https://arxiv.org/pdf/2212.04356.pdf,这篇论文给出了详细的分析,从架构设计来看,它是一个标准的 Transformer encoder-decoder 架构,没有增加大的创新,之所以效果如此好,主打一个“大力出奇迹”。
它从互联网抓取了 68w 小时的数据进行训练,甚至都没有经历微调阶段和增强学习阶段,预训练模型默认好用。之前之所以没人这么干,是因为音视频数据一般都存在版权问题,要抓取 68w 小时如此庞大规模的数据量,很可能会涉及到了版权纠纷,另外,作者在论文也没有透露数据来源。当然,它公开了代码、训练过程和数据等情况,其有效性和价值是不可否认的。
这篇论文中提到,当前任务处理效果最好的是英语,基本上已经接近人类的水平(词错率 5.8%),但是在韩语、中文上,效果还是要差一些,仍有优化空间。更多详情可以听一听李沐在 B 站的《OpenAI Whisper 精读》,聊得比较有意思,https://www.bilibili.com/video/BV1VG4y1t74x
OpenAI 开源的 Whisper 大模型,https://github.com/openai/whisper,基本上解决了 ASR (Automatic Speech Recognition)的问题,包括语音识别、翻译、VAD 检测等,其效果与各大厂收费的产品相比,不相上下,也算是作为一个搅局者加入到了整个市场。
云厂商识别 1 小时的语音,标价大概在 1~3 元(参考国内云厂商计费),而 Whisper,最大的模型也就是 1.5B 参数(tiny 仅 39M,大小 ~1Gb),本地部署也就消耗下电费。
关于 Whisper 模型,《Robust Speech Recognition via Large-Scale Weak Supervision》,https://arxiv.org/pdf/2212.04356.pdf,这篇论文给出了详细的分析,从架构设计来看,它是一个标准的 Transformer encoder-decoder 架构,没有增加大的创新,之所以效果如此好,主打一个“大力出奇迹”。
它从互联网抓取了 68w 小时的数据进行训练,甚至都没有经历微调阶段和增强学习阶段,预训练模型默认好用。之前之所以没人这么干,是因为音视频数据一般都存在版权问题,要抓取 68w 小时如此庞大规模的数据量,很可能会涉及到了版权纠纷,另外,作者在论文也没有透露数据来源。当然,它公开了代码、训练过程和数据等情况,其有效性和价值是不可否认的。
这篇论文中提到,当前任务处理效果最好的是英语,基本上已经接近人类的水平(词错率 5.8%),但是在韩语、中文上,效果还是要差一些,仍有优化空间。更多详情可以听一听李沐在 B 站的《OpenAI Whisper 精读》,聊得比较有意思,https://www.bilibili.com/video/BV1VG4y1t74x
Forwarded from 出海🚢&自媒体运营秘籍
被巨头全面压制,增长乏力,找不到突破口,是很多企业面临的问题。
找到和放大自身优势,才能提升竞争力。这个道理老板们肯定懂,关键是怎么找。
以小红书为例,分析他们是如何找到和落地的,希望能有启发。
先说背景。
小红书在最近3年飞速增长,在短视频平台中找到自己的位置,核心战略思想,就是错位竞争。
也就是,抖音做得好的,小红书就不做,而是在自己优势领域做突破和创新。
趋势,就是小红书构建的差异化优势之一。
比如之前的飞盘和露营,就是从小红书火起来的,催生了整个行业的快速发展。这并不是偶然现象,而是有目标的在探索和推动。
小红书是如何找到和落地这个差异化优势呢,如下图。
大致流程:
结合受众需求和平台优势,设计达成路径并执行,最后在完成正向闭环之后,再回到需求阶段,反复循环。
在这个过程中,要有清晰的目标导向和资源支持,是做好这事的基础。
1、受众需求:潮流先锋、好看有用
我们在找优势的时候,肯定不能凭空想象,要源于现有要素。只要你的公司或产品还活着,就一定有特点,或者至少有侧重点。
小红书的受众主力是一二线的年轻女性,对美好的事物更敏感,追求时尚,要走在时代潮流的前面。
有新鲜的事物、文化、产品,她们有能力在第一时间发现,并且积极的去尝试。
这点大家都懂,就不展开了。
2、平台特征:与竞品差异化、爆发前置
种草,是小红书的一个关键特征。 讲的是产生消费行为之前的那一步,也就是决策阶段。
按照这个逻辑,把用户完整的消费行为,分为:决策→交易→履约。
在消费决策这个环节,小红书是做得最好的。
但在交易和履约环节,有淘天、抖音、京东、美团等巨头,短期内小红书肯定比不了。先不说履约,在流量和销量的爆发力上,小红书也没有任何优势。
所以,最好的策略还是避开短板,把爆发点前置。 从决策出发,再延伸到相关联的交易环节。
爆发前置,其中一个内容方向,就是趋势。 也符合用户需求,是靠谱的策略。
3、达成路径:流量干预、传播助推
不只敢想,还得能做。策略要有可执行性,才有意义。
执行路径是这样的:监控→发现→助推→传播。 在这个过程中,需要工具和资源。比如,
1)能看到一段时间内的数据走势的后台,不仅能看到趋势的变化,内容分类的颗粒度也要足够细致。
2)能助推内容的流量,而且一定是能分发出去的流量。运营在依赖主观判断后,可以人工投放做尝试,看看客观指标的反馈。
找到和放大自身优势,才能提升竞争力。这个道理老板们肯定懂,关键是怎么找。
以小红书为例,分析他们是如何找到和落地的,希望能有启发。
先说背景。
小红书在最近3年飞速增长,在短视频平台中找到自己的位置,核心战略思想,就是错位竞争。
也就是,抖音做得好的,小红书就不做,而是在自己优势领域做突破和创新。
趋势,就是小红书构建的差异化优势之一。
比如之前的飞盘和露营,就是从小红书火起来的,催生了整个行业的快速发展。这并不是偶然现象,而是有目标的在探索和推动。
小红书是如何找到和落地这个差异化优势呢,如下图。
大致流程:
结合受众需求和平台优势,设计达成路径并执行,最后在完成正向闭环之后,再回到需求阶段,反复循环。
在这个过程中,要有清晰的目标导向和资源支持,是做好这事的基础。
1、受众需求:潮流先锋、好看有用
我们在找优势的时候,肯定不能凭空想象,要源于现有要素。只要你的公司或产品还活着,就一定有特点,或者至少有侧重点。
小红书的受众主力是一二线的年轻女性,对美好的事物更敏感,追求时尚,要走在时代潮流的前面。
有新鲜的事物、文化、产品,她们有能力在第一时间发现,并且积极的去尝试。
这点大家都懂,就不展开了。
2、平台特征:与竞品差异化、爆发前置
种草,是小红书的一个关键特征。 讲的是产生消费行为之前的那一步,也就是决策阶段。
按照这个逻辑,把用户完整的消费行为,分为:决策→交易→履约。
在消费决策这个环节,小红书是做得最好的。
但在交易和履约环节,有淘天、抖音、京东、美团等巨头,短期内小红书肯定比不了。先不说履约,在流量和销量的爆发力上,小红书也没有任何优势。
所以,最好的策略还是避开短板,把爆发点前置。 从决策出发,再延伸到相关联的交易环节。
爆发前置,其中一个内容方向,就是趋势。 也符合用户需求,是靠谱的策略。
3、达成路径:流量干预、传播助推
不只敢想,还得能做。策略要有可执行性,才有意义。
执行路径是这样的:监控→发现→助推→传播。 在这个过程中,需要工具和资源。比如,
1)能看到一段时间内的数据走势的后台,不仅能看到趋势的变化,内容分类的颗粒度也要足够细致。
2)能助推内容的流量,而且一定是能分发出去的流量。运营在依赖主观判断后,可以人工投放做尝试,看看客观指标的反馈。
👍5❤1
后来做大的产业,往往不是“我怎么没想到”,而是“我没想到这个如此有价值”
比如蒸汽机车的原理,拿给古人看,也是能看懂的:“这不就是烧水顶壶盖”。但意识不到原理背后的巨大效率升级,因为古人见过的机械玩具多了,但游牧民族的铁浮屠马才是古人心目中的最强噩梦啊
除非他们看到热水壶盖驱动巨大铁船从长江口逆流而上来签条约,才会被吓昏厥,记住这三千年未有之大噩梦,“没想到奇技淫巧玩具比铁浮屠马更有价值”
一切的起源,就是明明不认识,却用“这不就是我认识的xx”眼光去看待
比如蒸汽机车的原理,拿给古人看,也是能看懂的:“这不就是烧水顶壶盖”。但意识不到原理背后的巨大效率升级,因为古人见过的机械玩具多了,但游牧民族的铁浮屠马才是古人心目中的最强噩梦啊
除非他们看到热水壶盖驱动巨大铁船从长江口逆流而上来签条约,才会被吓昏厥,记住这三千年未有之大噩梦,“没想到奇技淫巧玩具比铁浮屠马更有价值”
一切的起源,就是明明不认识,却用“这不就是我认识的xx”眼光去看待
👍3
Forwarded from AI探索指南
刚刚,ChatGPT 崩了
倘若你现在登录 ChatGPT 的界面,你会发现界面上挂着这样一句话。 「我们正在经历异常高的需求,请耐心等待,我们正在努力扩大我们的系统。」 😱 伴随着 ChatGPT 的崩溃,所有的聊天记录和自定义 GPT 都已经消失,「ChatGPT Alpha」也出现在模型选择下拉列表中。 18 天前在 OpenAI 开发者论坛上的一篇文章表明,「ChatGPT Alpha」可能是类似于 GPT-4 All Tools 的版本,可供免费用户使用。 有网友分析称,有可能是因为 OpenAI 即将发布 ChatGPT Alpha,然后 ChatGPT 就猝不及防地崩了。 💥 而今天凌晨 OpenAI 宣布在 ChatGPT 移动端上提供可供所有免费用户使用的语音功能 ChatGPT Voice。大量免费用户的涌入或许也是耗尽 OpenAI 的计算能力的原因之一。 截至发稿前,ChatGPT 尚未恢复。目前尚不知道这次宕机,是否受到了 OpenAI 内部动荡的影响
倘若你现在登录 ChatGPT 的界面,你会发现界面上挂着这样一句话。 「我们正在经历异常高的需求,请耐心等待,我们正在努力扩大我们的系统。」 😱 伴随着 ChatGPT 的崩溃,所有的聊天记录和自定义 GPT 都已经消失,「ChatGPT Alpha」也出现在模型选择下拉列表中。 18 天前在 OpenAI 开发者论坛上的一篇文章表明,「ChatGPT Alpha」可能是类似于 GPT-4 All Tools 的版本,可供免费用户使用。 有网友分析称,有可能是因为 OpenAI 即将发布 ChatGPT Alpha,然后 ChatGPT 就猝不及防地崩了。 💥 而今天凌晨 OpenAI 宣布在 ChatGPT 移动端上提供可供所有免费用户使用的语音功能 ChatGPT Voice。大量免费用户的涌入或许也是耗尽 OpenAI 的计算能力的原因之一。 截至发稿前,ChatGPT 尚未恢复。目前尚不知道这次宕机,是否受到了 OpenAI 内部动荡的影响
【睡前消息673】模范夫妻中国梦 毁在融创烂尾楼_哔哩哔哩_bilibili
督工太敢说了😭
▪️▪️▪️
“产业升级这种事
而是要看动力比阻力大多少
至少在航天领域
美国资本市场
和创新环境带来的好处
要远大于官僚主义
和部分民间利益集团的坏处
所以马斯克还能够领跑世界”
▪️▪️▪️
“望算总账的时候好看一些
就得忍痛割掉土地财政这个毒瘤
要在外资退潮的背景下
找到产业升级路线
让普通的年轻人
得到合理的回报”
▪️▪️▪️
“产业升级是个艰难的事情
不可能立刻就起效
这个时候基本的素质
就是承认之前的错误
上下共担转型期的压力
同甘共苦才是领导者的样子”
督工太敢说了😭
▪️▪️▪️
“产业升级这种事
而是要看动力比阻力大多少
至少在航天领域
美国资本市场
和创新环境带来的好处
要远大于官僚主义
和部分民间利益集团的坏处
所以马斯克还能够领跑世界”
▪️▪️▪️
“望算总账的时候好看一些
就得忍痛割掉土地财政这个毒瘤
要在外资退潮的背景下
找到产业升级路线
让普通的年轻人
得到合理的回报”
▪️▪️▪️
“产业升级是个艰难的事情
不可能立刻就起效
这个时候基本的素质
就是承认之前的错误
上下共担转型期的压力
同甘共苦才是领导者的样子”
👍1