Deepseek R1可能找到了超越人类的办法
这篇讲 deepseek R1 的文章蛮不错的。
核心观点就是,R1 的价值主要不是低成本实现比肩 openai 领先模型的性能水平,而是其前置模型 R1-Xero“揭示了强化学习可以不依赖人类反馈,纯RL 也能训练出最强的 reasoning 模型”,从而展示了:
1 2024 年预训练因为世界数据不够而撞墙的 scaling law 找到新的作用路径(算力可以翻倍,但是训练的材料翻不了倍,每年人类产生的新数据相较于过往数据汇总只是一点点的增加)
2 如果依靠人类反馈,那理论上AI 只能比肩人类,不能超越人类,如果 AI 现在可能纯纯通过 RL 来获得能力,那理论上 AI 是可以超越人类的(所以)
(所以去年 openai 上了 o1 之后说,通往 AGI 的道路上再无阻碍,抛开PR 意图,可能就是这个背后的逻辑,只不过openai 是闭源的,所以没有 deepseek 这次这么 strong 的揭示)
这篇讲 deepseek R1 的文章蛮不错的。
核心观点就是,R1 的价值主要不是低成本实现比肩 openai 领先模型的性能水平,而是其前置模型 R1-Xero“揭示了强化学习可以不依赖人类反馈,纯RL 也能训练出最强的 reasoning 模型”,从而展示了:
1 2024 年预训练因为世界数据不够而撞墙的 scaling law 找到新的作用路径(算力可以翻倍,但是训练的材料翻不了倍,每年人类产生的新数据相较于过往数据汇总只是一点点的增加)
2 如果依靠人类反馈,那理论上AI 只能比肩人类,不能超越人类,如果 AI 现在可能纯纯通过 RL 来获得能力,那理论上 AI 是可以超越人类的(所以)
(所以去年 openai 上了 o1 之后说,通往 AGI 的道路上再无阻碍,抛开PR 意图,可能就是这个背后的逻辑,只不过openai 是闭源的,所以没有 deepseek 这次这么 strong 的揭示)
👍3
最近尝试使用Reddit,刚一看市值,竟然接近400亿美元,震惊了。这产品为啥能够做成?有啥独特之处?和百度贴吧有啥区别吗?审核机制估计是个关键点。Reddit成立是在2005年,这时候的百度贴吧早就很火热了。
R1 让大模型从过去两年的 Early adopter(早期采用者)跨越到 Early majority(早期大众),这是很多厂商关注到的要素变化,但只有极少数在产品和营销层面重新说另一种人话
过去我们这些 Early adopter 使用决策是大模型的 “智力”,说人话就是要用参数体现性能有多吊
但 Early adopter 的使用决策并不会对 Early majority 群体产生参照,所以 “联网” “满血” “671B” “全尺寸” “推理” “思维链” 这些语言体系要变为另一种人话了
不过比语言体系更彻底的还是回归到场景化思维,DeepSeek 的 “无需复杂 prompt” 和 “白盒化” ,以及纳米 AI 的 “默认输入为语音形式” 算是一些不大不小的场景回归
两年多了,产品经理老乡们,属于你们的机会怕是真的要来了
过去我们这些 Early adopter 使用决策是大模型的 “智力”,说人话就是要用参数体现性能有多吊
但 Early adopter 的使用决策并不会对 Early majority 群体产生参照,所以 “联网” “满血” “671B” “全尺寸” “推理” “思维链” 这些语言体系要变为另一种人话了
不过比语言体系更彻底的还是回归到场景化思维,DeepSeek 的 “无需复杂 prompt” 和 “白盒化” ,以及纳米 AI 的 “默认输入为语音形式” 算是一些不大不小的场景回归
两年多了,产品经理老乡们,属于你们的机会怕是真的要来了
🔥 网站收录终极指南!除了谷歌,把这些搜索引擎都提交上实现流量起飞! 🚀
想让你的网站获得更多流量,被更多人发现?谷歌只是众多搜索引擎之一,全球还有那么多的搜索引擎,一个也不能放过
🌍 国外搜索引擎
🔍 Google(全球最大搜索引擎)
👉 使用Google Search Console → 添加你的网站
🔗 https://search.google.com/search-console
🔍 Bing(微软旗下,欧美常用)
👉 进入Bing webmaster → 提交网站
🔗 https://www.bing.com/webmasters
🔍 Yandex(俄罗斯流量王)
👉 Yandex webmaster → 添加你的网站
🔗 https://webmaster.yandex.com/
🔍 Naver(韩国主流搜索引擎)
👉 Naver站长工具 → 提交网站
🔗 https://searchadvisor.naver.com
🔍 DuckDuckGo(隐私友好型搜索引擎)
👉 DuckDuckGo没有站长工具,但它的结果来自Bing和Yandex,提交到Bing和Yandex即可覆盖!
🔍 Seznam(捷克主流搜索引擎)
👉 Seznam站长工具 → 添加网站
🔗 https://napoveda.seznam.cz
🇨🇳 国内搜索引擎
🔍 百度(中国最大搜索引擎)
👉 百度搜索平台 → 提交链接
🔗 快速提交:https://ziyuan.baidu.com/linksubmit/url
✨ 高阶玩法:用百度站长工具深度优化!
🔗 进阶入口:https://ziyuan.baidu.com
🔍 360搜索(中国常用搜索引擎)
👉 360站长平台 → 提交链接
🔗 https://zhanzhang.so.com
🔍 Sogou(搜狗搜索)
👉 搜狗站长平台 → 提交网站
🔗 https://zhanzhang.sogou.com
📈 提交后别忘了定期检查收录状态!
想让你的网站获得更多流量,被更多人发现?谷歌只是众多搜索引擎之一,全球还有那么多的搜索引擎,一个也不能放过
🌍 国外搜索引擎
🔍 Google(全球最大搜索引擎)
👉 使用Google Search Console → 添加你的网站
🔗 https://search.google.com/search-console
🔍 Bing(微软旗下,欧美常用)
👉 进入Bing webmaster → 提交网站
🔗 https://www.bing.com/webmasters
🔍 Yandex(俄罗斯流量王)
👉 Yandex webmaster → 添加你的网站
🔗 https://webmaster.yandex.com/
🔍 Naver(韩国主流搜索引擎)
👉 Naver站长工具 → 提交网站
🔗 https://searchadvisor.naver.com
🔍 DuckDuckGo(隐私友好型搜索引擎)
👉 DuckDuckGo没有站长工具,但它的结果来自Bing和Yandex,提交到Bing和Yandex即可覆盖!
🔍 Seznam(捷克主流搜索引擎)
👉 Seznam站长工具 → 添加网站
🔗 https://napoveda.seznam.cz
🇨🇳 国内搜索引擎
🔍 百度(中国最大搜索引擎)
👉 百度搜索平台 → 提交链接
🔗 快速提交:https://ziyuan.baidu.com/linksubmit/url
✨ 高阶玩法:用百度站长工具深度优化!
🔗 进阶入口:https://ziyuan.baidu.com
🔍 360搜索(中国常用搜索引擎)
👉 360站长平台 → 提交链接
🔗 https://zhanzhang.so.com
🔍 Sogou(搜狗搜索)
👉 搜狗站长平台 → 提交网站
🔗 https://zhanzhang.sogou.com
📈 提交后别忘了定期检查收录状态!
❤1
8点1氪:多家航司回应不得低于200元卖票;《哪吒2》成全球票房前30唯一非好莱坞影片;DeepSeek优惠期结束,价格上调
《多家航司回应不得低于 200 元卖票;《哪吒 2》成全球票房前 30 唯一非好莱坞影片;DeepSeek 优惠期结束,价格上调》摘要由【知我AI】生成👇
🖥官网(建议电脑打开):https://knowme.xiaoduoai.com/index
📔 一句话总结
本文涵盖了多个领域的新闻,包括电影票房、科技产品、商业动态、社会政策等。
📖 文章摘要
【Q】《哪吒之魔童闹海》票房情况如何?
【A】影片《哪吒之魔童闹海》总票房(含预售)突破 11.52 亿美元,进入全球影史票房榜前 30 名。
【Q】DeepSeek-V3 API 价格有何变化?
【A】DeepSeek-V3 API 服务的优惠价格体验期结束,每百万输出 tokens 由 2 元升至 8 元。
【Q】喜茶为何暂停接受事业合伙申请?
【A】喜茶拒绝门店规模内卷,认为新茶饮行业的“数字游戏”已走到尽头。
【Q】超级碗广告费用是多少?
【A】广告商们为超级碗期间的 30 秒广告时段支付了近 800 万美元。
【Q】《封神二》殷郊法相制作情况如何?
【A】三头六臂殷郊法相由 Scanline VFX 制作,制作周期超 18 个月。
原文共 5842 字,阅读需要约 13 分钟,点击可生成思维导图:https://kmai.xiaoduoai.com/api/v1/v/Ld43DohA
《多家航司回应不得低于 200 元卖票;《哪吒 2》成全球票房前 30 唯一非好莱坞影片;DeepSeek 优惠期结束,价格上调》摘要由【知我AI】生成👇
🖥官网(建议电脑打开):https://knowme.xiaoduoai.com/index
📔 一句话总结
本文涵盖了多个领域的新闻,包括电影票房、科技产品、商业动态、社会政策等。
📖 文章摘要
【Q】《哪吒之魔童闹海》票房情况如何?
【A】影片《哪吒之魔童闹海》总票房(含预售)突破 11.52 亿美元,进入全球影史票房榜前 30 名。
【Q】DeepSeek-V3 API 价格有何变化?
【A】DeepSeek-V3 API 服务的优惠价格体验期结束,每百万输出 tokens 由 2 元升至 8 元。
【Q】喜茶为何暂停接受事业合伙申请?
【A】喜茶拒绝门店规模内卷,认为新茶饮行业的“数字游戏”已走到尽头。
【Q】超级碗广告费用是多少?
【A】广告商们为超级碗期间的 30 秒广告时段支付了近 800 万美元。
【Q】《封神二》殷郊法相制作情况如何?
【A】三头六臂殷郊法相由 Scanline VFX 制作,制作周期超 18 个月。
原文共 5842 字,阅读需要约 13 分钟,点击可生成思维导图:https://kmai.xiaoduoai.com/api/v1/v/Ld43DohA
❤1
Forwarded from AI探索指南
DeepSeek R1 + 深度研究 + Ollama 新玩法:
下载Ollama Deep Researcher,在本机装好 R1 。
然后给 R1 一个主题,观察它搜索网络、学习、反思、搜索更多内容。
它会自动重复此过程, 想让它研究多久,它就研究多久。
最后它会给出一份研究彻底的报告,报告附有它看过的所有信息来源。
该项目和模型全部开源。
M1 的 Mac 就可以跑起来
Ollama Deep Researcher GitHub 地址:https://github.com/langchain-ai/ollama-deep-researcher
DeepSeek R1 Ollama 模型地址:https://ollama.com/library/deepseek-r1
下载Ollama Deep Researcher,在本机装好 R1 。
然后给 R1 一个主题,观察它搜索网络、学习、反思、搜索更多内容。
它会自动重复此过程, 想让它研究多久,它就研究多久。
最后它会给出一份研究彻底的报告,报告附有它看过的所有信息来源。
该项目和模型全部开源。
M1 的 Mac 就可以跑起来
Ollama Deep Researcher GitHub 地址:https://github.com/langchain-ai/ollama-deep-researcher
DeepSeek R1 Ollama 模型地址:https://ollama.com/library/deepseek-r1