OpenAI 发布新一代大型多模态模型 GPT-4
GPT-4,这是GPT系列模型中的最新一代大型多模态模型,能够处理图像和文本输入并生成文本输出。三个方面:
1.GPT-4的性能:GPT-4在多种人类设计的测试中表现出色,往往超过了绝大多数人类测试者的得分。例如,在模拟律师资格考试中,GPT-4的得分位于前10%,而GPT-3.5的得分则位于后10%。在传统的自然语言处理基准测试中,GPT-4不仅胜过了之前的大型语言模型,还超过了许多最先进的系统。
2.GPT-4的局限性:尽管具有强大的功能,GPT-4仍然具有类似于早期GPT模型的局限性,例如不完全可靠(可能产生"幻觉"),有限的上下文窗口以及无法从经验中学习。因此,在关注可靠性的场景中使用GPT-4时应谨慎。
3.安全挑战及应对措施:报告强调了GPT-4的功能和局限性带来的重大且新颖的安全挑战。文章还详细描述了一些预期的风险,包括偏见、虚假信息、过度依赖、隐私、网络安全、扩散等。此外,还介绍了为减轻GPT-4部署可能带来的潜在危害而采取的干预措施,包括与领域专家进行对抗性测试以及采用模型辅助安全管道。
现在部分 ChatGPT Plus 的用户已经可以体验到 GPT-4 模型了
1. 使用会有上限,并且根据访问量来控制
2. 可能会引入除 Plus 外的新的订阅级别
GPT-4,这是GPT系列模型中的最新一代大型多模态模型,能够处理图像和文本输入并生成文本输出。三个方面:
1.GPT-4的性能:GPT-4在多种人类设计的测试中表现出色,往往超过了绝大多数人类测试者的得分。例如,在模拟律师资格考试中,GPT-4的得分位于前10%,而GPT-3.5的得分则位于后10%。在传统的自然语言处理基准测试中,GPT-4不仅胜过了之前的大型语言模型,还超过了许多最先进的系统。
2.GPT-4的局限性:尽管具有强大的功能,GPT-4仍然具有类似于早期GPT模型的局限性,例如不完全可靠(可能产生"幻觉"),有限的上下文窗口以及无法从经验中学习。因此,在关注可靠性的场景中使用GPT-4时应谨慎。
3.安全挑战及应对措施:报告强调了GPT-4的功能和局限性带来的重大且新颖的安全挑战。文章还详细描述了一些预期的风险,包括偏见、虚假信息、过度依赖、隐私、网络安全、扩散等。此外,还介绍了为减轻GPT-4部署可能带来的潜在危害而采取的干预措施,包括与领域专家进行对抗性测试以及采用模型辅助安全管道。
现在部分 ChatGPT Plus 的用户已经可以体验到 GPT-4 模型了
1. 使用会有上限,并且根据访问量来控制
2. 可能会引入除 Plus 外的新的订阅级别
👍8
Poe —— 由 Quora 推出的聊天机器人平台
目前已支持GPT4 👍
Poe 已有 iOS,网页还有 MacOS 版本供大家使用。 Quora 的 CEO Adam D’Angelo 提到,他们之后还会针对不同任务,创建更多的机器人
Poe 目前在平台上面提供 OpenAI 还有 Anthropic 的模型。 Anthropic 是由前 OpenAI 员工出来建立的公司,也是 OpenAI 最大的竞争者之一。在我个人体验下来,他们的模型 Claude 比 OpenAI 好用很多,回答没有那么模糊,对于指令也可以以完整性更高的情况下完成(看上图)
Poe 上目前只支援 OpenAI 和 Anthropic 的模型,但是在可预见的未来,将会出现一个持续成长的人工智慧生态系。
Quora 将 Poe 视为独立的新产品发展,并且当 Poe 足够成熟时,还会在 Quora 上发布由 Poe 产生的内容。 Adam 表示,未来如果他们选择使用Quora平台资料训练模型,也会尊重平台上的创作者,让创作依意愿选择退出
免费使用
https://poe.com/
目前已支持GPT4 👍
Poe 已有 iOS,网页还有 MacOS 版本供大家使用。 Quora 的 CEO Adam D’Angelo 提到,他们之后还会针对不同任务,创建更多的机器人
Poe 目前在平台上面提供 OpenAI 还有 Anthropic 的模型。 Anthropic 是由前 OpenAI 员工出来建立的公司,也是 OpenAI 最大的竞争者之一。在我个人体验下来,他们的模型 Claude 比 OpenAI 好用很多,回答没有那么模糊,对于指令也可以以完整性更高的情况下完成(看上图)
Poe 上目前只支援 OpenAI 和 Anthropic 的模型,但是在可预见的未来,将会出现一个持续成长的人工智慧生态系。
Quora 将 Poe 视为独立的新产品发展,并且当 Poe 足够成熟时,还会在 Quora 上发布由 Poe 产生的内容。 Adam 表示,未来如果他们选择使用Quora平台资料训练模型,也会尊重平台上的创作者,让创作依意愿选择退出
免费使用
https://poe.com/
Poe
Poe - Fast, Helpful AI Chat
Chat with the best AI, privately or in a group chat. Explore GPT-5, Claude-Sonnet-4.5, DeepSeek-R1, Veo-3.1, Sora-2, and thousands of others, all on Poe.
❤1
#工程师工具 看到一个柔和主题库 「 Catppuccin」,提供不沉闷也不明亮眼的 4 种不同的效果,适配了当前市面上绝大多少软件工具对应的主题,值得喜欢折腾的同学把玩一番。
🤖 https://github.com/catppuccin/catppuccin
🤖 https://github.com/catppuccin/catppuccin
❤1
#职场社畜日常
感觉经过200个小时的晋级答辩准备,我真的开窍了。说实话我在8升9、9升10的时候,跟大多数人一样非常愤世嫉俗,觉得制度垃圾、业务边缘、领导不行、评委不懂。
但这次我突然意识到,晋级答辩的目标就是:通过论述技巧去向别人证明你很厉害。这个论述技能其实就是在工作中广泛受用的说服能力。
把它当成一个游戏,把“业务价值不好证明”、“评委对这块儿事不够了解”当作关卡,想办法去攻破它,而不是埋怨它。
这本身就是一个闯关游戏,在闯关游戏中,你会因为关卡玩法太丰富而认为游戏垃圾么?
牛逼的人不正是那些一把烂牌也能赢的,不排除牌真的太烂了,只是绝大多数的人手里的牌真的没有他们想象中那么烂而已。
感觉经过200个小时的晋级答辩准备,我真的开窍了。说实话我在8升9、9升10的时候,跟大多数人一样非常愤世嫉俗,觉得制度垃圾、业务边缘、领导不行、评委不懂。
但这次我突然意识到,晋级答辩的目标就是:通过论述技巧去向别人证明你很厉害。这个论述技能其实就是在工作中广泛受用的说服能力。
把它当成一个游戏,把“业务价值不好证明”、“评委对这块儿事不够了解”当作关卡,想办法去攻破它,而不是埋怨它。
这本身就是一个闯关游戏,在闯关游戏中,你会因为关卡玩法太丰富而认为游戏垃圾么?
牛逼的人不正是那些一把烂牌也能赢的,不排除牌真的太烂了,只是绝大多数的人手里的牌真的没有他们想象中那么烂而已。
👍1
#运营
正好上午有个朋友问了一个非常好的问题,顺便讨论一下公众号到底该怎么做?
首先我们简单地切一刀,公众号的流量可以分为两块,一块是搜索流量,一块是推荐流量。
搜索流量在公众号里又可以切两刀,一块是热点搜索流量,一块是非热点搜索流量。
根据这个流量的属性的话,我们可以得出两种公众号。
一种是专门做热点的,最常见的就是微博出现了某热点,然后公众号跟进,写热点事件过程,写观点,写故事,重点是做关键词。
第二种就是做非热点的搜索流量,这种一般是垂直领域的,重点也是做关键词。
前者追求的是速度,大部分个体是干不了的,为什么?因为媒体或者说自媒体对某些领域内的热点稿件的结构了然于心。
所以这种公众号最关键的就是拆解热点稿的结构,去模仿。
后者就不一样了,后者追求的是内容能否解决用户的问题,比如说用户搜如何下载壁纸,那你最好不要长篇大论,直接给我下载链接。
所以后者简单,但是考验你会不会留钩子,设置自动回复转关注。
前者也就是我们大部分所说的热点情绪文,后者就是我们所说的干货价值文。
那么问题来了,这两种文章真的不能结合在一起吗?
答案非也,前者最有价值的地方在于标题和文章的结构,后者最有价值的地方在于文末留的钩子。
所以,最简单的方法就是设置好自己的关键词回复,多给用户做资料包之类的福利,比如热点可以做吃瓜群,天下万物都可以变成福利送给用户。
除了这种方法之外,还有一个起号的方法,我个人独创的。
先花两个月做搜索,后续再做情绪文。
搜索做到200个,保证每天公众号有稳定的搜索流量进来。
方法吗,暂且容我保密🍉
正好上午有个朋友问了一个非常好的问题,顺便讨论一下公众号到底该怎么做?
首先我们简单地切一刀,公众号的流量可以分为两块,一块是搜索流量,一块是推荐流量。
搜索流量在公众号里又可以切两刀,一块是热点搜索流量,一块是非热点搜索流量。
根据这个流量的属性的话,我们可以得出两种公众号。
一种是专门做热点的,最常见的就是微博出现了某热点,然后公众号跟进,写热点事件过程,写观点,写故事,重点是做关键词。
第二种就是做非热点的搜索流量,这种一般是垂直领域的,重点也是做关键词。
前者追求的是速度,大部分个体是干不了的,为什么?因为媒体或者说自媒体对某些领域内的热点稿件的结构了然于心。
所以这种公众号最关键的就是拆解热点稿的结构,去模仿。
后者就不一样了,后者追求的是内容能否解决用户的问题,比如说用户搜如何下载壁纸,那你最好不要长篇大论,直接给我下载链接。
所以后者简单,但是考验你会不会留钩子,设置自动回复转关注。
前者也就是我们大部分所说的热点情绪文,后者就是我们所说的干货价值文。
那么问题来了,这两种文章真的不能结合在一起吗?
答案非也,前者最有价值的地方在于标题和文章的结构,后者最有价值的地方在于文末留的钩子。
所以,最简单的方法就是设置好自己的关键词回复,多给用户做资料包之类的福利,比如热点可以做吃瓜群,天下万物都可以变成福利送给用户。
除了这种方法之外,还有一个起号的方法,我个人独创的。
先花两个月做搜索,后续再做情绪文。
搜索做到200个,保证每天公众号有稳定的搜索流量进来。
方法吗,暂且容我保密🍉
【OpenAI 发布新一代大型多模态模型 GPT-4】
今天凌晨,创造出ChatGPT的美国 AI 公司OpenAI 正式对外发布GPT-4。
据悉,GPT-4 是一个大型多模态模型,可以接受文本和图像输入。GPT-4 在各种专业学术基准上有着人类水平表现,例如模拟律师考试中,GPT-4 的得分约为前10%,而 GPT-3.5 的得分约为倒数10%。
在多语言测试中,GPT-4 优于 GPT-3.5 和 Chinchilla (来自DeepMind) 还有 PaLM (来自谷歌) ,包括英语性能还有拉脱维亚语、威尔士语和斯瓦希里语等低资源语言。
OpenAI 还开放了角色扮演和性格定制能力,开发人员和用户可以自定义他们的AI风格,而不是具有固定冗长、语气和风格的经典 ChatGPT 个性。
ChatGPT Plus 订阅用户现可直接使用 GPT-4 ,未来将对免费用户开放一定数量的 GPT-4 体验。GPT-4 API 需要申请候选名单,每1k prompt tokens 的价格为$0.03,每1k completion tokens 的价格为$0.06。目前图像输入处在研究预览阶段,仅对少部分客户开放。
微软在 GPT-4 发布后也正式确认 Bing Chat 基于 GPT-4 运行,同时 Bing Chat 的 Edge 边栏功能上线。与数据停留在2021年9月的 GPT-4 离线版本不同,Bing Chat 可联网获取实时信息并且免费。
今天凌晨,创造出ChatGPT的美国 AI 公司OpenAI 正式对外发布GPT-4。
据悉,GPT-4 是一个大型多模态模型,可以接受文本和图像输入。GPT-4 在各种专业学术基准上有着人类水平表现,例如模拟律师考试中,GPT-4 的得分约为前10%,而 GPT-3.5 的得分约为倒数10%。
在多语言测试中,GPT-4 优于 GPT-3.5 和 Chinchilla (来自DeepMind) 还有 PaLM (来自谷歌) ,包括英语性能还有拉脱维亚语、威尔士语和斯瓦希里语等低资源语言。
OpenAI 还开放了角色扮演和性格定制能力,开发人员和用户可以自定义他们的AI风格,而不是具有固定冗长、语气和风格的经典 ChatGPT 个性。
ChatGPT Plus 订阅用户现可直接使用 GPT-4 ,未来将对免费用户开放一定数量的 GPT-4 体验。GPT-4 API 需要申请候选名单,每1k prompt tokens 的价格为$0.03,每1k completion tokens 的价格为$0.06。目前图像输入处在研究预览阶段,仅对少部分客户开放。
微软在 GPT-4 发布后也正式确认 Bing Chat 基于 GPT-4 运行,同时 Bing Chat 的 Edge 边栏功能上线。与数据停留在2021年9月的 GPT-4 离线版本不同,Bing Chat 可联网获取实时信息并且免费。
#程序员
Q:什么是GPT4?
A:GPT4是由OpenAI开发的一种自然语言处理模型,它具有极高的语言理解和生成能力。于北京时间3月15日凌晨1点发布。
Q:在哪里可以体验 GPT4?
A:ChatGPT Plus账号可以直接使用GPT4。
Q:目前 API 可以调用GPT4吗?
A:暂未开放 API 调用,如果您想使用API调用GPT4,您需要填写 Waitlist 等待OpenAI开放名额。
Q:GPT4相比于GPT3.5,有哪些提升?
A:GPT4的推理能力和中文理解能力都得到了提升。这意味着AI可以更好地理解和推理人类语言,从而生成更准确、更自然的文本输出。
同时,GPT4的可控性也得到了提升,让AI玩角色扮演会更真实。这意味着用户可以更好地控制AI的输出,从而实现更自定义的文本生成。
Q:听说GPT4支持多模态了?
A:暂时GPT4只支持多模态输入,纯文本输出。目前暂时只支持文字和图片输入。它能够读懂图片内容,而不仅仅是图片上的文字。未来,GPT4可能会支持更多格式的输入和输出。
Q:GPT4相比于GPT3.5,token限制有哪些变化?
A:GPT4的token限制放宽了,有8k和32k两个可选,而GPT3.5是4k。这意味着GPT4可以处理更长的输入,从而产生更准确、更自然的输出。
Q:GPT4相比于GPT3.5,价格有变化吗?
A:GPT4的价格更贵了,并且输入输出价格不同。8k版本是0.03美元1k token输入,0.06美元1k token输出,32k版本是8k token版本价格2倍,而GPT3.5输入输出合并计费只需要0.002美元1k token。这意味着使用GPT4会更加昂贵,但可能会产生更好的结果。
特别说明,本文由哥飞和ChatGPT合作完成。
Q:什么是GPT4?
A:GPT4是由OpenAI开发的一种自然语言处理模型,它具有极高的语言理解和生成能力。于北京时间3月15日凌晨1点发布。
Q:在哪里可以体验 GPT4?
A:ChatGPT Plus账号可以直接使用GPT4。
Q:目前 API 可以调用GPT4吗?
A:暂未开放 API 调用,如果您想使用API调用GPT4,您需要填写 Waitlist 等待OpenAI开放名额。
Q:GPT4相比于GPT3.5,有哪些提升?
A:GPT4的推理能力和中文理解能力都得到了提升。这意味着AI可以更好地理解和推理人类语言,从而生成更准确、更自然的文本输出。
同时,GPT4的可控性也得到了提升,让AI玩角色扮演会更真实。这意味着用户可以更好地控制AI的输出,从而实现更自定义的文本生成。
Q:听说GPT4支持多模态了?
A:暂时GPT4只支持多模态输入,纯文本输出。目前暂时只支持文字和图片输入。它能够读懂图片内容,而不仅仅是图片上的文字。未来,GPT4可能会支持更多格式的输入和输出。
Q:GPT4相比于GPT3.5,token限制有哪些变化?
A:GPT4的token限制放宽了,有8k和32k两个可选,而GPT3.5是4k。这意味着GPT4可以处理更长的输入,从而产生更准确、更自然的输出。
Q:GPT4相比于GPT3.5,价格有变化吗?
A:GPT4的价格更贵了,并且输入输出价格不同。8k版本是0.03美元1k token输入,0.06美元1k token输出,32k版本是8k token版本价格2倍,而GPT3.5输入输出合并计费只需要0.002美元1k token。这意味着使用GPT4会更加昂贵,但可能会产生更好的结果。
特别说明,本文由哥飞和ChatGPT合作完成。
#运营
跑通27个品类后,我总结出7个小红书运营方法论
我们今年做2条线,一条是小红书代运营,一条还是小红书培训。
我日常懒得直播,搞公开课,我干脆写这篇文章,把我们的核心打法开源了,一方面增进代运营和课程客户对我们的了解,知道我们为啥可以干成这个事情;一方面,看到很多人,写得乱七八糟,作为小红书生态的圈内人,也忍不住想要站出来,告诉大家,真的玩法是什么。
跑通27个品类后,我总结出7个小红书运营方法论
我们今年做2条线,一条是小红书代运营,一条还是小红书培训。
我日常懒得直播,搞公开课,我干脆写这篇文章,把我们的核心打法开源了,一方面增进代运营和课程客户对我们的了解,知道我们为啥可以干成这个事情;一方面,看到很多人,写得乱七八糟,作为小红书生态的圈内人,也忍不住想要站出来,告诉大家,真的玩法是什么。
❤2
#产品经理
今天和一位有十几年产品经验的前辈沟通,他最开始在诺基亚,当过公司的副总,现在是公司 P9 左右的岗位(实际水平应该在 10 以上,但没坑位了)。
这位前辈并非是呆在办公室写 PPT 的吹水派,而是经常跑供应商、跑渠道的实干家。和他交流的最大感触是:
在大公司,做任何事,或者需求之前,都要考虑清楚,怎么在现有资源的前提下,既满足用户的需求,又满足渠道的需求,还要能够有比较高的 ROI 。
在交谈里,我恍然了一个道理:为什么需求要排优先级?归根结底是资源不够。因为资源不够,所以必须要把刀用在刀刃上,做什么产品?开发哪些功能?当资源被投入后,意味着其他的可能性被否定掉,而时间是有效的,也许一个季度只能迭代一次版本,开发三四个功能。如果选错,那么整年的产出或许是零。
互联网经常讲用户体验,然而在真实的世界里,在大部分公司中,资源是有限的,你要选择合适的市场、用户的核心需求和产品对应的匹配渠道,在有限的时间里做出产出。
事实上,即使不在大公司,这种压力仍然是存在的。创业公司追求创意和用户体验,但也要跟市场赛跑,你无法预估竞对是不是先你一步推出功能,用户不会流失。
把有限的资源投入到最有产出的地方,这是产品经理最重要的核心素质之一。
今天和一位有十几年产品经验的前辈沟通,他最开始在诺基亚,当过公司的副总,现在是公司 P9 左右的岗位(实际水平应该在 10 以上,但没坑位了)。
这位前辈并非是呆在办公室写 PPT 的吹水派,而是经常跑供应商、跑渠道的实干家。和他交流的最大感触是:
在大公司,做任何事,或者需求之前,都要考虑清楚,怎么在现有资源的前提下,既满足用户的需求,又满足渠道的需求,还要能够有比较高的 ROI 。
在交谈里,我恍然了一个道理:为什么需求要排优先级?归根结底是资源不够。因为资源不够,所以必须要把刀用在刀刃上,做什么产品?开发哪些功能?当资源被投入后,意味着其他的可能性被否定掉,而时间是有效的,也许一个季度只能迭代一次版本,开发三四个功能。如果选错,那么整年的产出或许是零。
互联网经常讲用户体验,然而在真实的世界里,在大部分公司中,资源是有限的,你要选择合适的市场、用户的核心需求和产品对应的匹配渠道,在有限的时间里做出产出。
事实上,即使不在大公司,这种压力仍然是存在的。创业公司追求创意和用户体验,但也要跟市场赛跑,你无法预估竞对是不是先你一步推出功能,用户不会流失。
把有限的资源投入到最有产出的地方,这是产品经理最重要的核心素质之一。
👍4
#产品经理
Github 上的[ Awesome Lists](https://github.com/topics/awesome)是个宝贝,几乎集合了世界上的优质信息,有人已经把ChatGPT的优质资源聚合了[awesome-chatgpt](https://github.com/OpenMindClub/awesome-chatgpt),大家可以继续提交优质信息。
Github 上的[ Awesome Lists](https://github.com/topics/awesome)是个宝贝,几乎集合了世界上的优质信息,有人已经把ChatGPT的优质资源聚合了[awesome-chatgpt](https://github.com/OpenMindClub/awesome-chatgpt),大家可以继续提交优质信息。