#程序员
作者实践下来,算上 DBA、运维等成本,价格仍然比云要低很多,一千万的云成本,最高可以节省五百万。
对于成熟的中大型公司,面向未来三到五年做预算,(部分)自建机房会是一个很大的优化点,在全面降本增效的大背景下,也是一个必然趋势吧。
https://web.okjike.com/originalPost/65517c9fde31fdaa4ec50b61
作者实践下来,算上 DBA、运维等成本,价格仍然比云要低很多,一千万的云成本,最高可以节省五百万。
对于成熟的中大型公司,面向未来三到五年做预算,(部分)自建机房会是一个很大的优化点,在全面降本增效的大背景下,也是一个必然趋势吧。
https://web.okjike.com/originalPost/65517c9fde31fdaa4ec50b61
和一个大厂战投的哥们聊各个条线的AI技术和产品进展,
聊到另外一个大厂的AI战略,
他说:听说他们在All in AI;
我说:是啊,不All in 这个还能All in什么呢?
他说:从我人生角度也一样……这一集你也看过我不废话了。
艹了,
这TM,
把话题又给聊沉重了……
聊到另外一个大厂的AI战略,
他说:听说他们在All in AI;
我说:是啊,不All in 这个还能All in什么呢?
他说:从我人生角度也一样……这一集你也看过我不废话了。
艹了,
这TM,
把话题又给聊沉重了……
#程序员
使用检索增强(Retrieval-Augmented Generation,RAG)可以缓解大模型的幻觉问题,从而避免大模型胡说八道,但传统的 RAG 存在一个很大的弊端——无论内容跟输入是否有足够的关联、对事实是否有足够的支撑,搜索模块都会不加区分地将内容召回,然后交给大模型来进行推理,这会很大程度降低大模型的多功能性,并导致生成质量不佳。
Self-RAG,https://selfrag.github.io,在一定程度上解决了这个问题。它设计了一个算法,将内容召回过程与大模型的推理过程进行了深度结合,大致思路如下:
1)设计了一些标签,包括「是否检索」(Retrieve)、「内容是否相关」(ISREL)、「内容是否支撑事实」(ISSUP)、「内容是否可用」(ISUSE)等,可以理解它们是对检索内容进行评分的工具
2)循环「推理->检索->过滤->评分」这个流程,在推理过程中,结合已有的信息和 LLM 的反馈,来判断要不要继续检索,过程中会获得足够多的包含了评分的内容
3)根据已获得的信息的权重进行重新整理,将与内容相关、能够支撑事实以及高可用的内容保留下来
4)可以进行全局设定,对于事实性要求高的推理任务,增加检索频次;对于创造性要求高的推理任务,减少检索频次
这个算法思路的表现非常良好,只不过在过程中需要跟大模型进行多次交互,与 ToT(Tree of Thought) 类似,比较消耗资源。
它有一个工程上的完整实现,可以戳这个项目:https://github.com/AkariAsai/self-rag
使用检索增强(Retrieval-Augmented Generation,RAG)可以缓解大模型的幻觉问题,从而避免大模型胡说八道,但传统的 RAG 存在一个很大的弊端——无论内容跟输入是否有足够的关联、对事实是否有足够的支撑,搜索模块都会不加区分地将内容召回,然后交给大模型来进行推理,这会很大程度降低大模型的多功能性,并导致生成质量不佳。
Self-RAG,https://selfrag.github.io,在一定程度上解决了这个问题。它设计了一个算法,将内容召回过程与大模型的推理过程进行了深度结合,大致思路如下:
1)设计了一些标签,包括「是否检索」(Retrieve)、「内容是否相关」(ISREL)、「内容是否支撑事实」(ISSUP)、「内容是否可用」(ISUSE)等,可以理解它们是对检索内容进行评分的工具
2)循环「推理->检索->过滤->评分」这个流程,在推理过程中,结合已有的信息和 LLM 的反馈,来判断要不要继续检索,过程中会获得足够多的包含了评分的内容
3)根据已获得的信息的权重进行重新整理,将与内容相关、能够支撑事实以及高可用的内容保留下来
4)可以进行全局设定,对于事实性要求高的推理任务,增加检索频次;对于创造性要求高的推理任务,减少检索频次
这个算法思路的表现非常良好,只不过在过程中需要跟大模型进行多次交互,与 ToT(Tree of Thought) 类似,比较消耗资源。
它有一个工程上的完整实现,可以戳这个项目:https://github.com/AkariAsai/self-rag
👍2
「99%的人都不知道的Google搜索功能使用的技巧」
1)搜索特定内容:使用“”号,它会完全按照您输入的内容搜索该短语。
2)使用冒号搜索特定站点内容,例如AI:twitter.com
3)查找其他类似的站点,例如 related:gptshunter.com
4)查找特定文件,例如LLMs:PDF,它就会只展示LLMs相关的所有pdf文件
5)查找社交媒体上的内容,例如AI@twitter
6)寻找特定颜色、尺寸、版权、时间或类型的图像,在图片页搜索完成后点击颜色调整按钮
7)Google快讯,如果你希望网络上发布关键词时收到通知,你可以创建订阅google的快讯
8)使用-排除单词或短语,Rocky -film 将显示与“rocky”相关的一般结果,但不显示电影film
9)在单词前面添加波形符 ~以查找同义词 如果您搜索 iPhone ~cheap,您还会得到“iPhone Cheap”等结果
1)搜索特定内容:使用“”号,它会完全按照您输入的内容搜索该短语。
2)使用冒号搜索特定站点内容,例如AI:twitter.com
3)查找其他类似的站点,例如 related:gptshunter.com
4)查找特定文件,例如LLMs:PDF,它就会只展示LLMs相关的所有pdf文件
5)查找社交媒体上的内容,例如AI@twitter
6)寻找特定颜色、尺寸、版权、时间或类型的图像,在图片页搜索完成后点击颜色调整按钮
7)Google快讯,如果你希望网络上发布关键词时收到通知,你可以创建订阅google的快讯
8)使用-排除单词或短语,Rocky -film 将显示与“rocky”相关的一般结果,但不显示电影film
9)在单词前面添加波形符 ~以查找同义词 如果您搜索 iPhone ~cheap,您还会得到“iPhone Cheap”等结果
👍3