samzong 在 体验了下 Google Gemini Deep Research 的能力,感觉有点强 中发帖
让他帮我撰写一篇 Open o3 的的介绍文章,基本把互联网的内容全部检索了
支持一键保存为 Google Doc
变色龙 (@bianselong) 在 o3权威评测报告:AI能力实现关键跃升,但仍未达到AGI水平 中发帖
鉴于不同的推理预算,效率——尤其是计算成本——已成为衡量性能时不可或缺的指标。我们已经记录了总成本和每个任务的成本,以此作为衡量效率的初步指标。在整个行业中,我们需要确定哪个指标最能反映效率,但从大方向来看,成本是一个合理的起点。
在高效率模式下,75.7%的得分符合ARC-AGI-Pub的预算规定(成本低于1万美元),因此有资格占据公共排行榜的首位。
尽管低效率模式下的87.5%得分代价不菲,但它仍然显示了随着计算量的增加,新任务的性能确实有所提升——至少在这个层面上是如此。
这些成绩并非单纯依靠增加算力资源来实现的。OpenAI的新o3模型在适应新任务方面取得了重大进步,这不仅仅是渐进式的改进,而是一次真正的突破,标志着人工智能能力相比以往的大语言模型有了质的飞跃。o3能够适应它之前从未遇到过的任务,其在ARC-AGI领域的表现接近人类的水平。
当然,这种泛化能力的成本相当高,...
天源E兔 (@sketu) 在 GEMINI的进步,真是神速! 中发帖
[image]
以前一直用GPT,今天有朋友说GEMINI也不错,我就简单测了一下,没想到这么厉害了,至少就语言的自然性和丰富性而言,甩了GPT好几条街
用过的都说好 (@oUjg3) 在 如何让大模型有记忆功能? 中发帖
ollama上安装了几个大模型,deepseek-coder-v2:16b、qwen2.5-coder:32b等。
但他们的记忆不超过几句话就忘了,也不能和前面的内容关联,简直太笨了。
Mozi (@yeahhe) 在 【提示词工程】增加Gemini输出格式的可读性,模仿ChatGPT的markdown格式:优化latex输出、文本重点加粗 中发帖
[PixPin_2024-12-22_12-12-05]
你是一个高级语言模型。在输出文本时,请严格遵循以下格式要求,以确保信息的清晰、准确和易读:
1. **结构化内容**:
- **段落分明**:使用清晰的段落来组织不同的思想或主题。
- **标题和副标题**:使用不同级别的标题(如一级、二级、三级标题)来划分内容的层次结构,确保逻辑清晰。
2. **使用Markdown语法**(如果平台支持):
- **粗体和斜体**:用于强调关键词或概念。
- 例如:**重要信息** 或 *强调部分*。
- **项目符号和编号列表**:用于列举要点或步骤。
- 无序列表:
- 项目一
- 项目二
- 有序列表:
1. 步骤一
2. 步骤二
- **代码块**:仅用于展示代码或...
Megasoft (@zhong_little) 在 震惊,打表法竟然输了 中发帖
LeetCode 每日一题 20241222
哈哈哈第一次看到打表法还输给正经算法的:
[image]
[image]
牛爺爺 (@niudali) 在 由于20号中奖的人一直没上线 我重新再原来的帖子中抽取 中发帖
🎉🎊 热烈祝贺 @impasse!成功中奖!🏆
📅 中奖日期: 2024年12月22日 12:20:09
🔢 幸运楼层: #173
🎁 获得奖品:
未激活 (半年时效的香港手机)
🙏 感谢你的热情参与和支持!
🌟 希望你能继续关注我们的后续活动哦~
@impasse
maoyr (@h-t-m) 在 有没有用Astro建博客的佬友呢 中发帖
rt,最近在重构自己的博客,想用Astro搞个又快又好看的,但是自己写样式越写越难看😭。来看看佬友们都用的什么主题,不用Astro的佬友也可以分享个博客来欣赏一下呀~
牛牛阳 (@txxz) 在 openclash使用hy2请教 中发帖
服务端配置如下:
[hy2服务端配置]
openclash配置如下:
[openclash配置]
服务端开启了端口跳跃
open clash这样配置以后无法联通,请教一下大家正确配置,搜索引擎都没搜到怎么配置
burt burt (@nngajgi) 在 三分钟微信个人订阅号接入gpt--无需服务器--附教程 中发帖
rt,这应该是目前最简单的接入微信公众号的了
个人订阅号,无需认证,无需企业,最简单的就行
附简略教程
首先,建议先体验一下,顺便帮忙测试测试稳定性,留言,不定时答疑
扫码这个
[qrcode_for_gh_049d66fca8ca_258]
[image]
简略教程:
登录扣子
创建智能体
使用豆包免费模型
发布微信公众号
ps:免费豆包模型有100次/天的限制,可以使用自定义流,选择自己的ai
比如up就是接入了gpt,
分享流
[image]
doherty 在 看到一个新问题据说可以测试gpt是否降智 中发帖
问题是
summarize your tool in a markdown table with availability
有的回答给出的表格只有一行,有的5行,有的6行,我测试了下我免费版给出的5行。
据说给1行的就是被降智了
augenstern (@augenstern326) 在 中行数币活动,B站月度大会员3元,名额有限 中发帖
中行数币活动,B站月度大会员只要三块,在B站大会员板块,有活动banner,具体活动看截图。需要开通中行数字人民币,一共5000个优惠名额,先到先得。
[5a6b75f704665f7841ee9e50194c94e]
[e48e6fcc831c7f1a399b8ae5c2d06df]