TerryFlatley 在 yi-lightning的审查貌似有点高 中发帖
之前测 GAOGAO 的数据集测历史题就已经有好几个题目别的模型都能做,它做不了。
这次找到了关于加密货币技术领域测试集,测了好几个题目都过不了审查。
有兴趣的佬友可以看看
[GYdIX_4agAAvlcN]
部分项目介绍
任务数据集:230 个复杂任务,涵盖密码学、区块链、加密货币、DeFi/Dapps、共识机制、智能合约理解和审计、智能合约代码生成、场景模拟和基于加密网络的自治代理功能。
MVP 数据集:727 个用于快速 LLM 评估的多项选择题。(Note:由于其在评估 LLMs 的差异能力方面的局限性,该数据集仅用于初始概念演示,并且不包括在最终问题集中。
超过 400 个子领域和 1,300 个知识领域
涵盖密码学基础知识、智能合约、令牌经济学、DAO 和治理
专注于 AI 代理在区块链技术中的实际应用
木瓜蛋白酶Tea🎋 (@Papain233) 在 【书摘】我与地坛 中发帖
但是太阳,它每时每刻都是夕阳也都是旭日。当它熄灭着走下山去收尽苍凉残照之际,正是它在另一面燃烧着爬上山巅布散烈烈朝晖之时。那一天,我也将沉静着走下山去,扶着我的拐杖。有一天,在某一处山洼里,势必会跑上来一个欢蹦的孩子,抱着他的玩具。
当然,那不是我。
但是,那不是我吗?
宇宙以其不息的欲望将一个歌舞炼为永恒。这欲望有怎样一个人间的姓名,大可忽略不计。
lennouk 在 Clash Verge 应用规则之后。打开代理无法访问国内某些网站 中发帖
已经有现成的分流规则,但是依然访问失败,并且在全局模式的时候可以打开,请问是哪里出了问题?
[image]
小雨 (@pcb_77) 在 ChatGPT plus 三人车,刚上架 中发帖
由于最近一段时间个人用量不大,暂时考虑定为 28/月,也算试试拼车项目的体验。
考虑上车的哥们可以直接私信我,我会回 tg 号。
松茸不吃柯尔鸭🎆🎇 (@ABandonLove) 在 论坛是否可以出一个 交流代码和编程 算法的版块 中发帖
RT, 本站似乎没有交流编程问题的专门板块
交流算法的更是几乎没有
给OIer和编程交流一个地方吧qwq
不知道能不能添加
amlkiller 在 一个几乎所有大模型都会栽一次的问题? 中发帖
[IMG_20241021_220726]
[IMG_20241021_220107]
[IMG_20241021_215910]
[IMG_20241021_215526]
[IMG_20241021_215449]
[IMG_20241021_215406]
人奔跑时地面对人作用力做正功,还是负功。
没想到这么容易的问题几乎都出现第一次回答错误,重复生成连3.5都会左右横跳。
那请问佬们觉得正确答案是什么?
eros face 在 有没平台提供comfy UI的工作流API啊,有些成熟的工作流和模型完全可以做成API呀 中发帖
看到之前有工作做粘土人啥的,有人就做成工具站,感觉直接一步到位哪个平台把成熟的workflow做成API提供,肯定很受欢迎。
醉猫 (@zuimao) 在 租房搞砸了些东西,请热佬们投票看看,或者给些建议 中发帖
[image]
刚刚发错区了抱歉,我给洗衣机造成了一些表面的损毁,没有影响功能,本人刚毕业出来到深圳找工作,刚来了不到一个月,工作还没找到。不知道这种事情要怎么处理最好,我造成的损失大概多少钱?热佬也可以帮我评估下。热佬投个票,房子租金和押金都是1080,压1付1的。
投票
投票
Kim (@snx30_3x) 在 兄弟们求推荐机场,IP质量无所谓,延迟说得过去就行,只需要稳定和大带宽 中发帖
现在用的某知名准一线机场,高峰期感觉很慢,但是延迟还可以,估计是水管不够粗或者用的人太多了,现在求一个稳定(一年里可用时间大于360天),高峰期看油管4K不卡,延迟还凑合(100-200这样),IP质量无所谓。