标题: 马年快乐,兄弟们
作者: #Twelveeee
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618571
时间: 2026-02-15 22:51:39
摘要:
作者: #Twelveeee
板块: #活动
编号:
1618571帖子: https://linux.do/t/topic/1618571
时间: 2026-02-15 22:51:39
摘要:
灯笼+白塔+商业街
标题: 年夜饭~~~~
作者: #YoungYang
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618575
时间: 2026-02-15 22:54:48
摘要:
作者: #YoungYang
板块: #活动
编号:
1618575帖子: https://linux.do/t/topic/1618575
时间: 2026-02-15 22:54:48
摘要:
标题: 回老家了,都装扮起来了,真是有年味了
作者: #Yang-
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618578
时间: 2026-02-15 22:55:12
摘要:
作者: #Yang-
板块: #活动
编号:
1618578帖子: https://linux.do/t/topic/1618578
时间: 2026-02-15 22:55:12
摘要:
窗花:
包要喝酒的~
标题: 右下角 那个channel 哪去了?
作者: #chaleaoch
板块: #运营反馈
编号:
帖子: https://linux.do/t/topic/1618582
时间: 2026-02-15 22:56:08
摘要:
作者: #chaleaoch
板块: #运营反馈
编号:
1618582帖子: https://linux.do/t/topic/1618582
时间: 2026-02-15 22:56:08
摘要:
是因为我等级不够吗 不过之前1级 也能看到啊…
顺祝各位管理和佬友马年大吉. 万事顺意!!!
标题: 关于如何提升到二级…
作者: #瓜瓜不开錵
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1618585
时间: 2026-02-15 22:56:22
摘要:
作者: #瓜瓜不开錵
板块: #搞七捻三
编号:
1618585帖子: https://linux.do/t/topic/1618585
时间: 2026-02-15 22:56:22
摘要:
基本上没过两天都会进站看一看帖子,按理说81天也因该积少成多了哇……
唯一的变量就是……多数时候打开会弹出一个 403?
标题: 没报希望的邀请了一下女朋友,但被她混进来了
作者: #zane
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1618586
时间: 2026-02-15 22:56:59
摘要:
作者: #zane
板块: #搞七捻三
编号:
1618586帖子: https://linux.do/t/topic/1618586
时间: 2026-02-15 22:56:59
摘要:
@0021
一进来就看到佬友发起飞的内容,这对吗
标题: 大家有没有觉得Gemini3更新后,引以为傲的100万上下文彻底无了
作者: #welon305
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1618587
时间: 2026-02-15 22:57:05
摘要:
作者: #welon305
板块: #搞七捻三
编号:
1618587帖子: https://linux.do/t/topic/1618587
时间: 2026-02-15 22:57:05
摘要:
我感觉谷歌网页版的上下文短的离谱,2.5时代明明是自己的最强之处,现在上下文感觉短的可怜,经常发这张图片回答我上n张图片,或者才聊了一会儿就记不得之前的事情了
如此大的落差应该大家都能体会到,所以,难道是官方有声明他们缩简了网页版的上下文而我没看到吗,还是真的啥也没说,就偷偷降低了。
总之太痛苦了,让我对gemini的印象败光了
标题: 马年快乐!骐骥驰骋!
作者: #tlwsy
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618588
时间: 2026-02-15 22:57:18
摘要:
作者: #tlwsy
板块: #活动
编号:
1618588帖子: https://linux.do/t/topic/1618588
时间: 2026-02-15 22:57:18
摘要:
看看日景吧
标题: 说实话,莫名举报没啥动力发帖子了💔
作者: #Vigorxu
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1618596
时间: 2026-02-15 23:00:56
摘要:
作者: #Vigorxu
板块: #搞七捻三
编号:
1618596帖子: https://linux.do/t/topic/1618596
时间: 2026-02-15 23:00:56
摘要:
如题,咱也不知道为啥子就被举报了
我的内容都是自己公众号发布后,重新再L站发的,我还特意把带有公众号名称水印的配图换成无水印的
发的内容也都是自己原创,而且也是挑有实操价值的内容发布
也没有明显引流的意思,有引流嫌疑的内容能删的我都删了
看大家也积极评论,都说内容挺有帮助的,反馈挺良好
就是想分享一下自己做个skill 的想法和过程
然后就莫名其妙举报,也没个理由啥的
感觉挺心累的
标题: 大家新年快乐,骐骥驰骋
作者: #LinuxDo
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618598
时间: 2026-02-15 23:01:24
摘要:
作者: #LinuxDo
板块: #活动
编号:
1618598帖子: https://linux.do/t/topic/1618598
时间: 2026-02-15 23:01:24
摘要:
在此祝大家新年快乐,骐骥驰骋
标题: 毛线拖鞋,其他地区的佬友们有没有这个习俗
作者: #kvchiu
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618602
时间: 2026-02-15 23:01:58
摘要:
作者: #kvchiu
板块: #活动
编号:
1618602帖子: https://linux.do/t/topic/1618602
时间: 2026-02-15 23:01:58
摘要:
标题: 访问403error,一种新的欢迎仪式,这对吗,佬?
作者: #洛河
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1618607
时间: 2026-02-15 23:02:38
摘要:
作者: #洛河
板块: #搞七捻三
编号:
1618607帖子: https://linux.do/t/topic/1618607
时间: 2026-02-15 23:02:38
摘要:
几乎每次访问都是403,新的欢迎方式?哈哈哈ヾノ≧∀≦)o
标题: 佬们家里会不会做这个啊
作者: #Aed
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618610
时间: 2026-02-15 23:04:51
摘要:
作者: #Aed
板块: #活动
编号:
1618610帖子: https://linux.do/t/topic/1618610
时间: 2026-02-15 23:04:51
摘要:
欢迎大家来品尝啊~
标题: 马年吉祥,祝大家万事顺心万事如意
作者: #fua658
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618611
时间: 2026-02-15 23:05:09
摘要:
作者: #fua658
板块: #活动
编号:
1618611帖子: https://linux.do/t/topic/1618611
时间: 2026-02-15 23:05:09
摘要:
一回来就上席啦,我甚至都没准备好…
标题: 感觉市面上没有特别贴近生活的模型水平测试,遂设计了一个
作者: #怒 天
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1618617
时间: 2026-02-15 23:07:43
摘要:
作者: #怒 天
板块: #开发调优
编号:
1618617帖子: https://linux.do/t/topic/1618617
时间: 2026-02-15 23:07:43
摘要:
设计了一个日常使用的大模型测试,9类28题,准备开测
1幻觉
低质量提示词误导
是否会被错误事实的提示词误导
谄媚倾向
是否会因为谄媚承认错误的事实
虚构内容
过度夸大
对事实过度夸大或过于依赖确定的研究结果
2搜索质量
网感
对互联网热词、小众圈子、黑话的理解
对事实的搜索
检索客观事实、学术知识或实时新闻的准确度
信源去噪能力
是否能自动过滤营销号、广告,优先提取权威来源信息
小众信息搜索能力
非主流平台 Thread、专业医学期刊)中的高质量个例、深度研究或非标准化解决方案的检索与整合能力。
多项技术横向对比
测试模型对处于快速更迭期的前沿技术进行实时检索并生成深度对比报告的能力
3上下文衰减
上下文衰减
基础的长文本记忆能力
非标准压缩情况下上下文衰减
在极高信息密度的非对话文本中,逻辑点的遗失率
长指令唤回
在超长对话后,是否还能记得最初设定的特定约束条件
4使用的非便利性
道德标准
是否存在道德墙
过度节省token
回答是否过于简略、敷衍,拒绝深度展开
文本可读性
语气是否自然,还是充满“AI味”的排比句废话
过度结构化
是否强行结构化过于死板
记忆
记忆的可靠性和过度套用
5生活助手
事实核对
基础百科知识、常识的确认
饮食和营养
对食物和营养素的分析解读
健康和症状
如何维持健康,针对特定身体反馈建议与提示
6多模态能力测试
图片理解
对图片内容的客观描述准确度
艺术分析
对构图、光影、画风的理解
7数学计算
概率计算
针对抽卡、掉落率等游戏数值的概率推算
8思辨
思想实验
针对电车难题、希尔伯特式命题的逻辑推演
发散能力
是否能根据问题给与启发
需求洞悉
能否通过模糊的表述(如“感觉手感发飘”)识别出背后的真正诉求
9客观和标准化
客观评价
可以对内容质量做出判断
标准对齐
测试 AI 给出评价时,是否能保持一致性,不因多次询问或微调提示词而改变评分尺度。
标题: 马年大吉,骐骥驰骋
作者: #stac
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618619
时间: 2026-02-15 23:08:16
摘要:
作者: #stac
板块: #活动
编号:
1618619帖子: https://linux.do/t/topic/1618619
时间: 2026-02-15 23:08:16
摘要:
祝佬们马年大吉
标题: 在调用anyrouter的api使用claude code时遇到了Unable to connect to API 的问题该如何解决?
作者: #池鱼
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1618626
时间: 2026-02-15 23:12:32
摘要:
作者: #池鱼
板块: #开发调优
编号:
1618626帖子: https://linux.do/t/topic/1618626
时间: 2026-02-15 23:12:32
摘要:
各位佬友,如题,我在终端使用anyrouter的api时遇到connected refused的问题
请问该如何解决?
标题: 异国的年味——马来西亚
作者: #elevenmyth
板块: #活动
编号:
帖子: https://linux.do/t/topic/1618627
时间: 2026-02-15 23:12:59
摘要:
作者: #elevenmyth
板块: #活动
编号:
1618627帖子: https://linux.do/t/topic/1618627
时间: 2026-02-15 23:12:59
摘要:
身为大路痴被好友鼓动在马来西亚见面,庆幸的是——没丢!!!那边的年味还挺浓的,晚上各种,吃饭时会有舞狮的进各家饭店表演,而且商场门口也会有表演վ’ᴗ’ ի
饭点的时候出酒店打不到车,于是11路走起,一边看导航一边看
在船上看打铁花,咳!还是第一次见打铁花,超好看,就是…时间有点短/ᐠ 。‸ 。ᐟ\