武则天 (@wzt) 在 【已开源】解决硅基流动的R1思考过程不可见的问题 中发帖
今天硅基流动的api看不见思维链了
原因是Siliconflow上的DeepSeek R1 接改成和官方完全一样的reasoning_content 了
[image]
于是做了一个中转服务用于恢复响应格式和旧版本一样。
开源在GitHub,也可以直接使用。
在Chatbox里添加新对话模型并填写配置:
名称:任意(如:DeepSeek-R1)
模型:deepseek-ai/DeepSeek-R1
API地址:https://deepseek2chatbox.dawne.cn/v1
API Key:硅基流动API Key(以sk-开头)
GitHub - chadyi/DeepSeek2Chatbox: 一个轻量级的API转发服务,让你在Chatbox中看到DeepSeek模型的完整思考过程。
@xinbalaw 在 诚意求一个 药丸 论坛 的邀,感谢各位大佬! 中发帖
听说这个论坛氛围不错,诚意求一个邀请。
有NAS和VPS 7X24小时在线。
已有你堡、我堡、家园、MT、电影票、HDTime、btschool、肉丝等站账号。
预注册用户名:xinbalaww
预注册邮箱:xinbalaw@gmail.com
感谢大佬!
附上两个大站的低隐藏链接(均达到PU级别,邮箱已公开,符合审核要求):
肉丝
学校
PTPP:
[image]
作业君 (@homeworkkun) 在 国内主流大模型调用价格/LiveBench分数/赠金一览表 中发帖
模型名
LiveBench分数
调用平台
输入
输出
赠量(M)
赠金
备注
deepseek-r1
73.9
DeepSeek
4
16
2.5/0.6
10
平台共用30天
deepseek-r1
73.9
硅基流动
4
16
3.5/0.9
14
平台共用不限时
qwen-max-32k-0125
62.9
阿里云百炼
11.2
44.8
1.0
0
模型专属180天
deepseek-v3
62.0
DeepSeek
2
8
5/1.3
10
平台共用30天
deepseek-v3
62.0
硅基流动
2
8
7/1.8
14
平台共用不限时
Doubao-1.5-pro-32k-250115
61.2
火山方舟
0.8
2
0.5
0
模型专属不限时
step-2-16k-202411
57.7
阶跃星辰
38
120
0.4/0.1
15
...
YanJony 在 新年快乐放烟花 中发帖
祝大家新年快乐,身体健康,巳巳如意。
[微信图片_20250203180614]
[微信图片_20250203180621]
[微信图片_20250203180627]
[微信图片_20250203180631]
root (@rootcao) 在 为什么打开Clash for Windows按一些按键或关闭窗口有时候会打开Windows的设置? 中发帖
请问有可能我的Clash for Windows是有病毒吗?
打开Clash for Windows按一些按键或关闭窗口有时候会打开Windows的设置?
onezerotwofourzero (@10240) 在 佬友们新年快乐呀!! 中发帖
新年快乐!巳巳如意!!!
[微信图片_20250203181917]
[微信图片_20250203175756]
给你们分享快乐的时刻 😆
佯装有名堂 (@Dabble) 在 记单词感悟,最好先看看用人话怎么说 中发帖
起因: 网上看到一个专业翻译家的工作流,受到启发,尝试找找合适的单词翻译
然后用 gemini-2.0-flash-thinking-exp 尝试用更加朴实的方式(比如 White house 翻译成 白房子),去翻译单词,结果意外发现效果不错:
私以为:经过 模型这种用人话的解释,会更容易能抓住词语的本质。
#需要说明的是,思考模型 比 普通模型强很多 (甚至普通LLM 是难以胜任)下面是一次性输出
professor 老师 (lǎoshī) (不是教授,更像日常称呼老师的感觉)
teacher 老师 (lǎoshī) (这个很朴实)
general(military) 大将 (dàjiàng) (不是将军,更像口语里说的“大领导”那种感觉)
partition 分开 (fēnkāi) (不是分割、分区...
变色龙 (@bianselong) 在 DeepSeek 威胁下,OpenAI 称考虑开源旧 AI 模型 中发帖
IT之家 2 月 3 日消息,在 DeepSeek 发布较低成本的开源 AI 模型后,OpenAI 表示正在考虑“不同的开源战略”。
据外媒 Seeking Alpha 报道,OpenAI CEO 山姆・阿尔特曼在当地时间上周五(1 月 31 日)举行的 Reddit“Ask Me Anything”活动中表示, OpenAI 需要“弄清楚另一种开源战略”。
他补充说,并非所有人都有这种观点,并且弄清楚该策略不是“我们当前的最高优先事项”。
OpenAI 首席产品官 Kevin Weil 在同一活动中表示,该公司正在考虑开源较旧的 AI 模型。
IT之家注:尽管学者和研究人员更喜欢开放源代码,但企业更喜欢封闭的模型,因为可以保护其商业秘密。PYMNTS 报道称, DeepSeek 最近推出的开源模型可能会威胁企业 AI。
据彭博社报道,阿尔特曼将在接下来的几周里,频繁往返东京、新...
变色龙 (@bianselong) 在 Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验 中发帖
IT之家 2 月 3 日消息,Gitee AI 昨日宣布上线 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B 四个较小尺寸的 DeepSeek 模型。更值得关注的是,本次上线的四个模型均部署在国产沐曦曦云 GPU 上 。 Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验 - IT之家