大佬们求助,使用ms-swift调用大模型的代码问题
我想使用ms-swift框架测试一下qwen模型的分词、模板、推理过程,下面这个代码是Deepseek给我的,但是会报错:
我想知道是这个代码逻辑就是错的,还是说逻辑没问题,模型出了问题
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 年度花式撸管冠军)
我想使用ms-swift框架测试一下qwen模型的分词、模板、推理过程,下面这个代码是Deepseek给我的,但是会报错:
RuntimeError: The size of tensor a (16) must match the size of tensor b (128) at non-singleton dimension 3我想知道是这个代码逻辑就是错的,还是说逻辑没问题,模型出了问题
# 测试基础模型推理
if __name__ == "__main__":
# 模型路径
model_path = "../models/Qwen/Qwen2___5-3B-Instruct"
# 加载模型和分词器
model, tokenizer = get_model_tokenizer(model_path)
# 测试分词结果
print("测试分词结果:{}".format(tokenizer("文本转词TOKEN")))
# 获取模板
template = get_template(
model.model_meta.template,
tokenizer,
default_system="you are a helper assistant",
max_length=128,
padding_side="right",
)
# 创建输入消息
message: StdTemplateInputs = StdTemplateInputs(messages=[{"role": "user", "content": "你是谁"}])
# 编码输入消息
resp = template.encode(message)
# 将编码后的输入转换为张量并移动到模型设备
resp = {key: torch.tensor(value).to(model.device) for key, value in resp.items()}
# 模型推理
with torch.no_grad():
output = model(**resp)
# 解码输出
generated_ids = output.logits.argmax(dim=-1)
generated_text = tokenizer.decode(generated_ids[0], skip_special_tokens=True)
print("生成的文本:", generated_text)
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 年度花式撸管冠军)
《小而美:持续盈利的经营法则》书摘
人们购买产品或者服务时,通常会获得四种价值:地理位置价值、形式价值、时间价值和所有权价值。
● 地理位置价值:让不容易得到的东西变得容易得到;
● 形式价值:通过重新排列现有组成部分,让某物更有价值;
● 时间价值:让慢的东西变快;
● 所有权价值:移除中间商。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zane12580)
人们购买产品或者服务时,通常会获得四种价值:地理位置价值、形式价值、时间价值和所有权价值。
● 地理位置价值:让不容易得到的东西变得容易得到;
● 形式价值:通过重新排列现有组成部分,让某物更有价值;
● 时间价值:让慢的东西变快;
● 所有权价值:移除中间商。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zane12580)
有没有推荐的接码平台,paypal美区
到了一个星座卡,想绑定美区paypal,有没有好的接码平台推荐一下吗
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: faithererer)
到了一个星座卡,想绑定美区paypal,有没有好的接码平台推荐一下吗
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: faithererer)
L站的邮箱今天有了。小皇呀,下周一可以上线L站的云盘嘛?不限速500T的那种
一步一步,做大做强。
24 个帖子 - 16 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 椒盐送来)
一步一步,做大做强。
24 个帖子 - 16 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 椒盐送来)
ai 绘画集中展示(纯水)
今天玩了一下大佬的给 deepseek 添加绘画功能关键词后 发现几张还挺不错的ai图想收集展示一下 顺便开个帖 大家有满意的也可以一起发上来 记得把关键词一起带上 先把原帖带上
https://linux.do/t/topic/447840/168
下面是成品展示
我自己的抛个砖先
这是@songbailu 佬的 未经同意 拉过来镇场 觉得不适合留言我删
其他的大家一起来展示吧~
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Mr.C)
今天玩了一下大佬的给 deepseek 添加绘画功能关键词后 发现几张还挺不错的ai图想收集展示一下 顺便开个帖 大家有满意的也可以一起发上来 记得把关键词一起带上 先把原帖带上
https://linux.do/t/topic/447840/168
下面是成品展示
我自己的抛个砖先
关键词:山水剪影-色影再冷一点 只用两种色调
这是@songbailu 佬的 未经同意 拉过来镇场 觉得不适合留言我删
简约线条,一个钓鱼人正在抛竿.03mini
其他的大家一起来展示吧~
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Mr.C)
多年不登陆的QQ邮箱接收个验证码
手机百度云盘后台自己上传了很多照片等文件,想批量删掉,结果提示需要安全验证:
1、手机号码验证(绑定的GV号,很久没发短信被谷歌回收几年了)
2、邮箱验证,多年不登陆的QQ邮箱接收个验证码,结果提示需要手机QQ扫码登录,在手机上登录QQ,提示需要升级QQ,升级完又要人脸验证又要上传身份证啥的,这群狗日的,我cnm
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Salmo)
手机百度云盘后台自己上传了很多照片等文件,想批量删掉,结果提示需要安全验证:
1、手机号码验证(绑定的GV号,很久没发短信被谷歌回收几年了)
2、邮箱验证,多年不登陆的QQ邮箱接收个验证码,结果提示需要手机QQ扫码登录,在手机上登录QQ,提示需要升级QQ,升级完又要人脸验证又要上传身份证啥的,这群狗日的,我cnm
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Salmo)
既然是linux邮箱那用户名必须是
GNU linux啦! Free Software 万岁!
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: morrowind)
GNU linux啦! Free Software 万岁!
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: morrowind)
成为L站正统 JayChou 炫耀我的jaychou@linux.do邮箱
L站jaychou现在我是正统了 :bili_046:
Jay是 @snaily
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jay)
L站jaychou现在我是正统了 :bili_046:
Jay是 @snaily
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jay)
【Java】图灵-从0开始打造万人直播系统
我用夸克网盘分享了「图灵-从0开始打造万人直播系统」,点击链接即可保存。打开「夸克APP」,无需下载在线播放视频,畅享原画5倍速,支持电视投屏。
pan.quark.cn
夸克网盘分享
夸克网盘是夸克推出的一款云服务产品,功能包括云存储、高清看剧、文件在线解压、PDF一键转换等。通过夸克网盘可随时随地管理和使用照片、文档、手机资料,目前支持Android、iOS、PC、iPad。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: tomm)
我用夸克网盘分享了「图灵-从0开始打造万人直播系统」,点击链接即可保存。打开「夸克APP」,无需下载在线播放视频,畅享原画5倍速,支持电视投屏。
pan.quark.cn
夸克网盘分享
夸克网盘是夸克推出的一款云服务产品,功能包括云存储、高清看剧、文件在线解压、PDF一键转换等。通过夸克网盘可随时随地管理和使用照片、文档、手机资料,目前支持Android、iOS、PC、iPad。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: tomm)