Taalas 推出 Transformer 特化 固化权重 的芯片,支持 lora
https://www.forbes.com/sites/karlfreund/2026/02/19/taalas-launches-hardcore-chip-with-insane-ai-inference-performance/
阅读完整话题
via LINUX DO - 最新话题 (author: stevessr)
Invalid media: image
https://www.forbes.com/sites/karlfreund/2026/02/19/taalas-launches-hardcore-chip-with-insane-ai-inference-performance/
2 个帖子 - 1 位参与者
[!quote]+
Etched 就是一个以牺牲灵活性为代价进行进一步优化的例子。Etched 的搜狐芯片是一款专用集成电路,专为运行 Transformer 架构(LLM、视觉 Transformer、MoE 变体等)而设计,但无法运行非 Transformer 模型,例如 CNN、LSTM 或 DLRM。不过,搜狐预计速度会非常快。
Taalas 是一家刚刚结束隐身模式的公司,它为一款(也仅一款)特定型号的设备定制了工作芯片,将专业化推向了新的高度。该公司的性能表现令人惊叹,如果大型数据中心采用这项技术,它可能会颠覆整个行业。但这仍然是一个很大的未知数。
“我们的首款产品是由一个 24 人的团队打造的,总共只花费了 3000 万美元,而我们筹集的资金超过 2 亿美元,”Taalas 联合创始人兼首席执行官 Ljubisa Bajic 表示。“我们的首款模型显然并非处于领先地位,但我们仍然决定将其作为测试版服务发布——让开发者探索当 LLM 推理以亚毫秒级的速度和近乎零成本运行时,能够实现哪些可能性。”
Taalas 并没有像其他公司那样使用软件进行编程(编译)并在 GPU 或 ASIC(例如 Google TPU)上执行,而是将模型及其权重硬编码到“硬核”ASIC(HC1)中,将整个模型嵌入到定制的专用芯片中。正如我在本文中探讨的那样,这种策略既是优势,也是潜在的市场障碍。
HC1 虽然在很大程度上是为了提高速度而设计的,但它通过可配置的上下文窗口大小和对低秩适配器 (LoRA) 进行微调的支持,保留了灵活性。
HC1 能够提供即时 响应,即使是像提供二战详细月度历史这样的耗时任务也能做到(仅需 0.138 秒,每秒处理 14,357 个令牌)。速度之快,甚至无需等待页面滚动。简直令人难以置信。如果大规模采用,云服务提供商将获得巨大的经济效益,因为 Taalas 可以支持更多的并发查询,并且每美元可以处理更多的令牌。
在目前可用于测试和演示的硅片上,基于 HC1 芯片的 Taalas Lllama 8B 性能测试结果显示,其速度比目前最快的推理平台 Cerebras 晶圆级引擎快 10 倍,比 GPU 快两个数量级。
以下是硬核方案的经济效益概览。对于单个模型,Llama 3.1 8B 的推理查询成本为每百万代币 0.75 美分,而 DeepSeek R1 推理模型的成本为每百万代币 7.6 美分。Llama 的结果基于第一代芯片测试,而 DeepSeek 的结果为模拟结果。相比之下,Llama 8B 和 DeepSeek R1 在 GPU 上的成本分别为 3.79 美分(吞吐量优化)和 28.6 美分(延迟优化),以及 20-49 美分。
当一个型号更新时(通常每年左右),Taalas 会在不到两个月的时间内修改芯片,并且已经将四年使用寿命内三次升级的成本(包括设计和流片升级的费用)纳入计算,以进行这些成本比较。
电力和散热是人工智能部署中两大关键问题。Hardcore 系统的能耗远低于现有技术,每个机架仅需 12-15 千瓦,而 GPU 机架的能耗则高达 120-600 千瓦/机架。Taalas 机架还可采用风冷散热,从而减少了昂贵的数据中心改造需求。Taalas HC1 PCIe 卡几乎可以安装在任何服务器中,并支持 Intel 和 AMD 的 CPU。
Talus 将同时向客户销售推理即服务 (Inference as a Service) 和 Hardcore 硬件。基于 Llama 3.1 8B 的 HC1 预计不会产生显著的收入,它更像是一个原型机而非量产机型。但它非常适合用于演示和验证 Hardcore 概念以及 Talus 的商业模式。
阅读完整话题
via LINUX DO - 最新话题 (author: stevessr)
Invalid media: image
【开源】在线多人听歌网站 | Music Together
我知道有个叫“一起听歌吧”的网站,但是它的UI古老且不符合我自己的需求,于是我就用Cursor做了一个可以多人在线一起听歌的网站。
● 自动调整歌曲进度同步,尽量保证歌房内成员听在同一刻。
● 房主可以给成员设置管理员权限,管理员随意操控切歌,普通成员操作需要投票
● 可以登录自己的vip账号,让房间内成员共享vip歌曲(退出房间任然保留cookie,直到房间销毁)
● 支持网易云音乐、酷狗音乐、QQ音乐歌曲搜索
● 支持登录网易云音乐、酷狗音乐,QQ音乐没整上扫码登陆就暂时不开放(求大佬救一下QQ音乐扫码登陆与获取歌单功能)
● 登录账号支持获取歌单,方便点自己喜欢的歌曲(登录功能在设置>账号里)
● 实时聊天功能
● 使用AMLL渲染歌词
● 移动端适配优化
多的不说了,可以去项目内看看
github.com
GitHub - Yueby/music-together: 在线多人同步听歌平台 — 创建房间,邀请朋友,一起实时听同一首歌
在线多人同步听歌平台 — 创建房间,邀请朋友,一起实时听同一首歌
下面是几张预览图:
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 月白)
Invalid media:
image
image
image
image
我知道有个叫“一起听歌吧”的网站,但是它的UI古老且不符合我自己的需求,于是我就用Cursor做了一个可以多人在线一起听歌的网站。
● 自动调整歌曲进度同步,尽量保证歌房内成员听在同一刻。
● 房主可以给成员设置管理员权限,管理员随意操控切歌,普通成员操作需要投票
● 可以登录自己的vip账号,让房间内成员共享vip歌曲(退出房间任然保留cookie,直到房间销毁)
● 支持网易云音乐、酷狗音乐、QQ音乐歌曲搜索
● 支持登录网易云音乐、酷狗音乐,QQ音乐没整上扫码登陆就暂时不开放(求大佬救一下QQ音乐扫码登陆与获取歌单功能)
● 登录账号支持获取歌单,方便点自己喜欢的歌曲(登录功能在设置>账号里)
● 实时聊天功能
● 使用AMLL渲染歌词
● 移动端适配优化
多的不说了,可以去项目内看看
github.com
GitHub - Yueby/music-together: 在线多人同步听歌平台 — 创建房间,邀请朋友,一起实时听同一首歌
在线多人同步听歌平台 — 创建房间,邀请朋友,一起实时听同一首歌
下面是几张预览图:
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 月白)
Invalid media:
image
image
image
image
Openclaw能不能监控微信信息?解决苹果微信双开问题
作为苹果手机用户,微信无法双开,经常要两个号来回切容易错过重要信息。有没有可能让openclaw监控一个微信号的信息,然后推送到tele、飞书等软件上?有没有佬做过类似的功能?
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 阿巫)
作为苹果手机用户,微信无法双开,经常要两个号来回切容易错过重要信息。有没有可能让openclaw监控一个微信号的信息,然后推送到tele、飞书等软件上?有没有佬做过类似的功能?
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 阿巫)
gemini 3.1 pro GMI已上,去年这家注册就送100刀,但当时都是些开源模型估计薅的比较少,现在一看全是顶级模型,只能说后悔也来不及了
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Saki)
Invalid media: image
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Saki)
Invalid media: image
Ai studio 要迎来更新?
logan 又在发消息了
logan 11.15 AM 发 我 11.16 AM 发
应该不会有人比我快了吧 🤣
7 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: K)
Invalid media: image
logan 又在发消息了
logan 11.15 AM 发 我 11.16 AM 发
应该不会有人比我快了吧 🤣
7 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: K)
Invalid media: image
求个war3 1.27 的下载地址,直链或天翼云
这两天终于闲下来了,无聊想玩会war3,结果全都是网盘分享,不安装客户端还不能下载
有没有佬友手头正好有资源的,分享一下?新年发财!
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zig)
这两天终于闲下来了,无聊想玩会war3,结果全都是网盘分享,不安装客户端还不能下载
有没有佬友手头正好有资源的,分享一下?新年发财!
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zig)
大模型辅助学习的能力对比?
有无佬友测评过各种大模型辅助学习的能力?平时问问题,哪些模型更能讲得简洁明了?
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: calendar)
有无佬友测评过各种大模型辅助学习的能力?平时问问题,哪些模型更能讲得简洁明了?
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: calendar)
17岁申请招行万事达要准备什么材料?
已经在小程序网申了,好奇后续有啥流程,手机号是父亲大人的qwq
(网申不会依旧去那边写一堆单子吧,如果这样意义何在qwq
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wuyuhanzijin)
Invalid media: image
已经在小程序网申了,好奇后续有啥流程,手机号是父亲大人的qwq
(网申不会依旧去那边写一堆单子吧,如果这样意义何在qwq
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wuyuhanzijin)
Invalid media: image
自制C盘强力清理工具,可清理常规垃圾和大文件
许久没上L站了,此次回归就发一个前段时间用python写的C盘清理工具(想必应该是很多佬友的刚需)
使用的ui是微软的 Fluent 2 Design,个人觉得很美观还接近win11原生,所以就用来写这个工具了
软件功能:
● 用户临时文件(
● 系统临时文件(
● Windows 日志(CBS / DISM)
● 崩溃转储(Minidump / MEMORY.DMP)
● 缩略图缓存(Explorer)
● DirectX / NVIDIA Shader Cache / AMD Shader Cache(可选)
● 浏览器缓存(Edge / Chrome,可选)
● pip 下载包缓存 / .NET 包缓存
● Windows 更新缓存(可选)
● 更多功能可以在软件内查看
再说一下大文件扫描吧,我加了一个多线程并发功能,可以检测当前磁盘是固态还是机械来动态判断线程数,放心使用如有任何问题可以在帖子中反馈
下载地址:Releases · Kiowx/c_cleaner_plus · GitHub
7 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Kio)
Invalid media:
image
image
许久没上L站了,此次回归就发一个前段时间用python写的C盘清理工具(想必应该是很多佬友的刚需)
使用的ui是微软的 Fluent 2 Design,个人觉得很美观还接近win11原生,所以就用来写这个工具了
软件功能:
● 用户临时文件(
%TEMP%)● 系统临时文件(
C:\Windows\Temp)● Windows 日志(CBS / DISM)
● 崩溃转储(Minidump / MEMORY.DMP)
● 缩略图缓存(Explorer)
● DirectX / NVIDIA Shader Cache / AMD Shader Cache(可选)
● 浏览器缓存(Edge / Chrome,可选)
● pip 下载包缓存 / .NET 包缓存
● Windows 更新缓存(可选)
● 更多功能可以在软件内查看
再说一下大文件扫描吧,我加了一个多线程并发功能,可以检测当前磁盘是固态还是机械来动态判断线程数,放心使用如有任何问题可以在帖子中反馈
下载地址:Releases · Kiowx/c_cleaner_plus · GitHub
7 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Kio)
Invalid media:
image
image
ai平台封控问题探讨
各位佬友,今天想和大家系统探讨一下各大平台针对“同域名后缀邮箱批量注册”的风控逻辑(尤其是x.ai),以及长期来看比较稳妥的应对姿势。
很多时候,为了方便管理,大家喜欢用自定义域名的别名(Alias)或者 Catch-all 来注册账号。但这种方式往往是平台风控的重灾区。我有以下见解:
1.邮箱策略
分散投资:准备多个不同后缀(尤其是偏 冷门、非免费的后缀)轮换使用
回归原生:在平台整体风控收紧的常态下,老老实实用回高权重的老牌邮箱(如 Gmail、Outlook,甚至 Edu 邮箱)
2.环境隔离
纯净ip是王道:很多时候注册失败或被秒封,不在域名,而在 IP。万人骑的机场节点早就进了黑名单。高质量的住宅代理或者小众干净的VPS节点是批量注册的刚需。
3.行为模拟:控制频率
停止“短时间内集中注册”
把战线拉长,每天随机时间段零星注册,模拟真实用户的自然增长
大家在日常搞小号的时候,还有哪些长期稳定的“野路子”?有没有哪些特别冷门的域名后缀是特别容易过检的😁
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chen7)
各位佬友,今天想和大家系统探讨一下各大平台针对“同域名后缀邮箱批量注册”的风控逻辑(尤其是x.ai),以及长期来看比较稳妥的应对姿势。
很多时候,为了方便管理,大家喜欢用自定义域名的别名(Alias)或者 Catch-all 来注册账号。但这种方式往往是平台风控的重灾区。我有以下见解:
1.邮箱策略
分散投资:准备多个不同后缀(尤其是偏 冷门、非免费的后缀)轮换使用
回归原生:在平台整体风控收紧的常态下,老老实实用回高权重的老牌邮箱(如 Gmail、Outlook,甚至 Edu 邮箱)
2.环境隔离
纯净ip是王道:很多时候注册失败或被秒封,不在域名,而在 IP。万人骑的机场节点早就进了黑名单。高质量的住宅代理或者小众干净的VPS节点是批量注册的刚需。
3.行为模拟:控制频率
停止“短时间内集中注册”
把战线拉长,每天随机时间段零星注册,模拟真实用户的自然增长
大家在日常搞小号的时候,还有哪些长期稳定的“野路子”?有没有哪些特别冷门的域名后缀是特别容易过检的😁
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chen7)
有用xyai站的codex部署openclaw的嘛
搞半天还是404,有没有佬来救救。应该是api配置的问题,其它的模型都能用
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: senru)
搞半天还是404,有没有佬来救救。应该是api配置的问题,其它的模型都能用
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: senru)
很好奇Gemini这么强?为什么不优化长文本的处理?
用户都能显著感知到长上下文对话的无力感,难道google不知道?
google不是说每3个月其数据中心的能力就要翻倍,难道还缺这点算力?
7 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: linjinpeng)
用户都能显著感知到长上下文对话的无力感,难道google不知道?
google不是说每3个月其数据中心的能力就要翻倍,难道还缺这点算力?
7 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: linjinpeng)
佬友们我忘了Fiat24入金细节了
现在买了币安的200USDC,后面怎么搞来着 😫 😫,原来参考的那一篇帖子找不到了
5 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 吞天蛤蟆)
现在买了币安的200USDC,后面怎么搞来着 😫 😫,原来参考的那一篇帖子找不到了
5 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 吞天蛤蟆)
【佬友记】骇死我了,这是数据传错了吧
最近看到有佬发的公益emby,寻思着挖一会,结果看到算力爆炸(bushi
5 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jese_Li)
Invalid media: image
最近看到有佬发的公益emby,寻思着挖一会,结果看到算力爆炸(bushi
5 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jese_Li)
Invalid media: image
求个gpt5的破甲词
用CPA反带出了几个gpt模型,有5.1codex,5.1等等,想问问有没有破甲词,想拿来玩酒馆,如果有私人珍藏的,我也可以ldc买o(╥﹏╥)o
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 谢谢不吃香菜)
用CPA反带出了几个gpt模型,有5.1codex,5.1等等,想问问有没有破甲词,想拿来玩酒馆,如果有私人珍藏的,我也可以ldc买o(╥﹏╥)o
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 谢谢不吃香菜)
GPT5.3 为什么一直不上?好奇怪呀
正常来讲 代码版本上了 通用说的版本也应该上了
那为什么一直不上呢?好奇怪呀,不是说可以加快速度吗?这不是好事儿吗
难道代码版本和正常聊天的版本还得做两次吗?不应该呀,好奇怪呀
7 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
正常来讲 代码版本上了 通用说的版本也应该上了
那为什么一直不上呢?好奇怪呀,不是说可以加快速度吗?这不是好事儿吗
难道代码版本和正常聊天的版本还得做两次吗?不应该呀,好奇怪呀
7 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
佬们,我想咨询个事情啊,同学叫我吃饭,结果他还带了几个我不认识的朋友,最后我跟盆友2个人AA的,我需要把钱要回来么?带了3个我不认识的朋友,也没提前说,到了我才知道的。
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: belike2026)
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: belike2026)
网易的🦞有人用吗?感觉没什么特别啊,推上好多广子
有沙箱、skill居然是塞到系统提示词、不能自定义模型、im没有电报 🫡
github.com
GitHub - netease-youdao/LobsterAI: Your 24/7 all-scenario AI agent that gets work...
Your 24/7 all-scenario AI agent that gets work done for you.
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
Invalid media:
image
image
image
image
image
有沙箱、skill居然是塞到系统提示词、不能自定义模型、im没有电报 🫡
github.com
GitHub - netease-youdao/LobsterAI: Your 24/7 all-scenario AI agent that gets work...
Your 24/7 all-scenario AI agent that gets work done for you.
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
Invalid media:
image
image
image
image
image
用AI造了一个新的个人形象/自设/OC——Alteidos
好看吧~
----------------------
我很早萌生了这么个想法,毕竟顶着一个██的头像感觉太██了,于是便早早策划了这个项目
我不会画画(悲),因此选择AI绘画路线,作为一位曾在Colab跑NovelAI、尝试过各种已经倒闭了的免费AI生图服务、尝试了当时一些不错的模型的网络大嫖客,在尝试了国内外部分免费的服务后,得出我的结论是——Seedream 4.5更合我意,后续我也将主要使用Seedream系列和Gemini Flash Image系列进行后续图片生成
某些国产模型我就不点名了,发布的时候宣传挺厉害的,特地说明有多好的文本渲染能力啊,结果我一用,动漫风格图像生成跟█一样,风格给我看吐了,我把Seedream已经生成好的图片作为参考图都还能把风格给弄回那么丑的……
分享一下,顺便看看佬友能不能二创出什么东西,随便给我创~
详细的可以看这里
这时就有人要问了 (点击了解更多详细信息)
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: for_the_zero)
Invalid media: image
好看吧~
----------------------
我很早萌生了这么个想法,毕竟顶着一个██的头像感觉太██了,于是便早早策划了这个项目
我不会画画(悲),因此选择AI绘画路线,作为一位曾在Colab跑NovelAI、尝试过各种已经倒闭了的免费AI生图服务、尝试了当时一些不错的模型的网络大嫖客,在尝试了国内外部分免费的服务后,得出我的结论是——Seedream 4.5更合我意,后续我也将主要使用Seedream系列和Gemini Flash Image系列进行后续图片生成
某些国产模型我就不点名了,发布的时候宣传挺厉害的,特地说明有多好的文本渲染能力啊,结果我一用,动漫风格图像生成跟█一样,风格给我看吐了,我把Seedream已经生成好的图片作为参考图都还能把风格给弄回那么丑的……
分享一下,顺便看看佬友能不能二创出什么东西,随便给我创~
详细的可以看这里
这时就有人要问了 (点击了解更多详细信息)
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: for_the_zero)
Invalid media: image