Forwarded from 무온적 사고 - AI, 명상, 밈
X (formerly Twitter)
Anthropic (@AnthropicAI) on X
The US government, citing national security authorities, has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States, including foreign national Anthropic employees.…
😱2
지난밤 있었던 드라마:
• 브라질 리우데자네이루시청에서 Rio-3.5-Open 397B 라는 초거대모델을 냈고, Base 모델인 Qwen 3.5는 물론이고 Qwen 3.7보다도 훨씬 우월한 벤치마크 성적을 냈다고 보고
• 사람들이 "DeepSeek, Qwen, Kimi 등등 중국 오픈 모델들도 학습에 몇십몇백억은 들였을 텐데 일개 시청(?) 이 이걸 쉽게 따버린다니 자본기반 AI연구도 다 끝났구나" 라고 호들갑
• 근데 Nex 모델(얘네도 Qwen posttraining) 만든 Nex 랩에서 "이거 우리 가중치랑 Qwen 가중치 합한건데?" 라고 분석결과 업로드
• 심지어 System prompt에 "너는 Rio야" 라는 내용을 빼고 "너는 누구니" 라고 물어보면 "나는 Nex야" 라고 답하는 웃기는 상황
• 리우 시청: "베이스 모델인데 최종본이랑 헷갈려서 잘못 업로드하는 실수했음 쏘리" 하고 싹 내려버림. 과연 예산타려고 구라친게 걸려서 빤스런한걸까 실수일까
https://x.com/nexecosystem/status/2066180407100571714
• 브라질 리우데자네이루시청에서 Rio-3.5-Open 397B 라는 초거대모델을 냈고, Base 모델인 Qwen 3.5는 물론이고 Qwen 3.7보다도 훨씬 우월한 벤치마크 성적을 냈다고 보고
• 사람들이 "DeepSeek, Qwen, Kimi 등등 중국 오픈 모델들도 학습에 몇십몇백억은 들였을 텐데 일개 시청(?) 이 이걸 쉽게 따버린다니 자본기반 AI연구도 다 끝났구나" 라고 호들갑
• 근데 Nex 모델(얘네도 Qwen posttraining) 만든 Nex 랩에서 "이거 우리 가중치랑 Qwen 가중치 합한건데?" 라고 분석결과 업로드
• 심지어 System prompt에 "너는 Rio야" 라는 내용을 빼고 "너는 누구니" 라고 물어보면 "나는 Nex야" 라고 답하는 웃기는 상황
• 리우 시청: "베이스 모델인데 최종본이랑 헷갈려서 잘못 업로드하는 실수했음 쏘리" 하고 싹 내려버림. 과연 예산타려고 구라친게 걸려서 빤스런한걸까 실수일까
https://x.com/nexecosystem/status/2066180407100571714
X (formerly Twitter)
Nex (@NexEcosystem) on X
The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.
🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5
It even literally…
🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5
It even literally…
• 트럼프 행정부는, 여전히 Fable 의 탈옥 리스크가 대해 해소되지 않았기 때문에, Fable의 수출통제 지침을 유지
• 앤트로픽은 탈옥 우려가 지나치게 과장되었다고 생각하며 여러 연구기관들과 협력하는 중
• 미국 상무부 장관은 Fable을 소비자에게 제공하는 것을 지지하나, 탈옥 문제가 해결되는 것이 선제조건
참고로 지금 상황은 앤트로픽 직원조차 미국 시민권자가 아니면 Fable을 압수당한 상황
https://x.com/hugolowell/status/2066686166884098244
• 앤트로픽은 탈옥 우려가 지나치게 과장되었다고 생각하며 여러 연구기관들과 협력하는 중
• 미국 상무부 장관은 Fable을 소비자에게 제공하는 것을 지지하나, 탈옥 문제가 해결되는 것이 선제조건
참고로 지금 상황은 앤트로픽 직원조차 미국 시민권자가 아니면 Fable을 압수당한 상황
https://x.com/hugolowell/status/2066686166884098244
X (formerly Twitter)
Hugo Lowell (@hugolowell) on X
NEW @WIRED: Trump admin officials concluded talks today with Anthropic without lifting export controls on Claude Fable 5, and next steps are unclear
— Admin continues to believe that there are ways to jailbreak Fable 5 and access the capabilities of Mythos…
— Admin continues to believe that there are ways to jailbreak Fable 5 and access the capabilities of Mythos…
• Z.ai 의 최신 프론티어 모델 GLM-5.2 공개 및 가중치도 Day1 업로드
• Artificial Analysis 의 종합 지능 인덱스에서는 Opus 4.8 > GPT-5.5 > GLM-5.2 > Sonnet 4.6 정도의 순서로 정리 (모두 max 레벨)
• WeirdML에서는 GLM-5.2 high가 Opus 4.5 high를 이김
• 기존 중국 프론티어 모델들은 코딩이나 어시스턴트 에이전트(claw) 에 집중하는 분위기가 있었다고 보는데(특히 DeepSeek) WeirdML 결과 보면 이제 코딩만 잘하는 너드가 아니라 그냥 일머리 좋은 AI도 만들어낸것으로 이해됨. 생각해볼 점이 많은 부분
• 중국의 공개모델들과 미국 프론티어 모델은 6개월 가량의 격차가 유지되고 있는 것으로 보임. Fable 이 현재 Opus 처음 나올 때처럼 충격을 많이 줬는데 이것도 6개월 내로 따라잡을지가 관건
• 지금은 이들 중국회사들이 가중치를 선선히 다 열어주고 있는데, 6개월 뒤에도 계속 퍼줄지는 개인적으로 의문이긴 함. 이거 만드는데 드는 돈이 얼만데?
참고
• AA 인덱스: 여러 벤치마크 결과들을 적당히 가중치해서 하나의 점수로 줄세운 인덱스
• WeirdML: 에이전트에 다양, 잡다한 일들을 시켜보는 테마의 벤치마크(예시: 체스판 보고 경기 결과 예측). 넓은 범위에서의 문제해결능력을 평가
링크
• https://z.ai/blog/glm-5.2
• https://artificialanalysis.ai/#intelligence
• https://x.com/htihle/status/2067575504085926232
• Artificial Analysis 의 종합 지능 인덱스에서는 Opus 4.8 > GPT-5.5 > GLM-5.2 > Sonnet 4.6 정도의 순서로 정리 (모두 max 레벨)
• WeirdML에서는 GLM-5.2 high가 Opus 4.5 high를 이김
• 기존 중국 프론티어 모델들은 코딩이나 어시스턴트 에이전트(claw) 에 집중하는 분위기가 있었다고 보는데(특히 DeepSeek) WeirdML 결과 보면 이제 코딩만 잘하는 너드가 아니라 그냥 일머리 좋은 AI도 만들어낸것으로 이해됨. 생각해볼 점이 많은 부분
• 중국의 공개모델들과 미국 프론티어 모델은 6개월 가량의 격차가 유지되고 있는 것으로 보임. Fable 이 현재 Opus 처음 나올 때처럼 충격을 많이 줬는데 이것도 6개월 내로 따라잡을지가 관건
• 지금은 이들 중국회사들이 가중치를 선선히 다 열어주고 있는데, 6개월 뒤에도 계속 퍼줄지는 개인적으로 의문이긴 함. 이거 만드는데 드는 돈이 얼만데?
참고
• AA 인덱스: 여러 벤치마크 결과들을 적당히 가중치해서 하나의 점수로 줄세운 인덱스
• WeirdML: 에이전트에 다양, 잡다한 일들을 시켜보는 테마의 벤치마크(예시: 체스판 보고 경기 결과 예측). 넓은 범위에서의 문제해결능력을 평가
링크
• https://z.ai/blog/glm-5.2
• https://artificialanalysis.ai/#intelligence
• https://x.com/htihle/status/2067575504085926232
👍1
Cerebras 가 OpenRouter 에서 GPT-5.5 를 소량 서빙하는 것이 포착 (테스트 혹은 오류)
GPT-5.3 Codex Spark 등을 1000 TPS 로 서빙했었는데 Full GPT-5.5 를 200tps 로만 서빙해도 상당히 놀라울듯. 이거도 너프된 Spark 버전이면 유감 (GPT-5.3 Codex Spark 는 gpt-oss 에 GPT-5.3 을 증류한거라 많이 멍청했음. oss용 칩을 재활용하는거라)
https://www.reddit.com/r/singularity/comments/1u8lmmt/gpt_55_on_cerebras_appeared_today_secretly_in/
GPT-5.3 Codex Spark 등을 1000 TPS 로 서빙했었는데 Full GPT-5.5 를 200tps 로만 서빙해도 상당히 놀라울듯. 이거도 너프된 Spark 버전이면 유감 (GPT-5.3 Codex Spark 는 gpt-oss 에 GPT-5.3 을 증류한거라 많이 멍청했음. oss용 칩을 재활용하는거라)
https://www.reddit.com/r/singularity/comments/1u8lmmt/gpt_55_on_cerebras_appeared_today_secretly_in/
Mutt Technologies
Cerebras 가 OpenRouter 에서 GPT-5.5 를 소량 서빙하는 것이 포착 (테스트 혹은 오류) GPT-5.3 Codex Spark 등을 1000 TPS 로 서빙했었는데 Full GPT-5.5 를 200tps 로만 서빙해도 상당히 놀라울듯. 이거도 너프된 Spark 버전이면 유감 (GPT-5.3 Codex Spark 는 gpt-oss 에 GPT-5.3 을 증류한거라 많이 멍청했음. oss용 칩을 재활용하는거라) https://www.red…
GLM-5.2가 보안, 코딩과 같이 사고력 필요한 일부 작업에서 GPT-5.5 에 버금간다는 간증 나오고 있음
중국-미국 격차가 6개월에서 3개월 이하로 줄었을 수도...
https://x.com/banteg/status/2067630638979584333
중국-미국 격차가 6개월에서 3개월 이하로 줄었을 수도...
https://x.com/banteg/status/2067630638979584333
X (formerly Twitter)
banteg (@banteg) on X
not a bad result from glm-5.2, it found this after gpt-5.5 xhigh
Ada 대량 해킹사고의 원인은 EdDSA 논스를 랜덤하게 생성사지 않아 몇 개의 서명만 보고 키 복구가 가능했던 것으로 판명
공부할때 실험환경에서만 발생하던건데 이게 실제로 발생을 하는구나
참고로 자주 쓰이는 ed25519의 경우 생성된 논스에 3-4 비트만 편향이 있어도 비밀키 유출이 가능합니다
https://x.com/tayvano_/status/2070107628639047744
공부할때 실험환경에서만 발생하던건데 이게 실제로 발생을 하는구나
참고로 자주 쓰이는 ed25519의 경우 생성된 논스에 3-4 비트만 편향이 있어도 비밀키 유출이 가능합니다
https://x.com/tayvano_/status/2070107628639047744
X (formerly Twitter)
Tay 💖 (@tayvano_) on X
They did it. They actually did it.
They actually managed to fuck up and reuse nonces for Ed25519 sigs.
Incredible things happening on Cardano.
Innovation, even. 😳
They actually managed to fuck up and reuse nonces for Ed25519 sigs.
Incredible things happening on Cardano.
Innovation, even. 😳
Mutt Technologies
Cerebras 가 OpenRouter 에서 GPT-5.5 를 소량 서빙하는 것이 포착 (테스트 혹은 오류) GPT-5.3 Codex Spark 등을 1000 TPS 로 서빙했었는데 Full GPT-5.5 를 200tps 로만 서빙해도 상당히 놀라울듯. 이거도 너프된 Spark 버전이면 유감 (GPT-5.3 Codex Spark 는 gpt-oss 에 GPT-5.3 을 증류한거라 많이 멍청했음. oss용 칩을 재활용하는거라) https://www.red…
이거 컨펌됐는데(GPT-5.6 서빙) 그사이 주가는 30퍼넘게 박고 15퍼 반등
😇
https://x.com/aleabitoreddit/status/2070754658868687086
😇
https://x.com/aleabitoreddit/status/2070754658868687086
X (formerly Twitter)
Serenity (@aleabitoreddit) on X
Kinda nutty OpenAI’s is launching its heavyweight 5.6 Sol frontier model on $CBRS.
At up to 750 tokens/sec, which is obscene performance.
American inference go brrr.
I actually picked up starter positions on Cerebras for the first time in the ~170s (below…
At up to 750 tokens/sec, which is obscene performance.
American inference go brrr.
I actually picked up starter positions on Cerebras for the first time in the ~170s (below…
Fable 토큰값이 너무 비싸서 부담스러우시죠? 프롬포트를 이미지로 출력해서 Fable에 말아드셔보세요. Fable이 OCR해서 똑같은 효과를 누리면서 80% 할인 효과가 있다고 함
실용성이 있는지는 모르겠는데(사실 그냥 비전토큰 가격 올려버리면 그만) 웃겨서 가져옴
https://github.com/teamchong/pxpipe
실용성이 있는지는 모르겠는데(사실 그냥 비전토큰 가격 올려버리면 그만) 웃겨서 가져옴
https://github.com/teamchong/pxpipe
GitHub
GitHub - teamchong/pxpipe: cut Fable 5 token usage by rendering text context as images
cut Fable 5 token usage by rendering text context as images - teamchong/pxpipe