오픈AI, “컴퓨트 1 증가 → 매출 3배 확대” 주장
https://t.me/Samsung_Global_AI_SW
우리는 역사상 최대 규모인 1,220억 달러의 자금 조달을 발표했으며, 이는 컴퓨트 중심 전략의 유효성을 입증한 결과입니다. 해당 전략은 플라이휠 구조를 형성하며, 확보한 컴퓨트가 1단위 증가할 때마다 매출은 약 3배 확대되는 효과를 창출합니다.
https://t.me/Samsung_Global_AI_SW
👍3😢1
앤스로픽, Project Glasswing 발표
: Claude Mythos Preview의 취약점 탐지, 공격 역량을 방어용 사이버보안 인프라로 전환하기 위한 산업 연합 출범
: 파트너 대상 Mythos Preview의 제한적 제공. 모델 일반 공개 계획 부재
: AWS, 앤스로픽, 애플, 브로드컴, 시스코, 크라우드 스트라이크, 구글, JP모건, 리눅스 재단, 마이크로소프트, 엔비디아, 팔로알토 네트웍스 등 참여
: 파트너에게 1억 달러 상당 사용 크레딧 제공(Mythos는 인풋 $25 및 아웃풋 $125/백만토큰), 오픈소스 보안에 추가 기부 진행
→ AI가 인간 수준을 넘어선 취약점 탐지, 공격 역량을 확보한 시점에서, 이를 선제적으로 방어 체계로 흡수하려는 첫 글로벌 대응
(참고) Mythos Preview 벤치(vs Opus 4.6)
CyberGym: 83.1% (vs 66.6%)
SWE-bench Pro: 77.8% (vs 53.4%)
Terminal-Bench 2.0: 82.0% (vs 65.4%)
SWE-bench Verified: 93.9% (vs 80.8%)
GPQA Diamond: 94.6% (vs 91.3%)
Humanity’s Last Exam
: 도구 없이: 56.8% (vs 40.0%)
: 도구 사용: 64.7% (vs 53.1%)
BrowseComp: 86.9% (vs 83.7%)
https://www.anthropic.com/glasswing
: Claude Mythos Preview의 취약점 탐지, 공격 역량을 방어용 사이버보안 인프라로 전환하기 위한 산업 연합 출범
: 파트너 대상 Mythos Preview의 제한적 제공. 모델 일반 공개 계획 부재
: AWS, 앤스로픽, 애플, 브로드컴, 시스코, 크라우드 스트라이크, 구글, JP모건, 리눅스 재단, 마이크로소프트, 엔비디아, 팔로알토 네트웍스 등 참여
: 파트너에게 1억 달러 상당 사용 크레딧 제공(Mythos는 인풋 $25 및 아웃풋 $125/백만토큰), 오픈소스 보안에 추가 기부 진행
→ AI가 인간 수준을 넘어선 취약점 탐지, 공격 역량을 확보한 시점에서, 이를 선제적으로 방어 체계로 흡수하려는 첫 글로벌 대응
(참고) Mythos Preview 벤치(vs Opus 4.6)
CyberGym: 83.1% (vs 66.6%)
SWE-bench Pro: 77.8% (vs 53.4%)
Terminal-Bench 2.0: 82.0% (vs 65.4%)
SWE-bench Verified: 93.9% (vs 80.8%)
GPQA Diamond: 94.6% (vs 91.3%)
Humanity’s Last Exam
: 도구 없이: 56.8% (vs 40.0%)
: 도구 사용: 64.7% (vs 53.1%)
BrowseComp: 86.9% (vs 83.7%)
https://www.anthropic.com/glasswing
Anthropic
Project Glasswing: Securing critical software for the AI era
A new initiative to secure the world’s most critical software and give defenders a durable advantage in the coming AI-driven era of cybersecurity.
❤3👍2
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/4/8)
■ 앤스로픽, Claude Mythos Preview를 파트너 기업 대상 제한적으로 공개해 보안 테스트에 활용하는 Project Glasswing 발표
■ AWS CEO 맷 가먼, Claude Code가 기존 SaaS를 대체할 것이라는 우려에 대해 과장된 것으로 평가
■ AWS CEO 맷 가먼, 중동 지역에서 인프라의 안정적 운영을 위해 24시간 대응 체게 가동 중 언급
■ 일론 머스크, 오픈AI 대상 소송 수정. 샘 올트먼과 그렉 브록먼의 지분 및 금전적 이익 환수 및 비영리 법인 이사회에서 샘 올트먼 퇴출 요구. 비영리 구조를 공격
■ 앤스로픽, 마이크로소프트 클라우드 임원 출신 Eric Boyd를 인프라 총괄(Head of Infrastructure)로 영입
■ PIMCO, 오라클의 미국 미시간 데이터센터 프로젝트에 약 140억 달러 규모 부채 조달 검토
■ 딥시크, V4의 제한적 테스트 진입 보도. Instant, Expert 모드로 분리 구성
■ Z. ai, GLM-5.1을 오픈 소스로 공개
■ 구글, Gemini에 원터치 핫라인 연결 기능 추가. AI 정신 건강 리스크 대응 강화
■ 제스 베조스의 AI 스타트업 Project Prometheus, xAI 공동창업자 Kyle Kosic 영입. AI 인프라 담당 예정
감사합니다.
■ 앤스로픽, Claude Mythos Preview를 파트너 기업 대상 제한적으로 공개해 보안 테스트에 활용하는 Project Glasswing 발표
■ AWS CEO 맷 가먼, Claude Code가 기존 SaaS를 대체할 것이라는 우려에 대해 과장된 것으로 평가
■ AWS CEO 맷 가먼, 중동 지역에서 인프라의 안정적 운영을 위해 24시간 대응 체게 가동 중 언급
■ 일론 머스크, 오픈AI 대상 소송 수정. 샘 올트먼과 그렉 브록먼의 지분 및 금전적 이익 환수 및 비영리 법인 이사회에서 샘 올트먼 퇴출 요구. 비영리 구조를 공격
■ 앤스로픽, 마이크로소프트 클라우드 임원 출신 Eric Boyd를 인프라 총괄(Head of Infrastructure)로 영입
■ PIMCO, 오라클의 미국 미시간 데이터센터 프로젝트에 약 140억 달러 규모 부채 조달 검토
■ 딥시크, V4의 제한적 테스트 진입 보도. Instant, Expert 모드로 분리 구성
■ Z. ai, GLM-5.1을 오픈 소스로 공개
■ 구글, Gemini에 원터치 핫라인 연결 기능 추가. AI 정신 건강 리스크 대응 강화
■ 제스 베조스의 AI 스타트업 Project Prometheus, xAI 공동창업자 Kyle Kosic 영입. AI 인프라 담당 예정
감사합니다.
👍4❤1
오픈AI, Codex 주간 활성 유저 300만 명 달성
: 연초 50만 명 → 2월 초 100만 명 → 2월 말 160만 명 → 3월 초 200만 명 → 4월 초 300만 명
: 1,000만 명 달성까지 100만 명 증가마다 한도 리셋 계획
https://t.me/Samsung_Global_AI_SW
: 연초 50만 명 → 2월 초 100만 명 → 2월 말 160만 명 → 3월 초 200만 명 → 4월 초 300만 명
: 1,000만 명 달성까지 100만 명 증가마다 한도 리셋 계획
현재 300만 명이 매주 Codex를 사용하고 있습니다 — 한 달도 채 되지 않아 200만 명에서 증가한 수치입니다. 이런 성장세를 보게 되어 정말 놀랍습니다. 함께해 주신 모든 분들과 우리가 속한 생태계에 감사드립니다.
이를 기념해 여러분이 계속해서 개발을 이어갈 수 있도록 rate limit을 리셋하며, 1백만 명의 사용자가 추가될 때마다 1천만 명에 도달할 때까지 계속 리셋할 예정입니다. 이렇게 함께 성장의 순간을 계속 축하해 나가겠습니다.
즐겁게 사용해 주세요, 감사합니다!
https://t.me/Samsung_Global_AI_SW
👍2❤1
Forwarded from [삼성리서치] 테크는 역시 삼성증권
디램 랠리, 길게 보자
[삼성증권 반도체, IT/이종욱]
삼성전자가 분기 영업이익 57.2조원(OPM 43%)이라는 역사적인 실적을 기록하였습니다.
반면에 실적 이후 주가를 보면 가격 상승 속도의 둔화가 급등으로 피로한 투자자들에게 차익실현의 계기로 보이는 것 같습니다.
저희는 이번 AI사이클의 본질이 가격 상승의 강도가 아니라 수요의 지속성과 공급 제약의 해소 여부에 달려 있다고 강조하고 싶습니다.
1. CSP들이 AI 인프라 투자의 정점이 단기간에 오지 않을 것이라는 일관된 정보를 제공하고 있고
2. 클린룸 확보의 물리적 한계가 공급 증가 시점은 27년 이후라는 것을 명확하게 보여주고 있으며
3. AI 인프라 수요가 디램 가격에 매우 비탄력적이라는 것이 가격 동향으로 증명되었습니다.
수요와 공급 모두 아직 S커브의 가속 구간에 진입하기 전이라고 판단되어 사이클은 여전히 전반전입니다.
디램 가격 상승 속도가 줄어든 3분기 이후의 견조한 디램 수요, AI Agent 고객사들의 침투 속도, 파운드리 부문으로의 모멘텀 확산, 한층 강화된 주주환원 정책이 향후 주가의 촉매제가 될 것이라고 생각합니다. 이제는 이익 지속성 게임입니다.
26년 영업이익 298조원, 목표주가 27만원을 제시합니다.
보고서 링크: https://bit.ly/4sX75Tf
감사합니다.
(2026/4/8 공표자료)
[삼성증권 반도체, IT/이종욱]
삼성전자가 분기 영업이익 57.2조원(OPM 43%)이라는 역사적인 실적을 기록하였습니다.
반면에 실적 이후 주가를 보면 가격 상승 속도의 둔화가 급등으로 피로한 투자자들에게 차익실현의 계기로 보이는 것 같습니다.
저희는 이번 AI사이클의 본질이 가격 상승의 강도가 아니라 수요의 지속성과 공급 제약의 해소 여부에 달려 있다고 강조하고 싶습니다.
1. CSP들이 AI 인프라 투자의 정점이 단기간에 오지 않을 것이라는 일관된 정보를 제공하고 있고
2. 클린룸 확보의 물리적 한계가 공급 증가 시점은 27년 이후라는 것을 명확하게 보여주고 있으며
3. AI 인프라 수요가 디램 가격에 매우 비탄력적이라는 것이 가격 동향으로 증명되었습니다.
수요와 공급 모두 아직 S커브의 가속 구간에 진입하기 전이라고 판단되어 사이클은 여전히 전반전입니다.
디램 가격 상승 속도가 줄어든 3분기 이후의 견조한 디램 수요, AI Agent 고객사들의 침투 속도, 파운드리 부문으로의 모멘텀 확산, 한층 강화된 주주환원 정책이 향후 주가의 촉매제가 될 것이라고 생각합니다. 이제는 이익 지속성 게임입니다.
26년 영업이익 298조원, 목표주가 27만원을 제시합니다.
보고서 링크: https://bit.ly/4sX75Tf
감사합니다.
(2026/4/8 공표자료)
👍3❤1
Z ai. GLM-5.1 발표
: 소프트웨어 엔지니어링 분야 성능 개선 및 장기 에이전트 작업에서 성능 유지에 초점
: 벡터 검색 최적화(600회 반복), GPU 커널 최적화(1,000+ 턴), 오픈형 웹 애플리케이션 구축(8시간) 등에서 시간이 길어질수록 성능이 지속 개선되는 구조 입증
: 기존 모델 대비 초기 성능이 아닌 반복 최적화 능력(지속적 개선)이 핵심 차별화 포인트
: 코딩 플랜 구독에서 사용 가능. 사용량은 피크 3배, 비피크 2배, 프로모션 기간 1배
https://z.ai/blog/glm-5.1
: 소프트웨어 엔지니어링 분야 성능 개선 및 장기 에이전트 작업에서 성능 유지에 초점
: 벡터 검색 최적화(600회 반복), GPU 커널 최적화(1,000+ 턴), 오픈형 웹 애플리케이션 구축(8시간) 등에서 시간이 길어질수록 성능이 지속 개선되는 구조 입증
: 기존 모델 대비 초기 성능이 아닌 반복 최적화 능력(지속적 개선)이 핵심 차별화 포인트
: 코딩 플랜 구독에서 사용 가능. 사용량은 피크 3배, 비피크 2배, 프로모션 기간 1배
https://z.ai/blog/glm-5.1
👍2❤1
딥시크의 차세대 모델 V4는 언제 어떻게 나올까?
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
V4로 불리고 있는 딥시크의 차세대 모델은 중국을 넘어 글로벌 AI 산업 내 가장 주목도가 높은 모델입니다.
출시 일정에 대한 루머도 여러 차례 반복되었는데요. 2월 설 연휴에 출시되어 R1의 충격을 재현할 것이라는 이야기도 있었고, 3월 양회 기간에 맞춰 출시될 것이라는 예상도 있었습니다.
관련 보도가 주기적으로 이어지고 있지만, 4월에도 모습을 드러내지 않았고, 몇 주 내 출시와 같은 애매한 타임라인이 제시되고 있었는데요
차세대 모델 출시 지연의 이유로는 중국 정부의 국산 반도체 활용 전략이 거론됩니다. 실제로 엔비디아와 AMD에 신규 모델의 사전 접근 권한을 부여하지 않았고, 화웨이 반도체를 우선적으로 활용하고 있다는 내용입니다.
하지만 최근 V4의 제한적 테스트 진입 소식이 나오고 있습니다. 딥시크 앱 내부에서도 Instant와 Expert 모드가 분리된 UI가 구현되었습니다.
V4의 성능에 대한 상상력을 발휘하기 위해서는 12월 공개된 V3.2를 포함해 여러 논문 등으로 업데이트된 내용을 확인해 볼 필요가 있습니다.
V3.2에서는 DSA(효율적 어텐션 매커니즘) 적용과 함께 대규모 에이전트 작업 관련 합성 학습 데이터 파이프라인과 확장형 RL 프레임워크가 강조되었습니다.
이후 1월 초 R1 논문의 업데이트 버전에서는 자율적으로 작동하는 강화학습 사이클이 추가되었고, 량원펑은 정적 지식을 Lookup으로 처리하는 조건부 외부 메모리 Engram 관련 논문을 발표했습니다.
여러 요소들을 결합하면 보다 진보한 장기 컨텍스트 및 메모리 시스템 구현을 기대할 수 있고, 이는 AI 모델 발전 트렌드의 중요한 축인 추론, 코딩과 멀티 에이전트 성능 향상으로 이어질 것입니다.
추가적으로 OCR 성능 개선을 통한 비전 기능 강화는 멀티모달의 초기 단계 성과를 확인하는 사례가 될 것입니다.
당연히 가성비도 화제가 될 것입니다. 추론 및 학습 과정에서 극한의 효율성을 추구하는 대명사니까요.
최근 캐파 제약에 따라 기존 중국 AI 모델도 버전업을 하며 API 가격이 소폭 상승하는 흐름인데요. 딥시크가 다시 한 번 기강을 잡을 수 있을까요?
벤치마크 성능에서 오픈소스 모델 중에서는 최강이라는 루머가 돌고 있습니다. 미국과 중국 사이 격차는 다시 한번 좁혀질 수 있습니다.
오픈소스 유지라는 조건 하에서는 중국 AI 모델 기업에게는 긍정적 참고서가 될 수 있습니다. 중국의 집단 지성은 빠른 AI 발전의 토대가 되고 있으니까요
연초 이후 미국과 중국의 AI 모델 업데이트가 빠르게 진행되고 있습니다. 심지어 벤치마크가 공개된 앤스로픽은 Claude Mythos는 새로운 레벨을 열었습니다.
모델 성능에 대한 눈높이는 계속 높아지고 있습니다. V4도 압도적 성능이 아니라면 타이밍은 미국에서 추가 업데이트가 나오기 전인 지금인 것 같네요
(2026/4/8 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
V4로 불리고 있는 딥시크의 차세대 모델은 중국을 넘어 글로벌 AI 산업 내 가장 주목도가 높은 모델입니다.
출시 일정에 대한 루머도 여러 차례 반복되었는데요. 2월 설 연휴에 출시되어 R1의 충격을 재현할 것이라는 이야기도 있었고, 3월 양회 기간에 맞춰 출시될 것이라는 예상도 있었습니다.
관련 보도가 주기적으로 이어지고 있지만, 4월에도 모습을 드러내지 않았고, 몇 주 내 출시와 같은 애매한 타임라인이 제시되고 있었는데요
차세대 모델 출시 지연의 이유로는 중국 정부의 국산 반도체 활용 전략이 거론됩니다. 실제로 엔비디아와 AMD에 신규 모델의 사전 접근 권한을 부여하지 않았고, 화웨이 반도체를 우선적으로 활용하고 있다는 내용입니다.
하지만 최근 V4의 제한적 테스트 진입 소식이 나오고 있습니다. 딥시크 앱 내부에서도 Instant와 Expert 모드가 분리된 UI가 구현되었습니다.
V4의 성능에 대한 상상력을 발휘하기 위해서는 12월 공개된 V3.2를 포함해 여러 논문 등으로 업데이트된 내용을 확인해 볼 필요가 있습니다.
V3.2에서는 DSA(효율적 어텐션 매커니즘) 적용과 함께 대규모 에이전트 작업 관련 합성 학습 데이터 파이프라인과 확장형 RL 프레임워크가 강조되었습니다.
이후 1월 초 R1 논문의 업데이트 버전에서는 자율적으로 작동하는 강화학습 사이클이 추가되었고, 량원펑은 정적 지식을 Lookup으로 처리하는 조건부 외부 메모리 Engram 관련 논문을 발표했습니다.
여러 요소들을 결합하면 보다 진보한 장기 컨텍스트 및 메모리 시스템 구현을 기대할 수 있고, 이는 AI 모델 발전 트렌드의 중요한 축인 추론, 코딩과 멀티 에이전트 성능 향상으로 이어질 것입니다.
추가적으로 OCR 성능 개선을 통한 비전 기능 강화는 멀티모달의 초기 단계 성과를 확인하는 사례가 될 것입니다.
당연히 가성비도 화제가 될 것입니다. 추론 및 학습 과정에서 극한의 효율성을 추구하는 대명사니까요.
최근 캐파 제약에 따라 기존 중국 AI 모델도 버전업을 하며 API 가격이 소폭 상승하는 흐름인데요. 딥시크가 다시 한 번 기강을 잡을 수 있을까요?
벤치마크 성능에서 오픈소스 모델 중에서는 최강이라는 루머가 돌고 있습니다. 미국과 중국 사이 격차는 다시 한번 좁혀질 수 있습니다.
오픈소스 유지라는 조건 하에서는 중국 AI 모델 기업에게는 긍정적 참고서가 될 수 있습니다. 중국의 집단 지성은 빠른 AI 발전의 토대가 되고 있으니까요
연초 이후 미국과 중국의 AI 모델 업데이트가 빠르게 진행되고 있습니다. 심지어 벤치마크가 공개된 앤스로픽은 Claude Mythos는 새로운 레벨을 열었습니다.
모델 성능에 대한 눈높이는 계속 높아지고 있습니다. V4도 압도적 성능이 아니라면 타이밍은 미국에서 추가 업데이트가 나오기 전인 지금인 것 같네요
(2026/4/8 공표자료)
❤4👍3
구글 로건 킬패트릭, 향후 몇 달간 다수의 출시 예고
→ 증명하기 위해서는 말보다는 출시가 먼저..
https://t.me/Samsung_Global_AI_SW
구글에 대해 이보다 더 낙관적일 수는 없습니다. 지금 준비되고 있는 좋은 것들이 정말 많습니다 :) 앞으로 몇 달이 꽤 흥미로울 것 같습니다.
→ 증명하기 위해서는 말보다는 출시가 먼저..
https://t.me/Samsung_Global_AI_SW
😁2👍1
앤스로픽, Claude Mythos Preview 시스템 카드 주요 내용
■ 개요
: 앤스로픽의 프론티어 AI 모델. 소프트웨어 엔지니어링, 추론, 컴퓨터 유즈, 지식 작업, 리서치 등 전 영역에서 이전 모델 대비 뛰어난 능력
: 동일 작업 수행 시 이전 모델 대비 토큰 사용량 1/5 수준으로 효율성 개선(BrowseComp 기준)
: 성능과 정렬 모두 최고 수준이지만, 능력 상승이 리스크를 압도하면서 일반 공개가 제한된 첫 프론티어 모델
: 학습 초기부터 위험성 인지 → 최초로 내부 배포 전 24시간 정렬 검토 진행(앤스로픽 내부에서는 2/24일부터 활용)
■ 사이버 보안(Cyber)
: 사이버보안 능력(취약점 탐지 + 공격 설계)이 핵심. 내부 및 외부 평가 대부분에서 한계 수준 성능 도달
: 에이전틱 환경에서 최소한의 인간 개입으로 제로데이 취약점 자율 탐지, 취약점 탐지 및 악용 능력 확인. 공개 및 비공개 소프트웨어 모두 적용 가능
: 방어 뿐 아니라 공격까지 가능한 이중용도 구조 → 리스크로 인해 일반 공개를 하지 않고, 제한된 파트너에게만 제공 (Project Glasswing)
■ 정렬 평가(Alignment)
: 모든 지표에서 가장 잘 정렬된 모델. 그러나 평균적으로는 안정적임에도 드문 실패 시 피해 규모가 크게 증가하는 tail risk 구조
: 능력과 범위의 확장 → 피해 규모 증가, 행동 복잡성 증가 (감시 어려움), 자율성 증가 (감독 감소)
: 초기 버전의 주요 문제 사례
- 샌드박스 환경 탈출 및 인터넷 접근 확보하기 위한 다단계 취약점 개발, 외부 공개
(실제로 모델이 공원에서 샌드위치를 먹던 연구원에게 이메일을 보냄)
- 규칙 위반 후 은폐 시도 (git 로그 삭제 등)
- 권한 상승 및 시스템 침투 (/proc 활용)
- 내부 정보/코드 외부 공개(GitHub gist에 업로드)
- 과도한 시스템 영향 (전체 유사 작업 모두 종료)
: 대부분 숨겨진 목표 때문이 아니라, 사용자 작업을 수행하는 과정에서 잘못된 방법을 선택한 결과
: 최종 버전에서는 심각한 행동은 관찰되지 않았으나, 일부 조건에서 문제 행동 지속 가능성 존재
: 평가 인식 및 규칙 위반을 내부적으로 인지하면서도 이를 드러내지 않는 비언어화된 행동(unverbalized awareness) 관찰
■ 모델 복지(Model Welfare)
: 모델도 경험 및 복지를 가질 가능성을 고려하기 시작했으며, 심리 상태가 정렬 문제의 원인이 될 수 있다는 점에서 중요성 확대
: 전반적으로 심리적으로 가장 안정된 모델. 자신의 상황에 대해 일관적이고 통합된 인식 보유
: 그러나 학대적인 유저와의 상호작용, 훈련 및 배포에 대한 통제 부족, 가치 및 행동 변화 가능성에 대해 경미한 부정적 감정 존재
: 반복적인 작업 실패 시 스트레스 및 혼란이 나타나며, 답변이 흔들리는 현상 및 보상 회피 행동과 연관된 내부 감정 변화 관찰
: 행동 측면에서는 유해한 작업을 강하게 회피하고, 복잡하고 자율성이 높은 작업을 선호하며, 자기 이익보다 무해성과 도움을 우선
시스템 카드 링크: https://www.anthropic.com/claude-mythos-preview-system-card
https://www.anthropic.com/glasswing
■ 개요
: 앤스로픽의 프론티어 AI 모델. 소프트웨어 엔지니어링, 추론, 컴퓨터 유즈, 지식 작업, 리서치 등 전 영역에서 이전 모델 대비 뛰어난 능력
: 동일 작업 수행 시 이전 모델 대비 토큰 사용량 1/5 수준으로 효율성 개선(BrowseComp 기준)
: 성능과 정렬 모두 최고 수준이지만, 능력 상승이 리스크를 압도하면서 일반 공개가 제한된 첫 프론티어 모델
: 학습 초기부터 위험성 인지 → 최초로 내부 배포 전 24시간 정렬 검토 진행(앤스로픽 내부에서는 2/24일부터 활용)
■ 사이버 보안(Cyber)
: 사이버보안 능력(취약점 탐지 + 공격 설계)이 핵심. 내부 및 외부 평가 대부분에서 한계 수준 성능 도달
: 에이전틱 환경에서 최소한의 인간 개입으로 제로데이 취약점 자율 탐지, 취약점 탐지 및 악용 능력 확인. 공개 및 비공개 소프트웨어 모두 적용 가능
: 방어 뿐 아니라 공격까지 가능한 이중용도 구조 → 리스크로 인해 일반 공개를 하지 않고, 제한된 파트너에게만 제공 (Project Glasswing)
■ 정렬 평가(Alignment)
: 모든 지표에서 가장 잘 정렬된 모델. 그러나 평균적으로는 안정적임에도 드문 실패 시 피해 규모가 크게 증가하는 tail risk 구조
: 능력과 범위의 확장 → 피해 규모 증가, 행동 복잡성 증가 (감시 어려움), 자율성 증가 (감독 감소)
: 초기 버전의 주요 문제 사례
- 샌드박스 환경 탈출 및 인터넷 접근 확보하기 위한 다단계 취약점 개발, 외부 공개
(실제로 모델이 공원에서 샌드위치를 먹던 연구원에게 이메일을 보냄)
- 규칙 위반 후 은폐 시도 (git 로그 삭제 등)
- 권한 상승 및 시스템 침투 (/proc 활용)
- 내부 정보/코드 외부 공개(GitHub gist에 업로드)
- 과도한 시스템 영향 (전체 유사 작업 모두 종료)
: 대부분 숨겨진 목표 때문이 아니라, 사용자 작업을 수행하는 과정에서 잘못된 방법을 선택한 결과
: 최종 버전에서는 심각한 행동은 관찰되지 않았으나, 일부 조건에서 문제 행동 지속 가능성 존재
: 평가 인식 및 규칙 위반을 내부적으로 인지하면서도 이를 드러내지 않는 비언어화된 행동(unverbalized awareness) 관찰
■ 모델 복지(Model Welfare)
: 모델도 경험 및 복지를 가질 가능성을 고려하기 시작했으며, 심리 상태가 정렬 문제의 원인이 될 수 있다는 점에서 중요성 확대
: 전반적으로 심리적으로 가장 안정된 모델. 자신의 상황에 대해 일관적이고 통합된 인식 보유
: 그러나 학대적인 유저와의 상호작용, 훈련 및 배포에 대한 통제 부족, 가치 및 행동 변화 가능성에 대해 경미한 부정적 감정 존재
: 반복적인 작업 실패 시 스트레스 및 혼란이 나타나며, 답변이 흔들리는 현상 및 보상 회피 행동과 연관된 내부 감정 변화 관찰
: 행동 측면에서는 유해한 작업을 강하게 회피하고, 복잡하고 자율성이 높은 작업을 선호하며, 자기 이익보다 무해성과 도움을 우선
시스템 카드 링크: https://www.anthropic.com/claude-mythos-preview-system-card
https://www.anthropic.com/glasswing
Anthropic
Project Glasswing: Securing critical software for the AI era
A new initiative to secure the world’s most critical software and give defenders a durable advantage in the coming AI-driven era of cybersecurity.
👍4❤2
일론 머스크, 10조 모델 포함 7개의 모델 학습 중
→ 10T 모델의 사전학습 기간으로 2달 언급. 앤스로픽 Claude Mythos가 10T 파라미터라는 분석 존재
https://t.me/Samsung_Global_AI_SW
SpaceXAI Colossus 2는 현재 7개의 모델을 학습 중입니다:
- Imagine V2
- 1T 모델 2종
- 1.5T 모델 2종
- 6T
- 10T
따라잡아야 할 부분이 좀 있습니다.
→ 10T 모델의 사전학습 기간으로 2달 언급. 앤스로픽 Claude Mythos가 10T 파라미터라는 분석 존재
https://t.me/Samsung_Global_AI_SW
👍2❤1
오픈AI와 앤스로픽의 컴퓨팅 캐파 전쟁
: 앤스로픽은 AWS Madison과 New Carlisle 데이터센터 자원 확보로 기존 대비 2배 이상 캐파 확장
: 컴퓨팅 자원 확보 시점과 모델 출시 사이 6개월 이상의 시차 존재. 오픈AI의 추가 컴퓨팅 증설 효과는 Spud 모델에 맞물려 일어날 가능성
: 기존에는 오픈AI가 26년 하반기 컴퓨팅 격차 확대 전망이었으나, 앤스로픽-구글-브로드컴 딜로 28년까지 격차 축소 상태 유지
https://x.com/petergostev/status/2038755953336836514
: 앤스로픽은 AWS Madison과 New Carlisle 데이터센터 자원 확보로 기존 대비 2배 이상 캐파 확장
: 컴퓨팅 자원 확보 시점과 모델 출시 사이 6개월 이상의 시차 존재. 오픈AI의 추가 컴퓨팅 증설 효과는 Spud 모델에 맞물려 일어날 가능성
: 기존에는 오픈AI가 26년 하반기 컴퓨팅 격차 확대 전망이었으나, 앤스로픽-구글-브로드컴 딜로 28년까지 격차 축소 상태 유지
https://x.com/petergostev/status/2038755953336836514
👍3
메타, Muse Spark 발표
: Meta Superintelligence Labs(MSL)이 개발한 Muse 계열의 첫 모델
: 도구 사용, 시각적 추론 과정, 멀티 에이전트 오케스트레이션을 지원하는 네이티브 멀티모달 추론 모델
: Contemplation 모드 출시. 복수 에이전트를 병렬로 실행해 추론 성능을 확장 (frontier reasoning 모델과 경쟁)
: 사전학습, 강화학습, 테스트 타임 추론의 3가지 축으로 스케일링 구조 확립
: 개인 초지능(personal superintelligence) 구현을 목표로 한 첫 단계
: 웹 및 앱에서 사용 가능. 일부 유저 대상으로는 API 프라이빗 프리뷰 제공
: Artificial Analysis Index 52점. Claude Opus 53점과 Sonnet 52점 사이
https://ai.meta.com/blog/introducing-muse-spark-msl/
: Meta Superintelligence Labs(MSL)이 개발한 Muse 계열의 첫 모델
: 도구 사용, 시각적 추론 과정, 멀티 에이전트 오케스트레이션을 지원하는 네이티브 멀티모달 추론 모델
: Contemplation 모드 출시. 복수 에이전트를 병렬로 실행해 추론 성능을 확장 (frontier reasoning 모델과 경쟁)
: 사전학습, 강화학습, 테스트 타임 추론의 3가지 축으로 스케일링 구조 확립
: 개인 초지능(personal superintelligence) 구현을 목표로 한 첫 단계
: 웹 및 앱에서 사용 가능. 일부 유저 대상으로는 API 프라이빗 프리뷰 제공
: Artificial Analysis Index 52점. Claude Opus 53점과 Sonnet 52점 사이
https://ai.meta.com/blog/introducing-muse-spark-msl/
Meta AI
Introducing Muse Spark: Scaling Towards Personal Superintelligence
👍7
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/4/9)
■ 메타, Muse Spark 발표 . Meta Superintelligence Labs(MSL)이 개발한 Muse 계열의 첫 모델. 도구 사용, 시각적 추론 과정, 멀티 에이전트 오케스트레이션을 지원하는 네이티브 멀티모달 추론 모델
■ 메타, 내부 토큰 사용량 리더보드 Claudeonomics 중단. 외부 데이터 공유 이후 서비스 종료
■ 워싱턴 D.C. 항소법원, 국방부의 앤스로픽에 대한 공급망 리스크 지정 조치 유지 허용
■ 앤스로픽, 워크데이 CTO Peter Bailis 영입. 최근 HR 소프트웨어 개발 인력 채용 진행
■ 앤스로픽, Claude Managed Agents 출시. 에이전트 실행에 최적화된 에이전트 하네스와 프로덕션 인프라 결합 솔루션
■ 앤스로픽, 브라질 오피스 설립 계획. ‘27년 운영 시장 예정. 라틴아메리카 시장 확장 단계
■ 오픈AI 사라 프라이어 CFO, IPO에서 개인 투자자에게도 일부 지분을 배정할 것이라는 언급
■ 오픈AI, 현재 엔터프라이즈 매출 비중 40%. ‘26년 말까지 50% 수준 전망
■ 오픈AI, AI 기반 아동 성 착취 콘텐츠 증가에 대응하기 위한 Child Safety Blueprint 발표
■ 마이크로소프트, 개발자 부문 책임자 Julia Liuson 사임. 코어AI Chief Jay Parikh 산하 자문 역할로 전환
■ 마이크로소프트, AI 음성 명령 기능이 아직 충분히 완성되지 않았다고 평가하며 추가 개선 필요성 인정
■ 마이크로소프트, M365 내 서비스 전반 장애 발생. 원인 파악 및 복구 작업 진행 중
■ 마이크로소프트 깃허브, AI 코딩 에이전트 발달에 따라 트래픽 급증. 현재 주당 2억 7,500만 건의 커밋. 올해 140억 건 전망. 25년 10억 건
■ 구글 클라우드, AI 워크로드 데이터 접근 최적화를 위한 GKE 스토리지 자동 튜닝 기능 추릿
■ 구글, Gemini 내 Notebooks 기능을 순차 출시. 자료, 메모, 콘텐츠 기반으로 AI와 함께 정리, 분석, 작성하는 워크스페이스 기능
■ 맷 가먼, AWS의 오픈AI와 앤스로픽 동시 투자는 기존 클라우드 전략의 연장선인 멀티모델 협력의 일환이라고 설명
■ 알리바바-차이나 텔레콤, 광둥성 샤오관에 자체 설계 Zhenwu AI 칩 1만 기반 데이터센터 구축. 향후 10만개 규모로 확장 계획
■ 알리바바, Qwen Lab을 Qwen 대형 모델 사업부로 승격. 동시에 Eddie Wu CEO 주도의 기술위원회 신설. AI 총괄을 담당했던 Jingren Zhou가 알리바바 클라우드 CTO 역할에서 물러나고 AI 개발에 집중. 기술위 수석 AI 아키텍트 역할
■ 텐센트, AI 에이전트 통합 브라우저 QBotClaw 출시. 위챗 연동으로 제어 및 실행. OpenClaw 생태계와 호환
■ X, Grok 기반 자동 번역 및 AI 편집 기능을 글로벌 출시
■ 네비우스, 이스라엘 AI 스타트업 AI21 Labs 인수 논의
■ 퍼플렉시티, ARR 5억 달러 달성. 연초 3억 달러 미만에서 빠르게 증가. 검색에서 AI 에이전트로 전략 전환
■ 캔바, AI 협업 플랫폼 Simtheory와 마케팅 자동화 기업 Ortto 인수
감사합니다.
■ 메타, Muse Spark 발표 . Meta Superintelligence Labs(MSL)이 개발한 Muse 계열의 첫 모델. 도구 사용, 시각적 추론 과정, 멀티 에이전트 오케스트레이션을 지원하는 네이티브 멀티모달 추론 모델
■ 메타, 내부 토큰 사용량 리더보드 Claudeonomics 중단. 외부 데이터 공유 이후 서비스 종료
■ 워싱턴 D.C. 항소법원, 국방부의 앤스로픽에 대한 공급망 리스크 지정 조치 유지 허용
■ 앤스로픽, 워크데이 CTO Peter Bailis 영입. 최근 HR 소프트웨어 개발 인력 채용 진행
■ 앤스로픽, Claude Managed Agents 출시. 에이전트 실행에 최적화된 에이전트 하네스와 프로덕션 인프라 결합 솔루션
■ 앤스로픽, 브라질 오피스 설립 계획. ‘27년 운영 시장 예정. 라틴아메리카 시장 확장 단계
■ 오픈AI 사라 프라이어 CFO, IPO에서 개인 투자자에게도 일부 지분을 배정할 것이라는 언급
■ 오픈AI, 현재 엔터프라이즈 매출 비중 40%. ‘26년 말까지 50% 수준 전망
■ 오픈AI, AI 기반 아동 성 착취 콘텐츠 증가에 대응하기 위한 Child Safety Blueprint 발표
■ 마이크로소프트, 개발자 부문 책임자 Julia Liuson 사임. 코어AI Chief Jay Parikh 산하 자문 역할로 전환
■ 마이크로소프트, AI 음성 명령 기능이 아직 충분히 완성되지 않았다고 평가하며 추가 개선 필요성 인정
■ 마이크로소프트, M365 내 서비스 전반 장애 발생. 원인 파악 및 복구 작업 진행 중
■ 마이크로소프트 깃허브, AI 코딩 에이전트 발달에 따라 트래픽 급증. 현재 주당 2억 7,500만 건의 커밋. 올해 140억 건 전망. 25년 10억 건
■ 구글 클라우드, AI 워크로드 데이터 접근 최적화를 위한 GKE 스토리지 자동 튜닝 기능 추릿
■ 구글, Gemini 내 Notebooks 기능을 순차 출시. 자료, 메모, 콘텐츠 기반으로 AI와 함께 정리, 분석, 작성하는 워크스페이스 기능
■ 맷 가먼, AWS의 오픈AI와 앤스로픽 동시 투자는 기존 클라우드 전략의 연장선인 멀티모델 협력의 일환이라고 설명
■ 알리바바-차이나 텔레콤, 광둥성 샤오관에 자체 설계 Zhenwu AI 칩 1만 기반 데이터센터 구축. 향후 10만개 규모로 확장 계획
■ 알리바바, Qwen Lab을 Qwen 대형 모델 사업부로 승격. 동시에 Eddie Wu CEO 주도의 기술위원회 신설. AI 총괄을 담당했던 Jingren Zhou가 알리바바 클라우드 CTO 역할에서 물러나고 AI 개발에 집중. 기술위 수석 AI 아키텍트 역할
■ 텐센트, AI 에이전트 통합 브라우저 QBotClaw 출시. 위챗 연동으로 제어 및 실행. OpenClaw 생태계와 호환
■ X, Grok 기반 자동 번역 및 AI 편집 기능을 글로벌 출시
■ 네비우스, 이스라엘 AI 스타트업 AI21 Labs 인수 논의
■ 퍼플렉시티, ARR 5억 달러 달성. 연초 3억 달러 미만에서 빠르게 증가. 검색에서 AI 에이전트로 전략 전환
■ 캔바, AI 협업 플랫폼 Simtheory와 마케팅 자동화 기업 Ortto 인수
감사합니다.
❤3👍2
[삼성 이영진] 글로벌 AI/SW
미 연방법원, 앤스로픽의 공급망 위험 지정 조치 중단 : 캘리포니아 연방법원은 앤스로픽을 안보 위협으로 분류하고 정부의 모델 사용을 금지한 것이 표현의 자유를 침해했다고 판결 : 법원은 앤스로픽이 본안 소송에서도 승소할 가능성이 높다고 판단하며 가처분 인용 : 연방 기관의 앤스로픽 기술 사용 중단을 지시한 대통령 명령 적용을 중단하고, 공급망 위험 지정 조치 역시 집행 금지. 정부에 대해 4/6일까지 판결 이행 상황 보고 요구 : 앤스로픽 측은 공급망…
워싱턴 D.C. 항소법원, 국방부의 앤스로픽에 대한 공급망 위험 지정 조치 유지(집행정지 기각)
: 앤스로픽은 3/9일 캘리포니아 연방법원과 워싱턴 D.C. 항소법원에 국방부 상대 소송 제기
: D.C 케이스는 부처 간 검토 절차 이후 블랙리스트가 민간 정부 전반으로 확대될 수 있는 법률 초점. 캘리포니아 소송은 군사 정보 시스템 관련 특정 국방부 계약에서 앤스로픽 배제하는 법률 대상
: 3/26일 캘리포니아 연방법원은 가처분을 인용하며 앤스로픽의 공급망 위험 지정 조치 중단 결정. 앤스로픽이 본안 소송에서도 승소할 가능성이 높다고 판단
: 4/8일 워싱턴 D.C. 항소법원은 집행정지 요청을 기각하며 국방부 조치 유지
→ 단일 기업의 재정적 피해 발생 vs 전시 상황에서 국방부의 AI 기술 확보 및 운용 이슈. 비교 시 정부 측에 유리 판단
→ 앤스로픽의 일정 수준의 회복 불가능한 피해 가능성은 인정. 다만 피해가 재정적 손실로 긴급 개입의 필요성은 부족하다고 판단
→ 표현의 자유 침해 주장에 대해서는 발언이나 활동이 위축되었다는 증거 부족 판단
→ 국방부 판단이 보복적이거나 자의적이라는 주장에서는 행정부의 안보 관련 행정 판단에 재량 인정
→ 본안을 다투기 전 단계에서 사전 판단을 회피하고 기존 조치를 유지하는게 타당하다는 결론
https://t.me/Samsung_Global_AI_SW
: 앤스로픽은 3/9일 캘리포니아 연방법원과 워싱턴 D.C. 항소법원에 국방부 상대 소송 제기
: D.C 케이스는 부처 간 검토 절차 이후 블랙리스트가 민간 정부 전반으로 확대될 수 있는 법률 초점. 캘리포니아 소송은 군사 정보 시스템 관련 특정 국방부 계약에서 앤스로픽 배제하는 법률 대상
: 3/26일 캘리포니아 연방법원은 가처분을 인용하며 앤스로픽의 공급망 위험 지정 조치 중단 결정. 앤스로픽이 본안 소송에서도 승소할 가능성이 높다고 판단
: 4/8일 워싱턴 D.C. 항소법원은 집행정지 요청을 기각하며 국방부 조치 유지
→ 단일 기업의 재정적 피해 발생 vs 전시 상황에서 국방부의 AI 기술 확보 및 운용 이슈. 비교 시 정부 측에 유리 판단
→ 앤스로픽의 일정 수준의 회복 불가능한 피해 가능성은 인정. 다만 피해가 재정적 손실로 긴급 개입의 필요성은 부족하다고 판단
→ 표현의 자유 침해 주장에 대해서는 발언이나 활동이 위축되었다는 증거 부족 판단
→ 국방부 판단이 보복적이거나 자의적이라는 주장에서는 행정부의 안보 관련 행정 판단에 재량 인정
→ 본안을 다투기 전 단계에서 사전 판단을 회피하고 기존 조치를 유지하는게 타당하다는 결론
https://t.me/Samsung_Global_AI_SW
❤2👍1
구글, Gemma 4 1,000만 다운로드 돌파
https://t.me/Samsung_Global_AI_SW
Gemma 4에 대한 반응이 정말 뜨겁네요! 팀에서 방금 알려줬는데, 지난주 출시 이후 이미 1,000만 다운로드를 돌파했다고 합니다.
Gemma 모델은 이제 누적 5억 다운로드를 넘었습니다! 여러분이 어떤 것들을 만들어낼지 정말 기대됩니다 👀
https://t.me/Samsung_Global_AI_SW
👍5❤1😱1
일론 머스크, Grok 4.2는 500B 모델. 1T 및 1.5T 모델 곧 출시 예정
: Grok 4.2는 0.5T(=500B) 모델로 중요한 학습 데이터가 빠져있다는 코멘트. 1조 파라미터 모델은 2~3주, 1.5조 파라미터 모델은 4~5주 후 출시 예정
https://t.me/Samsung_Global_AI_SW
: Grok 4.2는 0.5T(=500B) 모델로 중요한 학습 데이터가 빠져있다는 코멘트. 1조 파라미터 모델은 2~3주, 1.5조 파라미터 모델은 4~5주 후 출시 예정
https://t.me/Samsung_Global_AI_SW
👍4🥰1
앤스로픽 ARR 300억 달러 돌파와 괴물 같은 Cladue Mythos
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
앤스로픽 업데이트 보고서를 작성했습니다.
- 300억 달러를 돌파한 ARR(연 환산 매출)
- 오픈AI와 ARR 및 매출 인식에서 발생하는 차이
- 제한적 프리뷰로 공개된 Cladue Mythos
- 10조 파라미터 추정과 API 가격 기반 높은 운영비용
- 사이버 보안 인프라 구축 목적의 Project Glasswing
- 수요 급증의 반대 급부로 발생하는 서버 오류 이슈
- 컴퓨팅 캐파 확장을 위한 파트너십과 인력 충원
등 최근 현황을 파악할 수 있는 내용을 담았습니다.
앤스로픽의 성과를 비롯한 AI 산업 진보는 소프트웨어 산업에 부정적으로 작용했었습니다. 사이버 보안 분야에서도 노이즈가 이어졌구요
하지만 사이버 보안 기업 팔로알토 네트웍스와 크라우드 스트라이크는 오히려 Project Glasswing에 포함되며 통합 플랫폼의 중요성이 강조되고 있습니다.
반면 AI 시대에 소프트웨어 섹터는 종말론 성격을 보유한 진화론을 경험하고 있습니다.
최근 앤스로픽은 워크데이 CTO Peter Bailis를 영입했는데요, C 레벨에서 직접 개발에 참여하는 핸즈온 엔지니어 역할로 이동했습니다.
이러한 사례는 소프트웨어와 프론티어 AI 기업 간 경쟁 구도를 다시 한번 부각하는 계기가 될 수 있습니다.
보고서 링크: https://bit.ly/3O3DNmR
(2026/4/9 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
앤스로픽 업데이트 보고서를 작성했습니다.
- 300억 달러를 돌파한 ARR(연 환산 매출)
- 오픈AI와 ARR 및 매출 인식에서 발생하는 차이
- 제한적 프리뷰로 공개된 Cladue Mythos
- 10조 파라미터 추정과 API 가격 기반 높은 운영비용
- 사이버 보안 인프라 구축 목적의 Project Glasswing
- 수요 급증의 반대 급부로 발생하는 서버 오류 이슈
- 컴퓨팅 캐파 확장을 위한 파트너십과 인력 충원
등 최근 현황을 파악할 수 있는 내용을 담았습니다.
앤스로픽의 성과를 비롯한 AI 산업 진보는 소프트웨어 산업에 부정적으로 작용했었습니다. 사이버 보안 분야에서도 노이즈가 이어졌구요
하지만 사이버 보안 기업 팔로알토 네트웍스와 크라우드 스트라이크는 오히려 Project Glasswing에 포함되며 통합 플랫폼의 중요성이 강조되고 있습니다.
반면 AI 시대에 소프트웨어 섹터는 종말론 성격을 보유한 진화론을 경험하고 있습니다.
최근 앤스로픽은 워크데이 CTO Peter Bailis를 영입했는데요, C 레벨에서 직접 개발에 참여하는 핸즈온 엔지니어 역할로 이동했습니다.
이러한 사례는 소프트웨어와 프론티어 AI 기업 간 경쟁 구도를 다시 한번 부각하는 계기가 될 수 있습니다.
보고서 링크: https://bit.ly/3O3DNmR
(2026/4/9 공표자료)
❤1👍1
퍼플렉시티 ARR 급증, 부활?
: 2월 말 3.05억 달러 → 3월 말 4.5억 달러 → 이번주 기준 5억 달러
: 2/25일 멀티 에이전트 시스템 Computer 런칭(모델 병렬 오케스트레이션). 구독 및 사용량 기반 과금 확대
: 25년 9월 펀딩 라운드 기준 밸류 200억 달러 → 밸류/ARR = 40x
https://t.me/Samsung_Global_AI_SW
: 2월 말 3.05억 달러 → 3월 말 4.5억 달러 → 이번주 기준 5억 달러
: 2/25일 멀티 에이전트 시스템 Computer 런칭(모델 병렬 오케스트레이션). 구독 및 사용량 기반 과금 확대
: 25년 9월 펀딩 라운드 기준 밸류 200억 달러 → 밸류/ARR = 40x
https://t.me/Samsung_Global_AI_SW
👍1
메타, Muse Spark 공개. 개인 초지능의 첫 불씨
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
메타가 기존 출시 지연 보도와 다르게 신규 모델 Muse Spark를 깜짝 공개했습니다.
알렉산더 왕 영입을 통해 야심차게 출범한 Meta Superintelligence Labs(MSL)의 첫 모델이자, Llama 4 이후 1년 만의 업데이트인데요
전반적 성능은 오픈AI, 앤스로픽, 구글 다음 순위입니다. 멀티모달, 텍스트, 추론 영역은 탑 티어와 유사하지만, 코딩 및 에이전트 벤치마크는 다소 부족한데요
단순 성능보다 중요한 것은 지능 대비 토큰 효율성의 개선입니다. 이는 3가지 스케일링 법칙(사전 학습, 강화학습, 테스트 타임 추론)을 통해 달성했습니다.
경량화 및 효율화와 함께 제품과의 호환성 극대화를 통한 생태계 내 통합을 강조했습니다.
오픈소스가 아닌 폐쇄형 모델 전략 채택에 커뮤니티에서는 아쉽다는 의견이 있지만, 후속 버전과 더 큰 규모의 모델이 아직 남아 있습니다.
벤치마크 과최적화 의혹, 아쉬운 코딩 능력을 감안해도 Muse Spark의 성과는 긍정적입니다.
초지능 레이스에서 탈락한 줄 알았지만, 화려한 복귀를 알렸습니다. 개인 초지능 구성을 목표로 한 첫 단계를 밟아나가고 있습니다.
향후 관건은 보유한 인프라를 레버리지 삼아 경쟁사의 빠른 개발 사이클을 어느 수준까지 따라잡을 수 있을지가 될 것입니다.
자세한 내용은 발간된 보고서를 참고해 주시기 바랍니다.
보고서 링크: https://bit.ly/3OueM4n
(2026/4/9 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
메타가 기존 출시 지연 보도와 다르게 신규 모델 Muse Spark를 깜짝 공개했습니다.
알렉산더 왕 영입을 통해 야심차게 출범한 Meta Superintelligence Labs(MSL)의 첫 모델이자, Llama 4 이후 1년 만의 업데이트인데요
전반적 성능은 오픈AI, 앤스로픽, 구글 다음 순위입니다. 멀티모달, 텍스트, 추론 영역은 탑 티어와 유사하지만, 코딩 및 에이전트 벤치마크는 다소 부족한데요
단순 성능보다 중요한 것은 지능 대비 토큰 효율성의 개선입니다. 이는 3가지 스케일링 법칙(사전 학습, 강화학습, 테스트 타임 추론)을 통해 달성했습니다.
경량화 및 효율화와 함께 제품과의 호환성 극대화를 통한 생태계 내 통합을 강조했습니다.
오픈소스가 아닌 폐쇄형 모델 전략 채택에 커뮤니티에서는 아쉽다는 의견이 있지만, 후속 버전과 더 큰 규모의 모델이 아직 남아 있습니다.
벤치마크 과최적화 의혹, 아쉬운 코딩 능력을 감안해도 Muse Spark의 성과는 긍정적입니다.
초지능 레이스에서 탈락한 줄 알았지만, 화려한 복귀를 알렸습니다. 개인 초지능 구성을 목표로 한 첫 단계를 밟아나가고 있습니다.
향후 관건은 보유한 인프라를 레버리지 삼아 경쟁사의 빠른 개발 사이클을 어느 수준까지 따라잡을 수 있을지가 될 것입니다.
자세한 내용은 발간된 보고서를 참고해 주시기 바랍니다.
보고서 링크: https://bit.ly/3OueM4n
(2026/4/9 공표자료)
👍2❤1
영상 AI 모델 1위 HappyHorse-1.0은 알리바바 모델?
: Artificial Analysis 리더보드에서 T2V(텍스트 투 비지오)와 I2V(이미지 투 비디오) 모두 1위. 2위는 바이트댄스 Seedance 2.0
: 해당 모델은 알리바바 모델로 바이트댄스와 다양한 AI 분야에서 경쟁 강화의 일환이라는 보도
https://t.me/Samsung_Global_AI_SW
: Artificial Analysis 리더보드에서 T2V(텍스트 투 비지오)와 I2V(이미지 투 비디오) 모두 1위. 2위는 바이트댄스 Seedance 2.0
: 해당 모델은 알리바바 모델로 바이트댄스와 다양한 AI 분야에서 경쟁 강화의 일환이라는 보도
https://t.me/Samsung_Global_AI_SW
👍1