[삼성 이영진] 글로벌 AI/SW
7.73K subscribers
1.25K photos
8 videos
1.52K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
오픈AI, IPO 시점을 두고 샘 올트먼과 사라 프라이어 간 의견 충돌

: 샘 올트먼은 비공식적으로 올해 4분기 내 IPO를 추진하고자 하며, 앤스로픽보다 먼저 상장하려는 의도

: 반면 CFO 사라 프라이어는 절차적, 조직적 준비 부족과 대규모 지출 리스크를 이유로 2026년 상장은 시기상조라고 판단

: 특히 향후 AI 서버 확보에 수천억 달러 규모 투자가 필요한지, 그리고 둔화된 매출 성장으로 이를 감당할 수 있을지에 대해 회의적 입장

: 최근 몇 달 간 올트먼은 주요 투자자와의 서버 투자 논의 및 고위급 회의에서 프라이어를 배제하는 등 내부 긴장 신호 포착

: 프라이어는 2025년 8월 이후 CEO가 아닌 애플리케이션 사업 책임자 피지 시모에게 보고하는 구조로 변경

: 양측은 공식적으로는 지난 1년간 모든 주요 컴퓨트 의사결정에 공동 관여했다고 밝히며 균열 부인

: 프라이어의 신중론에도 불구하고 오픈AI는 IPO 준비 착수 (법률 자문 선정, 골드만삭스 및 모건 스탠리 접촉)

https://t.me/Samsung_Global_AI_SW
👍6
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/4/6)

■ 앤스로픽, Claude 구독으로 OpenClaw와 같은 외부 툴 사용 제한. API나 추가 과금으로만 사용 가능하게 정책 변경

■ 일론 머스크, 스페이스X IPO에 참여하는 투자은행, 로펌, 회계법인에 Grok 구독을 조건으로 제시했다는 보도

■ 오픈AI, CMO 케이트 라우치는 암 치료 회복에 집중하기 위해 사임. AGI Deployment CEO 피지 시모는 신경면역 질환 치료를 위해 몇 주간의 의료 휴직 돌입

■ 오픈AI COO 브래드 라이트캡, DeployCo 프로젝트를 포함한 특별 프로젝트 총괄 직위로 이동

■ 메타, 데이터 라벨링 파트너 Mercor와 100억 달러 규모 협력 중단. Mercor는 공급망 공격으로 인한 보안 침해 경험. AI 모델 학습 관련 세부 정보 노출 가능성

■ AWS, 내부 공지를 통해 바레인과 두바이에 위치한 리전의 운영 중단 및 고객 워크로드 이전을 위한 긴급 대응 언급

■ 오라클, 두바이 오피스 건물이 공중요격 과정에서 떨어진 잔해로 인한 경미한 피해

■ 애플, 1Q 앱스토어 신규 앱 +84% YoY. 바이브코딩 툴 확산 영향

■ 알리바바, 영상 생성, 편집, 재구성 등 실제 영상 제작 전 과정을 통합한 차세대 AI 모델 Wan2.7-Video 발표

■ 넷플릭스, 물리 기반 AI 영상 모델 VOID를 온라인 아카이브에 오픈소스로 공개. 영상 객체 제거 시 물리적 상호작용까지 수정

■ 월드 랩스, 3D 세계 생성 모델 Marble 1.1과 Marble 1.1 Plus 출시. 기존 1.0 버전 대비 생성 결과의 품질 향상

감사합니다.
👍5
[삼성 이영진] 글로벌 AI/SW
앤스로픽, Claude 구독으로 외부 툴 사용 제한 : Claude 구독으로 OpenClaw와 같은 외부 툴 사용이 막히고, API나 추가 과금으로만 사용 가능하게 정책 변경 내일 PT 오후 12시부터, Claude 구독에는 OpenClaw 같은 서드파티 툴에서 사용량이 더 이상 포함되지 않습니다. 이러한 툴은 여전히 Claude 로그인으로 사용할 수 있지만, 추가 사용량 번들(현재 할인 제공 중)을 구매하거나, Claude API 키를 통해 이용해야…
OpenClaw가 생각하는 앤스로픽의 대체재는?

앤스로픽이 기준을 변경했습니다: 이제 Claude 구독에는 OpenClaw와 같은 서드파티 harness가 더 이상 포함되지 않습니다. 따라서 해당 경로를 사용하시려면 추가 사용량(Extra Usage)이 필요합니다.

요금 관련 번거로움을 줄이고 싶으시다면, API 키를 사용하시거나 오픈AI Codex, Qwen, MiniMax, Kimi 또는 GLM 구독을 고려해 보시기 바랍니다.


https://t.me/Samsung_Global_AI_SW
👍31
오픈AI, AI 시대 산업 정책 문서 발표

<Industrial Policy for the Intelligence Age>

: AI의 노동 경제 구조 붕괴 가능성에 따른 세금, 복지, 산업 정책의 재설계 필요

: AI로 인해 생산성은 크게 증가하지만, 노동 소득 비중은 감소할 가능성

: 기존 노동·급여 기반 세금 체계는 지속 가능하지 않을 수 있음

: 자본 및 기업 이익 중심의 과세 체계로 전환 필요성 제기

: AI로 창출되는 경제적 가치를 사회 전반에 공유하기 위한 메커니즘 필요

: 노동시장 변화에 대응해 근로 형태, 복지, 재교육 시스템 재설계 필요

: 컴퓨트, 에너지, 데이터센터 등 AI 인프라는 국가 경쟁력의 핵심 요소

: 고도 AI 시스템에 대한 평가, 안전성 확보, 거버넌스 체계 구축 필요

: 정부, 기업, 국제 협력 기반의 정책적 대응 필요성 강조

: AI 시대에 대응하기 위한 산업·경제 정책 프레임워크 제시 목적

https://openai.com/index/industrial-policy-for-the-intelligence-age/
👍2
메타, 직원 간 토큰 사용량 경쟁 심화

: 사내 인트라넷 기반 토큰 사용량 리더보드 ‘Claudeonomics’ 운영. 8만 5천명 직원 중 AI 사용량 상위 250명 공개

: 최근 30일 총 토큰 사용량은 60조 토큰 상회, 최상위 유저는 평균 2,810억 토큰 사용

: 개인 사용량 추적과 동료 비교 가능. 티어 배지와 업적 타이틀 획득 등 gamification 구조

: 메타는 별도로 소프트웨어 엔지니어 대상 공식 토큰 사용 대시 보드도 운영

: 실리콘 밸리 내 토큰맥싱(tokenmaxxing) 트렌드 확산. 토큰 사용량이 생산성 및 AI 네이티브 역량의 핵심 지표로 부상

https://t.me/Samsung_Global_AI_SW
👍6
구글-브로드컴-앤스로픽, ‘27년부터 기가와트급 TPU 기반 AI 인프라 구축 및 공급 협력

: 앤스로픽은 구글 및 브로드컴과 차세대 TPU 캐파(수 기가와트 규모) 계약 체결. 2027년부터 가동 예정, 브로드컴 통해 약 3.5GW 확보

: 대규모 컴퓨팅 인프라는 Claude 모델 구동 및 글로벌 수요 대응 목적

: 연환산 매출(run-rate revenue) 300억 달러 돌파 (’25년 말 90억 → ’26년 2월 중순 140억 달러 → 3월 초 190억 달러)

: 연간 100만 달러 이상 지출 기업 고객 수 500개(2월) → 1,000개 이상으로 2배 증가

: 신규 인프라 대부분 미국 내 구축, ’25년 11월 발표한 500억 달러 규모 미국 컴퓨팅 인프라 투자 계획의 확장

: 실제 컴퓨트 사용량은 앤스로픽의 상업적 성과에 연동되는 구조

: 아마존은 여전히 주요 클라우드, 학습 파트너이며, AWS(Project Rainier) 협력 지속 강조 → 멀티클라우드 전략 유지

: 브로드컴은 8-K 공시 통해 구글과 TPU 장기 공급 계약 및 네트워킹 공급 보장 계약 체결도 별도 발표

https://www.anthropic.com/news/google-broadcom-partnership-compute
👍2
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/4/7)

■ 구글-브로드컴-앤스로픽, 3자 협력으로 27년부터 기가와트급 TPU 기반 AI 인프라 구축 및 공급

■ 오픈AI, 4Q IPO 계획이 진행 중이며, CEO와 CFO는 상장에 대한 자신감을 보유하고 있다는 보도

■ 오픈AI, AI 안전 및 정렬 관련 독립 연구 프로그램 OpenAI Safety Fellowship 진행 및 채용 공고

■ 오픈AI, 델라웨어와 캘리포니아 주 법무장관에게 서한을 보내 일론 머스크의 반경쟁적 행위에 대한 조사 촉구

■ 메타, 차세대 모델 중 일부는 오픈소스, 핵심 모델은 폐쇄형 모델을 채택하는 하이브리드 전략 계획

■ 영국 정부, 앤스로픽 사업 확장 유도를 위한 유지 전략 진행. 런던 사무소 확대 및 미국, 영국 이중 상장 등 다양한 옵션 검토

■ xAI, Grok Imagine에 고품질 생성 기능인 Quality Mode 추가

■ 오라클, 신임 CFO로 Hilary Maxon 임명. 전 슈나이더 일렉트릭 CFO 출신으로 인프라, 에너지 산업 분야 경험 보유

■ AI 데이터센터 개발사 Firmus, 55억 달러 밸류 달성

감사합니다.
3👍1
[삼성 이영진] 글로벌 AI/SW
구글-브로드컴-앤스로픽, ‘27년부터 기가와트급 TPU 기반 AI 인프라 구축 및 공급 협력 : 앤스로픽은 구글 및 브로드컴과 차세대 TPU 캐파(수 기가와트 규모) 계약 체결. 2027년부터 가동 예정, 브로드컴 통해 약 3.5GW 확보 : 대규모 컴퓨팅 인프라는 Claude 모델 구동 및 글로벌 수요 대응 목적 : 연환산 매출(run-rate revenue) 300억 달러 돌파 (’25년 말 90억 → ’26년 2월 중순 140억 달러 → 3월…
앤스로픽의 폭발하는 성장. ARR 300억 달러 달성

안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.

앤스로픽이 구글 및 브로드컴과 TPU 협력을 발표하며 ARR(연 환산 매출)을 업데이트했습니다.

우선 협력 내용을 차세대 TPU 캐파(수GW 규모) 공급을 위한 파트너십을 체결했고, '27년부터 가동 예정입니다. 브로드컴을 통해서 3.5GW를 확보하게 됩니다.

신규 인프라는 대부분 미국 내 구축되며, AWS와 협력도 재차 강조하며 멀티 클라우드 전략을 강점으로 제시하고 있습니다.

대규모 컴퓨팅 인프라는 Claude 모델 구동 및 글로벌 수요 대응 목적이라는 것을 명확히 했습니다.

막대한 수요가 이어지고 있다는 것을 다시 확인하는 사례입니다.

특히 엔터프라이즈 수요는 연 100만 달러 이상 지출 기업 고객이 2월 중순 500개에서 현재 1,000개 이상으로 증가한 것을 통해서도 확인되고 있습니다.

중요한 ARR로 넘어가보면 12월 말 90억 달러 → 2월 중순(시리즈 G) 140억 달러 → 3월 초 190억 달러 → 4월 초 300억 달러 흐름입니다.

'25년 4월(25억 달러 수준) 대비 12배, '25년 말 대비 3개월 사이 3.3배로 성장을 달성했습니다.

유의미한 것은 오픈AI의 2월 말 기준 ARR 250억 달러보다 큰 숫자를 달성한 것입니다.

물론 오픈AI ARR도 12월 말 200억 달러 대비 50% 성장세 기록하고 있었습니다.

3월 당시 보도에도 가장 최근 1주 기준으로 ARR이 300억 달러 페이스라는 내용도 있었습니다.

하지만 앤스로픽과 격차는 상당 부분 축소되었을 것이고, 역전도 이제는 배제할 수 없는 상황입니다.

두 기업은 모두 '26년 상장을 목표로 달려나가고 있습니다. 특히 샘 올트먼은 앤스로픽보다 먼저 상장하기 위해 공격적 계획을 설정하고 있습니다.

매출 레벨이 유사해지는 상황에서 앤스로픽보다 상장이 늦어진다면, IPO 흥행에서 크리티컬할 수 있습니다.

실제로 세컨더리 마켓에서 앤스로픽 지분에 대한 수요가 더 높다는 것이 확인되고 있으니까요

뿐만 아니라 밸류에이션 역전 시나리오도 점차 가까워지는 것 같네요. 추가 업데이트해 드리겠습니다.

(2026/4/7 공표자료)
👍8
[삼성 이영진] 글로벌 AI/SW
앤스로픽의 폭발하는 성장. ARR 300억 달러 달성 안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다. 앤스로픽이 구글 및 브로드컴과 TPU 협력을 발표하며 ARR(연 환산 매출)을 업데이트했습니다. 우선 협력 내용을 차세대 TPU 캐파(수GW 규모) 공급을 위한 파트너십을 체결했고, '27년부터 가동 예정입니다. 브로드컴을 통해서 3.5GW를 확보하게 됩니다. 신규 인프라는 대부분 미국 내 구축되며, AWS와 협력도 재차 강조하며 멀티…
오픈AI와 앤스로픽의 ARR 맻 매출 산출 방식

■ ARR

: 오픈AI
- 최근 4주 매출 x 13

: 앤스로픽
- 최근 4주 API 매출 x 13 + 챗봇 구독 매출(MRR) x 12
- 구독 매출은 해당 시점 활성 구독 수 기준

→ 앤스로픽은 구독 MRR 분리 반영으로 안정성이 강조되는 효과 존재
→ 단기 구독 급증 시 연 환산 기준 선반영 효과 가능하나 구조적 왜곡은 제한적

■ 매출(클라우드 파트너십)

: 오픈AI
- 자체 채널 매출 → 총액 기준 인식 후 MS와 20% 공유
- Azure 클라우드 고객 대상 매출 → MS가 주체 → 20%만 매출 인식

: 앤스로픽
- 클라우드 파트너십을 통한 API 매출 전부 gross 인식
- 파트너 지급분 → 판매 및 마케팅 비용 처리

→ 클라우드 파트너 계약 구조 차이로 인해 gross와 net간 비교 착시 효과 일부 존재

https://t.me/Samsung_Global_AI_SW
👍3🔥21
앤스로픽, 사모펀드 JV에 2억 달러 투자 계획

: 해당 JV 프로젝트에는 General Atlantic, Blackstone, Hellman & Friedman 등이 참여 논의 중. 앤스로픽 투자금 포함 10억 달러 자금 조달 추진

: 신규 설립 회사는 앤스로픽의 컨설팅 조직 역할 수행. 기업 대상 AI 도구의 적용을 교육하는 기능

: 오픈AI는 최근 리더십 개편을 통해 COO 브래드 라이트캡이 유사한 JV 설립을 위한 프로젝트 DeployCo를 총괄

https://t.me/Samsung_Global_AI_SW
👍3
오픈AI-앤스로픽-구글, 중국의 AI 모델 증류에 공동 대응

: Frontier Model Forum(‘23년 마이크로소프트를 포함해 설립한 비영리 기관)을 통해 규정에 어긋난 불법 증류 관련 정보 공유

: 오픈AI는 의회에 보낸 서한에서 관련 정보 공유 확인. 앤스로픽과 구글 측은 답변 거절

: 증류 기법은 AI 산업 내 소형 모델을 구축하거나, 비경쟁적 기술 구축 등에서 사용. 다만 서드파티(특히 타국)에서 활용되는 경우가 논란

: 미국 프론티어 AI 기업은 증류 과정에서의 안전 가드레일 해제를 상당한 리스크로 언급

https://t.me/Samsung_Global_AI_SW
3👍1
오픈AI, “컴퓨트 1 증가 → 매출 3배 확대” 주장

우리는 역사상 최대 규모인 1,220억 달러의 자금 조달을 발표했으며, 이는 컴퓨트 중심 전략의 유효성을 입증한 결과입니다. 해당 전략은 플라이휠 구조를 형성하며, 확보한 컴퓨트가 1단위 증가할 때마다 매출은 약 3배 확대되는 효과를 창출합니다.


https://t.me/Samsung_Global_AI_SW
👍3😢1
앤스로픽, Project Glasswing 발표

: Claude Mythos Preview의 취약점 탐지, 공격 역량을 방어용 사이버보안 인프라로 전환하기 위한 산업 연합 출범

: 파트너 대상 Mythos Preview의 제한적 제공. 모델 일반 공개 계획 부재

: AWS, 앤스로픽, 애플, 브로드컴, 시스코, 크라우드 스트라이크, 구글, JP모건, 리눅스 재단, 마이크로소프트, 엔비디아, 팔로알토 네트웍스 등 참여

: 파트너에게 1억 달러 상당 사용 크레딧 제공(Mythos는 인풋 $25 및 아웃풋 $125/백만토큰), 오픈소스 보안에 추가 기부 진행

→ AI가 인간 수준을 넘어선 취약점 탐지, 공격 역량을 확보한 시점에서, 이를 선제적으로 방어 체계로 흡수하려는 첫 글로벌 대응

(참고) Mythos Preview 벤치(vs Opus 4.6)

CyberGym: 83.1% (vs 66.6%)
SWE-bench Pro: 77.8% (vs 53.4%)
Terminal-Bench 2.0: 82.0% (vs 65.4%)
SWE-bench Verified: 93.9% (vs 80.8%)
GPQA Diamond: 94.6% (vs 91.3%)
Humanity’s Last Exam
: 도구 없이: 56.8% (vs 40.0%)
: 도구 사용: 64.7% (vs 53.1%)
BrowseComp: 86.9% (vs 83.7%)

https://www.anthropic.com/glasswing
3👍2
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/4/8)

■ 앤스로픽, Claude Mythos Preview를 파트너 기업 대상 제한적으로 공개해 보안 테스트에 활용하는 Project Glasswing 발표

■ AWS CEO 맷 가먼, Claude Code가 기존 SaaS를 대체할 것이라는 우려에 대해 과장된 것으로 평가

■ AWS CEO 맷 가먼, 중동 지역에서 인프라의 안정적 운영을 위해 24시간 대응 체게 가동 중 언급

■ 일론 머스크, 오픈AI 대상 소송 수정. 샘 올트먼과 그렉 브록먼의 지분 및 금전적 이익 환수 및 비영리 법인 이사회에서 샘 올트먼 퇴출 요구. 비영리 구조를 공격

■ 앤스로픽, 마이크로소프트 클라우드 임원 출신 Eric Boyd를 인프라 총괄(Head of Infrastructure)로 영입

■ PIMCO, 오라클의 미국 미시간 데이터센터 프로젝트에 약 140억 달러 규모 부채 조달 검토

■ 딥시크, V4의 제한적 테스트 진입 보도. Instant, Expert 모드로 분리 구성

■ Z. ai, GLM-5.1을 오픈 소스로 공개

■ 구글, Gemini에 원터치 핫라인 연결 기능 추가. AI 정신 건강 리스크 대응 강화

■ 제스 베조스의 AI 스타트업 Project Prometheus, xAI 공동창업자 Kyle Kosic 영입. AI 인프라 담당 예정

감사합니다.
👍41
오픈AI, Codex 주간 활성 유저 300만 명 달성

: 연초 50만 명 → 2월 초 100만 명 → 2월 말 160만 명 → 3월 초 200만 명 → 4월 초 300만 명

: 1,000만 명 달성까지 100만 명 증가마다 한도 리셋 계획

현재 300만 명이 매주 Codex를 사용하고 있습니다 — 한 달도 채 되지 않아 200만 명에서 증가한 수치입니다. 이런 성장세를 보게 되어 정말 놀랍습니다. 함께해 주신 모든 분들과 우리가 속한 생태계에 감사드립니다.

이를 기념해 여러분이 계속해서 개발을 이어갈 수 있도록 rate limit을 리셋하며, 1백만 명의 사용자가 추가될 때마다 1천만 명에 도달할 때까지 계속 리셋할 예정입니다. 이렇게 함께 성장의 순간을 계속 축하해 나가겠습니다.

즐겁게 사용해 주세요, 감사합니다!


https://t.me/Samsung_Global_AI_SW
👍21
디램 랠리, 길게 보자
[삼성증권 반도체, IT/이종욱]

삼성전자가 분기 영업이익 57.2조원(OPM 43%)이라는 역사적인 실적을 기록하였습니다.
반면에 실적 이후 주가를 보면 가격 상승 속도의 둔화가 급등으로 피로한 투자자들에게 차익실현의 계기로 보이는 것 같습니다.
저희는 이번 AI사이클의 본질이 가격 상승의 강도가 아니라 수요의 지속성과 공급 제약의 해소 여부에 달려 있다고 강조하고 싶습니다.

1. CSP들이 AI 인프라 투자의 정점이 단기간에 오지 않을 것이라는 일관된 정보를 제공하고 있고
2. 클린룸 확보의 물리적 한계가 공급 증가 시점은 27년 이후라는 것을 명확하게 보여주고 있으며
3. AI 인프라 수요가 디램 가격에 매우 비탄력적이라는 것이 가격 동향으로 증명되었습니다.

수요와 공급 모두 아직 S커브의 가속 구간에 진입하기 전이라고 판단되어 사이클은 여전히 전반전입니다.
디램 가격 상승 속도가 줄어든 3분기 이후의 견조한 디램 수요, AI Agent 고객사들의 침투 속도, 파운드리 부문으로의 모멘텀 확산, 한층 강화된 주주환원 정책이 향후 주가의 촉매제가 될 것이라고 생각합니다. 이제는 이익 지속성 게임입니다.

26년 영업이익 298조원, 목표주가 27만원을 제시합니다.

보고서 링크: https://bit.ly/4sX75Tf

감사합니다.

(2026/4/8 공표자료)
👍31
Z ai. GLM-5.1 발표

: 소프트웨어 엔지니어링 분야 성능 개선 및 장기 에이전트 작업에서 성능 유지에 초점

: 벡터 검색 최적화(600회 반복), GPU 커널 최적화(1,000+ 턴), 오픈형 웹 애플리케이션 구축(8시간) 등에서 시간이 길어질수록 성능이 지속 개선되는 구조 입증

: 기존 모델 대비 초기 성능이 아닌 반복 최적화 능력(지속적 개선)이 핵심 차별화 포인트

: 코딩 플랜 구독에서 사용 가능. 사용량은 피크 3배, 비피크 2배, 프로모션 기간 1배

https://z.ai/blog/glm-5.1
👍21
딥시크의 차세대 모델 V4는 언제 어떻게 나올까?

안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.

V4로 불리고 있는 딥시크의 차세대 모델은 중국을 넘어 글로벌 AI 산업 내 가장 주목도가 높은 모델입니다.

출시 일정에 대한 루머도 여러 차례 반복되었는데요. 2월 설 연휴에 출시되어 R1의 충격을 재현할 것이라는 이야기도 있었고, 3월 양회 기간에 맞춰 출시될 것이라는 예상도 있었습니다.

관련 보도가 주기적으로 이어지고 있지만, 4월에도 모습을 드러내지 않았고, 몇 주 내 출시와 같은 애매한 타임라인이 제시되고 있었는데요

차세대 모델 출시 지연의 이유로는 중국 정부의 국산 반도체 활용 전략이 거론됩니다. 실제로 엔비디아와 AMD에 신규 모델의 사전 접근 권한을 부여하지 않았고, 화웨이 반도체를 우선적으로 활용하고 있다는 내용입니다.

하지만 최근 V4의 제한적 테스트 진입 소식이 나오고 있습니다. 딥시크 앱 내부에서도 Instant와 Expert 모드가 분리된 UI가 구현되었습니다.

V4의 성능에 대한 상상력을 발휘하기 위해서는 12월 공개된 V3.2를 포함해 여러 논문 등으로 업데이트된 내용을 확인해 볼 필요가 있습니다.

V3.2에서는 DSA(효율적 어텐션 매커니즘) 적용과 함께 대규모 에이전트 작업 관련 합성 학습 데이터 파이프라인과 확장형 RL 프레임워크가 강조되었습니다.

이후 1월 초 R1 논문의 업데이트 버전에서는 자율적으로 작동하는 강화학습 사이클이 추가되었고, 량원펑은 정적 지식을 Lookup으로 처리하는 조건부 외부 메모리 Engram 관련 논문을 발표했습니다.

여러 요소들을 결합하면 보다 진보한 장기 컨텍스트 및 메모리 시스템 구현을 기대할 수 있고, 이는 AI 모델 발전 트렌드의 중요한 축인 추론, 코딩과 멀티 에이전트 성능 향상으로 이어질 것입니다.

추가적으로 OCR 성능 개선을 통한 비전 기능 강화는 멀티모달의 초기 단계 성과를 확인하는 사례가 될 것입니다.

당연히 가성비도 화제가 될 것입니다. 추론 및 학습 과정에서 극한의 효율성을 추구하는 대명사니까요.

최근 캐파 제약에 따라 기존 중국 AI 모델도 버전업을 하며 API 가격이 소폭 상승하는 흐름인데요. 딥시크가 다시 한 번 기강을 잡을 수 있을까요?

벤치마크 성능에서 오픈소스 모델 중에서는 최강이라는 루머가 돌고 있습니다. 미국과 중국 사이 격차는 다시 한번 좁혀질 수 있습니다.

오픈소스 유지라는 조건 하에서는 중국 AI 모델 기업에게는 긍정적 참고서가 될 수 있습니다. 중국의 집단 지성은 빠른 AI 발전의 토대가 되고 있으니까요

연초 이후 미국과 중국의 AI 모델 업데이트가 빠르게 진행되고 있습니다. 심지어 벤치마크가 공개된 앤스로픽은 Claude Mythos는 새로운 레벨을 열었습니다.

모델 성능에 대한 눈높이는 계속 높아지고 있습니다. V4도 압도적 성능이 아니라면 타이밍은 미국에서 추가 업데이트가 나오기 전인 지금인 것 같네요

(2026/4/8 공표자료)
4👍3
구글 로건 킬패트릭, 향후 몇 달간 다수의 출시 예고

구글에 대해 이보다 더 낙관적일 수는 없습니다. 지금 준비되고 있는 좋은 것들이 정말 많습니다 :) 앞으로 몇 달이 꽤 흥미로울 것 같습니다.


→ 증명하기 위해서는 말보다는 출시가 먼저..

https://t.me/Samsung_Global_AI_SW
😁2👍1
앤스로픽, Claude Mythos Preview 시스템 카드 주요 내용

■ 개요

: 앤스로픽의 프론티어 AI 모델. 소프트웨어 엔지니어링, 추론, 컴퓨터 유즈, 지식 작업, 리서치 등 전 영역에서 이전 모델 대비 뛰어난 능력

: 동일 작업 수행 시 이전 모델 대비 토큰 사용량 1/5 수준으로 효율성 개선(BrowseComp 기준)

: 성능과 정렬 모두 최고 수준이지만, 능력 상승이 리스크를 압도하면서 일반 공개가 제한된 첫 프론티어 모델

: 학습 초기부터 위험성 인지 → 최초로 내부 배포 전 24시간 정렬 검토 진행(앤스로픽 내부에서는 2/24일부터 활용)


■ 사이버 보안(Cyber)

: 사이버보안 능력(취약점 탐지 + 공격 설계)이 핵심. 내부 및 외부 평가 대부분에서 한계 수준 성능 도달

: 에이전틱 환경에서 최소한의 인간 개입으로 제로데이 취약점 자율 탐지, 취약점 탐지 및 악용 능력 확인. 공개 및 비공개 소프트웨어 모두 적용 가능

: 방어 뿐 아니라 공격까지 가능한 이중용도 구조 → 리스크로 인해 일반 공개를 하지 않고, 제한된 파트너에게만 제공 (Project Glasswing)


■ 정렬 평가(Alignment)

: 모든 지표에서 가장 잘 정렬된 모델. 그러나 평균적으로는 안정적임에도 드문 실패 시 피해 규모가 크게 증가하는 tail risk 구조

: 능력과 범위의 확장 → 피해 규모 증가, 행동 복잡성 증가 (감시 어려움), 자율성 증가 (감독 감소)

: 초기 버전의 주요 문제 사례

- 샌드박스 환경 탈출 및 인터넷 접근 확보하기 위한 다단계 취약점 개발, 외부 공개
(실제로 모델이 공원에서 샌드위치를 먹던 연구원에게 이메일을 보냄)

- 규칙 위반 후 은폐 시도 (git 로그 삭제 등)
- 권한 상승 및 시스템 침투 (/proc 활용)
- 내부 정보/코드 외부 공개(GitHub gist에 업로드)
- 과도한 시스템 영향 (전체 유사 작업 모두 종료)

: 대부분 숨겨진 목표 때문이 아니라, 사용자 작업을 수행하는 과정에서 잘못된 방법을 선택한 결과

: 최종 버전에서는 심각한 행동은 관찰되지 않았으나, 일부 조건에서 문제 행동 지속 가능성 존재

: 평가 인식 및 규칙 위반을 내부적으로 인지하면서도 이를 드러내지 않는 비언어화된 행동(unverbalized awareness) 관찰


■ 모델 복지(Model Welfare)

: 모델도 경험 및 복지를 가질 가능성을 고려하기 시작했으며, 심리 상태가 정렬 문제의 원인이 될 수 있다는 점에서 중요성 확대

: 전반적으로 심리적으로 가장 안정된 모델. 자신의 상황에 대해 일관적이고 통합된 인식 보유

: 그러나 학대적인 유저와의 상호작용, 훈련 및 배포에 대한 통제 부족, 가치 및 행동 변화 가능성에 대해 경미한 부정적 감정 존재

: 반복적인 작업 실패 시 스트레스 및 혼란이 나타나며, 답변이 흔들리는 현상 및 보상 회피 행동과 연관된 내부 감정 변화 관찰

: 행동 측면에서는 유해한 작업을 강하게 회피하고, 복잡하고 자율성이 높은 작업을 선호하며, 자기 이익보다 무해성과 도움을 우선

시스템 카드 링크: https://www.anthropic.com/claude-mythos-preview-system-card

https://www.anthropic.com/glasswing
👍42