Forwarded from [삼성 문준호의 반도체를 전하다]
[반.전] TSMC: 3Q25 실적 발표 - Quick review
안녕하세요. 삼성증권 문준호의 ‘반도체를 전하다’입니다.
TSMC가 3분기 실적을 공개했습니다. 우선 주요 수치들만 공유해 드립니다.
■ 3Q25 실적 (컨센서스: FactSet)
- 매출액 9,899억 대만달러
: +30.3% y-y, +6.0% q-q
: USD 기준, +40.8% y-y, +10.1% q-q
: 기 발표된 수치로 컨센서스와 비교 무의미
- 공정별 매출액
: 선단 공정 +6.8% q-q
: 성숙 공정 +5.0% q-q
: 비중 3nm 23%, 5nm 37%, 7nm 14%
vs 전분기 3nm 24%, 5nm 36%, 7nm 14%
- 전방 산업별 q-q 매출 증감
: HPC(고성능 컴퓨팅) -0%대
: 스마트폰 +19%
: IoT +20%
: 차량 +18%
- 매출총이익률 59.5% vs 전분기 58.6%
: 컨센서스 56.9% 상회
: 비우호적 환율 환경과 해외 공장 가동률 증가 영향이 지속되었음에도, 전체 가동률이 높게 유지된 덕분
- 영업이익률 50.6% vs 전분기 49.6%
: 컨센서스 47.3% 상회
■ 4Q25 가이던스
- USD 기준, 매출액 322~334억 달러 제시
: 컨센서스 311억 달러 상회
: 중간값 기준 +22.0% y-y, -0.9% q-q
- TWD 환산 시, 9,853~10,220억 대만달러
: 컨센서스 9,508억 대만달러 상회
: 중간값 기준 +15.6% y-y, +1.4% q-q
- 매출총이익률 가이던스 59.0~61.0%
: 컨센서스 56.8% 상회
: 환율 환경 개선과 전체 가동률이 높게 유지될 전망 덕분
- 영업이익률 가이던스 49.0~51.0%
: 컨센서스 47.1% 상회
■ 2025 연간 가이던스
- USD 기준, 연간 매출액 +35% 성장
: 직전 전망 +30% 성장에서 상향
- CAPEX 400~420억 달러
: 직전 전망 380~420억 달러 대비 상향
: 올해 연간 매출액의 34% 수준
다시 업데이트해 드리겠습니다.
감사합니다.
(2025/10/16 공표자료)
안녕하세요. 삼성증권 문준호의 ‘반도체를 전하다’입니다.
TSMC가 3분기 실적을 공개했습니다. 우선 주요 수치들만 공유해 드립니다.
■ 3Q25 실적 (컨센서스: FactSet)
- 매출액 9,899억 대만달러
: +30.3% y-y, +6.0% q-q
: USD 기준, +40.8% y-y, +10.1% q-q
: 기 발표된 수치로 컨센서스와 비교 무의미
- 공정별 매출액
: 선단 공정 +6.8% q-q
: 성숙 공정 +5.0% q-q
: 비중 3nm 23%, 5nm 37%, 7nm 14%
vs 전분기 3nm 24%, 5nm 36%, 7nm 14%
- 전방 산업별 q-q 매출 증감
: HPC(고성능 컴퓨팅) -0%대
: 스마트폰 +19%
: IoT +20%
: 차량 +18%
- 매출총이익률 59.5% vs 전분기 58.6%
: 컨센서스 56.9% 상회
: 비우호적 환율 환경과 해외 공장 가동률 증가 영향이 지속되었음에도, 전체 가동률이 높게 유지된 덕분
- 영업이익률 50.6% vs 전분기 49.6%
: 컨센서스 47.3% 상회
■ 4Q25 가이던스
- USD 기준, 매출액 322~334억 달러 제시
: 컨센서스 311억 달러 상회
: 중간값 기준 +22.0% y-y, -0.9% q-q
- TWD 환산 시, 9,853~10,220억 대만달러
: 컨센서스 9,508억 대만달러 상회
: 중간값 기준 +15.6% y-y, +1.4% q-q
- 매출총이익률 가이던스 59.0~61.0%
: 컨센서스 56.8% 상회
: 환율 환경 개선과 전체 가동률이 높게 유지될 전망 덕분
- 영업이익률 가이던스 49.0~51.0%
: 컨센서스 47.1% 상회
■ 2025 연간 가이던스
- USD 기준, 연간 매출액 +35% 성장
: 직전 전망 +30% 성장에서 상향
- CAPEX 400~420억 달러
: 직전 전망 380~420억 달러 대비 상향
: 올해 연간 매출액의 34% 수준
다시 업데이트해 드리겠습니다.
감사합니다.
(2025/10/16 공표자료)
👍3❤1
팔란티어 & 스노우플레이크 전략적 파트너십 발표
: 스노우플레이크의 AI Data Cloud와 팔란티어 Foundry + AIP 통합
: 스노우 Apache Iceberg 테이블과 팔란티어 플랫폼 간 양방향, 제로카피, 상호운용성 구현(=데이터 복제 없이 실시간 상호작용 가능)
: 효과 및 고객 가치
1) 데이터 사일로 제거 및 효율적이고 신뢰할 수 있는 데이터 파이프라인 구축
2) 분석 및 AI 애플리케이션 개발 속도 가속화
3) 보안, 거버넌스 강화 및 엔터프라이즈 전반의 데이터 통합 지원
https://www.snowflake.com/en/blog/palantir-snowflake-partner-trusted-ai/
: 스노우플레이크의 AI Data Cloud와 팔란티어 Foundry + AIP 통합
: 스노우 Apache Iceberg 테이블과 팔란티어 플랫폼 간 양방향, 제로카피, 상호운용성 구현(=데이터 복제 없이 실시간 상호작용 가능)
: 효과 및 고객 가치
1) 데이터 사일로 제거 및 효율적이고 신뢰할 수 있는 데이터 파이프라인 구축
2) 분석 및 AI 애플리케이션 개발 속도 가속화
3) 보안, 거버넌스 강화 및 엔터프라이즈 전반의 데이터 통합 지원
https://www.snowflake.com/en/blog/palantir-snowflake-partner-trusted-ai/
Snowflake
Palantir and Snowflake Partner to Deliver Trusted, Frictionless AI
Snowflake partners with Palantir Technologies to help organizations effectively integrate generative and agentic AI.
👍2❤1
세일즈포스 & 구글, 파트너십 확대 - Agentforce 360과 Gemini Enterprise 통합 심화
1) Gemini 모델의 Atlas Reasoning 엔진 통합. 하이브리드 추론 도입
2) Agentforce 360과 구글 워크스페이스 전면 통합 확대
3) Slack과 Gemini Enterprise 실시간 연동 강화
4) 대규모 액션 모델 기반으로 비즈니스 프로세스 자동화
5) 오픈 표준(MCP, A2A) 채택으로 멀티에이전트 상호운용성 확보
6) 신규 Agentforce IT Service 모듈 도입
7) Service Cloud + Google Telephony 컨텍센터 솔루션(26년 상반기 GA), Data File Federation(26년 하반기 GA) 등 구체적 제품 로드맵
https://www.salesforce.com/news/press-releases/2025/10/16/google-gemini-agentforce-partnership-expansion-announcement/
1) Gemini 모델의 Atlas Reasoning 엔진 통합. 하이브리드 추론 도입
2) Agentforce 360과 구글 워크스페이스 전면 통합 확대
3) Slack과 Gemini Enterprise 실시간 연동 강화
4) 대규모 액션 모델 기반으로 비즈니스 프로세스 자동화
5) 오픈 표준(MCP, A2A) 채택으로 멀티에이전트 상호운용성 확보
6) 신규 Agentforce IT Service 모듈 도입
7) Service Cloud + Google Telephony 컨텍센터 솔루션(26년 상반기 GA), Data File Federation(26년 하반기 GA) 등 구체적 제품 로드맵
https://www.salesforce.com/news/press-releases/2025/10/16/google-gemini-agentforce-partnership-expansion-announcement/
Salesforce
Salesforce and Google Expand Strategic Partnership with Deeper Integrations Across Agentforce 360 and Gemini Enterprise
Salesforce’s Atlas Reasoning Engine introduces hybrid reasoning with Gemini models, enabling AI agents to combine the creativity of AI with the
👍2
[삼성 이영진] 글로벌 AI/SW 헤드라인 (25/10/17)
■ 팔란티어 & 스노우플레이크 전략적 파트너십 발표. 스노우플레이크의 AI Data Cloud와 팔란티어 Foundry + AIP 통합
■ 세일즈포스 & 구글, 파트너십 확대. Agentforce 360과 Gemini Enterprise 통합 심화
■ 오픈AI, 블랙홀 물리학자 Alex Lupsasca 영입. OpenAI for Science 팀의 첫번째 멤버
■ 오픈AI, Sign in with ChatGPT 기능을 통해 외부 웹사이트에서 챗GPT 계정으로 로그인하고, 유저의 요금제 한도를 이용해 API 비용을 처리하도록 하는 새로운 AI 생태계 통합 모델 추진 보도
■ 구글 딥마인드, Commonwealth Fusion Systems(CFS)와 협력하여 AI를 이용한 핵융합 에너지 연구 추진
■ 앤스로픽, Excel, PowerPoint, Word, PDF 생성 등 특정 작업을 자동 수행하도록 설계된 Claude Skills 공개
■ 앤스로픽, MCP 커넥터 기반 Microsoft 365 통합 기능 출시
■ 마이크로소프트, 윈도우 11 PC를 기본적으로 AI PC가 되도록하는 다수의 업데이트 발표
■ 마이크로소프트, 서피스 및 데이터센터 서버 제품 관련 서플라이 체인에 26년부터 중국 외 지역 생산 준비 요청. AWS와 구글도 유사한 움직임
■ 애플 AI 조직 내 추가 이탈. 아이폰 기반의 AI 웹 검색 기능 개발을 이끌던 임원 Ke Yang이 메타로 이직
■코어위브, AWS 글로벌 스타트업 및 벤처 캐피탈 사업을 담당했던 Jon Jones를 Chief Revenue Officer로 영입
■ 데이터도그, 주당 $60 이상으로 깃랩 인수 제안 검토 보도
■ 사이버 보안 기업 F5, 중국 정부의 지원을 받는 해커 그룹이 BIG-IP 제품 개발 시스템에 침입한 사실 공개
감사합니다.
■ 팔란티어 & 스노우플레이크 전략적 파트너십 발표. 스노우플레이크의 AI Data Cloud와 팔란티어 Foundry + AIP 통합
■ 세일즈포스 & 구글, 파트너십 확대. Agentforce 360과 Gemini Enterprise 통합 심화
■ 오픈AI, 블랙홀 물리학자 Alex Lupsasca 영입. OpenAI for Science 팀의 첫번째 멤버
■ 오픈AI, Sign in with ChatGPT 기능을 통해 외부 웹사이트에서 챗GPT 계정으로 로그인하고, 유저의 요금제 한도를 이용해 API 비용을 처리하도록 하는 새로운 AI 생태계 통합 모델 추진 보도
■ 구글 딥마인드, Commonwealth Fusion Systems(CFS)와 협력하여 AI를 이용한 핵융합 에너지 연구 추진
■ 앤스로픽, Excel, PowerPoint, Word, PDF 생성 등 특정 작업을 자동 수행하도록 설계된 Claude Skills 공개
■ 앤스로픽, MCP 커넥터 기반 Microsoft 365 통합 기능 출시
■ 마이크로소프트, 윈도우 11 PC를 기본적으로 AI PC가 되도록하는 다수의 업데이트 발표
■ 마이크로소프트, 서피스 및 데이터센터 서버 제품 관련 서플라이 체인에 26년부터 중국 외 지역 생산 준비 요청. AWS와 구글도 유사한 움직임
■ 애플 AI 조직 내 추가 이탈. 아이폰 기반의 AI 웹 검색 기능 개발을 이끌던 임원 Ke Yang이 메타로 이직
■코어위브, AWS 글로벌 스타트업 및 벤처 캐피탈 사업을 담당했던 Jon Jones를 Chief Revenue Officer로 영입
■ 데이터도그, 주당 $60 이상으로 깃랩 인수 제안 검토 보도
■ 사이버 보안 기업 F5, 중국 정부의 지원을 받는 해커 그룹이 BIG-IP 제품 개발 시스템에 침입한 사실 공개
감사합니다.
👍2❤1
오라클(ORCL US) - Oracle AI World 2025 - 다시 올라간 OCI 전망
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
오라클은 Oracle AI World 2025 컨퍼런스에서 Financial Analyst Meeting을 진행하며 장기 재무 목표를 업데이트했습니다.
FY30 매출 및 EPS 전망은 각각 2,250억 달러와 $21로 연평균(CAGR) +31% 및 +28% 성장을 가정하고 있습니다.
F2Q 클라우드 인프라 추가 수주 650억 달러를 기록하며 RPO는 5,000억 달러=0.5조 달러를 넘어섰습니다. 4개 고객으로부터 7건의 계약으로 메타는 포함되어 있지만, 오픈AI는 포함되지 않았다는 점을 강조하며 고객 집중 우려에 대응하는 모습입니다.
추가 수주를 고려해 클라우드 인프라 매출 전망도 상향했습니다. FY30까지 누적 430억 달러가 올라갔네요. 성장률도 기존 연평균 +71%에서 +75%로 상승했습니다.
최근 오라클의 GPUaaS 마진에 대한 우려가 붉어졌습니다. 이에 대응해 OCI 고객군별 매출 총이익률을 제시했는데요
AI 인프라스트럭처 고객의 경우 35% 정도 마진을 보고 있습니다. 고객별 마진은 상이하지만, 이는 데이터센터 위치와 효율 그리고 고객 사이즈에 기인합니다. 초기 램프업 비용도 포함되며, 최대 규모 고객에서도 적용되는 수준입니다.
추가로 매출과 비용의 정렬을 위한 노력을 지속하고 있고, 최적화도 진행 중이라는 점을 강조했습니다. 매출 성장이 가속화 되면 영업이익 성장도 가속화될 것이라는 전망 속에서 마진보다는 성장률에 주목해달라는 입장도 피력했네요
오라클은 AI 인프라뿐 아니라 데이터베이스 및 애플리케이션까지 보유한 엔드 투 엔드 플랫폼의 강점을 보유하고 있습니다. 앞으로 펼쳐질 Agentic AI가 레버리지 할 수 있는 주요 자산이기도 합니다.
재무 업데이트와 관련된 자세한 내용은 발간된 보고서를 참고해 주시기 바랍니다.
보고서 링크: https://bit.ly/3J95iZI
(2025/10/17 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
오라클은 Oracle AI World 2025 컨퍼런스에서 Financial Analyst Meeting을 진행하며 장기 재무 목표를 업데이트했습니다.
FY30 매출 및 EPS 전망은 각각 2,250억 달러와 $21로 연평균(CAGR) +31% 및 +28% 성장을 가정하고 있습니다.
F2Q 클라우드 인프라 추가 수주 650억 달러를 기록하며 RPO는 5,000억 달러=0.5조 달러를 넘어섰습니다. 4개 고객으로부터 7건의 계약으로 메타는 포함되어 있지만, 오픈AI는 포함되지 않았다는 점을 강조하며 고객 집중 우려에 대응하는 모습입니다.
추가 수주를 고려해 클라우드 인프라 매출 전망도 상향했습니다. FY30까지 누적 430억 달러가 올라갔네요. 성장률도 기존 연평균 +71%에서 +75%로 상승했습니다.
최근 오라클의 GPUaaS 마진에 대한 우려가 붉어졌습니다. 이에 대응해 OCI 고객군별 매출 총이익률을 제시했는데요
AI 인프라스트럭처 고객의 경우 35% 정도 마진을 보고 있습니다. 고객별 마진은 상이하지만, 이는 데이터센터 위치와 효율 그리고 고객 사이즈에 기인합니다. 초기 램프업 비용도 포함되며, 최대 규모 고객에서도 적용되는 수준입니다.
추가로 매출과 비용의 정렬을 위한 노력을 지속하고 있고, 최적화도 진행 중이라는 점을 강조했습니다. 매출 성장이 가속화 되면 영업이익 성장도 가속화될 것이라는 전망 속에서 마진보다는 성장률에 주목해달라는 입장도 피력했네요
오라클은 AI 인프라뿐 아니라 데이터베이스 및 애플리케이션까지 보유한 엔드 투 엔드 플랫폼의 강점을 보유하고 있습니다. 앞으로 펼쳐질 Agentic AI가 레버리지 할 수 있는 주요 자산이기도 합니다.
재무 업데이트와 관련된 자세한 내용은 발간된 보고서를 참고해 주시기 바랍니다.
보고서 링크: https://bit.ly/3J95iZI
(2025/10/17 공표자료)
❤4👍1
일론 머스크, Grok 5의 AGI 달성 확률과 AGI의 정의
머스크의 첫번째 포스팅
Chubby의 리포스팅
머스크의 후속 답글(AGI 정의)
머스크의 첫번째 포스팅
Grok 5가 AGI를 달성할 확률은 10%이며 계속 상승 중이다.
Chubby의 리포스팅
일론 머스크가 어떤 정의의 AGI를 사용하고 있는지 명확히 할 필요가 있다.
머스크의 후속 답글(AGI 정의)
인간이 컴퓨터를 이용해서 할 수 있는 모든 일을 할 수는 있지만, 모든 인간과 컴퓨터를 합친 것보다 더 똑똑하지는 않은 수준. 그 수준까지는 아마 3~5년 정도 남았다.
Grok 5는 AI 엔지니어링(거만한 사람들이 AI 연구(리서치)라고 부르는 분야)에서 안드레 카파시보다 더 뛰어나게 될 것이다.
👍2❤1
[삼성 이영진] 글로벌 AI/SW
[삼성 이영진] 글로벌 SW 기업 실적 및 컨퍼런스 일정(현지시간) 실적(E)은 잠정 일정으로 향후 변동 가능 ■ 10월 3주 차 <오라클 AI World - 10/13~16> <클라우드플레어 Connect - 10/13~15> <세일즈포스 Dreamforce - 10/14~16> ■ 10월 4주 차 SAP(SAP DE) - 10/22 IBM(IBM) - 10/22 ■ 10월 5주 차 <어도비 MAX - 10/28~30> 마이크로소프트(MSFT)…
[삼성 이영진] 글로벌 SW 기업 실적 및 컨퍼런스 일정(현지시간)
실적(E)은 잠정 일정으로 향후 변동 가능
■ 10월 4주 차
SAP(SAP DE) - 10/22
IBM(IBM) - 10/22
■ 10월 5주 차
<어도비 MAX - 10/28~30>
마이크로소프트(MSFT) - 10/29
알파벳(GOOGL) - 10/29
메타 플랫폼스(META) - 10/29
서비스나우(NOW) - 10/29
애플(AAPL) - 10/30
아마존(AMZN) - 10/30
클라우드플레어(NET) - 10/30
네비우스(NBIS) - 10/30(E)
■ 11월 1주 차
팔란티어 테크놀로지스(PLTR) - 11/3
유니티 소프트웨어(U) - 11/5(개장전)
포티넷(FTNT) - 11/5
앱러빈(APP) - 11/5
허브스팟(HUBS) - 11/5(E)
데이터도그(DDOG) - 11/6(개장전)
트레이드 데스크(TTD) - 11/6
■ 11월 2주 차
코어위브(CRWV) - 11/12(E)
텐센트(700 HK) - 11/13(HKT 저녁)
알리바바(9988 HK) - 11/13(E)
팔로알토 네트웍스(PANW) - 11/13(E)
■ 11월 3주 차
<마이크로소프트 Ignite - 11/18~21>
■ 11월 4주 차
바이두(9888 HK) - 11/25(E)
세일즈포스(CRM) - 11/26(E)
스노우플레이크(SNOW) - 11/26(E)
지스케일러(ZS) - 11/26(E)
엘라스틱(ESTC) - 11/26(E)
■ 12월 1주 차
<아마존 AWS re:Invent - 12/1~5>
크라우드 스트라이크(CRWD) - 12/2(E)
워크데이(WDAY) - 12/2(E)
■ 12월 2주 차
오라클(ORCL) - 12/8(E)
몽고DB(MDB) - 12/9(E)
어도비(ADBE) - 12/11(E)
실적(E)은 잠정 일정으로 향후 변동 가능
■ 10월 4주 차
SAP(SAP DE) - 10/22
IBM(IBM) - 10/22
■ 10월 5주 차
<어도비 MAX - 10/28~30>
마이크로소프트(MSFT) - 10/29
알파벳(GOOGL) - 10/29
메타 플랫폼스(META) - 10/29
서비스나우(NOW) - 10/29
애플(AAPL) - 10/30
아마존(AMZN) - 10/30
클라우드플레어(NET) - 10/30
네비우스(NBIS) - 10/30(E)
■ 11월 1주 차
팔란티어 테크놀로지스(PLTR) - 11/3
유니티 소프트웨어(U) - 11/5(개장전)
포티넷(FTNT) - 11/5
앱러빈(APP) - 11/5
허브스팟(HUBS) - 11/5(E)
데이터도그(DDOG) - 11/6(개장전)
트레이드 데스크(TTD) - 11/6
■ 11월 2주 차
코어위브(CRWV) - 11/12(E)
텐센트(700 HK) - 11/13(HKT 저녁)
알리바바(9988 HK) - 11/13(E)
팔로알토 네트웍스(PANW) - 11/13(E)
■ 11월 3주 차
<마이크로소프트 Ignite - 11/18~21>
■ 11월 4주 차
바이두(9888 HK) - 11/25(E)
세일즈포스(CRM) - 11/26(E)
스노우플레이크(SNOW) - 11/26(E)
지스케일러(ZS) - 11/26(E)
엘라스틱(ESTC) - 11/26(E)
■ 12월 1주 차
<아마존 AWS re:Invent - 12/1~5>
크라우드 스트라이크(CRWD) - 12/2(E)
워크데이(WDAY) - 12/2(E)
■ 12월 2주 차
오라클(ORCL) - 12/8(E)
몽고DB(MDB) - 12/9(E)
어도비(ADBE) - 12/11(E)
👍3❤2
[삼성 이영진] 글로벌 AI/SW 헤드라인 (25/10/20)
■ 오픈AI, 챗GPT 모바일 앱의 글로벌 다운로드 증가율이 둔화되고, 미국 유저 기준 평균 사용 시간과 세션 수 감소했다는 서드파티 분석. 다만 이탈률은 안정화 상태
■ 오픈AI, Sora에서 마틴 루터 킹 목사의 딥페이크 영상 생성 중단. 유족의 공식 요청에 따른 조치
■ 마이크로소프트, 차세대 AI 프로세서 Maia 2를 인텔 파운드리의 18A 공정으로 생산 계획 보도
■ 메타, 루이지애나 Hyperion 데이터센터 프로젝트를 위한 300억 달러 규모 자금 조달 마무리 단계. 앞서 보도된 290억 달러 대비 규모 증가. SPV를 통한 자금 조달 방식
■ 메타, 부모가 자녀의 AI 사용을 직접 통제할 수 있는 신규 안전 기능 공개
■ 구글, Gemini에 구글 지도 데이터를 직접 결합할 수 있는 신규 API 기능 Grounding with Google Maps 출시
감사합니다.
■ 오픈AI, 챗GPT 모바일 앱의 글로벌 다운로드 증가율이 둔화되고, 미국 유저 기준 평균 사용 시간과 세션 수 감소했다는 서드파티 분석. 다만 이탈률은 안정화 상태
■ 오픈AI, Sora에서 마틴 루터 킹 목사의 딥페이크 영상 생성 중단. 유족의 공식 요청에 따른 조치
■ 마이크로소프트, 차세대 AI 프로세서 Maia 2를 인텔 파운드리의 18A 공정으로 생산 계획 보도
■ 메타, 루이지애나 Hyperion 데이터센터 프로젝트를 위한 300억 달러 규모 자금 조달 마무리 단계. 앞서 보도된 290억 달러 대비 규모 증가. SPV를 통한 자금 조달 방식
■ 메타, 부모가 자녀의 AI 사용을 직접 통제할 수 있는 신규 안전 기능 공개
■ 구글, Gemini에 구글 지도 데이터를 직접 결합할 수 있는 신규 API 기능 Grounding with Google Maps 출시
감사합니다.
👍3
오픈AI x 마이크로소프트 관계 변화(주요 타임라인 요약)
19년 7월
10억 달러 첫 투자 → 클라우드 독점 공급권 확보
21년 7월
20억 달러 수준 추가 투자
22년 11월
챗GPT 출시 → 폭발적 트래픽으로 컴퓨팅 수요 급증
23년 1월
100억 달러 투자 → 독점적 기술 및 수익 배분권 확보. 다만 일부 MS 임원은 오픈AI 사업 모델에 대한 회의론
23년 11월
샘 올트먼 해임 이슈 → MS 내부적으로 VIP 고객이 아닌 일반 고객으로 대해야 하는가 논의 존재
24년 초
대규모 컴퓨팅 프로젝트 착수 → 코드명은 Stargate(오픈AI) 및 Mercury(MS). 오픈AI용 데이터센터 계획. ex, 위스콘신 Fairwater
24년 3월
MS 무스타파 슐레이만 영입 → MS AI CEO 직책
24년 중반
MS 위스콘신 데이터센터 공사 지연 → 올트먼 ‘AGI 도달에 가장 큰 장애는 MS’라는 발언 인용 보도
24년 여름
클라우드 독점 해제 요청 → FTC와 EU 조사로 MS에 대한 압박 상승. MS 재무팀에서 오픈AI 요구를 무리하게 맞춰주다 수익성을 보장할 수 없는 과잉 투자 위험 내부 보고
24년 6월
클라우드 독점 완화 → 우선 협상권 조건으로 타 클라우드 계약 허용(25년 1월 공식 발표)
24년 7월
오픈AI-오라클 텍사스 1GW 데이터센터 협상
24년 가을
지배 구조 변경 협상 시작
24년 12월
MS 추가 캐파 제공 약속 → 위스콘신 지역 두 번째 데이터센터 건설. 40억 달러 이상 투자. 25년 9월 공식 발표
25년 1월
스타게이트 프로젝트 발표 → 오라클-소프트뱅크 협력
25년 3월
오픈AI-코어위브 계약 → 119억 달러 규모 컴퓨팅 파워 임대 계약(이후 누적 224억 달러)
25년 6월
오픈AI-구글 클라우드 협약
25년 6월
재협상 난항 → 주요 이견 존재
25년 9월
협상 관련 비구속 MOU → 잠정 합의 및 지배 구조 개편 방향 발표
25년 9월
엔비디아 협력 → 1,000억 달러 투자 유지. 자체 데이터센터 건설 계획
19년 7월
10억 달러 첫 투자 → 클라우드 독점 공급권 확보
21년 7월
20억 달러 수준 추가 투자
22년 11월
챗GPT 출시 → 폭발적 트래픽으로 컴퓨팅 수요 급증
23년 1월
100억 달러 투자 → 독점적 기술 및 수익 배분권 확보. 다만 일부 MS 임원은 오픈AI 사업 모델에 대한 회의론
23년 11월
샘 올트먼 해임 이슈 → MS 내부적으로 VIP 고객이 아닌 일반 고객으로 대해야 하는가 논의 존재
24년 초
대규모 컴퓨팅 프로젝트 착수 → 코드명은 Stargate(오픈AI) 및 Mercury(MS). 오픈AI용 데이터센터 계획. ex, 위스콘신 Fairwater
24년 3월
MS 무스타파 슐레이만 영입 → MS AI CEO 직책
24년 중반
MS 위스콘신 데이터센터 공사 지연 → 올트먼 ‘AGI 도달에 가장 큰 장애는 MS’라는 발언 인용 보도
24년 여름
클라우드 독점 해제 요청 → FTC와 EU 조사로 MS에 대한 압박 상승. MS 재무팀에서 오픈AI 요구를 무리하게 맞춰주다 수익성을 보장할 수 없는 과잉 투자 위험 내부 보고
24년 6월
클라우드 독점 완화 → 우선 협상권 조건으로 타 클라우드 계약 허용(25년 1월 공식 발표)
24년 7월
오픈AI-오라클 텍사스 1GW 데이터센터 협상
24년 가을
지배 구조 변경 협상 시작
24년 12월
MS 추가 캐파 제공 약속 → 위스콘신 지역 두 번째 데이터센터 건설. 40억 달러 이상 투자. 25년 9월 공식 발표
25년 1월
스타게이트 프로젝트 발표 → 오라클-소프트뱅크 협력
25년 3월
오픈AI-코어위브 계약 → 119억 달러 규모 컴퓨팅 파워 임대 계약(이후 누적 224억 달러)
25년 6월
오픈AI-구글 클라우드 협약
25년 6월
재협상 난항 → 주요 이견 존재
25년 9월
협상 관련 비구속 MOU → 잠정 합의 및 지배 구조 개편 방향 발표
25년 9월
엔비디아 협력 → 1,000억 달러 투자 유지. 자체 데이터센터 건설 계획
🔥4👍1
오라클이 Analyst Meeting에서 제시하지 못한 한 가지 - CapEx의 방향성
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
오라클이 AI World 2025 컨퍼런스에서 진행한 Analyst Meeting은 장기 매출 및 마진 제시에 초점을 맞췄습니다.
이전 대비 공격적 전망과 신규 계약에 따른 OCI 매출 가이던스 상향이 주요 포인트였습니다. 시장에서 대두된 1) 고객 집중과 2) 마진 우려에 대한 대응도 진행되었습니다.
신규 계약을 고려해도 오픈AI 익스포저는 여전히 크고, AI 클라우드 인프라 마진도 다른 부문 대비 낮아 희석 리스크가 존재한다고 할 수도 있지만, 경영진의 자신감을 일정 부분은 인정해줘야 한다는 판단입니다.
물론 CapEx 계획과 현금 흐름 관련 내용이 부재했다는 팩트입니다. 아쉬운 부분이기도 한데요
사실 회사채 발생을 비롯한 추가 자금 조달 필요성은 지난 실적에서 엄청난 RPO 성장을 보여준 이후 부터 이야기되던 내용입니다.
엄청난 숫자에 놀라고 난 뒤에는 당연하게 현실 감각을 찾게 됩니다.
RPO 수행을 위해서 막대한 투자가 불가피합니다. FY26~FY30 CapEx 컨센서스(Factset) 합산은 3,000억 달러 수준입니다.
FCF는 FY25 기준 이미 마이너스(-4억 달러)이고 FY26~29까지 -293억 달러를 전망하고 있습니다(FY30 + 전환)
하지만 9월 말 기존 대비 더 나은 조건으로 180억 달러 회사채 조달을 발표했습니다. 신용등급도 동일한 상황으로 투자 등급 내 장기물 조달이 가능합니다.
또한 레거시 사업 기반으로 영업 현금흐름은 FY25 208억 달러이고, 최근 12개월 기준 215억 달러입니다.
35% 수준의 AI 인프라 마진 제시로 리턴 구조를 구체화한 점과 에셋 라이트한 특성도 용이한 확장을 지원하는 요소입니다.
OCI 모멘텀이 강하게 부각되고 있지만, 데이터베이스와 애플리케이션 부문 내 AI 기반 사업 성장도 고려해야겠지요
RPO의 매출 전환 리스크까지 생각하기엔 아직 인프라 확장 초기 단계입니다.
'33년까지 250GW의 필요성을 언급하는 샘 올트먼과 이런 오픈AI가 연 600억 달러 지출이 가능하다는 오라클 경영진의 코멘트가 마냥 허황되다고 보기에 AI 발전은 계속되고 있습니다.
다음 주 진행될 빅테크 클라우드 기업의 CapEx가 클라우드 인프라 전반에 새로운 모멘텀이 될 것으로 기대합니다. 추가 업데이트해 드리겠습니다.
(2025/10/20 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
오라클이 AI World 2025 컨퍼런스에서 진행한 Analyst Meeting은 장기 매출 및 마진 제시에 초점을 맞췄습니다.
이전 대비 공격적 전망과 신규 계약에 따른 OCI 매출 가이던스 상향이 주요 포인트였습니다. 시장에서 대두된 1) 고객 집중과 2) 마진 우려에 대한 대응도 진행되었습니다.
신규 계약을 고려해도 오픈AI 익스포저는 여전히 크고, AI 클라우드 인프라 마진도 다른 부문 대비 낮아 희석 리스크가 존재한다고 할 수도 있지만, 경영진의 자신감을 일정 부분은 인정해줘야 한다는 판단입니다.
물론 CapEx 계획과 현금 흐름 관련 내용이 부재했다는 팩트입니다. 아쉬운 부분이기도 한데요
사실 회사채 발생을 비롯한 추가 자금 조달 필요성은 지난 실적에서 엄청난 RPO 성장을 보여준 이후 부터 이야기되던 내용입니다.
엄청난 숫자에 놀라고 난 뒤에는 당연하게 현실 감각을 찾게 됩니다.
RPO 수행을 위해서 막대한 투자가 불가피합니다. FY26~FY30 CapEx 컨센서스(Factset) 합산은 3,000억 달러 수준입니다.
FCF는 FY25 기준 이미 마이너스(-4억 달러)이고 FY26~29까지 -293억 달러를 전망하고 있습니다(FY30 + 전환)
하지만 9월 말 기존 대비 더 나은 조건으로 180억 달러 회사채 조달을 발표했습니다. 신용등급도 동일한 상황으로 투자 등급 내 장기물 조달이 가능합니다.
또한 레거시 사업 기반으로 영업 현금흐름은 FY25 208억 달러이고, 최근 12개월 기준 215억 달러입니다.
35% 수준의 AI 인프라 마진 제시로 리턴 구조를 구체화한 점과 에셋 라이트한 특성도 용이한 확장을 지원하는 요소입니다.
OCI 모멘텀이 강하게 부각되고 있지만, 데이터베이스와 애플리케이션 부문 내 AI 기반 사업 성장도 고려해야겠지요
RPO의 매출 전환 리스크까지 생각하기엔 아직 인프라 확장 초기 단계입니다.
'33년까지 250GW의 필요성을 언급하는 샘 올트먼과 이런 오픈AI가 연 600억 달러 지출이 가능하다는 오라클 경영진의 코멘트가 마냥 허황되다고 보기에 AI 발전은 계속되고 있습니다.
다음 주 진행될 빅테크 클라우드 기업의 CapEx가 클라우드 인프라 전반에 새로운 모멘텀이 될 것으로 기대합니다. 추가 업데이트해 드리겠습니다.
(2025/10/20 공표자료)
❤4👍1🔥1
Forwarded from [삼성 문준호의 반도체를 전하다]
[반.전] 반도체 소부장, 2026년이 아니라 2029년까지 봐야 합니다 - 커버리지 개시
안녕하세요. 삼성증권 문준호의 ‘반도체를 전하다’입니다.
반도체 섹터가 연일 무섭게 오르고 있습니다. 오늘도 신고가를 기록 중입니다. High-beta 소부장도 빠르게 따라가고 있습니다.
슬슬 주가가 부담스러우실 수 있지만, 지금의 기세는 쉽게 꺾이지 않을 것으로 전망됩니다. 과거 cycle과는 다르기 때문입니다.
삼성전자 P4, SK하이닉스 M15X 등 신규 투자가 진행 중이라지만, GW급 데이터센터 프로젝트들이 나날이 새로 발표되며, 수요도 계속해서 빠르게 상향되고 있습니다.
여기서 공급을 더 늘리고 싶어도 물리적 한계가 존재하여, 추가적인 증설은 다년에 걸쳐진 신공장 완공 일정에 맞추어야 진행 가능한 상황입니다.
이에 소부장 업체들은 예전처럼 단기 매출 급증/급감을 반복하는 게 아니라, 높은 이익 수준을 장기간 기록해 나갈 전망입니다.
소부장의 Multi-year up-cycle은 이제 막 시작인 것입니다. 그리고 중장기 이익 가시성이 확보된 바, re-rating은 정당합니다.
원익IPS를 Top-pick으로 제시합니다. 유진테크, 테스, 솔브레인, 파크시스템스, HPSP, 넥스틴에 대한 커버리지도 개시하며 모두 BUY 투자의견을 제시합니다.
이번 보고서가 반도체 섹터 투자 전략을 세우시는 데 도움이 되시기를 희망합니다.
감사합니다.
보고서 링크: https://bit.ly/3LhMiJ0
(2025/10/20 공표자료)
안녕하세요. 삼성증권 문준호의 ‘반도체를 전하다’입니다.
반도체 섹터가 연일 무섭게 오르고 있습니다. 오늘도 신고가를 기록 중입니다. High-beta 소부장도 빠르게 따라가고 있습니다.
슬슬 주가가 부담스러우실 수 있지만, 지금의 기세는 쉽게 꺾이지 않을 것으로 전망됩니다. 과거 cycle과는 다르기 때문입니다.
삼성전자 P4, SK하이닉스 M15X 등 신규 투자가 진행 중이라지만, GW급 데이터센터 프로젝트들이 나날이 새로 발표되며, 수요도 계속해서 빠르게 상향되고 있습니다.
여기서 공급을 더 늘리고 싶어도 물리적 한계가 존재하여, 추가적인 증설은 다년에 걸쳐진 신공장 완공 일정에 맞추어야 진행 가능한 상황입니다.
이에 소부장 업체들은 예전처럼 단기 매출 급증/급감을 반복하는 게 아니라, 높은 이익 수준을 장기간 기록해 나갈 전망입니다.
소부장의 Multi-year up-cycle은 이제 막 시작인 것입니다. 그리고 중장기 이익 가시성이 확보된 바, re-rating은 정당합니다.
원익IPS를 Top-pick으로 제시합니다. 유진테크, 테스, 솔브레인, 파크시스템스, HPSP, 넥스틴에 대한 커버리지도 개시하며 모두 BUY 투자의견을 제시합니다.
이번 보고서가 반도체 섹터 투자 전략을 세우시는 데 도움이 되시기를 희망합니다.
감사합니다.
보고서 링크: https://bit.ly/3LhMiJ0
(2025/10/20 공표자료)
👍1
AWS US-East-1 리전 오류로 다수의 서비스 영향
: 퍼플렉시티, 로빈후드, 코인베이스, 스냅챗, 로블록스, 벤모, 포티나이트 등 서비스 장애 및 지연 보고
https://health.aws.amazon.com/health/status
: 퍼플렉시티, 로빈후드, 코인베이스, 스냅챗, 로블록스, 벤모, 포티나이트 등 서비스 장애 및 지연 보고
https://health.aws.amazon.com/health/status
👍2❤1
[삼성 이영진] 글로벌 AI/SW
AWS US-East-1 리전 오류로 다수의 서비스 영향 : 퍼플렉시티, 로빈후드, 코인베이스, 스냅챗, 로블록스, 벤모, 포티나이트 등 서비스 장애 및 지연 보고 https://health.aws.amazon.com/health/status
AWS 복구 진행 중 및 초기 원인 언급
오전 3:03 (PDT)
영향을 받았던 대부분의 AWS 서비스에서 복구가 진행 중임을 관찰. US-EAST-1 리전에 의존하는 글로벌 서비스 및 기능들도 복구 확인. 완전한 해결을 위해 계속 노력 중
오전 2:27 (PDT)
현재 뚜렷한 복구 조짐. 대부분의 요청이 이제 성공적으로 처리. 대기 중이던 일부 요청 backlog 처리 중
오전 2:22 (PDT)
초기 대응 조치를 적용했으며, 일부 영향을 받은 AWS 서비스에서 초기 복구 징후. 요청이 계속 실패할 수 있으므로, 실패한 요청은 재시도 필요 요청이 성공하기 시작하더라도 추가 지연(latency) 발생 가능. 일부 서비스는 누적된 작업을 처리에 추가 시간이 소요 가능
오전 2:01 (PDT)
US-EAST-1 리전의 DynamoDB API 오류율 증가 문제의 잠재적 원인 파악. 조사 결과, 문제는 US-EAST-1 내 DynamoDB API 엔드포인트의 DNS resolution과 관련된 것으로 파악. 복구 속도를 높이기 위해 여러 대응 방안을 병행
https://health.aws.amazon.com/health/status
오전 3:03 (PDT)
영향을 받았던 대부분의 AWS 서비스에서 복구가 진행 중임을 관찰. US-EAST-1 리전에 의존하는 글로벌 서비스 및 기능들도 복구 확인. 완전한 해결을 위해 계속 노력 중
오전 2:27 (PDT)
현재 뚜렷한 복구 조짐. 대부분의 요청이 이제 성공적으로 처리. 대기 중이던 일부 요청 backlog 처리 중
오전 2:22 (PDT)
초기 대응 조치를 적용했으며, 일부 영향을 받은 AWS 서비스에서 초기 복구 징후. 요청이 계속 실패할 수 있으므로, 실패한 요청은 재시도 필요 요청이 성공하기 시작하더라도 추가 지연(latency) 발생 가능. 일부 서비스는 누적된 작업을 처리에 추가 시간이 소요 가능
오전 2:01 (PDT)
US-EAST-1 리전의 DynamoDB API 오류율 증가 문제의 잠재적 원인 파악. 조사 결과, 문제는 US-EAST-1 내 DynamoDB API 엔드포인트의 DNS resolution과 관련된 것으로 파악. 복구 속도를 높이기 위해 여러 대응 방안을 병행
https://health.aws.amazon.com/health/status
👍2😢1
[삼성 이영진] 글로벌 AI/SW
AWS 복구 진행 중 및 초기 원인 언급 오전 3:03 (PDT) 영향을 받았던 대부분의 AWS 서비스에서 복구가 진행 중임을 관찰. US-EAST-1 리전에 의존하는 글로벌 서비스 및 기능들도 복구 확인. 완전한 해결을 위해 계속 노력 중 오전 2:27 (PDT) 현재 뚜렷한 복구 조짐. 대부분의 요청이 이제 성공적으로 처리. 대기 중이던 일부 요청 backlog 처리 중 오전 2:22 (PDT) 초기 대응 조치를 적용했으며, 일부 영향을 받은…
AWS 장애 경과 추가 정리
■ 원인 및 확산
DynamoDB 엔드포인트의 DNS 해석 문제
→ EC2 내부 네트워크 장애
→ 로드밸런서 상태 모니터 서브시스템 장애
■ 복구 단계(PDT 기준)
초기 언급된 Dynamo DB DNS 복구(오전 3:35)
→ US-EAST-1 리전 내 다수 서비스에서 API 오류 및 연결 문제 발생(오전 7:14)
→ 네트워크 연결 문제가 EC2 내부 네트워크에서 시작 확인(오전 8:04)
→ 로드밸런서의 상태 모니터링 서브시스템 장애로 특정(오전 8:43)
→ EC2/Lambda 점진적 복원 (오전 10시~)
→ EC2 인스턴스 생성 제한이 사고 이전 수준으로 완전히 복구. EC2 인스턴트 생성 실패 문제도 정상화. 백로그 처리 중(오후 2:48)
https://health.aws.amazon.com/health/status
■ 원인 및 확산
DynamoDB 엔드포인트의 DNS 해석 문제
→ EC2 내부 네트워크 장애
→ 로드밸런서 상태 모니터 서브시스템 장애
■ 복구 단계(PDT 기준)
초기 언급된 Dynamo DB DNS 복구(오전 3:35)
→ US-EAST-1 리전 내 다수 서비스에서 API 오류 및 연결 문제 발생(오전 7:14)
→ 네트워크 연결 문제가 EC2 내부 네트워크에서 시작 확인(오전 8:04)
→ 로드밸런서의 상태 모니터링 서브시스템 장애로 특정(오전 8:43)
→ EC2/Lambda 점진적 복원 (오전 10시~)
→ EC2 인스턴스 생성 제한이 사고 이전 수준으로 완전히 복구. EC2 인스턴트 생성 실패 문제도 정상화. 백로그 처리 중(오후 2:48)
https://health.aws.amazon.com/health/status
👍2🎉1
[삼성 이영진] 글로벌 AI/SW 헤드라인 (25/10/21)
■ AWS, Amazon DynamoDB API 엔드포인트의 DNS 문제와 이후 EC2 내부 네트워크 관련 US-EAST-1 리전 오류 발생
■ 오픈AI, 미국 배우노조(SAG-AFTRA), 대표 에이전시 및 협회 등과 협력해 음성 및 초상 권리 보호를 위한 정책 강화 약속 발표
■ 구글 클라우드, 엔비디아 RTX PRO 6000 블랙웰 GPU를 활용한 신규 가상 머신 시리즈 G4 VM 발표
■ 구글, Veo 3.1이 LM아레나 내 T2V(텍스트 투 비디오) 아레나에서 1위 달성
■ 메타, Meta AI 모바일 앱 유저 및 다운로드 증가. 숏 폼 AI 생성 영상을 노출하는 Vibes 기능 영향으로 분석하는 시각
■ 딥시크, DeepSeek-OCR 공개. 고해상도 입력을 최대 20배까지 효율적으로 압축하면서 높은 정확도 유지
■ 다리오 아모데이, Claude가 앤스로픽 내부 코드의 90%를 작성하고 있다는 코멘트
■ 앤스로픽, Claude Code를 웹 인터페이스로 확대 제공
■ 앤스로픽, 생명 과학 분야 지원을 위한 주요 플랫폼 및 커넥터가 포함된 Claude for Life Sciences 출시
■ 어도비, 기업이 자사 브랜드 및 IP를 활용해 맞춤형 생성 AI 모델 구축하는 것을 지원하는 Adobe AI Foundry 발표
감사합니다.
■ AWS, Amazon DynamoDB API 엔드포인트의 DNS 문제와 이후 EC2 내부 네트워크 관련 US-EAST-1 리전 오류 발생
■ 오픈AI, 미국 배우노조(SAG-AFTRA), 대표 에이전시 및 협회 등과 협력해 음성 및 초상 권리 보호를 위한 정책 강화 약속 발표
■ 구글 클라우드, 엔비디아 RTX PRO 6000 블랙웰 GPU를 활용한 신규 가상 머신 시리즈 G4 VM 발표
■ 구글, Veo 3.1이 LM아레나 내 T2V(텍스트 투 비디오) 아레나에서 1위 달성
■ 메타, Meta AI 모바일 앱 유저 및 다운로드 증가. 숏 폼 AI 생성 영상을 노출하는 Vibes 기능 영향으로 분석하는 시각
■ 딥시크, DeepSeek-OCR 공개. 고해상도 입력을 최대 20배까지 효율적으로 압축하면서 높은 정확도 유지
■ 다리오 아모데이, Claude가 앤스로픽 내부 코드의 90%를 작성하고 있다는 코멘트
■ 앤스로픽, Claude Code를 웹 인터페이스로 확대 제공
■ 앤스로픽, 생명 과학 분야 지원을 위한 주요 플랫폼 및 커넥터가 포함된 Claude for Life Sciences 출시
■ 어도비, 기업이 자사 브랜드 및 IP를 활용해 맞춤형 생성 AI 모델 구축하는 것을 지원하는 Adobe AI Foundry 발표
감사합니다.
👍2
의결권 자문회사 ISS, Core Scientific 주주에게 인수 반대 투표 권고
: 보고서를 통해 코어 사이언티픽(Core Scientific)이 독립 기업으로 상당한 성공을 거두었고 독자적 성장을 이어갈 수 있다는 의견. 주주 투표는 10/30일 예정
: 7월 코어위브(CoreWeave)는 코어 사이언티픽을 전액 주식 교환 방식으로 인수 발표. 7/3일 종가 기준으로는 주당 $20.4
: 이후 투자자 Two Seas Capital은 인수 과정, 거래 구조(고정 교환 비율), 밸류에이션 우려 등으로 반대 입장을 표명. 코어 사이언티픽 이사회는 찬성 투표 권유 공식 서한
: 보고서를 통해 코어 사이언티픽(Core Scientific)이 독립 기업으로 상당한 성공을 거두었고 독자적 성장을 이어갈 수 있다는 의견. 주주 투표는 10/30일 예정
: 7월 코어위브(CoreWeave)는 코어 사이언티픽을 전액 주식 교환 방식으로 인수 발표. 7/3일 종가 기준으로는 주당 $20.4
: 이후 투자자 Two Seas Capital은 인수 과정, 거래 구조(고정 교환 비율), 밸류에이션 우려 등으로 반대 입장을 표명. 코어 사이언티픽 이사회는 찬성 투표 권유 공식 서한
👍1
알리바바의 Aegaeon 시스템, GPU 풀링을 통한 효율성 극대화
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
알리바바가 최근 발표한 Aegaeon 시스템은 “GPU를 똑똑하게 나누어 쓰는 방법”에 대한 연구입니다.
동시에 다양한 LLM을 서빙해야하는 모델 마켓플레이스 환경에서는 모델별로 GPU를 붙여두고, 요청 시 마다 해당 모델 전용 GPU를 독점적으로 사용했습니다.
문제는 인기 모델은 GPU가 모자라고, 비인기 모델은 GPU가 놀고 있는 상황이 계속 된다는 것입니다.
Aegaeon은 비효율을 해결하기 위해 토큰 단위 오토스케일링을 통해 여러 모델이 GPU를 공유(Pooling)하며 토큰 단위로 번갈아 쓰도록 설계되었습니다.
모델 전환 효율성 향상과 프리필과 디코딩 단계를 분리해 스케줄링함으로써 실제 클라우드 환경에서 GPU 사용량을 약 82% 줄이면서도, 동일 GPU로 트래픽을 더 많이 처리할 수 있다는 내용을 논문에 담았습니다.
하지만 기술적 한계점도 존재합니다. 모델을 토큰 단위로 쪼개어 스케줄링하다보니 실시간 대화형 서비스에서 첫 토큰 레이턴시의 변동성이 높아 질 수 있고,
모델마다 크기와 메모리 구조가 상이한 상황에서 파라미터 1,000억 개 이상의 모델에는 아직 검증되지 않았습니다(논문은 180~720억 개 모델 기준 데이터)
또한 연구에서 동 세대 GPU 활용을 가정했지만, 실제 환경 내 GPU 구성은 혼재되어 있습니다.
연구 결과는 알리바바 모델 스튜디오 트래픽을 기준으로 타 클라우드 및 엔터프라이즈 환경에서는 SLO 정의나 모델 분포에 따라 상이한 결과가 나올 수 있습니다.
의미는 분명히 존재합니다. 알리바바의 Aegaeon은 중국 AI 기업이 반도체 제약에 대응해 지속적으로 보여주는 학습 및 추론 측면의 효율성 추구의 방향성과 연결되어 있습니다.
하지만 새로운 기술의 등장을 GPU 수요 감소로 해석할 필요는 없습니다.
GPU 효율이 올라가면 일정한 GPU 수로 더 많은 모델(워크로드) 구동할 수 있게 됩니다. 추가로 GPU 생산성 상승 → 추론 단가 하락 → AI 서비스 확산 가속화로 연결될 수 있습니다.
효율화는 GPU 수요 감소가 아니라 AI 산업 내 토큰 수요를 폭발적으로 증가시키는 방향으로 작용할 것입니다.
(2025/10/21 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
알리바바가 최근 발표한 Aegaeon 시스템은 “GPU를 똑똑하게 나누어 쓰는 방법”에 대한 연구입니다.
동시에 다양한 LLM을 서빙해야하는 모델 마켓플레이스 환경에서는 모델별로 GPU를 붙여두고, 요청 시 마다 해당 모델 전용 GPU를 독점적으로 사용했습니다.
문제는 인기 모델은 GPU가 모자라고, 비인기 모델은 GPU가 놀고 있는 상황이 계속 된다는 것입니다.
Aegaeon은 비효율을 해결하기 위해 토큰 단위 오토스케일링을 통해 여러 모델이 GPU를 공유(Pooling)하며 토큰 단위로 번갈아 쓰도록 설계되었습니다.
모델 전환 효율성 향상과 프리필과 디코딩 단계를 분리해 스케줄링함으로써 실제 클라우드 환경에서 GPU 사용량을 약 82% 줄이면서도, 동일 GPU로 트래픽을 더 많이 처리할 수 있다는 내용을 논문에 담았습니다.
하지만 기술적 한계점도 존재합니다. 모델을 토큰 단위로 쪼개어 스케줄링하다보니 실시간 대화형 서비스에서 첫 토큰 레이턴시의 변동성이 높아 질 수 있고,
모델마다 크기와 메모리 구조가 상이한 상황에서 파라미터 1,000억 개 이상의 모델에는 아직 검증되지 않았습니다(논문은 180~720억 개 모델 기준 데이터)
또한 연구에서 동 세대 GPU 활용을 가정했지만, 실제 환경 내 GPU 구성은 혼재되어 있습니다.
연구 결과는 알리바바 모델 스튜디오 트래픽을 기준으로 타 클라우드 및 엔터프라이즈 환경에서는 SLO 정의나 모델 분포에 따라 상이한 결과가 나올 수 있습니다.
의미는 분명히 존재합니다. 알리바바의 Aegaeon은 중국 AI 기업이 반도체 제약에 대응해 지속적으로 보여주는 학습 및 추론 측면의 효율성 추구의 방향성과 연결되어 있습니다.
하지만 새로운 기술의 등장을 GPU 수요 감소로 해석할 필요는 없습니다.
GPU 효율이 올라가면 일정한 GPU 수로 더 많은 모델(워크로드) 구동할 수 있게 됩니다. 추가로 GPU 생산성 상승 → 추론 단가 하락 → AI 서비스 확산 가속화로 연결될 수 있습니다.
효율화는 GPU 수요 감소가 아니라 AI 산업 내 토큰 수요를 폭발적으로 증가시키는 방향으로 작용할 것입니다.
(2025/10/21 공표자료)
👍1
구글, 로건 킬패트릭 “내일은 바이브 코딩의 새로운 경험”
: AI 스튜디오 내 Gemini 기반의 새로운 AI 코딩 환경 업데이트 시사. 노코드 워크플로우 또는 자동화 파이프라인으로 AI 앱 구축 과정 단순화 전망. 내일 공개 후 2달 간 확장 페이즈
: AI 스튜디오 내 Gemini 기반의 새로운 AI 코딩 환경 업데이트 시사. 노코드 워크플로우 또는 자동화 파이프라인으로 AI 앱 구축 과정 단순화 전망. 내일 공개 후 2달 간 확장 페이즈
내일은 AI 스튜디오 팀에게 특별한 날입니다.
5월 이후로 우리는 Gemini를 활용해 프롬프트에서 프로덕션까지 가는 과정을 가속화할 새로운 AI 기반 바이브 코딩 경험을 만들기 위해 집중해왔습니다.
모두에게 보여드릴 날이 너무 기대되요 :)
아직은 초기 단계이지만, 누구나 AI 앱을 100배 쉽게 만들 수 있도록 하는 기회는 정말 엄청납니다.
내일은 첫 걸음에 불과하고, 앞으로 두 달은 아주 흥미로울 거예요
👍3❤1