[삼성 이영진] 글로벌 AI/SW
6.49K subscribers
1.06K photos
8 videos
1.25K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
마이크로소프트 Ignite 2024 주요 발표 내용

Azure AI Foundry
- AI 모델, 데이터, 개발 도구를 하나의 플랫폼으로 통합한 엔터프라이즈 AI 플랫폼. 이를 활용해 기업은 AI 솔루션을 쉽게 구축하고 배포 가능
- Azure AI Foundry SDK, Azure AI Foundry Portal(구 Azure AI Studio), Azure AI Agent Service 등 기능 포함

Copilot Actions
- 빈칸 채우기 형태 프롬프트로 일상적 반복 업무 자동화 기능. Private Preview 단계

MS 365 에이전트 추가
- Agents in SharePoint, Interpreter, Employee Self-Service Agent 등 에이전트 발표

Windows 365 Link
- Windows 365(클라우드 호스팅 기반 가상 머신)와 연결되는 미니 PC. 내년 출시 계획. 가격은 $349

Azure 클라우드와 보안 강화를 위한 맞춤형 칩
- Azure Boost DPU: 데이터 중심 워크로드를 고효율로 처리하기 위한 목적으로 설계
- Azure Integrated HSM: 신규 클라우드 보안 칩. 디지털 서명 및 암호화 키를 안전하게 보관하기 위한 모듈

마이크로소프트 Teams 신규 통합 번역 기능
- 다른 언어 사용자 간 대화에서 AI 기반 실시간 Speech to Speech 번역 활용

Atom Computing 협력
- 2025년 상용 양자 컴퓨터 출시 계획

https://blogs.microsoft.com/blog/2024/11/19/ignite-2024-why-nearly-70-of-the-fortune-500-now-use-microsoft-365-copilot/
1
[삼성 이영진] 글로벌 SW 헤드라인 (24/11/20)

■ 미중경제안보위(USCC), 연례 의회보고서에서 AGI 개발을 위해 맨해튼 프로젝트급 대규모 프로그램 수립 권고

■ 구글, 제미나이 챗 봇 사용자 일부에게 메모리 기능 롤아웃. 개인 정보, 직업, 개인 취향 등을 기억해 문맥을 추가

■ 영국 CMA, 알파벳의 앤스로픽에 대한 투자를 합병 규정 상 조사할 수 없다고 판단

■ 오픈AI, 챗GPT 어드밴스드 보이스 모드를 웹으로 확대

■ 오픈AI, 인도 대형 뉴스 에이전시인 Asian News International(ANI)로부터 저작권 침해 소송

■ 메타, 세일즈포스의 Clara Shih(CEO of AI) 영입. 비즈니스용 AI 툴을 구축하는 신규 조직 딤당

■ 세일즈포스, 9월 20억 달러에 인수한 데이터 관리 기업 Own의 임직원 구조조정 예정

■ 인튜이트 & H&R Block, 정부호율성부(DOGE)의 세금 보고 간편화 계획 논의에 부정적 영향

감사합니다.
👍1
마이크로소프트 Ignite 2024 - Something New, But Nothing Special

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

마이크로소프트가 Ignite 컨퍼런스를 통해 다양한 프로덕트를 발표했습니다.

Copilot + Copilot Devices + Copilot & AI Stack의 3가지 전략 레이어를 설정하고 이에 맞춘 방향성을 보여주고 있는데요

■ 주요 발표 내용
- Azure AI Foundry: AI 모델, 데이터, 개발 도구를 통합한 엔터프라이즈 AI 플랫폼. 기업의 손쉬운 AI 솔루션을 구축 및 배포 지원. 1,800개 모델 활용 가능

- Copilot Actions: 일상적 반복 업무를 손쉽게 자동화하는 기능. Private Preivew

- MS 365 신규 에이전트: Agents in SharePoint(조직 지식 베이스 내 필요한 정보 검색), Interpreter(실시간 음성 번역), Employee Self Service Agent(인사 및 IT 헬스 데스크 업무 간소화) 등

- Copilot Control System: 데이터 접근 및 보안 설정, 성과 측정과 보고 기능을 통해 코파일럿 및 에이전트의 안전한 채택 지원(Copilot Studio 기반). 효용성 확인을 위한 Copilot Analytics 기능 포함

- Copilot Studio 가격 정책 변경: Pay as you go 형태로 사용량 기반 지불 옵션 추가

- Windows 365 Link: Windows 365(클라우드 호스팅 기반 가상 머신)과 연결되는 미니 PC 기기. 내년 4월 출시 계획. 가격은 $349

- Azure 클라우드 및 보안 강화를 위한 맞춤 칩: 1) Azure Boost DPU(데이터 워크로드를 고효율로 처리하기 위한 목적), 2) Azure Integrated HSM(신규 클라우드 보안 칩)

Teams, PowerPoint, Outlook 등에도 코파일럿 기능도 추가되었고, 보안 및 데이터베이스 분야 업데이트도 진행되었습니다.

글로벌 IT 대란 이후 윈도우 OS 보안 안정성 향상 목표와 함께 AI 및 클라우드 보안 버그 바운티 Zero Day Quest가 발표되었고, 데이터 분야에서는 Fabric을 통해 엔터프라이즈 AI 워크 플로우 가속화를 추구하고 있습니다.

이번 Ignite는 새로운 것은 많았지만, 엄청 특별한 것은 없었다고 정리할 수 있는데요. 전략 방향성과 긍정적 포인트는 충분히 알겠지만 피부에 와닿는 부분은 다소 아쉬웠습니다.

번외로 샤티아 나델라 CEO는 키노트에서 최근 대두된 스케일링 법칙의 한계에 대해 test-time compute와 같은 새로운 스케일링 법칙의 발현을 확인하고 있다고 코멘트했습니다.

산업 내 여러 인물들의 코멘트와 일맥상통하는 부분이지요. 오히려 키노트 서두에 말한 내용이 AI 산업을 팔로우하는 입장에서 눈에 더 들어오는 행사였습니다.

Azure 케파 제약 이슈 해소의 가시성 대두 전까지 심심한 흐름이 지속될 것으로 전망합니다.

(2024/11/20 공표자료)
👍1
미중 경제안보검토위원회(USCC)는 19일(현지시간) 의회에 제출한 연례보고서에서 중국 첨단기술과 맞서 싸우기 위해 실행해야 할 32개 권고안을 발표했다.

먼저, USCC는 의회가 범용인공지능(AGI) 역량을 개발하기 위해 '맨해튼 프로젝트'와 같은 프로그램을 수립해야 한다고 강조했다. 인간 지능을 뛰어넘는 수준의 고성능 AI를 뜻하는 AGI를 개발하기 위해 미국이 세계 2차대전 도중 세계 패권을 쥐기 위해 핵무기를 극비 개발한 프로젝트 수준의 계획이 필요하다는 것이다.

AGI 리더십을 얻기 위한 정책으로, 행정부에 광범위한 다년 계약 권한을 제공하고, 주요 AI, 클라우드, 데이터센터 기업에 자금을 지급해야 한다고 강조했다. 이 같은 프로젝트가 실효성 있도록 국방부 장관이 AI와 같은 프로젝트에 국방 관련 물자와 서비스의 우선순위 중 가장 긴급하고 중요한 'DX' 등급을 부여해야 한다고도 권고했다.

https://cm.asiae.co.kr/article/2024112009255287284
즁국 AI 스타트업 DeepSeek AI, DeepSeek-r1-lite-preview 출시

: AIME 및 MATH 벤치마크에서 o1-preview 수준을 달성한 추론 기반 모델. o1과 유사하게 추론 스케일링 법칙 시현
[삼성 문준호의 반.전] 엔비디아 실적/가이던스 요약

■ FY 3Q25 실적

- 전체 매출액 350.8억 달러
: +94% y-y, +17% q-q
: 컨센서스 331.3억 달러 상회

- Data Center 매출액 307.7억 달러
: +112% y-y, +17% q-q
: 컨센서스 288.4억 달러 상회

- Gaming 매출액 32.8억 달러
: +15% y-y, +14% q-q
: 컨센서스 30.3억 달러 상회

- Non-GAAP 매출총이익률 75.0%
: 컨센서스 75.0% 부합

- Non-GAAP EPS 0.81 달러
: +103% y-y, +19% q-q
: 컨센서스 0.75 달러 상회

■ FY 4Q25 가이던스

- 전체 매출액 375억 달러 ±2%
: +70% y-y, +7% q-q
: 컨센서스 370.4억 달러 상회

- Non-GAAP 매출총이익률 73.0~74.0%
: 컨센서스 73.4% 부합


감사합니다.
👍1
[삼성 이영진] 팔로알토 네트웍스(PANW) F1Q25 실적

■ F1Q25 실적
: 매출 21.39억 달러(+21%)
vs 컨센 21.2억 달러, 가이던스 21~21.3억 달러
: NGS ARR 45.1억 달러(+40%)
vs 컨센 43.65억 달러
: RPO 126억 달러(+20%)
vs 컨센 124.9억 달러
: EPS $1.56
vs 컨센 $1.48, 가이던스 $1.47~1.49

■ F2Q25 가이던스
: 매출 22.2~22.5억 달러(+13%)
vs 컨센 22.29억 달러
EPS $1.54~1.56
vs 컨센 $1.55

■ FY25 가이던스
: 매출 91.2~91.7억 달러(+14%)
vs 컨센 91.32억 달러, 기존 91~91.5억 달러(+13.5%)
: NGS ARR 55.2~55.7 달러(+32%)
vs 컨센 54.39억 달러, 기존 54.2~54.7억 달러(+29%)
EPS $6.26~6.39
vs 컨센 $6.28, 기존 $6.18~6.31

■ 2 for 1 주식 분할 발표

https://investors.paloaltonetworks.com/node/18656/pdf

감사합니다.
1👍1
[삼성 이영진] 스노우플레이크(SNOW) F3Q25 실적 요약

■ F3Q25 실적
: 매출 9.42억 달러(+28%)
vs 컨센 8.99억 달러
: 제품 매출 9억 달러(+29%)
vs 컨센 8.49억 달러, 가이던스 8.5~8.55억 달러(+22%)
: RPO 57억 달러(+55%)
vs 컨센 53.4억 달러

■ F4Q25 가이던스
: 제품 매출 9.06~9.11억 달러(+23%)
vs 컨센 8.82억 달러

■ FY25 가이던스
: 제품 매출 34.3억 달러(+29%)
vs 컨센 33.34억 달러. 기존 33.56억 달러(+26%) 상향
: 제품 매출총이익률 76%
vs 기존 75% 상향
: 영업이익률 5%
vs 기존 3% 상향
: 조정 잉여현금흐름 마진 26%
vs 기존 26% 유지

https://investors.snowflake.com/news/news-details/2024/Snowflake-Reports-Financial-Results-for-the-Third-Quarter-of-Fiscal-2025/

감사합니다.
👍1
[삼성 이영진] 글로벌 SW 헤드라인 (24/11/21)

■ 오픈AI, GPT-4o 모델 업데이트. API는 gpt-4o-2024-11-20. 챗 봇 아레나 리더보드 1위 탈환(anonymous chatbot으로 테스팅)

■ DeepSeek AI, AIME 및 MATH 벤치마크에서 o1-Preivew 수준의 추론 기반 모델 DeepSeek-r1-lite-preview 출시

■ 반독점 당국의 구글 크롬 매각 요구 시 가치는 200억 달러에 이를 것으로 추정

■ 일론 머스크, 순다르 피차이 CEO의 트럼프 당선 축하 전화 당시 전화 상에 존재했다는 보도

■ 스노우플레이크 & 앤스로픽, Claude 모델을 AI 데이터클라우드 내에서 직접 활용 할 수 있도록 하는 다년간의 파트너십 발표

■ 세일즈포스, AI 에이전트 라이프사이클 관리 도구 Agentforce Testing Center 공개

■ 트레이드 데스크, CTV OS Ventura 공개

감사합니다.
2
[반.전] 엔비디아: BLACKWELL IN YOUR AREA - FY 3Q25 review

안녕하세요. 삼성증권 문준호의 ‘반도체를 전하다’입니다.

3분기 실적은 기대를 상회했으나, 가이던스가 부합에 그치며 엔비디아 주가는 시간외 -2% 하락했습니다.

더 이상 예전 같은 서프라이즈를 보여줄 수 없다는 점이나, 이미 시총 1위라 주가 upside가 제한적일 것을 우려하시는 것 같은데요.

결론적으로, 저희는 이번 실적 컨퍼런스콜을 듣고 난 후, 긍정적 시각이 여전히 유효하다는판단입니다.


■ FY 3Q25 review

3분기 매출액은 전분기 대비 17% 증가했고, FactSet 컨센서스를 6% 상회했고, 서프라이즈 배경은 단연 Data Center였습니다.

Non-GAAP 매출총이익률은 예고대로 75.0%로 위축되었는데, 이는 Blackwell 초기 수익성이 70% 초반 수준이기 때문입니다.

유쾌하지는 않지만, 신제품은 초기 수율이 낮을 점과 더불어 Blackwell은 다양한 파생 제품이 존재함을 고려해 줄 필요가 있습니다.


■ FY 4Q25 가이던스

4분기 매출 전망(+7% q-q)은 FactSet 컨센서스 부합에 그쳤습니다만, 세부적으로, AI GPU 수요는 기대 이상이었을 것으로 판단합니다.

우선 Blackwell 수요가 기대 이상으로, 지난 분기 가이던스 (several billion dollars) 상회 전망이라고 합니다.

이미 GB200 기반 NVL 서버 랙들은 인도 및 설치 중인 점을 보면 발열 이슈 우려도 해소될 전망이고요.

반면 Gaming 부문이 공급 제약으로 전분기 대비 감소할 전망이라고 합니다. 즉, AI 실적이 못 따라오는 게 아닌거죠.

물론 Gaming의 제약도 그만큼 AI GPU 생산을 최우선시 하기 위함으로 예상되고요.

Non-GAAP 매출총이익률은 또다시 73.5%로 위축될 전망입니다만, Blackwell의 수익성은 점진적으로 다시 70% 중반대까지 확대 예정입니다.

내년 연간 매출총이익률 컨센서스가 73%(Factset)이니까, 오히려 upside도 열려 있다는 판단입니다.


■ 결론

Top-down 관점에서 전방 산업의 트렌드나, Bottom-up 관점에서 엔비디아의 제품 일정이나 경쟁력은 변한 것이 없습니다.

섹터에서 가장 이익 가시성이 우수한 기업을 꼽으라면 단연 엔비디아이며, 이익 전망의 상향 가능성 또한 엔비디아가 가장 높습니다.

그렇다면 엔비디아를 대하는 우리의 마음도 변할 필요가 없지 않을까요?


감사합니다.

보고서 링크: https://bit.ly/4i16AT2

(2024/11/21 공표자료)
2
스노우플레이크(SNOW US) F3Q25 실적 - 와우! 겨울이다

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

스노우플레이크가 실적 발표 후 시간외에서 20% 상승했습니다.

제품 매출의 컨센서스(Factset) 상회율은 6.1%로 F2Q23(6.3% 상회) 이후 최고치인데요 과거 상회율 2~3% 레인지를 크게 뛰어넘는 실적입니다.

RPO 57.3억 달러(+55%)도 컨센서스 53.4억 달러를 상회하며 성장 가속화 트렌드가 지속되고 있는데요

매크로 코멘트는 지난 분기와 유사했으나, 세일즈 효율성 강화를 통한 신규 워크로드 및 제품 채택 지속이 호실적의 기반이 되고 있습니다

Iceberg 스토리지 관련 부정적 영향은 제한적이며 신규 데이터 엔지니어링 기능으로 상쇄도 기대하고 있네요

가이던스도 시원하게 올려주었습니다. FY25 제품 매출 가이던스 상회율은 F3Q 상회 폭보다 높다는 점을 고려하면 신규 제품 기대감도 존재합니다.

지난 분기는 유지되었던 이익단 가이던스도 소폭 상향 조정되었습니다(FCF 마진 가이던스는 유지)

생성 AI 활용에서 데이터 전략의 필요성은 모두가 공감하는 부분이고, 스노우는 긍정적 포지셔닝에도 불구 보여준 것이 제한적이었지요

Snowpark는 연 매출 3% 흐름을 이어가고 있으며, Cortex AI의 고객 채택이 지속되고 있습니다.

지난 주 BUILD 행사에서 공개한 기능과 출시한 신제품 모멘텀이 가시화될수록 업사이드가 존재합니다. 파트너십을 통한 데이터 상호운용성 개선 전략도 매력을 더하는 요인이지요

고통의 시간이 길었던만큼 주가 레벨이 높아진 타 SW 기업 대비 부담이 적다는 것도 하나의 포인트입니다.

스노우플레이크 실적에 대한 자세한 내용은 발간된 보고서를 참고해 주시기 바랍니다.

보고서 링크: https://bit.ly/4fZFWZ9

(2024/11/21 공표자료)
팔로알토 네트웍스(PANW US) F1Q25 실적 - 포장도 뜯지 못한 선물

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

팔로알토 네트웍스가 실적 발표 후 5% 하락했습니다. 전반적으로 긍정적 실적과 가이던스였지만, RPO 지표가 다소 아쉬웠는데요

하지만 지난 분기 대비 RPO 가이던스의 컨센서스 하회율은 크게 개선되었습니다. 사실 거의 부합이라고 봐도 무방할 정도네요

세부적으로 견조한 방화벽 제품 수요를 확인했으며, 클라우드 보안 및 보안 운영 성장도 계속되고 있습니다.

플랫폼화 정책의 효과도 이전 분기와 유사하게 성장하고 있으며, 대형 딜 체결 트랜드 속 딜 마감 사이클에서도 개선을 보였습니다.

IBM QRadar SaaS 인수를 통한 비유기적 성장이 존재했지만, 인수 사실은 모두 알고 있던 것이지요

기대치에 부합하는 정도의 약간은 아쉬운 숫자와 새로운 내용이 없는 실적은 주가 조정으로 이어지는 흐름이지만(ex 트레이드 데스크)

불확실성에 따른 우려가 극심했던 국면은 이미 벗어난 상황입니다. 팔로알토는 여전히 사이버 보안 섹터 내에서는 우선적으로 고려해야할 옵션입니다


주식 분할(2 for 1)이라는 이벤트도 실적의 폭풍 속 아직 뚜껑도 제대로 열어보지 못한 상황이니까요

자세한 내용은 발간된 보고서를 참고해 주시기 바랍니다.

보고서 링크: https://bit.ly/3V3reIi

(2024/11/21 공표자료)
소프트웨어의 시간이 온다면 주목할 기업은?

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

최근 주가 흐름에서 하드웨어에서 소프트웨어로 로테이션이 확인되고 있습니다.

AI 사이클은 건재하지만, 적극적 수익성을 추구하기 위한 머니 무브라고 볼 수 있는데요,

추론 비용의 급격한 하락, 오픈AI o1과 같은 추론 모델의 등장 등으로 마침내 AI 서비스의 시대가 열릴 것으로 기대되고 있습니다.

SW 섹터에서도 적극적인 투자 전략이 고민되는 시점인데요, 크게 세 가지 아이디어가 있습니다.

■ 이젠 AI 에이전트?!

'23년과 '24년 코파일럿은 기대감 대비 아쉬웠지만, 이번 에이전트 메타는 훨씬 똑똑한 모델과 여러 에이전틱 기능 개발 진행을 동반하고 있기 때문에 다르게 볼 수 있습니다.

세일즈포스는 가장 먼저 Agentforce라는 이름으로 에이전트를 자사 솔루션에 배치하기 시작했고, 서비스나우도 뒤를 잇고 있습니다.

마이크로소프트는 Ignite에서 에이전틱 월드 구축을 기치로 삼았지만, 세일즈포스처럼 영혼을 베팅한 느낌은 아닐 수 있다는 점에서 추가 확인이 필요합니다.

■ 그냥 AI 추론이 좋다!

단순하게 AI 추론이 성장하면 좋아지는 기업들도 있습니다.

AI 서비스가 많아지면 이를 모니터링(관리)해야하고, 서비스를 구축하기 위한 데이터베이스 솔루션 활용도 늘어날 수 있습니다. 데이터도그랑 오늘 시간 외 20% 급등 중인 스노우플레이크처럼요.

워크로드가 늘어나는 곳에는 사이버 보안의 필요성도 높아지지요. 크라우드 스트라이크가 대표적입니다.

■ 그래도 클라우드 인프라가 좋다면?

클라우드 인프라 확대의 수혜는 빅테크 모두 누리는 것입니다. 하지만 이미 실적도 발표된 상황에서 추가 모멘텀이 아쉬울 수 있는데요.

오라클은 12월 중순 실적 발표 예정으로 모멘텀이 남아있습니다. 클라우드 인프라 내 No 4지만 상위 플레이어가 채워주지 못하는 넘치는 수요의 낙수를 누리고 있습니다.

케파 제약으로 모멘텀이 둔화된 마소 입장에서도 먼저 케파 제약을 경험한 오라클의 회복 및 성장 트렌드를 참고해볼 필요가 있겠네요

■ 투자전략 요약

1) 대형주 위주의 안정적 베팅 → 오라클, 세일즈포스, 서비스나우

2) 리스크를 고려한 적극적 베팅 → 데이터도그, 스노우플레이크, 크라우드 스트라이크


(2024/11/21 공표자료)
4
[삼성 이영진] 글로벌 SW 헤드라인 (24/11/22)

■ 구글, Gemini-Exp-1121 API 모델 업데이트로 챗 봇 아레나 1위 재탈환

■ 구글 클라우드, AI 에이전트 개발과 배포에 특화된 플랫폼 AI Agent Space 출시

■ 미 법무부, 구글 반독점 관련 크롬 브라우저 매각을 법원에 공식 요청. 쿼리 기반 AI 프로덕트를 포함해 소비자 정보 검색 관련 기업에 대한 투자 및 협력 제한도 포함. 앤스로픽에 대한 20억 달러 투자가 해당 조건에 해당

■ 유튜브, 쇼츠 내 AI로 영상 배경을 생성하는 Dream Screan 공개

■ 오픈AI, 챗GPT와 결합된 브라우저 개발 보도. Natural Language Web(NLWeb) 검색 프로덕트 특징 강조. 전 크롬 개발자 영입

■ 아마존, 마켓플레이스 내 자사 제품 우선 프로모션 및 제공 관련 25년 EU DMA(디지털 시장법) 조사 가능성 보도

■ 애플, 대화형으로 개선된 Siri(LLM Siri)의 25년 공개 후, 26년 초 출시 계획 보도

■ 팔로알토 네트웍스, 약 2천대의 방화벽 장치가 PAN-OS 관련 제로데이 공격을 받았다는 사실 공개. 해당 취약점에 대한 긴급 패치 배포

감사합니다.
구글과 오픈AI의 챗 봇 아레나 1위 쟁탈전

: 타임라인(현지시간 기준)
11/14 - 구글, gemini-exp-1114
11/20 - 오픈AI, chatgpt-4o-2024-11-20
11/21 - 구글, gemini-exp-1121

: 모델 정식출시(GA) 관련 피드백에 대해 딥마인드 팀이 노력하고 있고, 모델‘들’을 곧 정식출시 할 것이라는 관계자 코멘트
샤티아 나델라와 젠슨 황의 스케일링 법칙에 대한 코멘트

1) 샤티아 나델라 Ignite 2024 Keynote

최근 몇 주 동안 많은 논쟁이 있었습니다. 스케일링 법칙이 벽에 부딪혔나? 계속될까? 결국 기억해야 할 것은, 이것들은 물리적 법칙이 아니라는 점입니다. 이것들은 단지 오랜 시간 동안 사실로 입증된 경험적 관찰에 불과합니다. 따라서, 회의론이나 논쟁은 오히려 모델 구조, 데이터 체제, 또는 시스템 아키텍처에 대한 많은 혁신을 촉진할 것이기 때문에 긍정적인 일입니다.

Now, in fact, there’s a lot of debate. In fact, just in the last multiple weeks, there’s a lot of debate, or have we hit the wall with scaling laws? Is it going to continue? I mean, the thing to remember, at the end of the day, these are not physical laws. These are just empirical observations that hold true, just like Moore’s Law did for a long period of time. And so, therefore, it’s actually good to have some skepticism, some debate, because that I think will motivate, quite frankly, more innovation on whether it’s model architectures or whether it’s data regimes or even systems architecture. So it’s a good thing to have.


이러한 맥락에서, 우리는 새로운 스케일링 법칙의 등장을 목격하고 있습니다. 바로 테스트 시간 또는 추론 시간 산출(test time or inference time compute)에 관한 것입니다. 오픈AI o1이 좋은 예입니다. 그리고 Copilot Think Harder 같은 기능은 o1을 기반으로 테스트 시간을 사용하여 어려운 문제를 해결합니다.

In that context, though, if anything, we are seeing the emergence of a new scaling law which test time or inference time compute. In fact, OpenAI’s o1 is a good example of it. And features like the Copilot Think Harder is built on o1, is all about using test time to solve even harder problems.


결국, 이러한 모든 혁신은 세 가지 기능에서 지수적으로 향상되는 모습을 나타냅니다. 첫째, 새로운 멀티모달 유니버설 인터페이스입니다. 이는 음성, 이미지, 비디오의 입력과 출력을 모두 지원합니다.

So ultimately, though, all these breakthroughs manifest in three capabilities that are exponentially getting better. The first is this new, universal interface that’s multimodal. It supports speech, images, videos, both as input and output.


둘째, 새로운 추론 및 계획 능력입니다. 이것을 통해 우리는 복잡한 문제를 해결하는 데 도움이 되는 새로운 신경 대수를 갖게 되었습니다. 사람, 장소, 사물 간의 패턴을 감지하고, 이들 간의 관계도 찾을 수 있습니다.

Second, we have these new reasoning and planning capabilities, which essentially we have new neural algebra to help solve complex problems. We can detect patterns involving people, places and things. You can even find relationships between people, places and things using this new algebra.


셋째, 장기 기억, 풍부한 맥락을 지원하고, 사실상 모델에게 도구를 사용하는 방법을 가르치는 능력을 갖게 되었습니다. 이 모든 요소들을 결합하면, 우리가 일과 삶, 팀, 비즈니스 프로세스, 그리고 조직을 대신하여 행동할 수 있는 매우 풍부한 AI 에이전트의 세계를 구축할 수 있습니다.

And third, we now have this capability to support long-term memory, rich contexts, and in fact teach these models to use tools. So if you put all those things together, you can build a very rich agentic world defined by this tapestry of AI agents, which can act on our behalf across our work and life, across teams, business processes as well as organization.
샤티아 나델라와 젠슨 황의 스케일링 법칙에 대한 코멘트

2) 젠슨 황, F3Q25 어닝콜

우리의 파운데이션 모델 사전 훈련 스케일링은 계속되고 있습니다. 이는 아는 것 처럼 경험적 법칙이지, 근본적인 물리적 법칙이 아닙니다. 그러나 증거는 계속 스케일링이 이루어지고 있다는 것을 가리키고 있습니다. 우리가 배운 것은 이것만으로는 충분하지 않다는 것입니다. 현재 우리는 두 가지 다른 스케일링 방법을 발견했습니다.

Our foundation model pre-training scaling is intact, and it's continuing. As you know, this is an empirical law, not a fundamental physical law. But the evidence is that it continues to scale. What we're learning, however, is that it's not enough, that we've now discovered two other ways to scale.


하나는 사후 훈련 스케일링입니다. 물론, 첫 번째 세대의 사후 훈련은 강화 학습 인간 피드백이었지만, 이제 우리는 강화 학습 AI 피드백과 다양한 합성 데이터를 생성하여 사후 훈련을 돕는 모든 형태의 데이터를 갖게 되었습니다. 그리고 가장 큰 이벤트이자 흥미로운 발전은 Strawberry, 챗GPT o1, 오픈AI의 o1입니다. 이는 추론 시간 스케일링, 일명 테스트 시간 스케일링을 수행합니다. 생각할 시간이 길어질수록 나은 품질의 답변을 생성합니다.

One is post-training scaling. Of course, the first generation of post-training was reinforcement learning human feedback, but now we have reinforcement learning AI feedback, and all forms of synthetic data generated data that assists in post-training scaling. And one of the biggest events and one of the most exciting developments is Strawberry, ChatGPT o1, OpenAI's o1, which does inference time scaling, what is called test time scaling. The longer it thinks, the better and higher-quality answer it produces.


이것은 연쇄적 사고(CoT)와 다중 경로 계획 등에 필요한 모든 기술을 고려합니다. 직관적으로, 우리가 질문에 답하기 전에 머릿속에서 생각하는 것과 비슷합니다. 이제 우리는 세 가지 스케일링 방법을 갖게 되었고, 세 가지 방법 모두에서 스케일링이 이루어지고 있습니다. 그 결과, 우리의 인프라에 대한 수요는 매우 큽니다.

And it considers approaches like chain of thought and multi-path planning and all kinds of techniques necessary to reflect and so on and so forth. And it's -- intuitively, it's a little bit like us doing thinking in our head before we answer your question. And so, we now have three ways of scaling, and we're seeing all three ways of scaling. And as a result of that, the demand for our infrastructure is really great.


지난 세대의 기초 모델들이 약 10만개 Hoppers로 끝났다면, 다음 세대는 10만개의 Blackwells로 시작합니다. 이는 사전 훈련 스케일링, 사후 훈련 스케일링, 그리고 이제 매우 중요한 추론 시간 스케일링에 대해 업계가 어디로 이동하고 있는지에 대한 느낌을 줍니다. 이러한 이유들로 인해 수요는 정말 큽니다.

You see now that at the tail end of the last generation of foundation models were at about 100,000 Hoppers. The next generation starts at 100,000 Blackwells. And so, that kind of gives you a sense of where the industry is moving with respect to pre-training scaling, post-training scaling, and then now very importantly, inference time scaling. And so, the demand is really great for all of those reasons.


우리는 추론 수요가 증가하는 것을 보고 있습니다. 추론 시간 스케일링도 증가하고 있습니다. AI 네이티브 회사도 계속 증가하고 있고, 에이전틱 AI의 기업 도입이 최신 유행이 되고 있습니다. 결국 다양한 곳에서 많은 수요가 발생하는 것을 보고 있습니다.

And so, we're seeing inference demand go up. We're seeing inference time scaling go up. We see the number of AI native companies continue to grow. And of course, we're starting to see enterprise adoption of agentic AI really is the latest rage. And so, we're seeing a lot of demand coming from a lot of different places.