Forwarded from 카이에 de market
* Ben Bajarin
(테크 기술/시장 분석경력 25년)
2026년을 훨씬 넘어가는 메모리 부족이 모두에게 닥칠 것입니다..
다시 말하지만, 추론/에이전트 AI에 필요한 메모리(그리고 저장 공간)가 얼마나 되는지 지켜보세요.
https://x.com/i/status/2057892608412950956
(테크 기술/시장 분석경력 25년)
2026년을 훨씬 넘어가는 메모리 부족이 모두에게 닥칠 것입니다..
다시 말하지만, 추론/에이전트 AI에 필요한 메모리(그리고 저장 공간)가 얼마나 되는지 지켜보세요.
https://x.com/i/status/2057892608412950956
X (formerly Twitter)
Ben Bajarin (@BenBajarin) on X
Memory shortage lasting WELL past 2026 everyone..
Again, just wait until you see how much memory (and storage) is required for inference/agentic AI.
Again, just wait until you see how much memory (and storage) is required for inference/agentic AI.
기억보단 기록을
#AI #온톨로지 Q5. 창업가에게는 어디에 기회가 있는지? - 기존 모델이 기본적으로 해결하지 못하는 비분포 영역의 비즈니스라면, 기업이 직접 독자적인 파인튜닝 데이터셋과 자체 강화학습(RL) 환경을 구축해야만 생존할 수 있음 - 창업가가 특정 산업 도메인에서 차별화되고 방대하며 다각화된 강화학습(RL) 환경이나 평가 데이터셋을 직접 구축해 낼 수만 있다면, 기성 오픈소스나 상용 파인튜닝 프레임워크의 레버를 당겨 AI 랩들을 능가하는 압도적인 수직 특화…
#AI #단상
개인적으로 생각하는 카파시의 3가지 Key Insight는
1. 프론티어 AI 랩들의 사전 학습 데이터에는 구조적인 공백이 있고, 커버 불가능한 도메인이 있다.
즉, 점수화/검증하기 어려운 물리 세계 데이터를 가진 산업, 기업들이 Vertical AI를 구축하는건 여전히 유효하며, 이런 시스템 유무가 압도적인 해자를 만들어낼 것.
해자의 핵심은 자체적인 파인튜닝 데이터셋과 독자적인 강화학습(RL) 보상 환경을 구축하는 것이다.
2. AI 에이전트가 활성화되더라도 인간이 지속적인 피드백을 주는 Human-in-the-loop 구조는 계속해서 필요하다.
그리고 이 구조가 그대로 녹아있는 플랫폼(PLTR AIP = AI 제안 → 인간 승인 → 실행 루프 구조 → 인간 피드백 → 동적 온톨로지에 반영)을 가지고 있는건 바로 팔란티어
현재 이 구조를 엔터프라이즈/정부/국방 레벨에서 실전 검증된 소프트웨어로 구현하고 있는 곳은 팔란티어가 유일하지 않을까
3. 에이전트가 실행을 대체할수록 '무엇을 만들지, 어느 방향으로 드라이브할지'를 판단하는 디렉팅 능력이 보틀넥이 된다.
이 판단력의 질은 개인의 온톨로지 깊이에 비례한다. 탄탄한 지식 구조를 가진 사람일수록 에이전트 군단을 더 정확한 방향으로 지휘할 수 있고, 투자 thesis 설정이나 비즈니스 의사결정 같은 고차원 의사결정에서도 온톨로지가 경쟁 우위가 될 것
https://blog.naver.com/aaaehgus?Redirect=Update&logNo=224294303864
개인적으로 생각하는 카파시의 3가지 Key Insight는
1. 프론티어 AI 랩들의 사전 학습 데이터에는 구조적인 공백이 있고, 커버 불가능한 도메인이 있다.
즉, 점수화/검증하기 어려운 물리 세계 데이터를 가진 산업, 기업들이 Vertical AI를 구축하는건 여전히 유효하며, 이런 시스템 유무가 압도적인 해자를 만들어낼 것.
해자의 핵심은 자체적인 파인튜닝 데이터셋과 독자적인 강화학습(RL) 보상 환경을 구축하는 것이다.
2. AI 에이전트가 활성화되더라도 인간이 지속적인 피드백을 주는 Human-in-the-loop 구조는 계속해서 필요하다.
그리고 이 구조가 그대로 녹아있는 플랫폼(PLTR AIP = AI 제안 → 인간 승인 → 실행 루프 구조 → 인간 피드백 → 동적 온톨로지에 반영)을 가지고 있는건 바로 팔란티어
현재 이 구조를 엔터프라이즈/정부/국방 레벨에서 실전 검증된 소프트웨어로 구현하고 있는 곳은 팔란티어가 유일하지 않을까
3. 에이전트가 실행을 대체할수록 '무엇을 만들지, 어느 방향으로 드라이브할지'를 판단하는 디렉팅 능력이 보틀넥이 된다.
이 판단력의 질은 개인의 온톨로지 깊이에 비례한다. 탄탄한 지식 구조를 가진 사람일수록 에이전트 군단을 더 정확한 방향으로 지휘할 수 있고, 투자 thesis 설정이나 비즈니스 의사결정 같은 고차원 의사결정에서도 온톨로지가 경쟁 우위가 될 것
https://blog.naver.com/aaaehgus?Redirect=Update&logNo=224294303864
👍4
#원자재 #에너지 #oil #원자력 #구리
어제 AI쪽 인사이트를 봤으니 오늘은 원자재쪽을 보기 위해 원자재 전설 Rick Rule의 인터뷰를 정리해봄
- 오일, 구리, 우라늄, 리튬, 금/은, 국채 등 폭넓은 원자재 인사이트를 얻어갈 수 있음
- 자세한건 블로그에..!
https://blog.naver.com/aaaehgus/224295201278
어제 AI쪽 인사이트를 봤으니 오늘은 원자재쪽을 보기 위해 원자재 전설 Rick Rule의 인터뷰를 정리해봄
- 오일, 구리, 우라늄, 리튬, 금/은, 국채 등 폭넓은 원자재 인사이트를 얻어갈 수 있음
- 자세한건 블로그에..!
✅원자재별 Key Insight 3가지
1. 오일: 중동 리스크 해소 시 트레이더라면 절반 매도를, 인베스터라면 오일 구조적 쇼티지를 노리고 우량 자산 위주로 홀딩을 추천 (본인은 제 3세계 해양 탐사 기업 보유 중)
2. 구리: AI가 없어도 구조적 쇼티지가 및 가격 상승은 필연적. 일반적인 투자자에게는 우량 구리 광산 기업을 추천
3. 우라늄: 에너지 안보 측면에서 최대 수혜. 극도의 소외기의 큰 수익을 낼 시기는 지났으나 향후 10년 구조적으로 계속 좋게 봄
https://blog.naver.com/aaaehgus/224295201278
NAVER
원자재 전설 Rick Rule 인터뷰 요약 (오일, 우라늄, 구리 등등)
✅원자재별 Key Insight 3가지
Forwarded from 하나증권/에너지화학/윤재성
*미국 온라인 매체 Axios는 미국과 이란이 60일 휴전 연장안을 포함한 잠정 합의에 근접했다고 보도. 해당 기간 동안 호르무즈 해협 재개방, 이란의 원유 수출 재개, 이란 핵 프로그램 관련 협상이 병행될 예정
**Axios에 따르면, 60일 동안 호르무즈 해협은 통행료 없이 개방되며, 이란은 해협에 설치한 기뢰를 제거해 선박의 자유로운 통항을 보장하는 데 동의
***그 대가로 미국은 이란 항구 봉쇄를 해제하고, 이란이 원유를 자유롭게 판매할 수 있도록 일부 제재 면제(sanctions waivers)를 제공하는 방안을 검토 중
****핵 협상 관련해서는 이란이 핵무기 개발을 추구하지 않겠다고 약속하고, 우라늄 농축 중단 및 고농축 우라늄 재고 처리 방안을 협상 테이블에 올리는 내용 포함
*****Axios에 따르면, 이란은 중재국을 통해 미국 측에 농축 중단 범위 및 핵물질 포기 수준에 대한 구두 입장을 전달한 상태. 미국 역시 60일 협상 기간 동안 대이란 제재 완화 및 동결 자금 해제에 대해 논의할 예정
******다만, 백악관은 해당 보도에 대해 아직 공식 입장을 내놓지 않은 상황
▶ Axios says proposed US-Iran deal involves opening strait during 60-day ceasefire extension (5/24, Reuters)
https://www.reuters.com/world/asia-pacific/axios-says-proposed-us-iran-deal-involves-opening-strait-during-60-day-ceasefire-2026-05-24/
**Axios에 따르면, 60일 동안 호르무즈 해협은 통행료 없이 개방되며, 이란은 해협에 설치한 기뢰를 제거해 선박의 자유로운 통항을 보장하는 데 동의
***그 대가로 미국은 이란 항구 봉쇄를 해제하고, 이란이 원유를 자유롭게 판매할 수 있도록 일부 제재 면제(sanctions waivers)를 제공하는 방안을 검토 중
****핵 협상 관련해서는 이란이 핵무기 개발을 추구하지 않겠다고 약속하고, 우라늄 농축 중단 및 고농축 우라늄 재고 처리 방안을 협상 테이블에 올리는 내용 포함
*****Axios에 따르면, 이란은 중재국을 통해 미국 측에 농축 중단 범위 및 핵물질 포기 수준에 대한 구두 입장을 전달한 상태. 미국 역시 60일 협상 기간 동안 대이란 제재 완화 및 동결 자금 해제에 대해 논의할 예정
******다만, 백악관은 해당 보도에 대해 아직 공식 입장을 내놓지 않은 상황
▶ Axios says proposed US-Iran deal involves opening strait during 60-day ceasefire extension (5/24, Reuters)
https://www.reuters.com/world/asia-pacific/axios-says-proposed-us-iran-deal-involves-opening-strait-during-60-day-ceasefire-2026-05-24/
Reuters
Axios says proposed US-Iran deal involves opening strait during 60-day ceasefire extension
The U.S. and Iran are close to signing a deal involving a 60-day ceasefire extension, during which the Strait of Hormuz would be reopened, Iran would be able to freely sell oil and negotiations would be held on curbing Iran's nuclear program, Axios reported…
기억보단 기록을
#원자재 #에너지 #oil #원자력 #구리 어제 AI쪽 인사이트를 봤으니 오늘은 원자재쪽을 보기 위해 원자재 전설 Rick Rule의 인터뷰를 정리해봄 - 오일, 구리, 우라늄, 리튬, 금/은, 국채 등 폭넓은 원자재 인사이트를 얻어갈 수 있음 - 자세한건 블로그에..! ✅원자재별 Key Insight 3가지 1. 오일: 중동 리스크 해소 시 트레이더라면 절반 매도를, 인베스터라면 오일 구조적 쇼티지를 노리고 우량 자산 위주로 홀딩을 추천 (본인은…
전반적으로 내가 생각하는 뷰와 거의 일치함
특히 오일 쪽은 본인이 보는 시나리오, 투자 시계열에 따라서 60일 휴전 연장 & 호르무즈 재개방 (말 뿐이 아니라 진짜 열린다면...)에 따른 대응을 어떻게 할지 잘 생각해봐야할듯
특히 오일 쪽은 본인이 보는 시나리오, 투자 시계열에 따라서 60일 휴전 연장 & 호르무즈 재개방 (말 뿐이 아니라 진짜 열린다면...)에 따른 대응을 어떻게 할지 잘 생각해봐야할듯
#매크로 #AI #반도체
신한투자증권 김성환 애널:
1) 현재 글로벌 증시는 빅테크의 AI CAPEX 치킨게임으로 인해 자본의 잉여가 주주 환원에서 구경제 및 하드웨어 밸류체인(특히 동아시아 3국)으로 재배분되는 강세장 후반부에 진입
2) 매크로 지표상 미니멈 1년의 잔여 기간이 존재
3) 소비 둔화와 투자 중심의 매커니즘 특성상 주도주가 바뀌기보다 극단적인 쏠림이 심화될 것이므로 미국 내 CAPEX 수혜주와 동아시아 하드웨어 기업에 집중하는 전략이 유효
https://www.youtube.com/watch?v=fTDeL7kQNj0
신한투자증권 김성환 애널:
1) 현재 글로벌 증시는 빅테크의 AI CAPEX 치킨게임으로 인해 자본의 잉여가 주주 환원에서 구경제 및 하드웨어 밸류체인(특히 동아시아 3국)으로 재배분되는 강세장 후반부에 진입
2) 매크로 지표상 미니멈 1년의 잔여 기간이 존재
3) 소비 둔화와 투자 중심의 매커니즘 특성상 주도주가 바뀌기보다 극단적인 쏠림이 심화될 것이므로 미국 내 CAPEX 수혜주와 동아시아 하드웨어 기업에 집중하는 전략이 유효
https://www.youtube.com/watch?v=fTDeL7kQNj0
❤3
기억보단 기록을
#매크로 #AI #반도체 신한투자증권 김성환 애널: 1) 현재 글로벌 증시는 빅테크의 AI CAPEX 치킨게임으로 인해 자본의 잉여가 주주 환원에서 구경제 및 하드웨어 밸류체인(특히 동아시아 3국)으로 재배분되는 강세장 후반부에 진입 2) 매크로 지표상 미니멈 1년의 잔여 기간이 존재 3) 소비 둔화와 투자 중심의 매커니즘 특성상 주도주가 바뀌기보다 극단적인 쏠림이 심화될 것이므로 미국 내 CAPEX 수혜주와 동아시아 하드웨어 기업에 집중하는 전략이…
NAVER
AI 강세 사이클 1년은 더 간다?
✅ 3줄 요약
🔥1
#AI #DELL #NVDA #PLTR
젠슨 황 & 마이클 델 (Dell CEO)인터뷰 요약
마이클 델:
- 과거의 단순 테스트·평가 단계를 지나 실제 생산 단계로 완전히 전환됨
- 일라이 릴리의 신약 개발, 삼성의 제조 현장처럼 수천 개의 GPU가 실제 물리적 세계에서 구동되는 대규모 성공 사례가 등장함
- 이러한 변화는 특정 기술 기업에 국한되지 않고 모든 산업, 모든 국가의 대기업 전반으로 광범위하게 확산 중임
- AI 모델 성능 개선과 에이전트 역량이 결합되면서, 엔터프라이즈 부문은 이제 막 거대한 파도가 시작되는 초입 단계이자 엄청난 기회의 영역임
젠슨 황:
- 인텔리전스는 반드시 맥락이 존재하는 지점, 즉 실제 행동과 데이터가 발생하는 현장에서 수행되고 생산되어야 함
- 초기 AI 서비스는 데이터가 클라우드에 집중되어 있어 클라우드 중심으로 발전하는 것이 자연스러웠음
- 삼성이나 일라이 릴리 같은 제조·엔터프라이즈의 미래에는 AI 에이전트가 온프레미스에 존재해야 함
Why? 기업의 핵심 자산인 독점 데이터, 보안 데이터, 고유 워크플로우가 모두 로컬 현장에 묶여 있기 때문
- 챗GPT 등장 이후 콘텐츠 '생성'에 머물렀던 AI는, 이제 기업 내부에서 실질적인 업무를 '수행'하는 에이전트 AI 시대로 진화함
마이클 델:
- 엔비디아와 델이 수십 년간 함께 구축해 온 글로벌 공급망이 현재 엄청난 규모로 계속 확장 중임
- 시장 전체적으로 수요가 공급을 초과하고 있으나, 절대적인 공급량 자체도 지속적으로 늘어나고 있음
- 기업들이 이 기술을 통해 자신들의 워크플로우를 재설계할 때, 생산성 개선이 10~30% 수준이 아니라 10배, 20배, 때로는 100배에 달한다는 것을 깨닫고 있음
- 이 압도적인 속도가 비즈니스 성공의 핵심이며, 모든 기업들이 이를 경쟁 우위로 전환하기 위해 전력을 다하고 있음
젠슨 황:
- 하이퍼스케일러가 엔비디아의 기술을 자체 클라우드 '서비스'로 통합한다면, 델은 이를 엔터프라이즈 고객이 즉시 비즈니스 임팩트를 낼 수 있는 완성형 '솔루션'으로 전환하는 독보적인 능력을 보유함
- 에이전트 AI의 등장으로 컴퓨터 아키텍처가 완전히 재정의되었으며, 이를 구현하기 위해 양사는 여러 기술 계층을 융합함
- 그레이스 블랙웰 NVL72 같은 거대 칩셋으로 LLM을 구동하는 '두뇌'를 구축하고, 에이전트 AI 특화 설계된 새 CPU '베라'가 이 두뇌 주변에 '하네스' 역할을 수행함
- 하네스: LLM이 로컬 메모리, 장기 메모리, 네트워크, 소프트웨어 툴을 유기적으로 활용할 수 있도록 연결하는 제어 장치 → 비로소 두뇌가 실제 업무를 수행하는 에이전트로 전환됨
- 엔비디아의 베이스 기술 위에 Dell AI Data Platform, NeMo 에이전트 런타임, 오픈셸까지 결합한 완전한 풀스택 에이전트 플랫폼 아키텍처를 구축 완료함
마이클 델:
- 기업이 에이전트 체제로 전환되면서 GPU뿐 아니라 CPU 수요 역시 공급을 초과할 정도로 급증하고 있으며, 이는 앞으로도 지속될 것임
- 과거에는 인간이 소프트웨어 툴을 간헐적으로 사용했지만, 에이전트 체제에서는 수천억 개의 에이전트가 항상, 극도로 빠른 속도로 무수한 툴을 호출함
- 에이전트가 툴을 끊임없이 호출하는 연산에는 막대한 CPU가 필요하며, 이 CPU들이 GPU와 초고속으로 연결되어야만 에이전트가 막힘없이 작동함
- GPU 확장은 필연적으로 대규모 CPU 수요를 동반함
젠슨 황:
- 선단 공정 반도체와 고대역폭 메모리 수급은 여전히 도전적인 과제이나, 엔비디아는 2~3년 전부터 장기 공급망 계획을 세워 CoWoS, HBM, 그레이스 블랙웰, 실리콘 포토닉스 네트워킹 부품까지 모든 조각을 정밀하게 확보해 둠
- 3년 전 마이크론, SK하이닉스 CEO와 미래 비전을 공유하고 공급을 준비시키는 등, 업스트림 반도체 제조사부터 다운스트림 발전기·부지·금융까지 선제적으로 납득시키고 준비시키는 것이 핵심 역할임
- 이것은 단순한 호황-불황 사이클이 아닌 구조적 대전환임
- 향후 생겨날 수천억 개의 AI 에이전트 각각에 컴퓨팅·스토리지·네트워킹 자원을 할당해야 하므로 수요는 기하급수적으로 늘어남
- 에이전트 인프라 확장만 최소 10년이 걸릴 것이며, 그 이후에는 전 세계 90조 달러 규모의 제조·산업 현장을 바꿀 피지컬 AI 시대가 도래함
- 공급망 캐파가 매년 수배씩 늘어나도 향후 10년간 수요를 따라잡기 어려울 것임
젠슨 황:
- 미국 행정부는 미국이 모든 기술 영역에서 AI 혁명을 글로벌하게 주도하기를 원함
- 현재 H200은 규제 당국의 라이선스 허가 하에 중국 시장에 판매 가능한 상태임
- 중국 정부는 자국 반도체 산업 보호와 미국산 AI 칩 대거 도입 사이에서 균형을 선택해야 하는 상황임
- 중국 내 에이전트 AI 수요 역시 폭발적으로 늘고 있어 장기적으로는 시장이 더 열릴 것으로 전망
- 현지에서 H200 판매를 직접 협상한 것은 아니며, 트럼프 행정부의 중국 비즈니스 외교 노선을 지원하는 미국 비즈니스 리더로서 동행한 것임
마이클 델:
- 중국 내 비즈니스를 지속하되, 정부가 부과한 모든 수출 통제 조치를 철저히 준수함
- 궁극적으로 미-중 간 경제 협력과 교류의 확대가 전 세계 번영을 이끄는 윈-윈 시나리오가 될 것이라 믿음
마이클 델:
- PC는 여전히 전 세계 모든 지식 노동자의 생산성 최전선에 놓인 핵심 디바이스임
- 현재 온디바이스에서 소형 언어 모델을 직접 구동할 수 있는 고성능 AI PC 형태로 빠르게 진화 중임
- 고객들은 클라우드와 로컬 연산을 함께 쓰는 하이브리드 AI를 원하며, 대규모 PC 비즈니스는 델에게 강력한 공급망 바잉 파워를 제공함
젠슨 황:
- 패러다임이 개인용 컴퓨터에서 '개인용 AI' 시대로 전환되고 있음
- 인텔리전스는 맥락이 있는 곳에 존재해야 하므로, 공장 에이전트는 공장에서, 수술실 에이전트는 병원에서, 자율주행 AI는 차량 내부에서 직접 구동되어야 함
- 미래의 AI 컴퓨팅은 고성능 로컬 하드웨어 위에서 사용자가 비용·대역폭 제한 없이 무제한으로 토큰을 생성하는 분산형 인텔리전스 인프라로 정착될 것임
- 델의 고성능 PC에 엔비디아의 차세대 GPU를 결합하는 미래 공동 비즈니스 플랜이 긴밀하게 진행 중이며, 조만간 공개 예정임
https://www.youtube.com/watch?v=oE5lNDhz9oo&t=616s
젠슨 황 & 마이클 델 (Dell CEO)인터뷰 요약
1. AI 팩토리 도입 현황 및 1년 전과의 차이점
마이클 델:
- 과거의 단순 테스트·평가 단계를 지나 실제 생산 단계로 완전히 전환됨
- 일라이 릴리의 신약 개발, 삼성의 제조 현장처럼 수천 개의 GPU가 실제 물리적 세계에서 구동되는 대규모 성공 사례가 등장함
- 이러한 변화는 특정 기술 기업에 국한되지 않고 모든 산업, 모든 국가의 대기업 전반으로 광범위하게 확산 중임
- AI 모델 성능 개선과 에이전트 역량이 결합되면서, 엔터프라이즈 부문은 이제 막 거대한 파도가 시작되는 초입 단계이자 엄청난 기회의 영역임
2. 하이퍼스케일러 중심에서 로컬 온프레미스로의 전환 배경
젠슨 황:
- 인텔리전스는 반드시 맥락이 존재하는 지점, 즉 실제 행동과 데이터가 발생하는 현장에서 수행되고 생산되어야 함
- 초기 AI 서비스는 데이터가 클라우드에 집중되어 있어 클라우드 중심으로 발전하는 것이 자연스러웠음
- 삼성이나 일라이 릴리 같은 제조·엔터프라이즈의 미래에는 AI 에이전트가 온프레미스에 존재해야 함
Why? 기업의 핵심 자산인 독점 데이터, 보안 데이터, 고유 워크플로우가 모두 로컬 현장에 묶여 있기 때문
- 챗GPT 등장 이후 콘텐츠 '생성'에 머물렀던 AI는, 이제 기업 내부에서 실질적인 업무를 '수행'하는 에이전트 AI 시대로 진화함
3. 클라우드 기업의 GPU 독점 우려와 델의 대규모 GPU 공급 비결
마이클 델:
- 엔비디아와 델이 수십 년간 함께 구축해 온 글로벌 공급망이 현재 엄청난 규모로 계속 확장 중임
- 시장 전체적으로 수요가 공급을 초과하고 있으나, 절대적인 공급량 자체도 지속적으로 늘어나고 있음
- 기업들이 이 기술을 통해 자신들의 워크플로우를 재설계할 때, 생산성 개선이 10~30% 수준이 아니라 10배, 20배, 때로는 100배에 달한다는 것을 깨닫고 있음
- 이 압도적인 속도가 비즈니스 성공의 핵심이며, 모든 기업들이 이를 경쟁 우위로 전환하기 위해 전력을 다하고 있음
4. 엔비디아와 델의 파트너십 구조 및 에이전트 AI 시대의 새로운 아키텍처
젠슨 황:
- 하이퍼스케일러가 엔비디아의 기술을 자체 클라우드 '서비스'로 통합한다면, 델은 이를 엔터프라이즈 고객이 즉시 비즈니스 임팩트를 낼 수 있는 완성형 '솔루션'으로 전환하는 독보적인 능력을 보유함
- 에이전트 AI의 등장으로 컴퓨터 아키텍처가 완전히 재정의되었으며, 이를 구현하기 위해 양사는 여러 기술 계층을 융합함
- 그레이스 블랙웰 NVL72 같은 거대 칩셋으로 LLM을 구동하는 '두뇌'를 구축하고, 에이전트 AI 특화 설계된 새 CPU '베라'가 이 두뇌 주변에 '하네스' 역할을 수행함
- 하네스: LLM이 로컬 메모리, 장기 메모리, 네트워크, 소프트웨어 툴을 유기적으로 활용할 수 있도록 연결하는 제어 장치 → 비로소 두뇌가 실제 업무를 수행하는 에이전트로 전환됨
- 엔비디아의 베이스 기술 위에 Dell AI Data Platform, NeMo 에이전트 런타임, 오픈셸까지 결합한 완전한 풀스택 에이전트 플랫폼 아키텍처를 구축 완료함
5. 에이전트 시대의 CPU 수요 급증 메커니즘
마이클 델:
- 기업이 에이전트 체제로 전환되면서 GPU뿐 아니라 CPU 수요 역시 공급을 초과할 정도로 급증하고 있으며, 이는 앞으로도 지속될 것임
- 과거에는 인간이 소프트웨어 툴을 간헐적으로 사용했지만, 에이전트 체제에서는 수천억 개의 에이전트가 항상, 극도로 빠른 속도로 무수한 툴을 호출함
- 에이전트가 툴을 끊임없이 호출하는 연산에는 막대한 CPU가 필요하며, 이 CPU들이 GPU와 초고속으로 연결되어야만 에이전트가 막힘없이 작동함
- GPU 확장은 필연적으로 대규모 CPU 수요를 동반함
6. 현재 공급망의 최대 병목과 장기 수요 전망
젠슨 황:
- 선단 공정 반도체와 고대역폭 메모리 수급은 여전히 도전적인 과제이나, 엔비디아는 2~3년 전부터 장기 공급망 계획을 세워 CoWoS, HBM, 그레이스 블랙웰, 실리콘 포토닉스 네트워킹 부품까지 모든 조각을 정밀하게 확보해 둠
- 3년 전 마이크론, SK하이닉스 CEO와 미래 비전을 공유하고 공급을 준비시키는 등, 업스트림 반도체 제조사부터 다운스트림 발전기·부지·금융까지 선제적으로 납득시키고 준비시키는 것이 핵심 역할임
- 이것은 단순한 호황-불황 사이클이 아닌 구조적 대전환임
- 향후 생겨날 수천억 개의 AI 에이전트 각각에 컴퓨팅·스토리지·네트워킹 자원을 할당해야 하므로 수요는 기하급수적으로 늘어남
- 에이전트 인프라 확장만 최소 10년이 걸릴 것이며, 그 이후에는 전 세계 90조 달러 규모의 제조·산업 현장을 바꿀 피지컬 AI 시대가 도래함
- 공급망 캐파가 매년 수배씩 늘어나도 향후 10년간 수요를 따라잡기 어려울 것임
7. 중국 시장 및 미국 행정부 규제 대응 전략
젠슨 황:
- 미국 행정부는 미국이 모든 기술 영역에서 AI 혁명을 글로벌하게 주도하기를 원함
- 현재 H200은 규제 당국의 라이선스 허가 하에 중국 시장에 판매 가능한 상태임
- 중국 정부는 자국 반도체 산업 보호와 미국산 AI 칩 대거 도입 사이에서 균형을 선택해야 하는 상황임
- 중국 내 에이전트 AI 수요 역시 폭발적으로 늘고 있어 장기적으로는 시장이 더 열릴 것으로 전망
- 현지에서 H200 판매를 직접 협상한 것은 아니며, 트럼프 행정부의 중국 비즈니스 외교 노선을 지원하는 미국 비즈니스 리더로서 동행한 것임
마이클 델:
- 중국 내 비즈니스를 지속하되, 정부가 부과한 모든 수출 통제 조치를 철저히 준수함
- 궁극적으로 미-중 간 경제 협력과 교류의 확대가 전 세계 번영을 이끄는 윈-윈 시나리오가 될 것이라 믿음
8. AI PC의 진화 및 차세대 온디바이스 협력
마이클 델:
- PC는 여전히 전 세계 모든 지식 노동자의 생산성 최전선에 놓인 핵심 디바이스임
- 현재 온디바이스에서 소형 언어 모델을 직접 구동할 수 있는 고성능 AI PC 형태로 빠르게 진화 중임
- 고객들은 클라우드와 로컬 연산을 함께 쓰는 하이브리드 AI를 원하며, 대규모 PC 비즈니스는 델에게 강력한 공급망 바잉 파워를 제공함
젠슨 황:
- 패러다임이 개인용 컴퓨터에서 '개인용 AI' 시대로 전환되고 있음
- 인텔리전스는 맥락이 있는 곳에 존재해야 하므로, 공장 에이전트는 공장에서, 수술실 에이전트는 병원에서, 자율주행 AI는 차량 내부에서 직접 구동되어야 함
- 미래의 AI 컴퓨팅은 고성능 로컬 하드웨어 위에서 사용자가 비용·대역폭 제한 없이 무제한으로 토큰을 생성하는 분산형 인텔리전스 인프라로 정착될 것임
- 델의 고성능 PC에 엔비디아의 차세대 GPU를 결합하는 미래 공동 비즈니스 플랜이 긴밀하게 진행 중이며, 조만간 공개 예정임
https://www.youtube.com/watch?v=oE5lNDhz9oo&t=616s
YouTube
Nvidia's Huang, Michael Dell on Agentic AI, Memory Demand and China
Nvidia CEO Jensen Huang and Dell CEO Michael Dell discuss agentic AI, the demand for memory and the outlook for the China market with Bloomberg's Ed Ludlow on the sidelines of the Dell World event in Las Vegas.
--------
More on Bloomberg Television and…
--------
More on Bloomberg Television and…
❤2
기억보단 기록을
#AI #DELL #NVDA #PLTR 젠슨 황 & 마이클 델 (Dell CEO)인터뷰 요약 1. AI 팩토리 도입 현황 및 1년 전과의 차이점 마이클 델: - 과거의 단순 테스트·평가 단계를 지나 실제 생산 단계로 완전히 전환됨 - 일라이 릴리의 신약 개발, 삼성의 제조 현장처럼 수천 개의 GPU가 실제 물리적 세계에서 구동되는 대규모 성공 사례가 등장함 - 이러한 변화는 특정 기술 기업에 국한되지 않고 모든 산업, 모든 국가의 대기업 전반으로…
요 인터뷰도 인사이트 한가득... CPU 밸류체인, 델 주가가 계속 강한 이유가 잘 나와있음
기억보단 기록을
2. 하이퍼스케일러 중심에서 로컬 온프레미스로의 전환 배경
#NVDA
테크피드님 코멘트에 따르면, 이번에 엔비디아 DC 세그먼트가 하이퍼스케일러 vs ACIE (Non-하이퍼)로 나눠짐
그리고 ACIE 부분이 훨씬 빠르게 성장중인데, 앞으로 온프레미스 포함 엔터프라이즈 레벨 침투율과 피지컬 AI, 그리고 월드모델을 생각하면 엔비디아 성장도 한참 멀었다고 생각
https://www.youtube.com/watch?v=og-O3Ujymn0
테크피드님 코멘트에 따르면, 이번에 엔비디아 DC 세그먼트가 하이퍼스케일러 vs ACIE (Non-하이퍼)로 나눠짐
그리고 ACIE 부분이 훨씬 빠르게 성장중인데, 앞으로 온프레미스 포함 엔터프라이즈 레벨 침투율과 피지컬 AI, 그리고 월드모델을 생각하면 엔비디아 성장도 한참 멀었다고 생각
https://www.youtube.com/watch?v=og-O3Ujymn0
기억보단 기록을
4. 엔비디아와 델의 파트너십 구조 및 에이전트 AI 시대의 새로운 아키텍처
#AI #PLTR #단상
온프레미스, 그리고 팔란티어와의 파트너십에 대한 단상
1) 원래 보안 측면에서 모델 성능이 고도화될수록, 데이터 주권과 컴플라이언스 이슈가 클라우드 AI 채택의 최대 보틀넥
2) 특히 금융/국방/의료 조직은 데이터를 외부 클라우드로 보낼 수 없고, 이 시장은 하이퍼스케일러가 원천적으로 공략하기 어려웠음 (그래서 팔란티어가 이쪽 섹터를 독점)
3) 근데 젠슨황이 이번 인터뷰에서 언급한것: "인텔리전스는 반드시 맥락이 존재하는 지점에서 수행되어야 한다."
즉, 단순 보안 선호의 문제가 아니라 데이터의 물리적 귀속 구조의 문제
4) 바꿔말하면 온프레미스 AI 팩토리 수요는 하이퍼스케일러 성장과 독립적으로, 또 구조적으로 증가 한다는 얘기
5) 그래서 엔비디아-팔란티어-델이 이번에 파트너십을 맺고 온프레미스 영역을 노리는 것
6) 팔란티어의 소프트웨어(AI 운영체제), 델은 하드웨어 통합, 엔비디아의 칩셋.. 이 3개 기업 조합은 진입장벽이 매우 높다.
7) 이 구조로 가면 안드레 카파시가 언급한 Human-in-the-loop도 자연스럽게 해결
온프레미스, 그리고 팔란티어와의 파트너십에 대한 단상
1) 원래 보안 측면에서 모델 성능이 고도화될수록, 데이터 주권과 컴플라이언스 이슈가 클라우드 AI 채택의 최대 보틀넥
2) 특히 금융/국방/의료 조직은 데이터를 외부 클라우드로 보낼 수 없고, 이 시장은 하이퍼스케일러가 원천적으로 공략하기 어려웠음 (그래서 팔란티어가 이쪽 섹터를 독점)
3) 근데 젠슨황이 이번 인터뷰에서 언급한것: "인텔리전스는 반드시 맥락이 존재하는 지점에서 수행되어야 한다."
즉, 단순 보안 선호의 문제가 아니라 데이터의 물리적 귀속 구조의 문제
4) 바꿔말하면 온프레미스 AI 팩토리 수요는 하이퍼스케일러 성장과 독립적으로, 또 구조적으로 증가 한다는 얘기
5) 그래서 엔비디아-팔란티어-델이 이번에 파트너십을 맺고 온프레미스 영역을 노리는 것
6) 팔란티어의 소프트웨어(AI 운영체제), 델은 하드웨어 통합, 엔비디아의 칩셋.. 이 3개 기업 조합은 진입장벽이 매우 높다.
7) 이 구조로 가면 안드레 카파시가 언급한 Human-in-the-loop도 자연스럽게 해결