삼성전자 이어 디스플레이·전기·SDI도 지방 투자 계획
삼성디스플레이가 유기발광다이오드(OLED)와 차세대 디스플레이 생산 거점인 아산·천안캠퍼스를 중심으로 향후 10년간 최대 100조 원 규모의 대규모 투자에 나설 것으로 알려졌다. 이는 올해부터 양산에 들어가는 8.6세대 OLED 라인(약 4조 1000억 원) 20개를 구축할 수 있는 규모다. 업계 관계자는 “삼성디스플레이의 차세대 OLED 생산 관련 추가 투자 계획이 이번 발표에 포함돼 있다”고 말했다.
삼성전기도 세종에 조(兆) 단위 자금을 투입해 AI 반도체 기판 생산 공장을 구축할 방침이다. 삼성전기는 세종사업장 유휴 부지에 최근 글로벌 빅테크들의 주문이 급증하는 AI 기판 생산 공장을 신설할 것으로 알려졌다. 삼성SDI 천안사업장도 차세대 모빌리티와 피지컬 AI 시장 확대에 맞춰 소형 배터리와 자동차용 배터리 생산 능력을 키울 것으로 전망된다.
https://www.sedaily.com/article/20061045
삼성디스플레이가 유기발광다이오드(OLED)와 차세대 디스플레이 생산 거점인 아산·천안캠퍼스를 중심으로 향후 10년간 최대 100조 원 규모의 대규모 투자에 나설 것으로 알려졌다. 이는 올해부터 양산에 들어가는 8.6세대 OLED 라인(약 4조 1000억 원) 20개를 구축할 수 있는 규모다. 업계 관계자는 “삼성디스플레이의 차세대 OLED 생산 관련 추가 투자 계획이 이번 발표에 포함돼 있다”고 말했다.
삼성전기도 세종에 조(兆) 단위 자금을 투입해 AI 반도체 기판 생산 공장을 구축할 방침이다. 삼성전기는 세종사업장 유휴 부지에 최근 글로벌 빅테크들의 주문이 급증하는 AI 기판 생산 공장을 신설할 것으로 알려졌다. 삼성SDI 천안사업장도 차세대 모빌리티와 피지컬 AI 시장 확대에 맞춰 소형 배터리와 자동차용 배터리 생산 능력을 키울 것으로 전망된다.
https://www.sedaily.com/article/20061045
청와대) 회복을 넘어 대도약으로, 초격차 대한민국
청와대에서 「대한민국 대도약 3대 메가프로젝트 국민보고회」를 주재한다. 국민보고회는 ‘회복을 넘어 대도약으로, 초격차 대한민국’이라는 슬로건 아래, 한국형 AI 산업혁명 완수를 위한 기업들의 3대 메가프로젝트(반도체, 피지컬 AI, AI 데이터센터) 투자계획과 정부 지원방안을 국민들께 보고하고, 성과를 내기 위한 방안을 함께 논의하기 위해 마련됐다.
오늘 행사에는 삼성전자, SK, LG전자, 퓨리오사, 로보티즈, HD현대로보틱스, GS, KT, 한국전력공사, 한국수자원공사 등 3대 메가프로젝트 분야의 주요 기업, 전문가, 관계기관이 참석한다.
청와대에서 「대한민국 대도약 3대 메가프로젝트 국민보고회」를 주재한다. 국민보고회는 ‘회복을 넘어 대도약으로, 초격차 대한민국’이라는 슬로건 아래, 한국형 AI 산업혁명 완수를 위한 기업들의 3대 메가프로젝트(반도체, 피지컬 AI, AI 데이터센터) 투자계획과 정부 지원방안을 국민들께 보고하고, 성과를 내기 위한 방안을 함께 논의하기 위해 마련됐다.
오늘 행사에는 삼성전자, SK, LG전자, 퓨리오사, 로보티즈, HD현대로보틱스, GS, KT, 한국전력공사, 한국수자원공사 등 3대 메가프로젝트 분야의 주요 기업, 전문가, 관계기관이 참석한다.
미국 소비자들이 메모리 3사를 대상으로 ‘DRAM 가격 담합’ 관련 반독점 소송을 제기했습니다.
AI 워크로드 급증으로 DRAM 수요가 급증해 그 과정에서 RAM 부족이 일어났고 가격 급등 현상이 초래됐다는 게 골자입니다.
원고는 수요 급증 자체와 별개로 벤더들이 생산 계획을 조정해 쇼티지를 심화시키고 마진을 극대화하려 했다고 지적합니다.
슈퍼사이클 때마다 반복되는 현상인데요. 2016~2018년 당시에도 집단 소송이 제기됐지만 미국 항소법원에서 증거 부족으로 기각한 바 있습니다. 하지만 2000년대에는 미 법무부가 DRAM 담합 건에 대해 $731M의 벌금을 부과하고 회사 임원들에게 징역형을 선고한 바 있습니다.
https://www.law360.com/cases/6a3d550e19d272e7662e8504?article_sidebar=1
AI 워크로드 급증으로 DRAM 수요가 급증해 그 과정에서 RAM 부족이 일어났고 가격 급등 현상이 초래됐다는 게 골자입니다.
원고는 수요 급증 자체와 별개로 벤더들이 생산 계획을 조정해 쇼티지를 심화시키고 마진을 극대화하려 했다고 지적합니다.
슈퍼사이클 때마다 반복되는 현상인데요. 2016~2018년 당시에도 집단 소송이 제기됐지만 미국 항소법원에서 증거 부족으로 기각한 바 있습니다. 하지만 2000년대에는 미 법무부가 DRAM 담합 건에 대해 $731M의 벌금을 부과하고 회사 임원들에게 징역형을 선고한 바 있습니다.
https://www.law360.com/cases/6a3d550e19d272e7662e8504?article_sidebar=1
Law360
Garciaguirre et al v. Samsung Electronics Co., Ltd. et al
Parties, docket activity and news coverage of federal case Garciaguirre et al v. Samsung Electronics Co., Ltd. et al, case number 3:26-cv-06345, from California Northern Court.
서남권 반도체 팹 4기(삼성 2기 + SKH 2기) 총 800조 투자
충청권 패키징(후공정) 팹 총 81조 원 투자
동남권 반도체 소부장 생태계 완성(금액 명시 X)
충청권 패키징(후공정) 팹 총 81조 원 투자
동남권 반도체 소부장 생태계 완성(금액 명시 X)
삼성전기는 생산 사업장이 부산/세종/베트남이 있는데, 부산 사업장을 중심으로 확대해 나간다고 합니다.
부산 사업장은 이미 부지가 없는데, 새로운 부지를 사서 공장을 올리는 그린필드 투자를 집행할 것으로 보입니다.
부산 사업장은 이미 부지가 없는데, 새로운 부지를 사서 공장을 올리는 그린필드 투자를 집행할 것으로 보입니다.
[정리] 삼성, 미래 성장 위해 2,655조원 투자
> 반도체
- 호남 및 충청(천안/온양)•영남 625조
- 평택·용인 반도체 클러스터 2030조
> 메가프로젝트
- 광주 신규 반도체 팹 건설
- 해남 솔라시도 AI 데이터센터
- 호남에 태양광·원전·그린수소 등 실증단지 투자
- 고창에 삼성전자 최첨단 물류 센터 건설
> 계열사
- 삼성SDI, 천안 차세대 배터리 마더팩토리 조성
- 삼성SDI, 울산 전고체 배터리 마더팩토리 조성
- 삼성전기, 세종에 최첨단 AI 서버 패키지 기판 시설 투자
- 삼성전기, 부산에 MLCC/패키지 기판 라인 구축
- 삼성전자, 구미에 휴머노이드 로봇 라인 건설
- 삼성SDS, 구미에 AI 데이터센터 건설
- 삼성중공업, 거제에 최첨단 고부가가치 건조 거점 구축
> 반도체
- 호남 및 충청(천안/온양)•영남 625조
- 평택·용인 반도체 클러스터 2030조
> 메가프로젝트
- 광주 신규 반도체 팹 건설
- 해남 솔라시도 AI 데이터센터
- 호남에 태양광·원전·그린수소 등 실증단지 투자
- 고창에 삼성전자 최첨단 물류 센터 건설
> 계열사
- 삼성SDI, 천안 차세대 배터리 마더팩토리 조성
- 삼성SDI, 울산 전고체 배터리 마더팩토리 조성
- 삼성전기, 세종에 최첨단 AI 서버 패키지 기판 시설 투자
- 삼성전기, 부산에 MLCC/패키지 기판 라인 구축
- 삼성전자, 구미에 휴머노이드 로봇 라인 건설
- 삼성SDS, 구미에 AI 데이터센터 건설
- 삼성중공업, 거제에 최첨단 고부가가치 건조 거점 구축
[단독] 중국 메모리 CXMT, 텐센트와 LTA 체결
- 텐센트와 200억 위안($2.94B) 이상 장기계약 체결
- 서버용 D램 다년 간 공급 포함. 최대 5년
- CXMT 현 캐파는 월 300K 수준 (팹 3기)
- LTA 기반으로 향후 월 600K 확장 방침
Source : Reuters
- 텐센트와 200억 위안($2.94B) 이상 장기계약 체결
- 서버용 D램 다년 간 공급 포함. 최대 5년
- CXMT 현 캐파는 월 300K 수준 (팹 3기)
- LTA 기반으로 향후 월 600K 확장 방침
Source : Reuters
딘스티커 Dean's Ticker
[단독] 중국 메모리 CXMT, 텐센트와 LTA 체결 - 텐센트와 200억 위안($2.94B) 이상 장기계약 체결 - 서버용 D램 다년 간 공급 포함. 최대 5년 - CXMT 현 캐파는 월 300K 수준 (팹 3기) - LTA 기반으로 향후 월 600K 확장 방침 Source : Reuters
중국 기업들끼리 메모리 LTA하는 게 큰 의미가 있는지는 모르겠습니다.
그럼에도 이 계기로 선급금 확보하고 캐파 증설에 쓸 현금을 확보할 수 있다는 점은 꽤 유의미합니다.
중국 CXMT는 내수 모바일/서버용 D램 공급에만 몰빵하고 있으며 해외 수출은 규제 여부와 상관 없이 물량 자체가 없다고 합니다.
애플이 미 정부와 의회를 상대로 로비 중인 CXMT 메모리 수입 관련 움직임 역시 당장의 물량 충족이 아닌 장기적인 옵션 확보로 해석해야 할 듯 합니다
그럼에도 이 계기로 선급금 확보하고 캐파 증설에 쓸 현금을 확보할 수 있다는 점은 꽤 유의미합니다.
중국 CXMT는 내수 모바일/서버용 D램 공급에만 몰빵하고 있으며 해외 수출은 규제 여부와 상관 없이 물량 자체가 없다고 합니다.
애플이 미 정부와 의회를 상대로 로비 중인 CXMT 메모리 수입 관련 움직임 역시 당장의 물량 충족이 아닌 장기적인 옵션 확보로 해석해야 할 듯 합니다
앤스로픽, 아마존과 ‘컴퓨팅 시간’ 기준에서 ‘토큰’ 기준으로 재협상
앤트로픽이 "우리도 이제 전사적으로 토큰당 단가로 정산하니, 아마존 당신들도 우리가 만든 API 쓸 때 토큰 단위로 돈을 내라"고 요구(재협상)한 상황. 결과적으로 아마존 내부 엔지니어들이 클로드 모델을 굴릴 때 발생하는 비용이 급증하게 됐고, 이에 부담을 느낀 아마존이 오픈AI 모델(GPT)이나 자체 AI 모델인 '노바' 모델로 갈아타려는 움직임을 보이고 있음
https://www.theinformation.com/articles/amazon-pay-anthropic-technology-new-deal?rc=3nnj10
앤트로픽이 "우리도 이제 전사적으로 토큰당 단가로 정산하니, 아마존 당신들도 우리가 만든 API 쓸 때 토큰 단위로 돈을 내라"고 요구(재협상)한 상황. 결과적으로 아마존 내부 엔지니어들이 클로드 모델을 굴릴 때 발생하는 비용이 급증하게 됐고, 이에 부담을 느낀 아마존이 오픈AI 모델(GPT)이나 자체 AI 모델인 '노바' 모델로 갈아타려는 움직임을 보이고 있음
https://www.theinformation.com/articles/amazon-pay-anthropic-technology-new-deal?rc=3nnj10
The Information
Amazon Could Pay More for Anthropic Technology Under New Deal
As Anthropic grows to become a leading AI model used by enterprises, it’s been flexing its power with customers—including one of its most important early backers, Amazon. Earlier this year, Anthropic renegotiated an aspect of its partnership with Amazon,…
로켓랩, 이리듐 인수...위성 통신/제조 사업 나선다 $RKLB
로켓 발사 서비스 기업인 로켓랩이 경쟁사 스페이스X에 맞서기 위해 이리듐을 $8B(주당 $54)에 인수하기로 합의(프리미엄 24% 부여). 이번 거래를 통해 위성 함대 자산과 위성 제조 역량을 확보하고 무선 주파수 자원을 확보하게 됨. 이리듐은 현재 저궤도에서 66개 위성을 운영하고 있으며 정부/선박/광산 업계의 고객들이 쓰는 핸드셋에 위성 통신 연결을 지원하고 있음. 이리듐 주파수 권리는 전 세계에서 사용할 수 있어 특히 가치가 높은 것으로 평가됨. 로켓랩은 20년 전 발사 서비스 업체로 출발했으나 경영진은 최근 자체적인 위성 함대를 직접 운영하고 싶다는 의사를 밝힌 바 있음
로켓 발사 서비스 기업인 로켓랩이 경쟁사 스페이스X에 맞서기 위해 이리듐을 $8B(주당 $54)에 인수하기로 합의(프리미엄 24% 부여). 이번 거래를 통해 위성 함대 자산과 위성 제조 역량을 확보하고 무선 주파수 자원을 확보하게 됨. 이리듐은 현재 저궤도에서 66개 위성을 운영하고 있으며 정부/선박/광산 업계의 고객들이 쓰는 핸드셋에 위성 통신 연결을 지원하고 있음. 이리듐 주파수 권리는 전 세계에서 사용할 수 있어 특히 가치가 높은 것으로 평가됨. 로켓랩은 20년 전 발사 서비스 업체로 출발했으나 경영진은 최근 자체적인 위성 함대를 직접 운영하고 싶다는 의사를 밝힌 바 있음
삼성전기 15조 투자…소부장도 메가프로젝트
삼성전기(009150)가 인공지능(AI) 반도체의 핵심 부품인 수동소자(MLCC)와 패키지 기판(FC-BGA) 증설을 위해 향후 수년간 부산·세종의 생산 거점 신·증설에 약 15조 원을 투자한다. 글로벌 빅테크들과 장기공급계약(LTA)을 잇따라 체결해 확보한 선급금을 투자 재원으로 생산능력을 대폭 확대해 급증하는 AI 반도체 수요에 부응한다는 전략이다.
삼성전기는 30일 부산 강서구 명지녹산국가산업단지에 위치한 사업장과 맞먹는 규모의 신규 부지를 인근에 확보해 MLCC와 FC-BGA 등 핵심 제품의 생산능력을 대폭 확대할 방침이다. 후보지로는 명지녹산국가산단 내 매각이 추진 중인 2~3개 사업장과 부산 강서구 에코델타시티 등이 거론된다.
https://n.news.naver.com/article/011/0004636608?type=journalists
삼성전기(009150)가 인공지능(AI) 반도체의 핵심 부품인 수동소자(MLCC)와 패키지 기판(FC-BGA) 증설을 위해 향후 수년간 부산·세종의 생산 거점 신·증설에 약 15조 원을 투자한다. 글로벌 빅테크들과 장기공급계약(LTA)을 잇따라 체결해 확보한 선급금을 투자 재원으로 생산능력을 대폭 확대해 급증하는 AI 반도체 수요에 부응한다는 전략이다.
삼성전기는 30일 부산 강서구 명지녹산국가산업단지에 위치한 사업장과 맞먹는 규모의 신규 부지를 인근에 확보해 MLCC와 FC-BGA 등 핵심 제품의 생산능력을 대폭 확대할 방침이다. 후보지로는 명지녹산국가산단 내 매각이 추진 중인 2~3개 사업장과 부산 강서구 에코델타시티 등이 거론된다.
https://n.news.naver.com/article/011/0004636608?type=journalists
Naver
삼성전기 15조 투자…소부장도 메가프로젝트
삼성전기(009150)가 인공지능(AI) 반도체의 핵심 부품인 수동소자(MLCC)와 패키지 기판(FC-BGA) 증설을 위해 향후 수년간 부산·세종의 생산 거점 신·증설에 약 15조 원을 투자한다. 글로벌 빅테크들과
트럼프, 엑손 지분 $5M 투자 $AXON
트럼프 행정부가 지난 2월 엑손 엔터프라이즈(AXON) 주식 $1M~$5M 상당 매입했다고 공시했음. 이를 통해 이민관세집행국(ICE)이 엑손으로부터 테이저건을 현 보유량 대비 4배 넘는 물량을 공급받는 5년 $220M 규모 계약을 체결했음.
엑손은 전략적 투자를 집행한 정부 대상으로 테이저건 판매에 그치지 않을 전망. 이 회사의 성장동력은 무기 판매 이후 필연적으로 뒤따르는 '디지털 증거 관리' 클라우드 소프트웨어와 바디캠 같은 또 다른 하드웨어 제품임. 이를 통해 일회성 수주를 넘어 장기 종속 기반의 반복 매출을 내는 게 핵심
엑손은 이미 2023년에 국토안보부와 $370M 규모의 바디캠 및 SW 계약을 체결한 바 있음. 하지만 현재까지 엑손에 집행된 예산이 $67.5M 수준으로 전체 계약액의 18%에 불과하다는 점이 지적되고 있음. 그럼에도 엑손의 클라우드 매출은 YoY 40% 이상 급성장하고 있음
by CNBC
트럼프 행정부가 지난 2월 엑손 엔터프라이즈(AXON) 주식 $1M~$5M 상당 매입했다고 공시했음. 이를 통해 이민관세집행국(ICE)이 엑손으로부터 테이저건을 현 보유량 대비 4배 넘는 물량을 공급받는 5년 $220M 규모 계약을 체결했음.
엑손은 전략적 투자를 집행한 정부 대상으로 테이저건 판매에 그치지 않을 전망. 이 회사의 성장동력은 무기 판매 이후 필연적으로 뒤따르는 '디지털 증거 관리' 클라우드 소프트웨어와 바디캠 같은 또 다른 하드웨어 제품임. 이를 통해 일회성 수주를 넘어 장기 종속 기반의 반복 매출을 내는 게 핵심
엑손은 이미 2023년에 국토안보부와 $370M 규모의 바디캠 및 SW 계약을 체결한 바 있음. 하지만 현재까지 엑손에 집행된 예산이 $67.5M 수준으로 전체 계약액의 18%에 불과하다는 점이 지적되고 있음. 그럼에도 엑손의 클라우드 매출은 YoY 40% 이상 급성장하고 있음
by CNBC
Forwarded from 에테르의 일본&미국 리서치
This media is not supported in your browser
VIEW IN TELEGRAM
Cerebras에서 자기들의 웨이퍼스케일엔진(WSE)라는 초대형AI가속기를 홍보하기 위해서 WSE로 AI를 사용하는 것을 체험해줄 수 있게 합니다. 최근 Gemma4 31B가 추가되었는데, 추론이 없다고 해도 토큰출력속도가 1700T/s로 미쳤습니다. 역시 메모리대역폭이 21PB/s라서 그런지 대단하네요.
https://chat.cerebras.ai/
https://cloud.cerebras.ai/
두군데서 체험할 수 있습니다.
https://chat.cerebras.ai/
https://cloud.cerebras.ai/
두군데서 체험할 수 있습니다.
다음 AI 칩 혁신은 팬넬(Panel) 레벨 칩에서 나올 게 분명해 보입니다
사각형 모양의 거대 칩을 만드는 세레브라스(CBRS) 제품으로 구성된 서버가 GPT 5.6 Sol 모델을 돌리면 초당 750토큰 처리 속도를 보인다고 하는데요. 이게 현재 엔비디아 GPU 서버로 GPT 5.5XHigh 돌릴 때 나오는 초당 70~100토큰 속도를 최대 10배 이상 웃도는 수준입니다.
by Reddit & X
사각형 모양의 거대 칩을 만드는 세레브라스(CBRS) 제품으로 구성된 서버가 GPT 5.6 Sol 모델을 돌리면 초당 750토큰 처리 속도를 보인다고 하는데요. 이게 현재 엔비디아 GPU 서버로 GPT 5.5XHigh 돌릴 때 나오는 초당 70~100토큰 속도를 최대 10배 이상 웃도는 수준입니다.
by Reddit & X
Reddit
From the codex community on Reddit: GPT 5.6 Sol will be on Cerebras at 750 Tokens Per Second. 5.5 XHigh currently runs at 70-100…
Explore this post and more from the codex community
에테르의 일본&미국 리서치
번스타인) 메모리; 새로운 메모리 LTA 계약이 실적과 멀티플의 지속에 어떤 정당성을 부여할까요? 샌디스트 TP $3000.
샌디스크의 장기계약(5년 기준) 선급금 비중은 16% 정도로 추정된다고 합니다 (by Bernstein)
마이크론은 오피셜하게 22%라고 나왔고요. 20% 안팎 수준의 선급금 지급이 나오는 걸로 보입니다.
다만 이게 말이 좋아 선급금이지, 언제든지 고객사가 회수할 수 있도록 계약액에서 조정하는 거지 현금을 직접 제공하는 건 아니라고 합니다.
즉, 벤더에 완전히 유리한 계약은 아닌 것으로 보입니다.
마이크론은 오피셜하게 22%라고 나왔고요. 20% 안팎 수준의 선급금 지급이 나오는 걸로 보입니다.
다만 이게 말이 좋아 선급금이지, 언제든지 고객사가 회수할 수 있도록 계약액에서 조정하는 거지 현금을 직접 제공하는 건 아니라고 합니다.
즉, 벤더에 완전히 유리한 계약은 아닌 것으로 보입니다.
UBS : 마벨 CXL 선두 예상 / TP $230 → $340 $MRVL
(Timothy Arcuri) 마벨의 2027년 CXL 매출이 $1.0B에 이르고 2028년 매출도 $2.0B에 달할 것으로 전망(상향). 주로 XPU-소켓 시장이 매출을 견인하고 에이전트 CPU 수요도 주요 성장 요인 중 하나.
마벨의 CXL 매출은 3가지 범주로 구분됨. ①랙 내부 부품 간 인터커넥트 ②다양한 연산장치가 탑재되는 메인보드 내 연결(XPU-소켓) ③연산장치와 메모리 풀 사이 스위치 칩셋. ①의 경우 기존에 해왔던 영역, ②는 하이퍼스케일러 2곳과 5개의 커스텀 칩(XPU) 프로그램을 진행하면서 확장 중, ③은 구글 TPU에 스위치 CXL을 제공하면서 확장하고 있음
아스테라랩스(ALAB) 역시 CXL 시장 기회(TAM)가 클 것으로 보임. ALAB은 주요 고객인 마이크로소프트와 함께 오랫동안 CXL 시장을 확대해왔으나 현재까지 연간 출하량은 $25M 수준에 불과. 하지만 2026년 하반기부터 MS향 출하량을 본격 증가할 것으로 예상. 2027년에는 새로운 하이퍼스케일러 수주로 기존 CPU향 제품을 넘어 GPU에서도 기회가 생길 것으로 관측
(Timothy Arcuri) 마벨의 2027년 CXL 매출이 $1.0B에 이르고 2028년 매출도 $2.0B에 달할 것으로 전망(상향). 주로 XPU-소켓 시장이 매출을 견인하고 에이전트 CPU 수요도 주요 성장 요인 중 하나.
마벨의 CXL 매출은 3가지 범주로 구분됨. ①랙 내부 부품 간 인터커넥트 ②다양한 연산장치가 탑재되는 메인보드 내 연결(XPU-소켓) ③연산장치와 메모리 풀 사이 스위치 칩셋. ①의 경우 기존에 해왔던 영역, ②는 하이퍼스케일러 2곳과 5개의 커스텀 칩(XPU) 프로그램을 진행하면서 확장 중, ③은 구글 TPU에 스위치 CXL을 제공하면서 확장하고 있음
아스테라랩스(ALAB) 역시 CXL 시장 기회(TAM)가 클 것으로 보임. ALAB은 주요 고객인 마이크로소프트와 함께 오랫동안 CXL 시장을 확대해왔으나 현재까지 연간 출하량은 $25M 수준에 불과. 하지만 2026년 하반기부터 MS향 출하량을 본격 증가할 것으로 예상. 2027년에는 새로운 하이퍼스케일러 수주로 기존 CPU향 제품을 넘어 GPU에서도 기회가 생길 것으로 관측
딘스티커 Dean's Ticker
#Opinion 광통신에서 파생되는 돈줄기가 보이고 있습니다. 엔비디아의 AI 컴퓨팅 플랫폼 계보는 그레이스-블랙웰(GB)에서 베라-루빈(VR)로 넘어갔습니다. 단순히 CPU/GPU 아키텍처만 업그레이드된 게 아닙니다. 랙 종류가 훨씬 많아졌는데요. 슈퍼칩(CPU & GPU) 랙과 네트워킹 스위치 랙을 넘어 VR에서는 CPU 랙 / 스토리지 랙(CMX) / 가속기(LPU) 랙이 추가로 생겼죠. CPU 랙이 나오면서 CPU 종목인 인텔·Arm·AMD는…
전에 AI 투자 아이디어 하나를 전개하면서 제안했던 게
스케일아웃 CPO 확장 → 랙 종류 증가 → 메모리 전용 랙 추가
이거였죠. 만약에 메모리 전용 랙이 나오게 되면 기존 서버 아키텍처에 쓰이던 PCIe가 아니라 메모리가 CPU 옆에 바로 안 붙어있어도 연결이 가능한 표준인 CXL을 채택할 가능성이 매우 높습니다.
이러한 경우에는 메모리 랙에 CXL 기반이 갖춰져야 하고 마벨(MRVL)과 아스테라랩스(ALAB) 등이 제공하는 CXL스위치 / CXL컨트롤러 / CXL리타이머 같은 제품이 필연적으로 요구될 것입니다
메모리 랙이 나오면 D램 업체뿐 아니라 부속 부품을 제공하는 이런 업체들에도 큰 수혜가 나올 수 있다는 말입니다
스케일아웃 CPO 확장 → 랙 종류 증가 → 메모리 전용 랙 추가
이거였죠. 만약에 메모리 전용 랙이 나오게 되면 기존 서버 아키텍처에 쓰이던 PCIe가 아니라 메모리가 CPU 옆에 바로 안 붙어있어도 연결이 가능한 표준인 CXL을 채택할 가능성이 매우 높습니다.
이러한 경우에는 메모리 랙에 CXL 기반이 갖춰져야 하고 마벨(MRVL)과 아스테라랩스(ALAB) 등이 제공하는 CXL스위치 / CXL컨트롤러 / CXL리타이머 같은 제품이 필연적으로 요구될 것입니다
메모리 랙이 나오면 D램 업체뿐 아니라 부속 부품을 제공하는 이런 업체들에도 큰 수혜가 나올 수 있다는 말입니다
오픈AI, 추론 비용 절반 줄이는 새로운 기법 발견
오픈AI 엔지니어들은 6월 초 추론 비용을 절반 이상 줄일 수 있는 기법을 발견. 챗GPT에 이 기법을 적용했을 때 특정 연산 시점에 필요한 엔비디아 GPU 수가 몇백대 수준으로 줄어들었다고 함
이 기법이 정확히 무엇인지 알려지지 않았으나 구글 터보퀀트 등 기존 효율화 기법에 쓰인 ‘양자화(Quantization)’와 연산 정보를 기억하는 ‘KV 캐싱’, 쿼리를 묶어서 보내는 ‘배칭(Batching)’, 그리고 일부 쿼리를 저전력 모델에 라우팅하는 기술 다수가 포함됐을 것으로 추정됨
경쟁사 앤스로픽이 최근 모델 사용료를 더 높게 책정하는 것에 대해 일부 비판을 받고 있는 상황에서 오픈AI가 이 기법으로 비용 효율적인 모델 제공업체로 명성을 공고히하는 데 도움이 될 수 있음
오픈AI는 이렇게 추론 비용을 절감하게 되면 절감분만큼 어떻게 재투자를 할 것인지에 대해 질문이 던져짐. 챗GPT 사용자가 동일 요금제에서 사용할 수 있는 쿼리 수가 늘거나, API로 호출하는 모델 비용 자체를 낮추거나 해서 고객의 투자 회수를 이끌어내는 것이 방법 중 하나
오픈AI는 1Q26 기준 GPM이 39% 수준. YoY 6%p 개선에도 불구하고 목표치인 52%에는 크게 못 미치고 있음. 이번에 발견한 최적화 기법으로 이 수준을 얼마나 빨리 달성할 수 있는지 귀추가 주목됨
The Information
오픈AI 엔지니어들은 6월 초 추론 비용을 절반 이상 줄일 수 있는 기법을 발견. 챗GPT에 이 기법을 적용했을 때 특정 연산 시점에 필요한 엔비디아 GPU 수가 몇백대 수준으로 줄어들었다고 함
이 기법이 정확히 무엇인지 알려지지 않았으나 구글 터보퀀트 등 기존 효율화 기법에 쓰인 ‘양자화(Quantization)’와 연산 정보를 기억하는 ‘KV 캐싱’, 쿼리를 묶어서 보내는 ‘배칭(Batching)’, 그리고 일부 쿼리를 저전력 모델에 라우팅하는 기술 다수가 포함됐을 것으로 추정됨
경쟁사 앤스로픽이 최근 모델 사용료를 더 높게 책정하는 것에 대해 일부 비판을 받고 있는 상황에서 오픈AI가 이 기법으로 비용 효율적인 모델 제공업체로 명성을 공고히하는 데 도움이 될 수 있음
오픈AI는 이렇게 추론 비용을 절감하게 되면 절감분만큼 어떻게 재투자를 할 것인지에 대해 질문이 던져짐. 챗GPT 사용자가 동일 요금제에서 사용할 수 있는 쿼리 수가 늘거나, API로 호출하는 모델 비용 자체를 낮추거나 해서 고객의 투자 회수를 이끌어내는 것이 방법 중 하나
오픈AI는 1Q26 기준 GPM이 39% 수준. YoY 6%p 개선에도 불구하고 목표치인 52%에는 크게 못 미치고 있음. 이번에 발견한 최적화 기법으로 이 수준을 얼마나 빨리 달성할 수 있는지 귀추가 주목됨
The Information
The Information
OpenAI Discovers New Way to Cut Inference Costs in Half
We closely track efforts by Anthropic, Google and OpenAI to get access to more server chips to run their models. But we don’t talk enough about the work these companies are doing to get more juice from the servers they already have.In one previously unreported…