#AI #클라우드 #서버
* 클라우드의 AI 플랫폼화
Google Cloud Will Offer AI Supercomputers Powered by Nvidia H100 GPUs
Google Cloud customers will soon be able to rent A3 virtual machines to train AI models. Google's A3 systems will have eight Nvidia H100 Hopper GPUs paired with 4th Gen Intel Xeon Scalable processors and 2TB of DDR5-4800 RAM. The GPUs use NVSwitch and NVLink 4.0 to enable 3.6 TB/s of bi-directional bandwidth between the cards. By moving data directly between GPUs and bypassing the CPU, A3 virtual machines have 10 times the bandwidth of the old A2 VMs.
https://www.extremetech.com/computing/google-cloud-will-offer-ai-supercomputers-powered-by-nvidia-h100-gpus
* 클라우드의 AI 플랫폼화
Google Cloud Will Offer AI Supercomputers Powered by Nvidia H100 GPUs
Google Cloud customers will soon be able to rent A3 virtual machines to train AI models. Google's A3 systems will have eight Nvidia H100 Hopper GPUs paired with 4th Gen Intel Xeon Scalable processors and 2TB of DDR5-4800 RAM. The GPUs use NVSwitch and NVLink 4.0 to enable 3.6 TB/s of bi-directional bandwidth between the cards. By moving data directly between GPUs and bypassing the CPU, A3 virtual machines have 10 times the bandwidth of the old A2 VMs.
https://www.extremetech.com/computing/google-cloud-will-offer-ai-supercomputers-powered-by-nvidia-h100-gpus
ExtremeTech
Google Cloud Will Offer AI Supercomputers Powered by Nvidia H100 GPUs
Why build your own supercomputer when you can train AI in the cloud?
#AI #클라우드 #구글
- 구글클라우드, 생명공학 및 제약 회사가 약물 발견 가속화에 도움을 줄 수 있는 AI 기반 도구 2가지 출시
- 신약을 출시하는데 시간이 오래걸리고 비용이 많이 드는 프로세스를 해결하는데 도움
- 화이자 등 여러 생명공학 기업들이 이미 제품을 사용 중
https://www.cnbc.com/2023/05/16/google-cloud-launches-ai-tools-to-accelerate-drug-discovery.html
- 구글클라우드, 생명공학 및 제약 회사가 약물 발견 가속화에 도움을 줄 수 있는 AI 기반 도구 2가지 출시
- 신약을 출시하는데 시간이 오래걸리고 비용이 많이 드는 프로세스를 해결하는데 도움
- 화이자 등 여러 생명공학 기업들이 이미 제품을 사용 중
https://www.cnbc.com/2023/05/16/google-cloud-launches-ai-tools-to-accelerate-drug-discovery.html
CNBC
Google Cloud launches A.I.-powered tools to accelerate drug discovery, precision medicine
The solutions mark Google’s latest advancements in the AI arms race and hope to address a long-standing issue facing biotech and pharmaceutical companies.
#반도체 #AI #GPU #클라우드 #플러그인
* 업계에 따르면 엔비디아는 A100, H100 AI GPU 주문 증가로 TSMC에서 웨이퍼 투입 확대
* 클라우드 플러그인 시작
- ServiceNow는 Nvidia의 소프트웨어, 서비스 및 가속화된 인프라를 사용하여 스마트한 종단간 디지털 전환 플랫폼을 위한 맞춤형 대규모 언어 모델(LLM)을 개발합니다. 또한 ServiceNow는 Nvidia의 데이터를 사용하여 Nvidia DGX 클라우드와 로컬에 배포된 Nvidia DGX SuperPOD AI로 구성된 하이브리드 클라우드 인프라에서 실행되는 기반 모델을 사용자 지정함으로써 이러한 생성형 AI 도구로 Nvidia의 IT 운영을 간소화할 수 있도록 지원합니다.
https://www.digitimes.com/news/a20230518PD215/nvidia-ic-manufacturing-ai-gpu-ai-server-tsmc.html
* 업계에 따르면 엔비디아는 A100, H100 AI GPU 주문 증가로 TSMC에서 웨이퍼 투입 확대
* 클라우드 플러그인 시작
- ServiceNow는 Nvidia의 소프트웨어, 서비스 및 가속화된 인프라를 사용하여 스마트한 종단간 디지털 전환 플랫폼을 위한 맞춤형 대규모 언어 모델(LLM)을 개발합니다. 또한 ServiceNow는 Nvidia의 데이터를 사용하여 Nvidia DGX 클라우드와 로컬에 배포된 Nvidia DGX SuperPOD AI로 구성된 하이브리드 클라우드 인프라에서 실행되는 기반 모델을 사용자 지정함으로써 이러한 생성형 AI 도구로 Nvidia의 IT 운영을 간소화할 수 있도록 지원합니다.
https://www.digitimes.com/news/a20230518PD215/nvidia-ic-manufacturing-ai-gpu-ai-server-tsmc.html
DIGITIMES
Nvidia sees AI GPU orders ramp up
Nvidia has seen a ramp-up in orders for its A100 and H100 AI GPUs, as a result of the generative AI boom, which has led to an increase in wafer starts at TSMC, according to market sources.
#오라클 #클라우드
* 오라클의 매출은 5월 31일 마감된 분기에 전년 동기 대비 17% 증가. 순이익은 33억 2000만 달러(주당 1.19달러)로 전년 동기의 31억 9000만 달러(주당 1.16달러)보다 증가함
- 회사의 최고 수익원인 클라우드 서비스 및 라이센스 지원은 23% 증가한 93억 7천만 달러를 기록, 그러나 클라우드 라이선스 및 온프레미스 수익은 15% 감소한 21억 5천만 달러를 기록함
- 클라우드 인프라 매출은 총 14억 달러로 전분기 55% 성장에서 76% 증가.
- Oracle의 해당 부분은 Microsoft, 구글보다 빠르게 확장 중
- 그러나 여전히 라이벌보다 훨씬 작음. CEO Catz는 Oracle의 총 마진이 계속 확대될 것이라 언급
- Oracle의 회장 겸 기술 책임자인 Larry Ellison은 Occpany가 Oracle의 클라우드 인프라 사용에 동의한 스타트업 Cohere와의 파트너십과 연계된 생성형 인공 지능 클라우드 서비스를 도입할 것이라고 언급
https://www.cnbc.com/2023/06/12/oracle-orcl-q4-earnings-report-2023.html
* 오라클의 매출은 5월 31일 마감된 분기에 전년 동기 대비 17% 증가. 순이익은 33억 2000만 달러(주당 1.19달러)로 전년 동기의 31억 9000만 달러(주당 1.16달러)보다 증가함
- 회사의 최고 수익원인 클라우드 서비스 및 라이센스 지원은 23% 증가한 93억 7천만 달러를 기록, 그러나 클라우드 라이선스 및 온프레미스 수익은 15% 감소한 21억 5천만 달러를 기록함
- 클라우드 인프라 매출은 총 14억 달러로 전분기 55% 성장에서 76% 증가.
- Oracle의 해당 부분은 Microsoft, 구글보다 빠르게 확장 중
- 그러나 여전히 라이벌보다 훨씬 작음. CEO Catz는 Oracle의 총 마진이 계속 확대될 것이라 언급
- Oracle의 회장 겸 기술 책임자인 Larry Ellison은 Occpany가 Oracle의 클라우드 인프라 사용에 동의한 스타트업 Cohere와의 파트너십과 연계된 생성형 인공 지능 클라우드 서비스를 도입할 것이라고 언급
https://www.cnbc.com/2023/06/12/oracle-orcl-q4-earnings-report-2023.html
CNBC
Oracle beats on top and bottom lines as cloud revenue jumps
Oracle's cloud infrastructure revenue growth accelerated in the fiscal fourth quarter, and the company sees revenue faster growth than expected.
#아마존 #클라우드 #AMD
* 아마존 AWS, AMD의 AI칩 사용 고려
https://www.reuters.com/technology/amazons-cloud-unit-is-considering-amds-new-ai-chips-2023-06-14/
* 아마존 AWS, AMD의 AI칩 사용 고려
https://www.reuters.com/technology/amazons-cloud-unit-is-considering-amds-new-ai-chips-2023-06-14/
Reuters
Exclusive: Amazon's cloud unit is considering AMD's new AI chips
Amazon Web Services , the world's largest cloud computing provider, is considering using new artificial intelligence chips from Advanced Micro Devices Inc , though it has not made a final decision, an AWS executive told Reuters.
#AI #클라우드
* GPU 생산 대응하는 파운드리 or AI 연산에 필요한 기능을 최적화한 NPU 등 AI 전용칩 성장 중요
MS는 지난 27일(현지 시각) 발표한 연례 보고서의 ‘위험(Risks)’ 항목에서 GPU 부족 사태를 다뤘다. MS는 기존에는 자사의 데이터센터에 영향을 미치는 항목에 기존의 ‘토지, 에너지, 네트워킹·서버 공급’ 등을 주로 언급했다. MS가 연례 보고서에 클라우드 사업의 위험 요소로 GPU를 거론한 것은 이번이 처음이라고 CNBC는 보도했다. MS와 같은 클라우드 사업을 하고 있는 알파벳(구글), 애플, 아마존, 메타 등 다른 빅테크에도 같은 영향을 미칠 가능성이 높다.
https://www.chosun.com/economy/tech_it/2023/07/30/ZEY4WAHE6ZDGVLJJOUVKVV4IU4/?outputType=amp
* GPU 생산 대응하는 파운드리 or AI 연산에 필요한 기능을 최적화한 NPU 등 AI 전용칩 성장 중요
MS는 지난 27일(현지 시각) 발표한 연례 보고서의 ‘위험(Risks)’ 항목에서 GPU 부족 사태를 다뤘다. MS는 기존에는 자사의 데이터센터에 영향을 미치는 항목에 기존의 ‘토지, 에너지, 네트워킹·서버 공급’ 등을 주로 언급했다. MS가 연례 보고서에 클라우드 사업의 위험 요소로 GPU를 거론한 것은 이번이 처음이라고 CNBC는 보도했다. MS와 같은 클라우드 사업을 하고 있는 알파벳(구글), 애플, 아마존, 메타 등 다른 빅테크에도 같은 영향을 미칠 가능성이 높다.
https://www.chosun.com/economy/tech_it/2023/07/30/ZEY4WAHE6ZDGVLJJOUVKVV4IU4/?outputType=amp
조선일보
MS “AI 반도체 부족, 클라우드 서비스 중단 위험” 첫 경고
MS AI 반도체 부족, 클라우드 서비스 중단 위험 첫 경고
#오라클 #클라우드 #AI
* 클라우드 인프라, 클라우드 서비스 및 라이선스 지원 부문은 성장성 보여주었으나 클라우드 라이선스 및 온프레미스 라이선스 부문은 전년 동기 대비 10% 감소. 가이던스 또한 추정치 부근. 시간외 -9.23%
- CTO, AI 개발 회사들이 오라클의 클라우드에서 40억 달러 이상의 용량을 구매하는 계약을 체결했다고 발표. 이는 지난 5월 말 대비 2배 규모
- 또한 CTO는 애널리스트들과의 컨퍼런스 콜에서 일론머스크가 최근 발표한 AI 스타트업인 xAI가 오라클의 클라우드 서비스를 사용할 것이라 언급
https://www.cnbc.com/2023/09/11/oracle-orcl-q1-earnings-report-2024.html
* 클라우드 인프라, 클라우드 서비스 및 라이선스 지원 부문은 성장성 보여주었으나 클라우드 라이선스 및 온프레미스 라이선스 부문은 전년 동기 대비 10% 감소. 가이던스 또한 추정치 부근. 시간외 -9.23%
- CTO, AI 개발 회사들이 오라클의 클라우드에서 40억 달러 이상의 용량을 구매하는 계약을 체결했다고 발표. 이는 지난 5월 말 대비 2배 규모
- 또한 CTO는 애널리스트들과의 컨퍼런스 콜에서 일론머스크가 최근 발표한 AI 스타트업인 xAI가 오라클의 클라우드 서비스를 사용할 것이라 언급
https://www.cnbc.com/2023/09/11/oracle-orcl-q1-earnings-report-2024.html
CNBC
Oracle comes up short on revenue but touts AI cloud contracts
Larry Ellison pointed to a doubling in the amount of money that artificial intelligence development companies have agreed to spend on Oracle cloud services
#아마존 #클라우드 #데이터센터
“아마존웹서비스(AWS)는 향후 5년간 서울 리전 데이터센터 공급망 구축과 운영을 위해 7조8500억원을 투자할 계획입니다”
함기호 AWS코리아 대표는 11일 열린 'AWS 인더스트리 위크 2023'에서 한국에 인프라 투자를 늘리고, 디지털 전환을 돕겠다고 밝혔다.
https://www.etnews.com/20231011000206?mc=em_050_00014
“아마존웹서비스(AWS)는 향후 5년간 서울 리전 데이터센터 공급망 구축과 운영을 위해 7조8500억원을 투자할 계획입니다”
함기호 AWS코리아 대표는 11일 열린 'AWS 인더스트리 위크 2023'에서 한국에 인프라 투자를 늘리고, 디지털 전환을 돕겠다고 밝혔다.
https://www.etnews.com/20231011000206?mc=em_050_00014
전자신문
AWS, “한국에 5년간 7조8500억원 투자”
“아마존웹서비스(AWS)는 향후 5년간 서울 리전 데이터센터 공급망 구축과 운영을 위해 7조8500억원을 투자할 계획입니다” 함기호 AWS코리아 대표는 11일 열린 ‘AWS 인더스트리 위크 2023’에서 한국에 인프라 투자를 늘리고, 디지털 전환을 돕겠다고 밝혔다. 함
#클라우드 #Capex
3일 시장조사기관 카날리스는 지난해 3분기 전세계 클라우드 인프라 투자액은 735억달러(96조3900억원)를 기록했다고 밝혔다. 전년동기대비 16.5% 증가한 수치다. 2023년 2분기와 비교하면 1.5% 늘었다.
지난해 3분기 전체 클라우드 시장에서 가장 많은 투자액을 집행한 기업은 아마존웹서비스(AWS)다. 전세계 클라우드 인프라 투자액의 31%를 차지했다. 마이크로소프트애저와 구글클라우드는 각각 25%, 10% 수준의 인프라 투자액을 기록했다. 카날리스는 이들 기업의 인프라 투자가 AI서버에 집중되고 있다고 설명했다.
중국 기업의 클라우드 인프라 투자 회복도 늦어지고 있다. 지난해 3분기 중국 빅테크 기업의 지난해 3분기 글로벌 클라우드 인프라 투자액은 92억달러로, 전년동기와 비교해 18.0% 늘었다. 기업별로보면 알리바바클라우드의 투자액(중국 클라우드 인프라 투자액의 39% 차지)이 가장 컸다. 그 다음은 화웨이클라우드(19%), 텐센트클라우드(15%)가 뒤를 이었다.
빅테크 기업의 AI 서버 위주의 투자가 이어지면서 서버 관련 반도체 수요 회복도 지연되고 있다. 글로벌 AI 서버 출하량은 연간 50만~60만대에 불과해 일반 서버 대비 메모리 반도체 소비량이 적기 때문이다.
삼성전자는 지난해 3분기 실적 발표 컨퍼런스콜에서 올해 서버 시장 전망에 대해 "서버는 수요 개선이 타 응용(PC, 스마트폰 등)보다는 비교적 더디게 진행되고 있다"고 말하기도 했다. 다만 "AI향 수요 증가와 더불어 고객사의 재고가 정상 수준에 접어들면서 메모리 수요는 점진적으로 회복될 것으로 전망된다"고 덧붙였다.
업계에서는 일반 서버 수요가 올해 하반기부터 회복될 것으로 보고 있다. 업계 관계자는 "올해 상반기는 지나야 일반 서버 수요가 정상화될 것으로 보이고, 이르면 2분기 말 정도에 서버 수요 회복이 시작될 것으로 예상하고 있다"고 전했다.
https://www.thelec.kr/news/articleView.html?idxno=25081
3일 시장조사기관 카날리스는 지난해 3분기 전세계 클라우드 인프라 투자액은 735억달러(96조3900억원)를 기록했다고 밝혔다. 전년동기대비 16.5% 증가한 수치다. 2023년 2분기와 비교하면 1.5% 늘었다.
지난해 3분기 전체 클라우드 시장에서 가장 많은 투자액을 집행한 기업은 아마존웹서비스(AWS)다. 전세계 클라우드 인프라 투자액의 31%를 차지했다. 마이크로소프트애저와 구글클라우드는 각각 25%, 10% 수준의 인프라 투자액을 기록했다. 카날리스는 이들 기업의 인프라 투자가 AI서버에 집중되고 있다고 설명했다.
중국 기업의 클라우드 인프라 투자 회복도 늦어지고 있다. 지난해 3분기 중국 빅테크 기업의 지난해 3분기 글로벌 클라우드 인프라 투자액은 92억달러로, 전년동기와 비교해 18.0% 늘었다. 기업별로보면 알리바바클라우드의 투자액(중국 클라우드 인프라 투자액의 39% 차지)이 가장 컸다. 그 다음은 화웨이클라우드(19%), 텐센트클라우드(15%)가 뒤를 이었다.
빅테크 기업의 AI 서버 위주의 투자가 이어지면서 서버 관련 반도체 수요 회복도 지연되고 있다. 글로벌 AI 서버 출하량은 연간 50만~60만대에 불과해 일반 서버 대비 메모리 반도체 소비량이 적기 때문이다.
삼성전자는 지난해 3분기 실적 발표 컨퍼런스콜에서 올해 서버 시장 전망에 대해 "서버는 수요 개선이 타 응용(PC, 스마트폰 등)보다는 비교적 더디게 진행되고 있다"고 말하기도 했다. 다만 "AI향 수요 증가와 더불어 고객사의 재고가 정상 수준에 접어들면서 메모리 수요는 점진적으로 회복될 것으로 전망된다"고 덧붙였다.
업계에서는 일반 서버 수요가 올해 하반기부터 회복될 것으로 보고 있다. 업계 관계자는 "올해 상반기는 지나야 일반 서버 수요가 정상화될 것으로 보이고, 이르면 2분기 말 정도에 서버 수요 회복이 시작될 것으로 예상하고 있다"고 전했다.
https://www.thelec.kr/news/articleView.html?idxno=25081
#미국 #클라우드 #중국
미국이 자국 클라우드 컴퓨팅 서비스 기업들이 자사 플랫폼에서 인공지능(AI) 애플리케이션을 개발하는 외국 고객들을 공개하도록 추진하고 있다.
29일(현지시각) 블룸버그통신 보도에 따르면 조 바이든 미국 행정부는 29일 클라우드 컴퓨팅 서비스 기업이 외국 고객의 이름과 IP 주소를 공개하도록 의무화하는 안을 공개할 예정이다. 미국 정부는 오는 4월 29일까지 제안된 안에 대한 의견을 요청해 놓고 있으며 이후 이 규정을 확정할 계획이다.
앞서 공개된 초안에서는 AWS, MS, 구글 등은 이러한 세부 정보를 수집하기 위한 예산을 마련하는 한편 의심스러운 활동을 보고해야만 한다.
이 안이 진행된다면 미국은 이러한 의무 사항을 활용, AI 교육 및 호스팅에 중요한 데이터 센터와 서버에 중국기업들이 접근하는 주요 경로를 차단할 수 있다.
조 바이든 미국 대통령은 지난해 10월 “악의적인 사이버 기반 활동”을 목적으로 AI를 사용할 수 있는 외국 행위자를 탐지하기 위한 방안으로 상무부에 이러한 공개를 요구하도록 지시한 바 있다.
상무부는 다만 미국 클라우드 제공업체의 해외 자회사에 대해서는 이런 식별 규정에 예외를 제공할 수 있다는 가능성을 열어 놓았다.
https://biz.chosun.com/it-science/ict/2024/01/29/F7YOWGYT7FB3POXPTUQJLCHT3I/
미국이 자국 클라우드 컴퓨팅 서비스 기업들이 자사 플랫폼에서 인공지능(AI) 애플리케이션을 개발하는 외국 고객들을 공개하도록 추진하고 있다.
29일(현지시각) 블룸버그통신 보도에 따르면 조 바이든 미국 행정부는 29일 클라우드 컴퓨팅 서비스 기업이 외국 고객의 이름과 IP 주소를 공개하도록 의무화하는 안을 공개할 예정이다. 미국 정부는 오는 4월 29일까지 제안된 안에 대한 의견을 요청해 놓고 있으며 이후 이 규정을 확정할 계획이다.
앞서 공개된 초안에서는 AWS, MS, 구글 등은 이러한 세부 정보를 수집하기 위한 예산을 마련하는 한편 의심스러운 활동을 보고해야만 한다.
이 안이 진행된다면 미국은 이러한 의무 사항을 활용, AI 교육 및 호스팅에 중요한 데이터 센터와 서버에 중국기업들이 접근하는 주요 경로를 차단할 수 있다.
조 바이든 미국 대통령은 지난해 10월 “악의적인 사이버 기반 활동”을 목적으로 AI를 사용할 수 있는 외국 행위자를 탐지하기 위한 방안으로 상무부에 이러한 공개를 요구하도록 지시한 바 있다.
상무부는 다만 미국 클라우드 제공업체의 해외 자회사에 대해서는 이런 식별 규정에 예외를 제공할 수 있다는 가능성을 열어 놓았다.
https://biz.chosun.com/it-science/ict/2024/01/29/F7YOWGYT7FB3POXPTUQJLCHT3I/
Chosun Biz
美, 클라우드 기업에 외국고객 공개 의무화… 중국기업 겨냥
美, 클라우드 기업에 외국고객 공개 의무화 중국기업 겨냥
#마이크로소프트 #윈도우즈 #클라우드 #AI #5월
Microsoft will unveil new Windows and cloud AI features in May
- 수요일에 게시된 세션 목록에 따르면 마이크로소프트는 연례 빌드 컨퍼런스에서 PC와 클라우드에서 사용할 수 있는 새로운 AI 도구를 공개할 예정
- 지난 1월 CEO 사티아 나델라(Satya Nadella)는 분석가들에게 2024년은 “AI가 모든 PC의 일류 부품이 될 것”이라고 말했으며 Microsoft의 5월 컨퍼런스 일정에는 이러한 목표가 반영
- 지난달 AI 스타트업 인플렉션(Inflection)에서 마이크로소프트에 합류한 무스타파 술레이만(Mustafa Suleyman)이 기조연설에서 나델라와 함께 연설할 예정
https://www.cnbc.com/2024/04/10/microsoft-will-unveil-new-windows-and-cloud-ai-features-in-may.html
Microsoft will unveil new Windows and cloud AI features in May
- 수요일에 게시된 세션 목록에 따르면 마이크로소프트는 연례 빌드 컨퍼런스에서 PC와 클라우드에서 사용할 수 있는 새로운 AI 도구를 공개할 예정
- 지난 1월 CEO 사티아 나델라(Satya Nadella)는 분석가들에게 2024년은 “AI가 모든 PC의 일류 부품이 될 것”이라고 말했으며 Microsoft의 5월 컨퍼런스 일정에는 이러한 목표가 반영
- 지난달 AI 스타트업 인플렉션(Inflection)에서 마이크로소프트에 합류한 무스타파 술레이만(Mustafa Suleyman)이 기조연설에서 나델라와 함께 연설할 예정
https://www.cnbc.com/2024/04/10/microsoft-will-unveil-new-windows-and-cloud-ai-features-in-may.html
CNBC
Microsoft will unveil new Windows and cloud AI features in May
Microsoft will reveal brand-new artificial intelligence tools for use on PCs and in the cloud at its annual Build conference.