[삼성 이영진] 글로벌 AI/SW
7.27K subscribers
1.11K photos
8 videos
1.35K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
오픈AI, GPT-4.5 출시

: 지금까지 발표한 모델 중 가장 큰 LLM. 사전 및 사후 학습 확장에서 한 단계 진보. GPT-4 대비 사전학습 컴퓨팅 10배. 다만 프론티어 모델 x

: 비지도 학습을 확장해 추론 없이 창의적 통찰 능력 향상. 컴퓨팅 파워와 데이터를 확장하고 아키텍처 및 최적화 혁신을 통한 비지도 학습 확대

: 사실 기반 질문에 대한 정확도 향상. 환각 현상 감소. 창의적 작업(글쓰기, 디자인)에서 뛰어난 성과. 인간과 자연스러운 대화. 높은 설득력

: 높은 API 가격 이슈. 인풋 $75/백만토큰, 아웃풋 $150/백만토큰(vs 4o 인풋 $2.5, 아웃풋 $15) 보이스 모드, 영상 등 멀티모달 기능 지원 x.

: Pro 구독자는 리서치 프리뷰 형태로 접근 가능. 다른 유료 유저는 다음 주 부터

https://openai.com/index/introducing-gpt-4-5/
👍21
[삼성 이영진] 글로벌 SW 헤드라인 (25/2/28)

■ 오픈AI, GPT-4.5 출시. 지금까지 발표한 모델 중 가장 큰 LLM. GPT-4 대비 사전학습 컴퓨팅 10배. 다만 프론티어 모델 x

■ AWS, 자사 첫 번째 양자 컴퓨팅 칩 Ocelot 공개

■ 메타, 인스타그램 숏 폼 기능 릴스를 독립 앱으로 분리하는 방안 검토 중. Project Ray라는 코드명으로 진행

■ 메타, 별도의 Meta AI 앱 런칭 계획 보도

■ 메타, Apollo 매니지먼트와 협력해 미국 내 데이터센터 구축을 위한 350억 달러 규모 자금 조달 논의

■ 메타, 연구 목적의 스마트 글래스 Aria Gen2 발표

■ 마이크로소프트, 코파일럿 MacOS 앱 출시

■ 텐센트, Hunyuan Turbo S 모델 발표. 짧은 사고 체인을 통해 직관적으로 빠르게 답변. 모든 질의에 1초 이내로 응답 강조

■ 바이두, 3월 중순 업그레이드 된 AI 모델 Ernie 4.5 출시 계획

감사합니다.
👍3
딥시크, 오픈소스 위크 Day 별 발표 내용

= 대규모 모델 훈련 및 추론의 성능 최적화와 확장성 향상 목적. 이를 위한 고성능 컴퓨팅 도구와 기술 공개(고성능 연산 최적화 / 병렬 처리 및 컴퓨팅 자원 활용 개선 / 데이터 관리 혁신 등)

Day 1 - FlashMLA
: Hopper GPU에 최적화된 디코딩 커널. 가변 길이 시퀀스 처리 특화

Day 2 - DeepEP(Efficient Parallelism)
: MoE 모델 훈련 및 추론을 위한 병렬 통신 라이브러리. 전문가 병렬 처리(EP) 최적화

Day 3 - DeepGEMM(General Matrix Multiplication)
: FP8 기반 딥러닝 모델의 효율성을 높이는 고성능 행렬 연산 라이브러리

Day 4 - Optimized Parallelism Strategies
: 병렬 처리 최적화를 위한 전략 및 관련 코드. DualPipe(양방향 파이프라인 병렬 처리 알고리즘)와 EPLB(MoE 모델을 위한 병렬 로드 밸런서)

Day 5 - Fire-Flyer File System(3FS)
: 고성능 컴퓨팅을 지원하는 분산 파일 시스템. SSD와 RDMA 네트워크를 활용한 성능과 확장성

https://github.com/deepseek-ai
1👍1
Day 6 - 딥시크 온라인 서비스 통계를 통한 이론적 마진 산출

■ 기본 서비스 가정

: 모든 V3/R1 추론 서비스는 학습과 동일한 정밀도 유지하며 H800 GPU에서 제공

: 행렬 곱셈 및 디스패치 전송은 훈련과 일치된 FP8 형식 채택. 핵심 MLA 계산 및 결합 전송은 BF16 형식을 사용해 최적 서비스 성능 보장

: 주간 높은 서비스 부하와 야간 낮은 서비스 부하 고려. 피크 시간대는 모든 노드에 추론 서비스 배치. 야간에는 추론 노드를 줄이고 리소스를 연구 및 훈련에 할당

■ 비용 추정 및 데이터

: 24시간(2/27~28) V3/R1 추론 서비스 최대 서버 노드 점유율 278개. 평균 점유율 226.75개(각 노드는 8개의 H800 GPU)

: H800 GPU 한 대 임대 비용 $2/시간 가정 시, 총 일일 비용 $87,072(= 평균 노드 226.75개 * 8대 GPU * 24시간 * $2/시간)

■ 수익 추정 및 데이터

: 총 인풋 토큰 = 6,080억 개. 3,420억 개 토큰(56.3%)은 Cache Hit

: 총 아웃풋 토큰 = 1,680억 개. 평균 속도 초당 20-22토큰

: 각 H800 노드 당 처리량 = 인풋 평균 ~73.7k 토큰/초(캐시 적중 포함), 아웃풋 평균 ~14.8k 토큰/초

: R1 API 청구 가정 시 총 일일 수익 $562,027
= Cache Hit 인풋 = 342B * $0.14/M = $47,880
+ Cache Miss 인풋 = (608-342)B * $0.55/M = $146,300
+ 아웃풋 = 168B * $2.19 = $367,920

■ 이익률

비용 이익률(Cost Profit Margin) 545% = (562,027-87,072)/ 87,072

그러나 실제 수익은 이보다 낮음

1) V3 서비스 가격 < R1 서비스 가격
2) 서비스 일부만 수익화(통계는 API 외 무료인 웹/앱 액세스 포함)
3) 야간 시간대 할인 적용


https://github.com/deepseek-ai/open-infra-index/blob/main/202502OpenSourceWeek/day_6_one_more_thing_deepseekV3R1_inference_system_overview.md
2👍2
테크크런치는 28일(현지시간) 오픈AI의 경영진들이 디스코드를 통해 진행된 세션을 통해 소라의 챗GPT 통합 계획을 밝혔다고 보도했다.

오픈AI는 지난해 12월3일 '십마스(Shipmas)' 이벤트를 통해 소라를 정식 출시했다. 현재는 별도의 웹 페이지에서만 사용할 수 있으며, 유료 사용자들에게 일정 크레딧을 지급하는 방식이다.

그러나 이날 로한 사하이 소라 제품 책임자는 "소라를 챗GPT에서 사용할 수 있는 방법을 적극적으로 연구하고 있으며, 두 제품을 결합하고 있다"라고 말했다. 

이는 소라가 업그레이드 작업이 어느 정도 마무리됐다는 것을 의미한다. 실제로 샘 알트먼 오픈AI CEO는 지난해 말 추론 모델 'o3'의 출시와 함께 소라의 업그레이드를 최우선 업무 리스트에 포함했다고 밝혔다.

지난해 2월 처음으로 선보인 소라는 최대 1분에 달하는 사실감 넘치는 영상 생성으로 엄청난 화제가 됐고, 많은 경쟁자를 탄생시켰다. 그러나 12월 공식 출시된 뒤 기대에 못 미치는 퀄리티로 많은 실망을 안겼다. 또 직후 등장한 구글 '비오 2'의 성능에 압도당하며 이후 화제성이 완전히 사라졌다. 오픈AI 내부에서도 "너무 일찍 출시했다"라는 자성의 목소리가 등장했다.  

특히 이번 통합은 챗GPT 사용자 및 유료 사용자 확대를 유도하기 위한 의도로 볼 수 있다. 따라서 이번에 등장할 소라가 어떤 성능을 보일지 기대된다.

또 오픈AI는 소라로 구동하는 AI 이미지 생성기도 개발 중이라고 밝혔다. 챗GPT에는 이미 '달리 3'로 구동되는 이미지 생성 기능이 있지만, 소라 기반 이미지 생성기는 더 사실적인 이미지를 생성할 수 있는 것으로 알려졌다. 현재 웹 앱을 구동하는 모델도 '소라 터보' 새로운 버전으로 교체할 예정이다.

다만, 사하이 책임자는 챗GPT 버전 소라는 웹 버전만큼 다양한 기능을 제공하지 않을 수 있다고 덧붙였다. 또 자세한 출시 일정이나 요금 정책 등은 언급하지 않았다. 또 소라를 별도의 모바일 앱으로 개발하는 것도 검토 중이라며 모바일 엔지니어를 영입 중이라고 덧붙였다.

https://www.aitimes.com/news/articleView.html?idxno=168417
👍1
[삼성 이영진] 글로벌 SW 헤드라인 (25/3/4)

■ 오픈AI, 챗GPT에 영상 생성 AI 모델 Sora 통합 예정

■ 소프트뱅크, 오픈AI 투자를 위해 160억 달러 대출 추진 중

■ 애플, 시리 AI 기능 업데이트 지연에 따라 완벽 통합 작동하는 시기로 2027년 iOS 20 전망

■ 딥시크, 온라인 서비스 통계를 통해 일간 매출 및 수익 공개. 이론적 마진 545%

■ 마이크로소프트, 의료 분야를 위한 신규 AI 음성 비서 Dragon Copilot 발표

■ 앤스로픽, 시리즈 E 펀딩 완료 발표. 615억 달러로 35억 달러 펀딩

■ 구글, Gemini Live 신규 기능 업데이트. 실시간 화면 공유 및 비디오 분석을 통해 사용자와 Gemini 간 상호작용

■ 구글, 클라우드 기반 코딩, 데이터 과학 도구 Colab에 AI 에이전트 기능 Data Science Agent 추가

■ 구글, 카메라 트랩으로 촬용한 야생동물 사진을 분석하는 SpeciesNet 모델 오픈소스 공개

■ 세르게이 브린, 구글 Gemini 모델 개발 담당 직원에게 AGI 경쟁에서 이기기 위해 주 당 60시간 업무 촉구

■ 에릭 슈미트, AGI의 핵심 지표로 자체 발견을 기반으로 지식을 생산하는 능력을 꼽았으며, AI가 새로운 르네상스를 열 수 있다는 의견

■ 퍼플렉시티 & 티모바일, 1,000달러 이하의 AI 폰 출시 발표

■ AWS, 인도에 향후 몇 년간 82억 달러 투자 계획

■ 마이크로소프트, 25년 5월 스카이프 서비스 종료

■ 오페라, 브라우저에 통합된 AI 에이전트 Browser Operator 공개

■ AI닷컴(AI. com) 도메인 매물로 등장. 판매가 래리 피셔는 약 1억 달러 가치 전망

감사합니다.
👍3
챗 봇 아레나 리더보드 1위 경쟁

오픈AI GPT-4.5 1위 달성
→ 일론 머스크 Not for long 코멘트
→ xAI Grok 3 1위 탈환

X 포스팅 기준 1) → 3) 소요시간 5시간 40분
👍4
[반.전] 주말 사이 엔비디아에 겹쳐진 악재들

안녕하세요. 삼성증권 문준호의 ‘반도체를 전하다’입니다.

엔비디아 주가가 높은 변동성을 이어가고 있습니다. 금요일 밤 조금 안심했더니, 전일 또다시 8% 넘게 급락했습니다.

역시나 주말 사이 여러 이슈들이 겹쳐졌는데요, 규제와 오더컷 루머입니다.


■ 싱가포르를 거쳐 중국으로?

엔비디아 GPU 서버가 싱가포르, 말레이시아의 중간 거래상을 거쳐 규제를 우회하고, 최종적으로 중국 고객사에게 갔다는 뉴스입니다.

블룸버그는 싱가포르 정부가 말레이시아로 향한 델과 슈퍼 마이크로 서버에 대한 조사에 착수했다고 보도했습니다. 해당 뉴스로 델과 슈퍼 마이크로 주가도 전일 급락했고요.

엔비디아는 중국향 Data Center 매출 비중이 한 자릿수 수준이라고 언급해왔는데요, 10-K에 따르면, billing 기준, 싱가포르향 매출 비중이 작년 18%에 달했습니다 (전체 매출 기준).

가뜩이나 추가 규제 리스크로 불안한데, 싱가포르까지 규제 범위가 확대된다면, 투자 심리는 한 차례 더 훼손될 수 있습니다.


■ TSMC CoWoS 오더컷?

엔비디아가 TSMC CoWoS 주문을 줄였다는 이슈입니다. AI GPU는 다 CoWoS를 거치니까, "CoWoS 주문 축소 = AI 수요 감소"로 연결됩니다.

다만 이는 아직 확인이 필요한 부분입니다. TSMC가 CoWoS 증설을 일부 애널리스트들이 기대한 것보다는 천천히 진행 중이라는 보도도 있었는데요.

대개 1) TSMC 연간 CoWoS capa에, 2) 엔비디아 할당 비중을 가정하고, 3) 이를 통해 엔비디아 GPU 생산량을 추정합니다.

따라서 TSMC capa 가정을 낮추되, 할당 비중은 동일하다고 가정하면, 결국 엔비디아 GPU 생산량도 줄어드는 식이 됩니다.

하지만 이는 어디까지나 가정의 영역이죠. 클라우드 CAPEX가 그렇게 늘고, 대형 프로젝트들이 발표되고 있는데, 엔비디아 주문이 늘면 늘었지, 아직 줄 것 같지는 않아 보입니다.

오히려 구글 TPU의 세대 교체, 작년 AMD와 인텔의 GPU 성과 부진 등으로 인해 엔비디아 외의 고객사들이 주문을 줄였을 수 있고, 이로 인한 증설 속도 조절이라고 봅니다.


대외적 환경이 너무도 급변하고 있어서, 당분간 높은 변동성을 감내해야 할 것 같습니다. 다만 주가 조정은 너무나도 과도해 보이는데요.

현재 동사 주식은 12개월 forward P/E 24.5배(FactSet)에 거래 중입니다.

과거 5년 기준, -1.7SD에 거래 중입니다. 어느덧 -2SD선 21.9배에 가까워지고 있습니다. SOX 24.2배와도 거의 붙은 상황이고요.

여정이 험난하기는 하겠지만, valuation은 거의 바닥에 가까워지고 있다는 점도 고려하실 필요가 있습니다.


감사합니다.

(2025/03/04 공표자료)
👍6
아마존, 자체 추론 모델 개발 보도

: Nova 브랜드 하에 하이브리드 형태 추론 모델 개발 보도. 25년 6월 출시 계획. 경쟁사 대비 저렴한 가격과 코딩 및 수학 벤치마크 5위권 목표. 앤스로픽 추론 모델과 경쟁 가능성

https://www.businessinsider.com/amazon-ai-reasoning-model-nova-2025-3
👍1
[삼성 이영진] 크라우드 스트라이크(CRWD) F4Q25 실적 요약

■ F4Q25 실적
: 매출 10.59억 달러(+25%)
vs 컨센 10.38억 달러, 가이던스 10.29~10.35억 달러
: 구독 매출 10.08억 달러(+27%)
vs 컨센 9.87억 달러
: ARR 42.4억 달러(+23%)
vs 컨센 42.1억 달러
: Non GAAP 영업이익 2.17억 달러
vs 컨센 1.88억 달러, 가이던스 1.84~1.89억 달러

■ F1Q26 가이던스
: 매출 11~11.06억 달러
vs 컨센 11.05억 달러
: Non GAAP 영업이익 1.73~1.8억 달러
vs 컨센 2.18억 달러

■ FY26 가이던스
: 매출 47.44~48.06억 달러
vs 컨센 47.68억 달러
: Non GAAP 영업이익 9.44~9.85억 달러
vs 컨센 10.23억 달러

https://ir.crowdstrike.com/static-files/74d1ad6a-8301-40f3-836f-7948a3a31f1c

감사합니다.
👍2
샘 알트먼, 챗GPT 구독의 크레딧 형태 전환 가능성을 시사하는 X 포스팅
👍1
[삼성 이영진] 글로벌 SW 헤드라인 (25/3/5)

■ 아마존, Nova 브랜드 하에 하이브리드 형태 추론 모델 개발. 6월 발표 계획

■ 아마존, Agentic AI에 초점을 맞춘 신규 조직 구성. 이외에 AI 그룹 내 Bedrock 및 SageMaker와 하드웨어 엔지니어링 팀을 컴퓨팅 조직으로 통합하는 계획도 보도

■ 아마존, GE 버노바와 데이터센터 확장을 위한 파트너십

■ 샘 알트먼, 챗GPT 구독의 크레딧 형태 전환 가능성 시사

■ 오픈AI, 연구 및 교육 분야 AI 활용 가속화를 위한 NextGenAI 컨소시엄 출범. 5천만 달러 규모 연구 보조금, 컴퓨팅 자원, API 제공

■ 구글, HP와 협력해 3D 화상 회의 플랫폼 Project Starline 개발. 스마트 글래스나 헤드셋 없이 구동. 25년 상용화 목표

■ 팔란티어, 소시에뗴 제네랄과 금융 범죄 방지를 위한 파트너십 발표

■ 세일즈포스, Agentforce 기반 AI 에이전트 마켓플레이스 AgentExchange 런칭

■ 오토데스크, 전체 인력의 9%인 1,350명 감축. 효율성 개선 및 AI 전환 전략 일환

■ SSI, 텔 아비브 대학교 교수 Dr Yair Carmon을 포함해 이스라엘 연구팀 구축

■ 코히어, 멀티모달 AI 모델 Aya Vision을 오픈 소스로 공개

감사합니다.
👍1
미 연방법원, 일론 머스크의 오픈AI 영리 법인 전환 중단 가처분 신청 기각

: 캘리포니아 북부 연방법원 판사는 머스크 측이 영리 법인 전환이 즉각 중단되어야하는 충분한 증거를 제시하지 못했다고 판단

: 다만 오픈AI 전환 계획이 법적으로 문제가 있는지에 대한 핵심 주장 대상으로 재판 일정을 가을로 앞당겨 진행할 계획

https://techcrunch.com/2025/03/04/judge-rejects-musks-attempt-to-block-openais-for-profit-transition/
👍2
크라우드 스트라이크(CRWD US) F4Q25 실적 - 프로 엄살러

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

크라우드 스트라이크는 글로벌 IT 대란으로 이어진 지난 7월 사고 이후 전반적 가시성을 높혀가고 있습니다.

F4Q 실적은 지난 분기 대비 좋았고, 멀티 모듈 활용 고객 성장과 Flex 확장을 확인하고 있습니다.

CCP 프로그램 영향이 예상보다 컸지만, 장기 파트너십 관점에서는 긍정적으로 해석할 수 있습니다.

하지만 지난 분기와 마찬가지로 가이던스가 아쉬웠습니다. 원래도 보수적인데 아직 불확실성이 완전히 가시지 않았다는 점이 반영된 것으로 예상합니다.

이익단에는 CCP 프로그램 관련 영업비용 상각과 주요 부문에 대한 일회성 투자 그리고 회계 처리 변경이 영향을 미치고 있습니다. 이를 고려하면 이익단의 부진도 생각보다 큰 것은 아닙니다.

불확실성을 반영한 보수적 가이던스가 아쉬울 수 있으나, 안개가 걷히고 난 이후 장기 가이던스도 긍정적입니다. AI 산업 발전에 따른 사이버 보안의 필요성과 수혜 기대감도 존재합니다.

평소라면 이해할 수 있는 실적이지만, 현재 시장 상황이 고밸류 주식에게 불리한 국면입니다.

시간외 하락을 고려한 12M FWD P/E는 79배 수준인데요. 성장주에게 기대하는 더블 Beat를 보여주지 못했다는 점은 단기 부침으로 이어질 수 있지만 장기 관점의 접근은 여전히 유효하다고 생각합니다.

자세한 내용은 발간된 보고서를 참고해주시기 바랍니다.

보고서 링크: https://bit.ly/3F6TNQ2

(2025/3/5 공표자료)
👍2
[삼성 이영진] 글로벌 SW 헤드라인 (25/3/6)

■ 오픈AI, 박사급 능력의 고급 에이전트를 월 최대 2만 달러에 출시 계획 보도

■ 오픈AI, GPT-4.5를 Plus 유저에게 확대 제공. 초기 사용량 제한은 주 50개

■ 구글, 검색 서비스 내 Gemini 2.0을 활용해 사용자의 복잡하고 다중적인 질문에 답변하고, 추가 탐색 및 후속 질문을 통해 주제를 탐구하는 AI 모드(AI Mode) 도입. Google One AI 프리미엄 구독자 대상 테스트

■ 알리바바, 320억 개 파라미터로 R1과 유사한 벤치마크를 기록한 QwQ-32B 출시

■ 앤스로픽, 바이든 행정부 시절 게시한 AI 안전 관련 공약을 웹사이트에서 삭제. 회사 측은 추가 혼란을 방지하기 위한 섹션 추가 의사를 밝힘

■ 세일즈포스, Agentforce 2dx 런칭. 엔터프라이즈 시스템 내 AI 에이전트의 자율적 업무수행 지원

■ 팔란티어, TWG 글로벌과 금융 및 보험 산업 내 AI 프로그램 배포를 위한 JV 설립

■ 아마존, 프라임 비디오 내 일부 라이선스 영화와 TV 프로그램 대상 AI 더빙 기능 실험적 도입

■ 영국 반독점 당국, MS-오픈AI 파트너십의 조사 필요성이 없다고 판단

감사합니다.
👍21
오픈AI, 고급 에이전트 출시 계획 논의

: 티어 구분 및 타겟(가격은 /월)
- (Low) 고소득 지식 노동자용 에이전트: $2,000
- (Mid) 소프트웨어 개발자용 에이전트: $10,000
- (High) PhD 수준 리서치 에이전트: $20,000

: 장기적으로 전체 매출의 20-25%를 에이전트로부터 창출 목표

: 오픈AI 에이전트 관련 공개된 성과 및 보도
- (Low) 챗GPT가 영업 리드를 정렬하고 우선순위를 매기는 작업 시연
- (Mid) 시니어 소프트웨어 엔지니어 타겟의 코딩 어시스턴트 개발 보도
- (High) o1 모델, 로렌스 리버모어 국립연구소 내 핵 융합 연구 활용

: 지난 1월 워싱턴에서 정부 관계자와 슈퍼 에이전트 관련 비공개 브리핑을 진행 계획도 보도된 바 있음

https://www.theinformation.com/articles/openai-plots-charging-20-000-a-month-for-phd-level-agents
1👍1
알리바바 Qwen, 경량 추론 모델 QwQ-32B 공식 출시

: 파라미터 320억 개로 딥시크 R1(6.710억 개, 활성 파라미터는 370억 개)과 유사한 성능 달성. 베이스 모델은 Qwen2.5-32B

: 콜드 스타트에서 시작해 결과 기반 보상을 통한 강화학습(RL) 스케일링 방식 적용

: 1) 수학 및 코딩 작업에 특화된 RL 적용 → 2) 일반적 능력 향상을 위한 추가 RL 진행. 환경적 피드백 기반으로 에이전트 기능 통합

https://qwenlm.github.io/blog/qwq-32b/?utm_source=perplexity
👍3
마이크로소프트, CoreWeave(코어위브) 일부 계약 철회 보도

: 서비스 제공 이슈 및 기한 미준수에 따라 일부 클라우드 컴퓨팅 계약 철회 보도. MS는 CoreWeave의 최대 고객(작년 매출 62%). 30년까지 100억 달러 이상 지출 계획

: CoreWeave는 350억 달러 밸류 및 40억 달러 자금 조달 목표로 IPO 추진 중. IPO 신청서 상 마이크로소프트의 수요 변화, 계약 이행 능력 및 의지 변화, 규제 변화, 전략적 관계 변화 등을 리스크 요인으로 꼽음

https://www.ft.com/content/f3d9d339-42ef-4979-bf52-89ecd699dea2
2👍1