[삼성 이영진] 글로벌 AI/SW
5.85K subscribers
975 photos
8 videos
1.12K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
알파벳의 클라우드 성적표

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

알파벳은 견조한 클라우드 매출을 발표했습니다. 처음으로 분기 매출 100억 달러를 돌파했는데요

- 클라우드 매출 103.5억 달러 vs 컨센 102.2억 달러

- 클라우드 매출 성장률. 마지막이 최근 분기
(28.0% → 22.5% → 25.7% → 28.4% → 28.8%)

- 클라우드 영업이익 11.72억 달러 vs 컨센 9.97억 달러

■ SW 섹터와 연관되는 컨퍼런스콜 주요 내용

- 연초 이후 AI 인프라와 생성 AI 솔루션은 수십억 달러 매출. 200만 명 이상 개발자 활용

- 긍정적 AI 오버뷰 트렌드. 검색 증가 및 만족도 측면. 복잡한 주제에서 높은 활용도. 접목되는 광고에서도 기회

- GCP 성장은 구글 클라우드 전체 성장보다 높은 수준. AI 수요 증가 영향

- 구글 워크스페이스 성장은 ASP(시트당 매출) 상승 영향

- AI는 구글의 다양한 제품군 접목. 엔터프라이즈 SW에도 적용. 상위 100개 고객 대부분이 이미 생성 AI 솔루션 활용 중

- Capex는 120억 달러(1Q)보다 높은 수준일 것. 대부분 데이터 센터 관련 비용

- 3Q 클라우드 및 기술 인프라 투자 관련 인력 증가 전망

- 과소 투자 리스크는 과대 투자보다 큼. 효율적 투자를 진행 중이며, 과대 투자 경우에도 효과적 활용 가능

AI 모멘텀과 클라우드 성장이 유지된다는 것을 확인했지만, 새로운 내용은 부재하며 강도가 커지는 느낌은 없네요

클라우드 인프라 기업 실적에 반응하던 사용량 기반 SW 기업 시간외 주가도 부진한 상황입니다.

결국 시선은 섹터 대장인 마이크로소프트(30일) 실적으로 옮겨가게 되었습니다.

추가 업데이트해 드리겠습니다. (컨센서스 Factset 기준)

(2024/7/24 공표자료)
1
일론 머스크, 테슬라가 xAI에 50억 달러를 투자해야하는지 투표 게시
주커버그가 보내는 편지 - 오픈소스 AI 강조(챗GPT 요약)

고성능 컴퓨팅 초기에는 주요 기술 회사들이 폐쇄형 Unix를 개발했으나, 개방형 Linux가 인기를 끌면서 산업 표준이 되었습니다.

AI도 비슷하게 발전할 것입니다. Meta는 오픈소스 AI가 산업 표준이 되기 위한 다음 단계를 밟고 있으며, Llama 3.1 모델들을 출시하고 다양한 기업들과 협력하여 생태계를 구축하고 있습니다.

오픈소스 AI의 장점
- 맞춤형 모델 학습, 튜닝, 증류 가능
- 폐쇄형 벤더 의존 없이 데이터 보호
- 효율적이고 비용 효과적인 운영
- 장기적 표준 생태계에 투자 가능

Meta는 오픈소스 AI가 자사 및 전 세계에 이점을 제공한다고 믿으며, 오픈소스 AI가 안전하고 투명하며 더 많은 사람들에게 혜택을 줄 것이라 기대합니다.

Llama 3.1의 출시는 개방형 AI의 잠재력을 극대화하고 AI의 혜택을 전 세계에 확산시키기 위한 중요한 단계입니다.

https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/
1
[삼성 이영진] 서비스나우(NOW) 2Q24 실적 요약

■ 2Q24 실적
: 매출 26.3억 달러(+22%)
vs 컨센 26.1억 달러
: 구독 매출 25.42억 달러(+23%)
vs 컨센 25.28억 달러, 가이던스 25.25~25.3억 달러
: cRPO 87.8억 달러(+22%)
vs 컨센 86.8억 달러, 가이던스 +20.5%
EPS $3.13
vs 컨센 $2.83

■ 3Q24 가이던스
: 구독 매출 26.6-26.65억 달러(+20%)
vs 컨센 26.7억 달러
: cRPO 성장률 +22.5%
vs 컨센 +21.1%(90억 달러)

https://www.servicenow.com/company/media/press-room/second-quarter-2024-earnings.html

감사합니다.
1
[삼성 이영진] 글로벌 SW 헤드라인 (24/7/25)

■ 오픈AI, 올해 순 손실은 50억 달러에 달할 것이라는 보도. 챗GPT와 기타 추론 관련 비용 40억 달러, 학습 비용 30억 달러, 인건비 15억 달러 등

■ 크라우드스트라이크, 사죄의 의미로 파트너사에 우버 이츠 기프트 카드(약 $10) 제공

■ 말레이시아 디지털 부 장관, 글로벌 IT 대란에 따라 마이크로소프트와 크라우드 스트라이크에 보상 요구

■ 마이크로소프트, 구글 AI 오버뷰와 유사한 Bing Generative Search 기능 프리뷰로 공개

■ 마이크로소프트, Lumen Technologies와 파트너십. Lumen의 디지털 전환을 지원하고, 네트워크 케파 및 AI 수요를 위해 Lumen의 기술 활용

■ 미스트랄 AI, Mistral Large 2 공개(123B). 코드 생성 및 math 벤치마크에서는 Llama 3.1 405B 상회

■ 서비스나우, 생성 AI 기반 검색 및 지식 관리 기능 강화를 위해 Raytion 인수

■ 세일즈포스 & 워크데이, 임직원 서비스를 위한 AI 어시스턴트 구축 관련 파트너십

■ 콰이쇼우, 영상 생성 모델 Kling AI 글로벌 런칭

■ 애플, 앱 스토어 반독점 관련 스페인 규제 당국의 조사

■ 구글, 플레이 스토어에 AI 기반 앱 비교, 유사 앱 자동 카테고리화, 특정 콘텐츠 허브 등의 신규 기능 추가

감사합니다.
2
서비스나우(NOW US) 2Q24 실적 - 실적이 뚫어준 숨구멍

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

서비스나우가 긍정적 2Q 실적과 가이던스를 발표하며 시장 조정 이후 시간외 7% 상승했습니다.

긍정적 실적은 생성 AI 수요 증가 기반 NNACV(평균 계약 규모 순증가) 성장과 조기 재계약 영향입니다.

Now Assist의 NNACV는 1Q 대비 2배 수준으로 성장했으며. ACV 백만 달러 이상 딜 11개로 빠른 침투 속도를 보이고 있습니다.

cRPO도 가이던스와 컨센서스를 모두 상회했으며, RPO는 오랜만에 30% 성장 레벨을 넘어섰습니다.

3Q 구독 매출 가이던스는 컨센서스를 소폭 하회했지만, 전체 연도 가이던스를 상향하며 하반기 불확실성이 약간 존재함에도 견조한 수요와 함께 성장 기대감을 제시했습니다

이번 분기에도 생성 AI 관련 구체적 숫자를 제시하지 않았다는 점은 아쉽지만, 엔비디아, 마이크로소프트 등과의 파트너십을 통해 생성 AI 트렌드에서 적절한 포지셔닝을 구축하고 있습니다

추가로 내부 부정 채용 조사 결과 관련 임원 퇴사가 결정되었지만 관련 정부 딜 영향은 없다는 코멘트도 긍정적 요인입니다.

그럼 서비스나우 실적이 SW 섹터를 구해낼 수 있을까요?

개별 기업별로 체감하는 수준이 다를 수 있다는 점을 고려해야하지만, 제한적 매크로 영향에 대한 톤은 SAP과 유사한 모습으로 섹터엔 긍정적 요인입니다.

하지만 정규장 하락을 고려하면 시간외 상승 폭도 큰 편은 아닌데요. 미국 경기와 기업의 견조함에 힘을 싣어주었지만, 시장 트렌드 변화를 이끌어 내기엔 다소 부족해보이네요

자세한 내용은 발간된 보고서를 참고해주시기 바랍니다.

보고서 링크: https://bit.ly/4dg45ZM

(2024/7/25 공표자료)
1
오픈AI 손실이 무려 7조 원(50억 달러)?

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

오픈AI의 24년 순손실이 50억 달러에 달할 것이라는 보도가 나왔습니다. 세부 비용 추정을 살펴보면 다음과 같습니다.

+ 챗GPT 및 추론용 마소 서버 대여: 40억 달러
+ 학습 비용(데이터 관련 비용 포함): 30억 달러
+ 인건비: 15억 달러
= 85억 달러

매출은 월매출 2.8억 달러를 고려해 24년 말 기준 35~45억 달러로 전망했습니다. 단순하게 비용을 차감하면 손실은 40~50억 달러가 되는 것이지요

지난해 초 마이크로소프트로 받은 100억 달러 투자금이 바닥을 보이면 추가 자금 조달을 할 필요가 있다는 것이 주요 내용인데요.

AI 수익화에 대한 논쟁(돈도 못버는데 투자만?)에 더욱 불을 지필 수도 있는 내용입니다. 더구나 아이폰에 챗GPT가 탑재되면 고객 급증에 따른 쿼리 비용 상승에 대한 우려도 제기되고 있습니다.

하지만 과거 매출 및 손실과 비교하면 구조 자체는 크게 악화되지 않았습니다.

우선 오픈 AI의 23년 말 기준 연 환산 매출(ARR)은 16억 달러입니다. 연 환산 매출은 월 매출을 12개월로 변환한 것이기 때문에 실제 연 매출은 해당 수치보다 작아지게 됩니다.

다만 선형적 성장은 너무 보수적 추정이기 때문에 10억 달러와 16억 달러의 중간값인 13억 달러 정도로 생각해볼 수 있습니다.

손실은 어느정도 일까요? 오픈AI의 23년 자체 손실 목표는 10억 달러 정도이나, 시장에서는 공격적으로 20억 달러 손실이 발생했다고 보는 시각도 존재합니다. 여기도 중간 수치를 활용해보면

매출: 23년 13억 달러 → 24년 40억 달러(3배)
비용: 23년 28억 달러 → 24년 85억 달러(3배)
손실: 23년 15억 달러 → 24년 45억 달러(3배)

절대적 손실 폭은 커졌지만 매출은 정체인데 비용만 무한하게 투자되는 구조는 아니라는 것을 알 수 있습니다.

챗GPT는 다른 생성 AI 서비스와 다르게 독보적 유저 성장을 보여주고 있으며, 아이폰 적용도 반대로 생각하면 유료 유저 증가로 이어질 수 있습니다.

검색 서비스와 같은 신규 매출원 등장도 생각해볼 수 있지요. 6월 연 환산 매출은 34억 달러로 12월 대비 두 배 이상 성장했습니다.

학습 비용은 어쩔 수 없더라도 추론 비용 커버를 위한 노력은 계속되고 있습니다. 오픈AI를 비롯해 구글, 앤스로픽 등의 프론티어 모델 개발사들은 모델 크기 확대에도 불구 신규 기술 도입과 모델 구조 개선을 통해 토큰당 비용은 과거와 유사한 수준으로 유지하고 있습니다.

마지막으로 50억 달러라는 숫자가 좀 흥미롭습니다. 어제 일론 머스크 X(트위터)에서도 등장한 숫자인데요, 머스크는 테슬라가 xAI에 50억 달러를 투자해야하는지에 대한 투표를 게시했었죠.

생성 AI 경쟁은 단순히 스타트업 간 경쟁이 아닙니다. 오픈AI 손실 수준을 보고 과도하게 우려할 필요는 없다는 판단입니다. 오히려 이 정도 돈을 태우지 못하면 경쟁할 수 없다는 하나의 지표가 되겠네요.

(2024/7/25 공표자료)
2👍2
오픈AI, 자체 검색 엔진 SearchGPT 공개

: 프로토타입으로 소규모 유저 대상 테스팅. 챗GPT와 통합 목표

: GPT-4o 보이스모드(alpha)의 차주 plus 구독자 대상 출시도 언급(by 샘 알트먼)

https://openai.com/index/searchgpt-prototype/
[삼성 이영진] 글로벌 SW 헤드라인 (24/7/26)

■ 오픈AI, 자체 검색 엔진 SearchGPT 공개

■ 구글 딥마인드, 수학적 추론 능력을 개선한 모델 AlphaProof와 AlphaGeometry 2 공개. 수학 올림피아드 문제를 해결

■ 구글, Gemini AI 챗 봇에 소형 모델 Gemini 1.5 Flash 적용. 답변 퀄리티와 속도 향상

■ 런웨이의 영상 생성 AI 모델 학습 데이터가 OTT기업과 언론사의 유튜브 채널이라는 폭로성 보도

■ 일론 머스크, 테슬라가 xAI에 50억 달러를 투자해야하는지에 대한 투표 결과를 놓고 이사회와 논의 예정

■ 마이크로소프트, Phi-3 mini와 medium 서버리스 파인튜닝 기능 지원

■ 오라클, 이탈리아 Rai Way 데이터 센터 활용 계약 체결

■ AWS & GE 헬스케어, 복잡한 의료 데이터 분석하는 생성 AI 툴 구축을 위한 파트너십

■ 메타 왓츠앱 미국 내 MAU 1억명 돌파

감사합니다.
구글 딥마인드, AlphaProof와 AlphaGeometry 2 공개

: AlphaProof-강화학습 기반 수학 추론 특화
: AlphaGeometry 2-기하학 관련 업글 모델

: 올해 국제 수학 올림피아드(IMO) 문제 6개 중 4개 해결
: 은메달 레벨(28점, 609명 참가자 중 58등), 금메달 컷 29점(42점 만점)

: 데미스 허사비스 CEO는 관련 연구를 Gemini에 적용시킬 것이라 코멘트

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/
1
크라우드스트라이크, 윈도우 센서 97% 이상 재가동 소식 업데이트

https://www.reuters.com/technology/cybersecurity/crowdstrike-says-over-97-windows-sensors-back-online-2024-07-25/
💩1
저커버그, Bloomberg 팟캐스트 인터뷰 중 AI 투자 관련 코멘트

“I think Al is gonna be very fundamental. I think that there’s a meaningful chance that a lot of the companies are over-building now, and that you’ll look back and you’re like, ‘oh, we maybe all spent some number of billions of dollars more than we had to.”

“On the flip side, I actually think all the companies that are investing are making a rational decision, because the downside of being behind is that you’re out of position for like the most important technology for the next 10 to 15 years.”


https://youtu.be/YuIc4mq7zMU?si=rarEEYZpPoqXlI3E
2
[삼성 이영진] 글로벌 SW 헤드라인 (24/7/29)

■ 애플, Apple Inteligence 기능을 9월 ios 18 업데이트가 아닌 10월 경 18.1 버전에 도입 보도

■ 애플, 바이든 행정부 주도 AI 안전조치 이행에 자발적으로 동참. 구글, 아마존, 메타, 마이크로소프트 등은 지난해 7월 참여

■ 애플, iCloud Private Relay 기능 장애 보고. 사파리 이용 중 익명의 IP 주소를 할당해 활동 기록 및 개인 정보 유출 방지

■ 마이크로소프트, 윈도우 보안 벤더의 커널 접근 권한 제한 관련 논의 시도

■ X(트위터), 유저 포스팅의 AI 챗 봇 Grok 학습 활용 옵트아웃 조항 추가

■ 세일즈포스 리서치, 대학교들과 협력해 텍스트 토큰 1조개와 이미지 34억장이 포함된 데이터셋 Mint-1T 출시

■ 중국 AI 스타트업 바이촨, 알리바바 텐센트 샤오미로부터 6.9억 달러 신규 자금 조달. 중국 4대 AI 호랑이로 불리는 기업은 지푸, 문샷, 미니맥스, 바이촨

감사합니다.
AI 모델을 위한 합성 데이터 트렌드와 의외의 수혜 기업

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

웹사이트 데이터를 수집하는 크롤링 금지 움직임과 함께 데이터 고갈 우려가 지속 제기되고 있습니다.

에포크AI는 2026년부터 고품질 언어 데이터 고갈 시작을 전망하며, AI 모델 효율성을 높이기 위한 오버 트레이닝이 데이터 고갈을 가속화 시키고 있다고 분석했습니다.

이에 대안으로 떠오른 것이 합성 데이터(Synthetic Data)입니다. 데이터가 부족하니까 AI 모델을 활용해 자체적으로 데이터를 만들어서 활용한다는 것이지요

대표적 합성 데이터 스타트업 Scale AI는 지난 5월 138억 달러 밸류로 10억 달러 펀딩하며 산업 성장 속도를 간접적으로 보여주고 있습니다.

하지만 동시에 합성 데이터의 문제점도 제기되고 있습니다. 합성 데이터를 재차 AI 모델에 학습 시킬 경우 오류 및 환각 현상이 중첩되며 모델 성능이 급격히 떨어지고 이상한 대답을 하는 "모델 붕괴" 현상이 나타날 수 있다는 것 인데요.

생각해 볼 것은 모델 붕괴 현상은 합성 데이터 자체를 여과없이 학습시킬 경우 발생하는 현상이라는 것 입니다.

합성 데이터를 모델 학습에 활용할 때는 RLHF(인간 피드백 강화 학습), 데이터 큐레이션, 프롬프트 엔지니어링 등 정제 및 후처리가 동반되게 됩니다.

지난주 공개된 메타 Llama(라마) 3.1 405B 모델은 후기 학습에 합성 데이터를 상당 부분 활용했고, 합성 데이터셋 퀄리티를 유지하기 위해 레드팀 프로세스과 개발 기술(피드백 매커니즘 등) 활용했는데요,

오히려 대형 모델 기반으로 소형 모델을 학습 및 미세 조정하는 것이 주요 트렌드로 떠오른 상황에서 합성 데이터 관련 우려는 과도할 필요가 없다고 판단합니다. 메타도 405B 모델을 활용한 합성 데이터 생성과 증류 프로세스를 강조했습니다.

합성 데이터 논쟁의 연장선에서 중요성이 높아지는 분야는 단연 데이터 큐레이션입니다. 서두에 언급한 크롤링 행위 금지에 대응으로 대형 AI 기업은 미디어와 대형 파트너십을 체결하고 있는데요,

단순한 데이터 제공자 같지만 큐레이팅 능력을 보유한 기업이라는 점에 주목해야합니다. 뉴욕타임즈(NYT), 피어슨(PSO) 등 주가는 이미 신고가를 기록하고 있습니다. 

이러한 흐름은 레딧(RDDT)에게도 기회가 될 수 있습니다. 주말간 X(트위터)가 유저 포스팅을 Grok 챗 봇 학습에 활용한다는 보도가 나왔습니다.

학습 데이터를 놓고 합종연횡이 계속되는 상황에서 산업에 가치를 더할 수 있다는 점은 기업 가치 확장으로도 연결될 수 있습니다.

(2024/7/29 공표자료)
2
[삼성 이영진] 글로벌 SW 헤드라인 (24/7/30)

■ 오픈 AI 이사회 멤버 Adam D’Angel, General AI가 5-15년 내 달성 될 것이라 코멘트

■ 애플, iOS 18.1 베타 버전(개발자용)과 함께 Apple Intelligence 베타를 통해 일부 기능 공개. 개선된 시리 기반 이메일 작성, 요약, 번역 기능 등

■ 델타 항공, 글로벌 IT 대란에 대한 보상 요구를 위해 로펌 고용

■ 팔란티어, 청정 에너지 기업 TES(Tree Energy Solution)와 AI 기술 활용을 위한 파트너십 체결

■ 런웨이, Gen-3 alpha에 image to video 기능 추가

■ 허깅 페이스, 엔비디아 NIM 기반의 Inference as a Service 제공

■ 생성 AI 모델의 특정 정보를 제외시키는 기술(개인정보나 저작권에 적용)가 모델 성능을 떨어뜨린다는 연구 결과

감사합니다.
크라우드 스트라이크(CRWD), 계속되는 글로벌 IT 대란의 여진

안녕하세요 삼성증권 글로벌 SW 담당 이영진입니다.

글로벌 IT 대란의 근원인 크라우드 스트라이크가 긍정적 소식에 바닥을 모색하는 듯 했지만, 부정적 뉴스로 인해 시간외 재차 하락하고 있습니다(-5%).

긍정적 소식부터 살펴보면 초기 조사 결과가 공표되었고, 윈도우 센서의 97%가 복구되었습니다. 생각보다 사태 장기화는 막은 모습입니다. 

문제 데이터가 포함된 Rapid Response Content가 Validator 오류로 인해 검증 과정을 통과하고 디플로이 된 것이 글로벌 IT 대란의 시작이었습니다.

앞서 진행한 스트레스 테스팅에서 문제 되지 않았기 때문에 기존 배치 프로세스에 대한 신뢰성 바탕으로 업데이트를 진행한 것이 독이 되었는데요

하지만 단순히 기술적 이슈가 아니라 단계적 업데이트가 부재했고, 롤백을 통한 대응으로 해결되지 않았다는 점 등은 개선이 필요한 부분입니다. 사측은 자체 개선에 더해 서드파티 검증 프로세스 도입도 대응책으로 제시했습니다.

반대로 델타 항공이 글로벌 IT 대란으로 입은 피해 보상을 위해 법무법인(로펌)을 고용했다는 소식이 부정적으로 작용하고 있습니다. 운영 차질로 인한 델타의 피해규모는 3.5~5억 달러로 추정되고 있는데요

당장 소송이 제기된 것은 아니며, SW 계약 구조 상 보상 규모가 제한적일 가능성도 존재하지만 현재 시장 환경은 불확실성 자체를 극도로 싫어하고 있습니다.

탑라인 둔화 가능성도 여전히 열려있습니다. 무료 크레딧 제공과 같은 정책을 펼치지 않지만 통상적으로 유사 이슈가 발생 시 SW 벤더가 겪는 세일즈 사이클 장기화와 가격 압박이 대두될 수 있습니다(전환 비용 고려하면 고객 이탈은 제한적으로 판단).

특히 하반기 NNARR(연 환산 매출 성장) 축소가 극심해 역성장 트렌드에 직면한다면 '23년 초 밸류에이션 레벨(P/E 47배)을 각오해야할 지도 모릅니다. 컨센은 FY25 NNARR 9.3억 달러(+6% YoY, Factset)

또한 마이크로소프트가 보안 벤더에 대해 윈도우 커널(Kernel) 접근권을 일부 제한하려는 움직임을 보인다는 점도 부정적 포인트입니다. 애플처럼 폐쇄형 생태계로 가기에는 유럽 규제 당국 합의가 걸림돌이지만, 계층 분리 형태로 자체 OS에 안정성을 더하려는 시도는 명분이 충분합니다.

그럼 밸류에이션 상 바닥은 어디일까요? 크라우드 스트라이크 12M FWD P/E(Factset)은 59배(시간외 하락 고려시 56배)까지 하락했습니다. 피어 기업 팔로알토 네트워크(52배)와 격차도 상당 부분 축소되었습니다.

이번 사태가 독보적 성장에 제동을 걸겠지만 피어 기업보다 고성장하며, 플랫폼 통합 트렌드와 신규 성장 동력은 프리미엄 요인입니다.

불확실성이 어느정도 해소되기 전까지는 한발 물러나 지켜보는 것이 낫다는 판단입니다. 크라우드 스트라이크 실적은 8월 말 발표 예정이지만, 내일 예정된 마이크로소프트 실적 발표에서도 관련 내용은 중요한 화두가 될 것입니다. 추가 업데이트해 드리겠습니다.

(2024/7/30 공표자료)
This media is not supported in your browser
VIEW IN TELEGRAM
메타, SAM(Segment Anything Model) 2 오픈소스로 공개

: 입력 텍스트 및 클릭 기반으로 AI가 이미지/영상 내 특정 물체를 식별하고 분리하는 모델. 이미지에 적용한 SAM(지난해 공개)의 후속

: 리얼 월드 어플리케이션 개발, 멀티모달 모델 개선, 컴퓨터 비전 시스템 학습을 위한 주석 툴, AR/VR 적용 기대

: 5.1만개 실제 영상과 60만개 분할 마스크로 구성된 SA-V 데이터셋도 공개

데모: https://ai.meta.com/sam2/#demo

블로그: https://ai.meta.com/blog/segment-anything-2/
오픈AI, GPT-4o 아웃풋 토큰 확장 버전 공개(Alpha Program)

: max 아웃풋 토큰 64k로 확대. 기존 API 가격 대비 프리미엄

<가격 비교, 백만토큰 당>
- gpt-4o: 인풋 $5, 아웃풋 $15
- gpt-4o-64k: 인풋 $6, 아웃풋 $18

<주요 모델 아웃풋 토큰 비교>
- GPT-4o mini - 16384
- GPT-4o - 4096
- Claude 3.5 Sonnet - 4096/8092(베타)
- Gemini 1.5 Flash - 8192
- Gemini 1.5 Pro - 8192
- Llama 3.1 - 2048

https://openai.com/gpt-4o-long-output/
애플 인텔리전스 기반 모델은  모바일 기기 내 AI 처리를 위한 30억 매개변수의 온디바이스 언어 모델 ‘AFM-on-device’와 Private Cloud Compute 시스템 기반 애플의 클라우드 인프라에서 실행될 서버 언어 모델 ‘AFM-server’ 2가지다.

애플이 새로운 AI 모델을 훈련하기 위해 사용한 인프라의 규모도 구체적으로 드러났다. 6월 당시에는 구글의 AI 칩 TPU를 장착한 구글 클라우드에서 훈련했다고만 밝혔는데, 이번에는 구체적인 수치를 추가했다.

온디바이스 AI 모델 학습에는 올해 1월 선보인 TPUv5p 칩 2048개를, 서버 모델에는 지난해 공개된 TPU 4세대 버전인 TPUv4 8192개를 사용했다는 내용이다.


https://www.aitimes.com/news/articleView.html?idxno=162046