[삼성 이영진] 글로벌 AI/SW
오픈AI, Sora 2 출시 : 이전 세대 모델보다 물리적으로 정확하고, 실패 상황까지 시뮬레이션. 사실적 모델링 가능 : 복잡한 지시사항을 따르며 여러 장면을 이어가는 제어 능력 향상 : 범용 영상 및 오디오 생성 시스템. 배경음, 대화, 효과음 동시 생성 지원. 현실 세계 요소 직접 주입 가능 : 새로운 iOS 소셜 앱 “Sora” 출시. 콘텐츠 제작, 리믹스, 탐색 기능. 카메오 기능을 통해 영상 출연 가능 안전 및 청소년 보호 장치 강화.…
오픈AI, Sora 앱 종료 발표
R.I.P Sora 앱(25.9.30-26.3.24)
→ 앱 뿐 아니라 API 중단 및 챗GPT 통합 계획 보류 보도. 디즈니 라이선싱 딜과 지분 투자도 철회
https://t.me/Samsung_Global_AI_SW
R.I.P Sora 앱(25.9.30-26.3.24)
우리는 Sora 앱과 작별을 고합니다.
Sora로 창작하고, 공유하고, 커뮤니티를 만들어준 모든 분들께 감사합니다.
여러분이 Sora로 만든 것들은 의미가 있었고, 이번 소식이 실망스러울 수 있다는 것도 잘 알고 있습니다.
앱과 API의 일정, 그리고 작업을 보존하는 방법에 대한 자세한 내용은 곧 공유하겠습니다. — Sora 팀
→ 앱 뿐 아니라 API 중단 및 챗GPT 통합 계획 보류 보도. 디즈니 라이선싱 딜과 지분 투자도 철회
https://t.me/Samsung_Global_AI_SW
😱4🔥1
오픈AI, 조직 개편과 차세대 모델 ‘Spud’ 사전 학습 완료
: 샘 올트먼은 내부 메모를 통해 조직 개편, 권한 조정, 제품 및 모델 로드맵 방향성 제시
: 올트먼은 안전 및 보안 팀에 대한 직접 관할을 내려놓고, 자본 조달, 공급망 관리, 데이터센터 구축에 집중
: 안전 팀은 마크 첸 CRO 산하 연구 조직으로 이동. 보안 팀은 그렉 브록먼 산하 스케일링 조직으로 재편
: 피지 시모가 이끄는 제품 조직 명칭을 AGI 배포(AGI Deployment)로 변경. 연구 중심에서 실제 배포 단계로의 전환 시사
: 차세대 AI 모델 코드명 ‘Spud’ 사전 학습 완료. 수주 내 공개 예정이며, 실질적 경제 성장 가속화 기대
: Sora 앱과 API 중단. 차세대 모델 구동을 위한 컴퓨팅 자원 재배치 및 우선순위 재정렬 목적
: Sora 연구팀은 월드 모델 연구로 전환. 로봇 공학 중심의 장기 시뮬레이션에 집중. 물리적 경제의 자동화 목표
https://t.me/Samsung_Global_AI_SW
: 샘 올트먼은 내부 메모를 통해 조직 개편, 권한 조정, 제품 및 모델 로드맵 방향성 제시
: 올트먼은 안전 및 보안 팀에 대한 직접 관할을 내려놓고, 자본 조달, 공급망 관리, 데이터센터 구축에 집중
: 안전 팀은 마크 첸 CRO 산하 연구 조직으로 이동. 보안 팀은 그렉 브록먼 산하 스케일링 조직으로 재편
: 피지 시모가 이끄는 제품 조직 명칭을 AGI 배포(AGI Deployment)로 변경. 연구 중심에서 실제 배포 단계로의 전환 시사
: 차세대 AI 모델 코드명 ‘Spud’ 사전 학습 완료. 수주 내 공개 예정이며, 실질적 경제 성장 가속화 기대
: Sora 앱과 API 중단. 차세대 모델 구동을 위한 컴퓨팅 자원 재배치 및 우선순위 재정렬 목적
: Sora 연구팀은 월드 모델 연구로 전환. 로봇 공학 중심의 장기 시뮬레이션에 집중. 물리적 경제의 자동화 목표
https://t.me/Samsung_Global_AI_SW
👍2❤1👏1
오픈AI, 챗GPT 쇼핑 탐색 기능 강화 및 ACP 기반 커머스 플랫폼 확장
: 챗GPT 내에서 제품 탐색, 비교, 의사결정을 통합하는 쇼핑 경험 출시
: 텍스트 대화 기반으로 조건을 구체화하고, 시각적 UI를 통해 상품을 직관적으로 탐색 가능
: 가격, 리뷰, 기능 등을 한 화면에서 비교 제공, 기존 탭 기반 검색 대비 탐색 효율 대폭 개선
: 이미지 업로드를 통한 유사 상품 추천 기능 추가, 탐색 방식 고도화
: Agentic Commerce Protocol(ACP)을 제품 탐색 영역까지 확장, 커머스 데이터 통합 레이어 구축
: ACP를 통해 판매자 카탈로그, 프로모션 데이터 연결. 향후 개인화·재고·배송 정보까지 확장 예정
: Target, Walmart, Sephora 등 주요 리테일러 참여, Shopify는 자동 연동 구조로 상품 노출 확대
: Instant Checkout 축소, 대신 판매자 자체 결제 시스템 유지
: Walmart는 챗GPT 내 앱 형태로 직접 통합, 계정 연동, 결제까지 확장된 커머스 경험 제공
: Free·Go·Plus·Pro 전 사용자 대상 출시, 챗GPT를 검색을 넘어 커머스 진입점으로 확장 목표
→ 결제 기능 직접 수행보다, 구매 결정에 영향을 미치는 탐색, 비교 단계에 집중하는 전략으로 전환
https://openai.com/index/powering-product-discovery-in-chatgpt/
: 챗GPT 내에서 제품 탐색, 비교, 의사결정을 통합하는 쇼핑 경험 출시
: 텍스트 대화 기반으로 조건을 구체화하고, 시각적 UI를 통해 상품을 직관적으로 탐색 가능
: 가격, 리뷰, 기능 등을 한 화면에서 비교 제공, 기존 탭 기반 검색 대비 탐색 효율 대폭 개선
: 이미지 업로드를 통한 유사 상품 추천 기능 추가, 탐색 방식 고도화
: Agentic Commerce Protocol(ACP)을 제품 탐색 영역까지 확장, 커머스 데이터 통합 레이어 구축
: ACP를 통해 판매자 카탈로그, 프로모션 데이터 연결. 향후 개인화·재고·배송 정보까지 확장 예정
: Target, Walmart, Sephora 등 주요 리테일러 참여, Shopify는 자동 연동 구조로 상품 노출 확대
: Instant Checkout 축소, 대신 판매자 자체 결제 시스템 유지
: Walmart는 챗GPT 내 앱 형태로 직접 통합, 계정 연동, 결제까지 확장된 커머스 경험 제공
: Free·Go·Plus·Pro 전 사용자 대상 출시, 챗GPT를 검색을 넘어 커머스 진입점으로 확장 목표
→ 결제 기능 직접 수행보다, 구매 결정에 영향을 미치는 탐색, 비교 단계에 집중하는 전략으로 전환
https://openai.com/index/powering-product-discovery-in-chatgpt/
Openai
Powering Product Discovery in ChatGPT
ChatGPT introduces richer, visually immersive shopping powered by the Agentic Commerce Protocol, enabling product discovery, side-by-side comparisons, and merchant integration.
👍2❤1
팔란티어 & 안두릴, 골든 돔 미사일 방어 시스템 소프트웨어 개발 컨소시엄 참여
: 컨소시엄은 올 여름 테스트를 목표로 소프트웨어를 준비 중. Aalyria, Scale AI, Swoop 등 AI, 네트워크 기업들도 참여
: 소프트웨어는 센서, 레이더, 요격체계를 연결하는 ‘지휘통제(C2) OS’ 역할로, 시스템의 핵심 아키텍처
: 실제 시연 성공 시 1,850억 달러 규모 방어 시스템의 중심 레이어로 자리잡으며, 장기 개발·유지보수 매출 기회 확보
: 프로젝트는 미 우주군 마이클 게틀라인 장군이 총괄하며, 소프트웨어는 유일하게 직속 조직에서 직접 관리
: 기존 방산 기업(Lockheed, Northrop 등)은 메인 컨트랙터가 아닌 테크 기업 하청 구조로 참여
https://t.me/Samsung_Global_AI_SW
: 컨소시엄은 올 여름 테스트를 목표로 소프트웨어를 준비 중. Aalyria, Scale AI, Swoop 등 AI, 네트워크 기업들도 참여
: 소프트웨어는 센서, 레이더, 요격체계를 연결하는 ‘지휘통제(C2) OS’ 역할로, 시스템의 핵심 아키텍처
: 실제 시연 성공 시 1,850억 달러 규모 방어 시스템의 중심 레이어로 자리잡으며, 장기 개발·유지보수 매출 기회 확보
: 프로젝트는 미 우주군 마이클 게틀라인 장군이 총괄하며, 소프트웨어는 유일하게 직속 조직에서 직접 관리
: 기존 방산 기업(Lockheed, Northrop 등)은 메인 컨트랙터가 아닌 테크 기업 하청 구조로 참여
https://t.me/Samsung_Global_AI_SW
👍4❤2
[삼성 이영진] 글로벌 AI/SW
중국 상무부, 메타-Manus 인수의 기술 수출 통제 위반 가능성 검토 : 메타의 마누스 인수는 미국 기업이 중국 AI 스타트업을 인수하는 드문 사례 : 중국 상무부는 마누스 인력과 기술의 싱가포르 이전과 이후 메타 매각이 중국 법률 상 수출 허가 대상에 해당하는지 여부 검토 시작 : 초기 단계로 공식 조사로 이어지지 않을 수도 있지만, 수출 허가가 필요하다는 판단의 경우 중국 정부는 거래에 개입할 수 있는 수단 확보. 극단적으로 거래 철회 압박 가능…
중국 규제 당국, Manus 공동 창업자 2인 출국 금지 조치
: 규제 당국은 메타의 20억 달러 규모 인수에 대한 투자 규정 위반 여부 검토 중
: Manus의 최고경영자 Xiao Hong과 최고과학자 Ji Yichao는 이달 초 베이징 National Development and Reform Commission(NDRC)에 소환되어 회의 진행
: 회의 이후 검토가 진행되는 동안 중국을 떠날 수 없다는 통보. 국내 이동은 허용
: 해당 사안 해결을 위해 Manus는 현재 법률 및 컨설팅 지원을 적극적으로 모색
https://t.me/Samsung_Global_AI_SW
: 규제 당국은 메타의 20억 달러 규모 인수에 대한 투자 규정 위반 여부 검토 중
: Manus의 최고경영자 Xiao Hong과 최고과학자 Ji Yichao는 이달 초 베이징 National Development and Reform Commission(NDRC)에 소환되어 회의 진행
: 회의 이후 검토가 진행되는 동안 중국을 떠날 수 없다는 통보. 국내 이동은 허용
: 해당 사안 해결을 위해 Manus는 현재 법률 및 컨설팅 지원을 적극적으로 모색
https://t.me/Samsung_Global_AI_SW
👍2😁1
트럼프 대통령, 대통령 과학기술자문위원회(PCAST) 위원 임명 발표
: 행정명령을 통해 설립. 과학기술 분야 최고 수준 인사들이 대통령 자문 및 미국 기술 리더십 강화 전략 제시
: 최대 24명 구성. 추가 위원 및 첫 회의 일정 추후 발표 예정
: 공동 의장은 David Sacks와 Michael Kratsios
: 임명 위원 리스트
- Marc Andreessen - a16z 공동창업자
- Sergey Brin - 구글 공동창업자
- Safra Catz - 오라클 CEO
- Michael Dell - 델 창업자
- Jacob DeWitte - 오클로 CEO
- Fred Ehrsam - 코인베이스 공동창업자
- Larry Ellison - 오라클 창업자
- David Friedberg - 딥테크, 바이오 투자자(The Production Board)
- Jensen Huang - 엔비디아 CEO
- John Martinis - 전 구글 Quantum AI 책임자
- Bob Mumgaard - 커먼웰스 퓨전 CEO
- Lisa Su - AMD CEO
- Mark Zuckerberg - 메타 CEO
https://www.whitehouse.gov/articles/2026/03/president-trump-announces-appointments-to-presidents-council-of-advisors-on-science-and-technology/
: 행정명령을 통해 설립. 과학기술 분야 최고 수준 인사들이 대통령 자문 및 미국 기술 리더십 강화 전략 제시
: 최대 24명 구성. 추가 위원 및 첫 회의 일정 추후 발표 예정
: 공동 의장은 David Sacks와 Michael Kratsios
: 임명 위원 리스트
- Marc Andreessen - a16z 공동창업자
- Sergey Brin - 구글 공동창업자
- Safra Catz - 오라클 CEO
- Michael Dell - 델 창업자
- Jacob DeWitte - 오클로 CEO
- Fred Ehrsam - 코인베이스 공동창업자
- Larry Ellison - 오라클 창업자
- David Friedberg - 딥테크, 바이오 투자자(The Production Board)
- Jensen Huang - 엔비디아 CEO
- John Martinis - 전 구글 Quantum AI 책임자
- Bob Mumgaard - 커먼웰스 퓨전 CEO
- Lisa Su - AMD CEO
- Mark Zuckerberg - 메타 CEO
https://www.whitehouse.gov/articles/2026/03/president-trump-announces-appointments-to-presidents-council-of-advisors-on-science-and-technology/
The White House
President Trump Announces Appointments to President’s Council of Advisors on Science and Technology
Today, President Donald J. Trump appointed the first members to his President’s Council of Advisors on Science and Technology (PCAST). Established by
❤4🤡2
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/26)
■ 구글, AI 메모리 압축 알고리즘 TurboQuant 공개. 추론 최적화에 집중
■ 구글, 신규 음악 생성 AI 모델 Lyria 3 Pro 발표. 최대 3분 길이 음악 트랙 생성
■ 애플, 구글과 계약을 통해 Gemini 모델에 대한 완전한 접근 권한을 자사 데이터센터 내에서 확보. 모델 증류도 가능 언급
■ 메타와 구글(YouTube)이 소셜미디어 중독 피해에 대한 책임을 인정받으며 300만 달러 배상 판결. 메타 측은 즉시 항소 의견
■ 일론 머스크, xAI의 AI 영상 생성 강화 계획. Grok Imagine 제품 업그레이드 시사
■ 메타, 창업 지원 및 AI 도입 확대를 위한 신규 이니셔티브 Meta Small Business 출시
■ 메타, AI 투자 확대에 대한 구조조정으로 700명 규모 감원 단행. 반대로 상위 경영진 보상은 강화
■ xAI 공동창업자 Manuel Kris 퇴사 발표
■ 바이트댄스, 자체 AI 창작 플랫폼 드리미나(Dreamina)에서 영상 생성 모델 Seedscne 2.0과 이미지 생성 모델 Seedream 5.0 Lite 공식 출시
■ 버니 샌더스 상원의원, AI Data Center Moratorium Act 제안. 미국 내 모든 데이터센터 신규 건설 및 업그레이드 중단(모라토리움) 및 미국산 GPU 수출 전면 금지 포함
■ 블랙스톤, 미국의 주요 데이터센터 개발사 Rowan Digital Infrastructure 인수 근접
■ AI 법률 스타트업 Harvey, 신규 펀딩 라운드에서 110억 달러 밸류 확인
■ 세일즈포스, 디렉터급 이상 직원에 대한 연봉 인상 중단
■ 크라우드스트라이크-인텔, 전략적 협력을 확대해 차세대 AI PC의 엔드포인트 보안 강화
감사합니다.
■ 구글, AI 메모리 압축 알고리즘 TurboQuant 공개. 추론 최적화에 집중
■ 구글, 신규 음악 생성 AI 모델 Lyria 3 Pro 발표. 최대 3분 길이 음악 트랙 생성
■ 애플, 구글과 계약을 통해 Gemini 모델에 대한 완전한 접근 권한을 자사 데이터센터 내에서 확보. 모델 증류도 가능 언급
■ 메타와 구글(YouTube)이 소셜미디어 중독 피해에 대한 책임을 인정받으며 300만 달러 배상 판결. 메타 측은 즉시 항소 의견
■ 일론 머스크, xAI의 AI 영상 생성 강화 계획. Grok Imagine 제품 업그레이드 시사
■ 메타, 창업 지원 및 AI 도입 확대를 위한 신규 이니셔티브 Meta Small Business 출시
■ 메타, AI 투자 확대에 대한 구조조정으로 700명 규모 감원 단행. 반대로 상위 경영진 보상은 강화
■ xAI 공동창업자 Manuel Kris 퇴사 발표
■ 바이트댄스, 자체 AI 창작 플랫폼 드리미나(Dreamina)에서 영상 생성 모델 Seedscne 2.0과 이미지 생성 모델 Seedream 5.0 Lite 공식 출시
■ 버니 샌더스 상원의원, AI Data Center Moratorium Act 제안. 미국 내 모든 데이터센터 신규 건설 및 업그레이드 중단(모라토리움) 및 미국산 GPU 수출 전면 금지 포함
■ 블랙스톤, 미국의 주요 데이터센터 개발사 Rowan Digital Infrastructure 인수 근접
■ AI 법률 스타트업 Harvey, 신규 펀딩 라운드에서 110억 달러 밸류 확인
■ 세일즈포스, 디렉터급 이상 직원에 대한 연봉 인상 중단
■ 크라우드스트라이크-인텔, 전략적 협력을 확대해 차세대 AI PC의 엔드포인트 보안 강화
감사합니다.
👍5❤1
구글의 TurboQuant, 메모리 효율성 향상이 가져올 추론 수요 폭발
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
구글이 발표한 TurboQuant는 AI 추론 과정에서 발생하는 KV 캐시 병목을 해결하기 위한 알고리즘입니다.
KV 캐시는 자주 사용되는 정보를 저장해 방대한 데이터베이스 참조 없이 즉시 정보를 불러올 수 있도록 하는 일종의 메모장인데요
병목 완화를 위해 고차원 벡터 크기를 줄이는 전통적 벡터 양자화를 통한 압축 기술 적용이 기존에도 연구되었습니다. 하지만 전통적 방식은 추가 메모리 오버헤드와 정확도 손실이 발생하는데요
반면 TurboQuant는 PolarQuant와 QJL을 결합해 벡터 양자화에서 메모리 오버헤드 문제를 최적으로 해결하는 압축 알고리즘입니다.
PolarQuant는 벡터를 좌표에서 각도(극좌표)로 변환해 데이터 구조를 단순화하고, QJL은 값을 +1과 -1 비트로 표현하는 수학적 기법으로 남은 오차를 보정합니다.
1단계 PolarQuant로 대부분 압축을 실행하고, QJL로 오류를 보정하는 통합 구조입니다.
사람들이 주목한 것은 결과인데요
1) KV 메모리 크기를 최소 6배 축소
2) 추가 학습 및 파인튜닝 없이 KV 캐시를 3비트까지 양자화
3) 모델 정확도를 유지하면서 빠른 실행 속도 달성
특히 H100 기준 4비트 TurboQuant는 32비트 비양자화 대비 8배의 어텐션 연산 속도를 달성했습니다.
KV 캐시 압축을 비롯한 추론 최적화는 지속적으로 연구가 진행되던 분야입니다. 중국 기업들도 상당한 노력을 기울이고 있구요
과거 딥시크의 MLA나 DSA도 KV 캐시로 인한 메모리 및 연산 병목 완화 목적의 연구입니다. MLA는 구조 변경 DSA는 선택적 어텐션을 통해 접근했습니다.
물론 구글의 TurboQuant는 KV 저장 및 사용 구조를 유지하면서 모델 수정 없이 바로 적용이 가능하고 이론적으로 무손실에 가까운 압축을 달성한다는 점에서는 차별화되는 부분이 있습니다.
TurboQuant 알고리즘이 활용된다면 추론 비용 하락을 달성할 수 있습니다. 하지만 오히려 수요는 폭발 할 것입니다. 속도 및 퀄리티 하향 없이 장기 컨텍스트 윈도우 및 대규모 배치의 활용이 가능하니까요
또한 로컬 모델에서도 대규모 컨텍스트 윈도우 활용이 가능해집니다. 온디바이스 개화로도 이어질 수 있는 포인트입니다.
추론 작업에 대한 메모리 공간이 추가로 생긴다고 하더라도 에이전트 AI 확대 속 이를 상회하고도 남는 전체 추론 수요 상승 트렌드는 이미 이어지고 있습니다.
작년 딥시크 이슈 때도 대두되었던 제본스의 역설(비용 하락에 따른 수요 급증)이 재확인될 가능성이 높다고 생각합니다. 쿼리와 토큰량의 기울기는 다시 한 번 가팔라질 수 있습니다.
세상을 뒤흔들고 있지만, 방금 나온 따끈한 새로운 기술은 아닙니다. 이미 25년 4월에 논문으로 공개된 내용입니다. 시스템 레벨에서 적용한 사례가 추가되어 블로그에 게시된 것입니다.
그리고 공개된 연구인 만큼 AI 산업 내 다른 플레이어의 활용도 열려있습니다.
또한 알고리즘은 추론 측면에서 적용됩니다. 학습 측면에서 모델 스케일링에 기반한 반도체 필요성은 여전합니다.
마지막으로 연구 성과가 실제 환경에서 적용되는 것에서 괴리가 존재할 수 있습니다. 이건 구글이 향후에 증명해야하는 부분이겠지요
저희도 AI 투자와 반도체에 긍정적인 뉴스라는 의견입니다.
(2026/3/26 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
구글이 발표한 TurboQuant는 AI 추론 과정에서 발생하는 KV 캐시 병목을 해결하기 위한 알고리즘입니다.
KV 캐시는 자주 사용되는 정보를 저장해 방대한 데이터베이스 참조 없이 즉시 정보를 불러올 수 있도록 하는 일종의 메모장인데요
병목 완화를 위해 고차원 벡터 크기를 줄이는 전통적 벡터 양자화를 통한 압축 기술 적용이 기존에도 연구되었습니다. 하지만 전통적 방식은 추가 메모리 오버헤드와 정확도 손실이 발생하는데요
반면 TurboQuant는 PolarQuant와 QJL을 결합해 벡터 양자화에서 메모리 오버헤드 문제를 최적으로 해결하는 압축 알고리즘입니다.
PolarQuant는 벡터를 좌표에서 각도(극좌표)로 변환해 데이터 구조를 단순화하고, QJL은 값을 +1과 -1 비트로 표현하는 수학적 기법으로 남은 오차를 보정합니다.
1단계 PolarQuant로 대부분 압축을 실행하고, QJL로 오류를 보정하는 통합 구조입니다.
사람들이 주목한 것은 결과인데요
1) KV 메모리 크기를 최소 6배 축소
2) 추가 학습 및 파인튜닝 없이 KV 캐시를 3비트까지 양자화
3) 모델 정확도를 유지하면서 빠른 실행 속도 달성
특히 H100 기준 4비트 TurboQuant는 32비트 비양자화 대비 8배의 어텐션 연산 속도를 달성했습니다.
KV 캐시 압축을 비롯한 추론 최적화는 지속적으로 연구가 진행되던 분야입니다. 중국 기업들도 상당한 노력을 기울이고 있구요
과거 딥시크의 MLA나 DSA도 KV 캐시로 인한 메모리 및 연산 병목 완화 목적의 연구입니다. MLA는 구조 변경 DSA는 선택적 어텐션을 통해 접근했습니다.
물론 구글의 TurboQuant는 KV 저장 및 사용 구조를 유지하면서 모델 수정 없이 바로 적용이 가능하고 이론적으로 무손실에 가까운 압축을 달성한다는 점에서는 차별화되는 부분이 있습니다.
TurboQuant 알고리즘이 활용된다면 추론 비용 하락을 달성할 수 있습니다. 하지만 오히려 수요는 폭발 할 것입니다. 속도 및 퀄리티 하향 없이 장기 컨텍스트 윈도우 및 대규모 배치의 활용이 가능하니까요
또한 로컬 모델에서도 대규모 컨텍스트 윈도우 활용이 가능해집니다. 온디바이스 개화로도 이어질 수 있는 포인트입니다.
추론 작업에 대한 메모리 공간이 추가로 생긴다고 하더라도 에이전트 AI 확대 속 이를 상회하고도 남는 전체 추론 수요 상승 트렌드는 이미 이어지고 있습니다.
작년 딥시크 이슈 때도 대두되었던 제본스의 역설(비용 하락에 따른 수요 급증)이 재확인될 가능성이 높다고 생각합니다. 쿼리와 토큰량의 기울기는 다시 한 번 가팔라질 수 있습니다.
세상을 뒤흔들고 있지만, 방금 나온 따끈한 새로운 기술은 아닙니다. 이미 25년 4월에 논문으로 공개된 내용입니다. 시스템 레벨에서 적용한 사례가 추가되어 블로그에 게시된 것입니다.
그리고 공개된 연구인 만큼 AI 산업 내 다른 플레이어의 활용도 열려있습니다.
또한 알고리즘은 추론 측면에서 적용됩니다. 학습 측면에서 모델 스케일링에 기반한 반도체 필요성은 여전합니다.
마지막으로 연구 성과가 실제 환경에서 적용되는 것에서 괴리가 존재할 수 있습니다. 이건 구글이 향후에 증명해야하는 부분이겠지요
저희도 AI 투자와 반도체에 긍정적인 뉴스라는 의견입니다.
(2026/3/26 공표자료)
👍11❤2
Forwarded from [삼성리서치] 테크는 역시 삼성증권
터보퀀트는 메모리 사용량을 줄일까?
[삼성증권 반도체, IT/이종욱]
어제 구글이 블로그를 통해 터보퀀트(TurboQuant) 기술을 소개했고, 마이크론 주가 하락(-3.4%)에 영향을 미친 것으로 보입니다.
1. 터보퀀트가 무엇일까
TurboQuant는 Transformer의 핵심 병목인 KV cache를 이론적 최적 수준으로 압축(양자화)하는 알고리즘입니다.
KV는 벡터값인데, 이 값을 바꾸는 것이 아니라 이 값을 읽은 기준선(좌표계) 바꿔서, 압축 손실을 최소화하는 최적의 좌표계를 찾는 방식입니다.
2. 터보퀀트가 메모리에 미치는 영향
계산량이 추가되고 캐시메모리 사용량을 줄이는 트레이드오프가 있긴 하지만, 현재 AI 속도의 병목은 캐시메모리이기 때문에 전체 속도를 높이고, 곧 AI 추론 비용을 낮출수 있습니다. 따라서 메모리를 덜 사용하면서 같은 성능을 낼 수 있는 AI 기술이라고 할수 있습니다.
3. 제본의 역설?
딥시크 이후로, 반도체 사용량을 최적화하려는 AI모델의 개선 노력은 계속되어 왔습니다. 그러나 효율적인 AI 모델은 오히려 전체 비용을 낮춰 더 많은 AI 계산 수요를 불러오고 있습니다. 최적화 모델들은 반도체 수요를 낮추는 것이 아니라 같은 반도체 자원으로 더 높은 성능의 AI 서비스를 구현하는데 사용되고 있습니다.
4. 무엇이 메모리 사용량을 결정할까
제일 말씀드리고 싶은 것이 이것입니다. 그럼 AI 메모리 수요에 영향을 미치는 인자는 무엇이 있을까요? 지금은 인프라 선점효과가 필요한 구간이기 때문에 보통의 가격과 수급 사이의 관계는 크지 않습니다(낮은 가격탄력성). 오히려 비즈니스 구조와 전략적 선택의 문제(생존문제)로 접근해야 합니다.
- AI 메모리 수요 감소요인은 주로 AI 기능이 고착화되는 지점에서 나타날 것입니다: AI서비스 개선 속도 둔화, AI 모델 기업끼리의 경쟁 구도 완화, AI산업 TAM 성장 둔화
- 다음과 같은 것은 수요에 영향을 미치지 않습니다: 디램과 반도체 가격, 데이터센터 비용, AI모델이나 클라우드 기업의 수익성, AI모델의 최적화와 비용절감
결론적으로 AI 업체들이 비용경쟁이 아니라 성능 경쟁을 하는한 비용 최적화는 반도체 수요에 영향을 미치지 않습니다. 우리가 걱정해야 할 순간은 AI로 더 할수 있는 기능이 별로 없거나 AI 업체들이 경쟁을 멈출때입니다.
감사합니다.
(2026/3/26 공표자료)
[삼성증권 반도체, IT/이종욱]
어제 구글이 블로그를 통해 터보퀀트(TurboQuant) 기술을 소개했고, 마이크론 주가 하락(-3.4%)에 영향을 미친 것으로 보입니다.
1. 터보퀀트가 무엇일까
TurboQuant는 Transformer의 핵심 병목인 KV cache를 이론적 최적 수준으로 압축(양자화)하는 알고리즘입니다.
KV는 벡터값인데, 이 값을 바꾸는 것이 아니라 이 값을 읽은 기준선(좌표계) 바꿔서, 압축 손실을 최소화하는 최적의 좌표계를 찾는 방식입니다.
2. 터보퀀트가 메모리에 미치는 영향
계산량이 추가되고 캐시메모리 사용량을 줄이는 트레이드오프가 있긴 하지만, 현재 AI 속도의 병목은 캐시메모리이기 때문에 전체 속도를 높이고, 곧 AI 추론 비용을 낮출수 있습니다. 따라서 메모리를 덜 사용하면서 같은 성능을 낼 수 있는 AI 기술이라고 할수 있습니다.
3. 제본의 역설?
딥시크 이후로, 반도체 사용량을 최적화하려는 AI모델의 개선 노력은 계속되어 왔습니다. 그러나 효율적인 AI 모델은 오히려 전체 비용을 낮춰 더 많은 AI 계산 수요를 불러오고 있습니다. 최적화 모델들은 반도체 수요를 낮추는 것이 아니라 같은 반도체 자원으로 더 높은 성능의 AI 서비스를 구현하는데 사용되고 있습니다.
4. 무엇이 메모리 사용량을 결정할까
제일 말씀드리고 싶은 것이 이것입니다. 그럼 AI 메모리 수요에 영향을 미치는 인자는 무엇이 있을까요? 지금은 인프라 선점효과가 필요한 구간이기 때문에 보통의 가격과 수급 사이의 관계는 크지 않습니다(낮은 가격탄력성). 오히려 비즈니스 구조와 전략적 선택의 문제(생존문제)로 접근해야 합니다.
- AI 메모리 수요 감소요인은 주로 AI 기능이 고착화되는 지점에서 나타날 것입니다: AI서비스 개선 속도 둔화, AI 모델 기업끼리의 경쟁 구도 완화, AI산업 TAM 성장 둔화
- 다음과 같은 것은 수요에 영향을 미치지 않습니다: 디램과 반도체 가격, 데이터센터 비용, AI모델이나 클라우드 기업의 수익성, AI모델의 최적화와 비용절감
결론적으로 AI 업체들이 비용경쟁이 아니라 성능 경쟁을 하는한 비용 최적화는 반도체 수요에 영향을 미치지 않습니다. 우리가 걱정해야 할 순간은 AI로 더 할수 있는 기능이 별로 없거나 AI 업체들이 경쟁을 멈출때입니다.
감사합니다.
(2026/3/26 공표자료)
❤6👍6
오픈AI, Codex 앱 유지 재확인
- Codex 총괄 Tibo
https://t.me/Samsung_Global_AI_SW
- Codex 총괄 Tibo
확실히 해두자면, Codex 앱은 계속 유지됩니다. 우리는 단지 이전보다 훨씬 더 많은 투자를 하고 있을 뿐이고, 곧 정말 멋지게 발전할 예정입니다.
https://t.me/Samsung_Global_AI_SW
🔥2👍1
문샷 AI, 홍콩 IPO 초기 논의 보도
: CICC 및 Goldman Sachs와 예비 협의 진행. 다만 상장 시점과 구체적 계획은 불확실
: 최근 180억 달러 밸류로 10억 달러 신규 펀딩 라운드 진행 보도
: 1월 홍콩 상장한 미니맥스와 Z ai는 공모가 대비 +505% 및 +492%
https://t.me/Samsung_Global_AI_SW
: CICC 및 Goldman Sachs와 예비 협의 진행. 다만 상장 시점과 구체적 계획은 불확실
: 최근 180억 달러 밸류로 10억 달러 신규 펀딩 라운드 진행 보도
: 1월 홍콩 상장한 미니맥스와 Z ai는 공모가 대비 +505% 및 +492%
https://t.me/Samsung_Global_AI_SW
👍2❤1
오픈AI, 성인용 챗 봇 출시 계획 무기한 연기
: 성적 AI 콘텐츠의 사회적 영향(중독성, 인간 관계 대체, 청소년 노출 등)에 대한 내부 및 투자자 우려 반영
: 명명시적 콘텐츠 생성과 불법 콘텐츠 필터링을 동시에 만족시키는 안전 정렬 모델 구현의 기술적 난이도 존재
: 사이드 프로젝트 축소 및 코어 생산성·에이전트 중심 전략 전환 과정에서 우선순위 재조정
https://t.me/Samsung_Global_AI_SW
: 성적 AI 콘텐츠의 사회적 영향(중독성, 인간 관계 대체, 청소년 노출 등)에 대한 내부 및 투자자 우려 반영
: 명명시적 콘텐츠 생성과 불법 콘텐츠 필터링을 동시에 만족시키는 안전 정렬 모델 구현의 기술적 난이도 존재
: 사이드 프로젝트 축소 및 코어 생산성·에이전트 중심 전략 전환 과정에서 우선순위 재조정
https://t.me/Samsung_Global_AI_SW
❤2👎2🤣2👍1
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/27)
■ 오픈AI, 내부 반발과 리스크 우려 속 성인용 챗 봇 출시 계획을 무기한 연기
■ 오픈AI, 광고 파일럿 기준으로 연 매출 1억 달러 돌파
■ 구글, Gemini 3.1 Flash Live 모델 공개. 저지연 실시간 음성 대화 지원
■ 구글, 카메라와 음성을 활용해 AI와 실시간 대화하며 검색하는 Search Live 글로벌 확장
■ 구글, 유저들이 타 AI 앱에서 생성된 메모리, 컨텍스트를 Gemini로 가져올 수 있는 기능 도입
■ 구글, 헤드폰 활용 실시간 번역 기능을 iOS와 글로벌로 확대
■ 아마존, AI 반도체 부문 디렉터 Gadi Hutt 퇴사
■ 마이크로소프트, 클라우드 및 세일즈 조직 내 채용 동결
■ 애플, iOS 27에서 Siri에 외부 AI 어시스턴트 연동 허용 계획
■ 메타, 텍사스 엘 파소 데이터센터 투자를 기존 15억 달러에서 100억 달러로 확대
■ 메타, fMRI 기반 데이터로 인간의 시청각 자극에 대한 뇌 반응을 범용적으로 예측하는 뇌 파운데이션 모델 TRIBE v2를 공개
■ 팔란티어, Bain & Company와 주요 경영 컨설팅 파트너십 확대 발표
■ Z. Ai, GLM-5-Turbo를 GLM Coding Plan 유저 대상으로 확대 배포
■ 네비우스, Nebius AI Cloud 3.5 출시. 서버리스 AI와 최신 GPU 옵션 추가. 플랫폼 툴 강화
■ 얀 르쿤, 기존 월드 모델의 학습 불완정성과 구조적 복잡성을 해결하는 LeWM(LeWorldModel) 논문 공개
■ 미스트랄 AI, 신규 오픈소스 음성 모델 Voxtral TTS 발표
■ 코히어, 자동 음성 인식(ASR)에 특화된 오픈소스 음성 모델 Transcribe 공개
■ X, CMO 포함 비기술 인력 20명 이상 감원
■ Aligned Data Centers, 26억 달러 부채 조달을 통해 AI 데이터센터 확장 가속
감사합니다.
■ 오픈AI, 내부 반발과 리스크 우려 속 성인용 챗 봇 출시 계획을 무기한 연기
■ 오픈AI, 광고 파일럿 기준으로 연 매출 1억 달러 돌파
■ 구글, Gemini 3.1 Flash Live 모델 공개. 저지연 실시간 음성 대화 지원
■ 구글, 카메라와 음성을 활용해 AI와 실시간 대화하며 검색하는 Search Live 글로벌 확장
■ 구글, 유저들이 타 AI 앱에서 생성된 메모리, 컨텍스트를 Gemini로 가져올 수 있는 기능 도입
■ 구글, 헤드폰 활용 실시간 번역 기능을 iOS와 글로벌로 확대
■ 아마존, AI 반도체 부문 디렉터 Gadi Hutt 퇴사
■ 마이크로소프트, 클라우드 및 세일즈 조직 내 채용 동결
■ 애플, iOS 27에서 Siri에 외부 AI 어시스턴트 연동 허용 계획
■ 메타, 텍사스 엘 파소 데이터센터 투자를 기존 15억 달러에서 100억 달러로 확대
■ 메타, fMRI 기반 데이터로 인간의 시청각 자극에 대한 뇌 반응을 범용적으로 예측하는 뇌 파운데이션 모델 TRIBE v2를 공개
■ 팔란티어, Bain & Company와 주요 경영 컨설팅 파트너십 확대 발표
■ Z. Ai, GLM-5-Turbo를 GLM Coding Plan 유저 대상으로 확대 배포
■ 네비우스, Nebius AI Cloud 3.5 출시. 서버리스 AI와 최신 GPU 옵션 추가. 플랫폼 툴 강화
■ 얀 르쿤, 기존 월드 모델의 학습 불완정성과 구조적 복잡성을 해결하는 LeWM(LeWorldModel) 논문 공개
■ 미스트랄 AI, 신규 오픈소스 음성 모델 Voxtral TTS 발표
■ 코히어, 자동 음성 인식(ASR)에 특화된 오픈소스 음성 모델 Transcribe 공개
■ X, CMO 포함 비기술 인력 20명 이상 감원
■ Aligned Data Centers, 26억 달러 부채 조달을 통해 AI 데이터센터 확장 가속
감사합니다.
👍3
[삼성 이영진] 글로벌 AI/SW
오픈AI 4Q IPO 준비? : 오픈AI의 4Q IPO 가능성 재보도. 다만 세부 일정은 변경될 수 있다는 내용. 재무조직 구축(블록 전 CAO Ajmere Dale와 도큐사인 전 CFO Cynthia Gaylor 영입)은 앞서 알려진 내용 : 지난 1월 말 보도와 비교하면 비공식 논의 수준에서 상장 실행 초기 단계 진입 해석. 3월 초 IPO 준비를 위한 로펌 선정 보도 존재. 전략 재편 진행 중 : 젠슨 황은 오픈AI가 올해 상장할 것으로 예상하기…
앤스로픽, 4Q IPO 계획 보도
: 상장을 통해 600억 달러 이상 조달 예상(스페이스X는 750억 달러 조달 예상)
: IPO 시점이나 여부는 변화할 수 있으나 로펌 협력 등 구체적 준비 작업 진행 중
: 앤스로픽이 오픈AI보다 먼저 상장할 가능성이 높다고 평가 받는 중. 개발자 및 기업 고객 중심 전략과 짧은 수익화 경로의 장점
: 규제 당국과 상장 논의 과정에서 클라우드 사업자가 재판매하는 AI 모델 매출 인식 방식과 매출 고성장 및 서버 비용 추정 방식 등이 주요 검토 대상 전망
https://t.me/Samsung_Global_AI_SW
: 상장을 통해 600억 달러 이상 조달 예상(스페이스X는 750억 달러 조달 예상)
: IPO 시점이나 여부는 변화할 수 있으나 로펌 협력 등 구체적 준비 작업 진행 중
: 앤스로픽이 오픈AI보다 먼저 상장할 가능성이 높다고 평가 받는 중. 개발자 및 기업 고객 중심 전략과 짧은 수익화 경로의 장점
: 규제 당국과 상장 논의 과정에서 클라우드 사업자가 재판매하는 AI 모델 매출 인식 방식과 매출 고성장 및 서버 비용 추정 방식 등이 주요 검토 대상 전망
https://t.me/Samsung_Global_AI_SW
👍2
오픈AI, 광고 사업 연 매출 1억 달러 돌파
: 광고 파일럿 출시 6주 만에 연 환산 매출 1억 달러 달성
: 현재 무료 및 저가 요금제 유저 중 20% 미만에게 광고 노출. 85% 이상 유저는 광고 노출 대상이 될 수 있는 상태
: 광고주 600개 이상 확보, 4월 중 광고주가 직접 광고를 집행할 수 있는 셀프서브(self-serve) 시스템 출시 목표
: 광고 관련성 개선 집중. “관련성이 낮다”고 평가된 광고 비율은 7% 미만. 동시에 사용자 경험 훼손 최소화
: 이번 주 초 전 메타 광고 임원 출신인 Dave Dugan을 광고 사업 총괄로 영입. 광고 사업을 캐나다, 호주, 뉴질랜드 등 다른 지역으로 확대하는 방안도 검토 중
: ‘26년 챗GPT 소비자 사업에서 매출 170억 달러 전망(무료 사용자 대상 광고 수익 포함) 2월 말 기준 오픈AI ARR은 250억 달러
https://t.me/Samsung_Global_AI_SW
: 광고 파일럿 출시 6주 만에 연 환산 매출 1억 달러 달성
: 현재 무료 및 저가 요금제 유저 중 20% 미만에게 광고 노출. 85% 이상 유저는 광고 노출 대상이 될 수 있는 상태
: 광고주 600개 이상 확보, 4월 중 광고주가 직접 광고를 집행할 수 있는 셀프서브(self-serve) 시스템 출시 목표
: 광고 관련성 개선 집중. “관련성이 낮다”고 평가된 광고 비율은 7% 미만. 동시에 사용자 경험 훼손 최소화
: 이번 주 초 전 메타 광고 임원 출신인 Dave Dugan을 광고 사업 총괄로 영입. 광고 사업을 캐나다, 호주, 뉴질랜드 등 다른 지역으로 확대하는 방안도 검토 중
: ‘26년 챗GPT 소비자 사업에서 매출 170억 달러 전망(무료 사용자 대상 광고 수익 포함) 2월 말 기준 오픈AI ARR은 250억 달러
https://t.me/Samsung_Global_AI_SW
👍3
[삼성 이영진] 글로벌 AI/SW
앤스로픽, 국방부 상대 소송 제기 : 캘리포니아 연방 법원과 워싱턴 D.C 항소 법원에 소송 제기. ”헌법은 정부가 막대한 권력을 이용해 보호된 표현을 이유로 기업을 처벌하는 것을 허용하지 않는다“고 주장 : 구글 딥마인드 수석 과학자 제프 딘 포함 40명의 오픈AI 및 구글 직원은 국방부의 공급망 위험 지정에 반대하는 법정 의견서(amicus brief) 제출 ■ 소장에서 제시된 앤스로픽의 주요 주장 1. 공급망 위험 지정은 위헌적 조치 :…
미 연방법원, 앤스로픽의 공급망 위험 지정 조치 중단
: 캘리포니아 연방법원은 앤스로픽을 안보 위협으로 분류하고 정부의 모델 사용을 금지한 것이 표현의 자유를 침해했다고 판결
: 법원은 앤스로픽이 본안 소송에서도 승소할 가능성이 높다고 판단하며 가처분 인용
: 연방 기관의 앤스로픽 기술 사용 중단을 지시한 대통령 명령 적용을 중단하고, 공급망 위험 지정 조치 역시 집행 금지. 정부에 대해 4/6일까지 판결 이행 상황 보고 요구
: 앤스로픽 측은 공급망 리스크 지정이 적법 절차 위반이자 정치적 견해 차이에 대한 보복이라고 주장
: 해당 조치로 수억 달러 규모 계약 취소 및 지연 등 사업 영향 발생. 피해에 대한 구제도 요청
: 관련 법적 쟁점이 분리되어 있어 추가 소송도 병행 진행중. 정부는법원의 가처분 결정에 대해 항소할 의사 시사
https://t.me/Samsung_Global_AI_SW
: 캘리포니아 연방법원은 앤스로픽을 안보 위협으로 분류하고 정부의 모델 사용을 금지한 것이 표현의 자유를 침해했다고 판결
: 법원은 앤스로픽이 본안 소송에서도 승소할 가능성이 높다고 판단하며 가처분 인용
: 연방 기관의 앤스로픽 기술 사용 중단을 지시한 대통령 명령 적용을 중단하고, 공급망 위험 지정 조치 역시 집행 금지. 정부에 대해 4/6일까지 판결 이행 상황 보고 요구
: 앤스로픽 측은 공급망 리스크 지정이 적법 절차 위반이자 정치적 견해 차이에 대한 보복이라고 주장
: 해당 조치로 수억 달러 규모 계약 취소 및 지연 등 사업 영향 발생. 피해에 대한 구제도 요청
: 관련 법적 쟁점이 분리되어 있어 추가 소송도 병행 진행중. 정부는법원의 가처분 결정에 대해 항소할 의사 시사
https://t.me/Samsung_Global_AI_SW
❤3👍3
[삼성 이영진] 글로벌 AI/SW
앤스로픽, Claude 사용량 2배 이벤트 : 3/13~3/27, 피크 시간대(EST 08:00–14:00 / PT 05:00–11:00) 제외 비혼잡 시간대에 5시간 기준 사용량 한도 2배 : 한국시간 기준 피크 시간대: 21:00–03:00(기존 한도 유지) : 주말은 하루 종일 사용량 2배 https://support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion
앤스로픽, Claude 피크 시간대 이용 제한 조정 - Claude Code 팀 Thalia Shihipar
→ Show me the Capa. 한국시간 기준 밤 10시~새벽 4시
https://t.me/Samsung_Global_AI_SW
Claude 수요 증가에 대응하기 위해, 피크 시간대 동안 무료/Pro/Max 구독자의 5시간 세션 제한을 조정하고 있습니다. 주간 총 사용 한도는 변하지 않습니다.
평일 기준 태평양 시간 오전 5시-11시 / GMT 오후 1시-7시 동안에는 이전보다 더 빠르게 5시간 세션 한도에 도달하게 됩니다.
영향을 완화하기 위해 여러 효율 개선을 적용했지만, 약 7%의 사용자(특히 Pro 요금제)는 이전보다 더 자주 세션 한도에 도달하게 될 것입니다.
토큰 사용량이 많은 백그라운드 작업은 비혼잡 시간(off-peak)으로 옮기면 세션을 더 오래 사용할 수 있습니다.
전체 주간 한도는 동일하며, 단지 한 주 동안의 분배 방식만 바뀌는 것입니다.
불편을 드린 점 알고 있습니다. 우리는 계속해서 효율적인 확장을 위해 투자하고 있으며, 진행 상황을 계속 공유하겠습니다.
→ Show me the Capa. 한국시간 기준 밤 10시~새벽 4시
https://t.me/Samsung_Global_AI_SW
👍2
마이크로소프트, 클라우드와 북미 영업 조직 채용 동결
: 수만 명 규모의 Azure 및 영업 조직에서 신규 채용 전면 중단(오퍼 인력 제외). 비용 억제 및 수익성 개선 목적. Azure 마진 격차 해소를 핵심 과제로 설정
: 전사적 조치는 아니며 Copilot 등 AI 핵심 엔지니어링 조직은 채용 지속. 회계연도(6월)을 앞두고 채용 속도 조절 및 인력 감축은 드문 일은 아님
: 메타, 구글, AWS 등 빅테크와 아틀라시안 등 소프트웨어 기업 전반에서 AI 투자 확대에 따른 인력 조정 확산
: MS의 지난 회계연도 말 기준 직원 22만 8,000명으로 전년과 동일한 수준. 사내 AI 도구 활용 증가 기반 인력 효율 개선으로 향후 몇 년간 전체 인력 규모 정체 전망
https://t.me/Samsung_Global_AI_SW
: 수만 명 규모의 Azure 및 영업 조직에서 신규 채용 전면 중단(오퍼 인력 제외). 비용 억제 및 수익성 개선 목적. Azure 마진 격차 해소를 핵심 과제로 설정
: 전사적 조치는 아니며 Copilot 등 AI 핵심 엔지니어링 조직은 채용 지속. 회계연도(6월)을 앞두고 채용 속도 조절 및 인력 감축은 드문 일은 아님
: 메타, 구글, AWS 등 빅테크와 아틀라시안 등 소프트웨어 기업 전반에서 AI 투자 확대에 따른 인력 조정 확산
: MS의 지난 회계연도 말 기준 직원 22만 8,000명으로 전년과 동일한 수준. 사내 AI 도구 활용 증가 기반 인력 효율 개선으로 향후 몇 년간 전체 인력 규모 정체 전망
https://t.me/Samsung_Global_AI_SW
👍1
[삼성 이영진] 글로벌 AI/SW
앤스로픽, Claude 피크 시간대 이용 제한 조정 - Claude Code 팀 Thalia Shihipar Claude 수요 증가에 대응하기 위해, 피크 시간대 동안 무료/Pro/Max 구독자의 5시간 세션 제한을 조정하고 있습니다. 주간 총 사용 한도는 변하지 않습니다. 평일 기준 태평양 시간 오전 5시-11시 / GMT 오후 1시-7시 동안에는 이전보다 더 빠르게 5시간 세션 한도에 도달하게 됩니다. 영향을 완화하기 위해 여러 효율 개선을 적용했지만…
오픈AI, Codex 플러그인 출시 기념 사용한도 리셋
https://t.me/Samsung_Global_AI_SW
안녕하세요. 최근 출시한 훌륭한 플러그인들을 모두가 실험해볼 수 있도록, 그리고 꽤 시간이 지났기 때문에 모든 플랜의 Codex 사용 한도를 리셋했습니다.
이제 Codex로 무제한으로 무엇이든 만들 수 있습니다. 즐기세요!
https://t.me/Samsung_Global_AI_SW
👍2
앤스로픽, 신규 AI 모델 개발 및 테스트 인정
: 앤스로픽, 신규 AI 모델 개발 및 초기 고객 대상 테스트 진행 인정. 기존 공개 모델 대비 성능 도약(step change) 가장 강력한 모델
: 해당 모델 존재는 공개 데이터 캐시 유출을 통해 드러남. 모델명 Claude Mythos, 학습 완료 상태
: 모델 티어는 Capybara로, 기존 Opus 상위 등급. 소프트웨어 코딩, 학문적 추론, 사이버보안 테스트에서 큰 폭 성능 개선
: Mythos = 모델 이름 / Capybara = 신규 최상위 티어. 동일 파운데이션 모델을 지칭하는 다른 표현
: 초기에는 소수 enterprise 고객 대상 early access 형태로 제한적 배포. 높은 운영 비용으로 일반 공개는 지연 가능성
: 모델이 전례 없는 사이버보안 리스크를 가질 수 있다고 내부 문서에서 언급. 단순 성능 향상을 넘어 offensive capability 강화 시사
: 공개 데이터에는 유럽 CEO 초청 서밋 정보도 포함. 대기업 대상 AI 판매 전략의 일환
: 약 3,000개 미공개 콘텐츠 자산 노출. 제품 출시 직전 단계에서 발생한 유출로 추정
→ 프론티어 AI 기업은 공개 모델보다 강력한 내부 모델 보유 중(ex, 앤스로픽 Claude Mythos, 오픈AI Spud)
https://t.me/Samsung_Global_AI_SW
: 앤스로픽, 신규 AI 모델 개발 및 초기 고객 대상 테스트 진행 인정. 기존 공개 모델 대비 성능 도약(step change) 가장 강력한 모델
: 해당 모델 존재는 공개 데이터 캐시 유출을 통해 드러남. 모델명 Claude Mythos, 학습 완료 상태
: 모델 티어는 Capybara로, 기존 Opus 상위 등급. 소프트웨어 코딩, 학문적 추론, 사이버보안 테스트에서 큰 폭 성능 개선
: Mythos = 모델 이름 / Capybara = 신규 최상위 티어. 동일 파운데이션 모델을 지칭하는 다른 표현
: 초기에는 소수 enterprise 고객 대상 early access 형태로 제한적 배포. 높은 운영 비용으로 일반 공개는 지연 가능성
: 모델이 전례 없는 사이버보안 리스크를 가질 수 있다고 내부 문서에서 언급. 단순 성능 향상을 넘어 offensive capability 강화 시사
: 공개 데이터에는 유럽 CEO 초청 서밋 정보도 포함. 대기업 대상 AI 판매 전략의 일환
: 약 3,000개 미공개 콘텐츠 자산 노출. 제품 출시 직전 단계에서 발생한 유출로 추정
→ 프론티어 AI 기업은 공개 모델보다 강력한 내부 모델 보유 중(ex, 앤스로픽 Claude Mythos, 오픈AI Spud)
https://t.me/Samsung_Global_AI_SW
👍3
영상 생성 AI 트래픽 점유율 추이(by Similarweb)
: 오픈AI Sora가 감소하고, xAI Grok Imagine이 성장
: 다만 공개적으로 접근 가능한 제품 URL 트래픽 기반. 일부는 플랫폼 내에서 사용되기 때문에, 해당 사용량은 완전히 반영되지 않았을 수 있다는 한계 명시
https://t.me/Samsung_Global_AI_SW
: 오픈AI Sora가 감소하고, xAI Grok Imagine이 성장
: 다만 공개적으로 접근 가능한 제품 URL 트래픽 기반. 일부는 플랫폼 내에서 사용되기 때문에, 해당 사용량은 완전히 반영되지 않았을 수 있다는 한계 명시
https://t.me/Samsung_Global_AI_SW
👍2❤1