저커버그, 자신의 업무를 지원하는 CEO 에이전트 개발 중
: 조직 내 보고 체계를 거치지 않고 정보를 빠르게 확보하는 용도
: 메타의 조직 구조 평면화 및 개인 생산성 중심으로 재편. 팀 계층 축소 및 개인 기여자 중심 구조 강화
: AI 도구 사용을 성과 평가에 반영. 기업 내부 전반에 AI 활용 확산 가속
: AI 기반 업무 자동화 도구 급속 확산. 직원들이 자체적으로 AI 툴 개발 및 활용 사례 공유
: 개인 AI 에이전트 간 상호작용 환경 구축. 직원 에이전트끼리 대신 커뮤니케이션 수행
: My Claw, Second Brain 등 개인 에이전트 도입 확대. ‘AI 비서실장’ 역할 수행
: AI 네이티브 조직 전환 가속. 대기업 구조를 스타트업 수준 생산성으로 재설계 추진
: 개인 단위 생산성 극대화 전략. 소수 인력으로 더 큰 산출을 내는 구조 지향
https://t.me/Samsung_Global_AI_SW
: 조직 내 보고 체계를 거치지 않고 정보를 빠르게 확보하는 용도
: 메타의 조직 구조 평면화 및 개인 생산성 중심으로 재편. 팀 계층 축소 및 개인 기여자 중심 구조 강화
: AI 도구 사용을 성과 평가에 반영. 기업 내부 전반에 AI 활용 확산 가속
: AI 기반 업무 자동화 도구 급속 확산. 직원들이 자체적으로 AI 툴 개발 및 활용 사례 공유
: 개인 AI 에이전트 간 상호작용 환경 구축. 직원 에이전트끼리 대신 커뮤니케이션 수행
: My Claw, Second Brain 등 개인 에이전트 도입 확대. ‘AI 비서실장’ 역할 수행
: AI 네이티브 조직 전환 가속. 대기업 구조를 스타트업 수준 생산성으로 재설계 추진
: 개인 단위 생산성 극대화 전략. 소수 인력으로 더 큰 산출을 내는 구조 지향
https://t.me/Samsung_Global_AI_SW
👍3🔥1
[삼성 이영진] 글로벌 AI/SW
프론티어 AI 기업과 사모 펀드의 JV 협력 보도 안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다. 오픈AI가 TPG, Advent International, Bain Capital, Brookfield Asset Management 등 사모 펀드(PE)와 기업용 AI 제품 배포를 위한 JV 설립 논의 보도가 있었습니다. JV의 밸류는 100억 달러 수준으로 사모 펀드는 40억 달러 투자 후 지분을 확보하고, 오픈AI 기술이 포트폴리오 기업에게…
오픈AI, 사모펀드 JV 설립 과정에서 앤스로픽 대비 매력적 조건 제시
: 사모펀드 투자자들에게 최소 17.5% 수익률 보장 + 최신 모델 조기 접근 제공하며 공격적 유치 전략
: 앤스로픽은 동일 JV 구조 추진 중이나 수익 보장 조건 없이 일반 지분 투자 형태 → OpenAI는 금융 구조로 차별화
: JV는 PE 포트폴리오 기업 대상 AI 도구를 빠르게 배포하는 엔터프라이즈 유통 채널 확보 전략, 채택 가속 및 고객 락인 강화 목적
: 고객 맞춤형 모델 구축을 위한 초기 엔지니어 투입 비용을 JV에서 흡수 → 비용 부담 완화 및 확장성 확보
: 다만 일부 사모펀드는 경제성, 유연성, 수익 구조 불확실성 이유로 JV 참여 거부
: 대표적으로 Thoma Bravo는 JV의 장기 수익성에 의문 제기하며 불참 결정, 이미 포트폴리오 기업 내 AI 도입 진행도 고려
: 대형 PE는 별도 투자 없이도 프론티어 AI 기업에 직접 접근 가능하다는 점에서 JV 필요성에 대한 회의론 존재
: 해당 JV는 PE들이 LP로부터 AI 전략 제시 압박을 받고 있는 상황을 반영하나, 실제 추가 수익 창출 여부는 불확실
: 의미 있는 upside는 이사회 의석, 지분 참여, 또는 기타 경제적 권리를 확보한 주요 투자자에게만 제한될 가능성
: 다만 여전히 다수 PE가 JV 참여 논의 중이며, 상당수는 이사회 참여 없이 소수 지분 투자 형태 예상
: 해당 투자구조에는 투자자 우선순위(seniority) 및 손실 방어 장치 포함
https://t.me/Samsung_Global_AI_SW
: 사모펀드 투자자들에게 최소 17.5% 수익률 보장 + 최신 모델 조기 접근 제공하며 공격적 유치 전략
: 앤스로픽은 동일 JV 구조 추진 중이나 수익 보장 조건 없이 일반 지분 투자 형태 → OpenAI는 금융 구조로 차별화
: JV는 PE 포트폴리오 기업 대상 AI 도구를 빠르게 배포하는 엔터프라이즈 유통 채널 확보 전략, 채택 가속 및 고객 락인 강화 목적
: 고객 맞춤형 모델 구축을 위한 초기 엔지니어 투입 비용을 JV에서 흡수 → 비용 부담 완화 및 확장성 확보
: 다만 일부 사모펀드는 경제성, 유연성, 수익 구조 불확실성 이유로 JV 참여 거부
: 대표적으로 Thoma Bravo는 JV의 장기 수익성에 의문 제기하며 불참 결정, 이미 포트폴리오 기업 내 AI 도입 진행도 고려
: 대형 PE는 별도 투자 없이도 프론티어 AI 기업에 직접 접근 가능하다는 점에서 JV 필요성에 대한 회의론 존재
: 해당 JV는 PE들이 LP로부터 AI 전략 제시 압박을 받고 있는 상황을 반영하나, 실제 추가 수익 창출 여부는 불확실
: 의미 있는 upside는 이사회 의석, 지분 참여, 또는 기타 경제적 권리를 확보한 주요 투자자에게만 제한될 가능성
: 다만 여전히 다수 PE가 JV 참여 논의 중이며, 상당수는 이사회 참여 없이 소수 지분 투자 형태 예상
: 해당 투자구조에는 투자자 우선순위(seniority) 및 손실 방어 장치 포함
https://t.me/Samsung_Global_AI_SW
👍3😱1
오픈AI, 완전 자동화된 AI 연구자 구축에 집중
: 오픈AI 최고 과학자 Jakub Pachocki는 인터뷰에서 AI 연구자 시스템 구축이 향후 몇 년간의 북극성(North Star)가 될 것이라 언급
: 완전 자동화를 목표로 한 에이전트 기반 시스템으로, 스스로 대규모, 복잡한 문제 해결을 지향하며 추론 모델, 에이전트, 해석 가능성 등 다양한 연구 축 통합
: 오픈AI는 ‘26년 9월 자율적 AI 연구 인턴 개발을 목표로 하고, ‘28년에는 완전 자동화된 멀티 에이전트 연구 시스템으로 발전시킬 계획
: Codex는 AI 연구자의 초기 형태로, 장시간 자율 작업 및 범용 문제 해결 능력 중심으로 지속적 성능 개선 예상
: 핵심 기술 방향은 단순 성능 향상이 아니라 인간 개입 없이 장시간 작업을 수행하는 ‘자율 실행(long-running autonomy)’ 확보
: 코딩 에이전트를 출발점으로 수학·과학·비즈니스 등 범용 문제 해결로 확장 가능한 방향성 제시
: GPT-5 기반으로 수학·생물·화학 등에서 새로운 해법 제시 및 문제 돌파 사례 등장
: 개발 패러다임은 사람이 직접 수행하기보다 에이전트 집단을 관리하는 방향으로 변화. 현재 주요 병목은 멀티스텝 작업에서의 오류 누적
: 안전 대응은 chain-of-thought 모니터링 중심 — 모델의 사고 과정을 기록, 감시. 고성능 시스템은 샌드박스 환경에서 제한적으로 운영 필요
: 장기적으로 데이터센터 단위에서 연구소 수준 기능 수행 가능성 제시
: AGI는 ‘28년까지 전면적 인간 수준 지능은 어려우나, 모든 영역에서 인간 수준이 아니어도 충분히 큰 변화를 만들 수 있다는 입장
https://t.me/Samsung_Global_AI_SW
: 오픈AI 최고 과학자 Jakub Pachocki는 인터뷰에서 AI 연구자 시스템 구축이 향후 몇 년간의 북극성(North Star)가 될 것이라 언급
: 완전 자동화를 목표로 한 에이전트 기반 시스템으로, 스스로 대규모, 복잡한 문제 해결을 지향하며 추론 모델, 에이전트, 해석 가능성 등 다양한 연구 축 통합
: 오픈AI는 ‘26년 9월 자율적 AI 연구 인턴 개발을 목표로 하고, ‘28년에는 완전 자동화된 멀티 에이전트 연구 시스템으로 발전시킬 계획
: Codex는 AI 연구자의 초기 형태로, 장시간 자율 작업 및 범용 문제 해결 능력 중심으로 지속적 성능 개선 예상
: 핵심 기술 방향은 단순 성능 향상이 아니라 인간 개입 없이 장시간 작업을 수행하는 ‘자율 실행(long-running autonomy)’ 확보
: 코딩 에이전트를 출발점으로 수학·과학·비즈니스 등 범용 문제 해결로 확장 가능한 방향성 제시
: GPT-5 기반으로 수학·생물·화학 등에서 새로운 해법 제시 및 문제 돌파 사례 등장
: 개발 패러다임은 사람이 직접 수행하기보다 에이전트 집단을 관리하는 방향으로 변화. 현재 주요 병목은 멀티스텝 작업에서의 오류 누적
: 안전 대응은 chain-of-thought 모니터링 중심 — 모델의 사고 과정을 기록, 감시. 고성능 시스템은 샌드박스 환경에서 제한적으로 운영 필요
: 장기적으로 데이터센터 단위에서 연구소 수준 기능 수행 가능성 제시
: AGI는 ‘28년까지 전면적 인간 수준 지능은 어려우나, 모든 영역에서 인간 수준이 아니어도 충분히 큰 변화를 만들 수 있다는 입장
https://t.me/Samsung_Global_AI_SW
👍3❤1🔥1
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/24)
■ 오픈AI, 전 메타 핵심 광고 임원 Dave Dugan 영입. 광고 영업 총괄 담당
■ 오픈AI, 핵융합 스타트업 Helion Energy와 전력 구매 협상 진행. 샘 올트먼은 이해상충을 피하기 위해 Helion 이사회에서 사임
■ 오픈AI, 챗GPT 내 파일 관리 및 재사용을 위한 Library 기능 도입
■ 앤스로픽,AI 기반 과학 연구와 발견을 공유하기 위한 ‘Anthropic Science’ 블로그 출시
■ 앤스로픽, Claude가 사용자 대신 컴퓨터를 직접 조작해 작업을 수행하는 기능 프리뷰로 출시
■ 메타, AI 협업 및 생산성 툴 개발 스타트업 Dreamer 팀 영입
■ 미니맥스, 멀티모달 통합 API 구매 모델 MiniMax Token Plan 출시
■ 알리바바, 기업 업무 자동화를 위한 AI 에이전트 Accio Work 출시
■ 알리바바, OpenClaw 기반 에이전트 경험을 디바이스로 확장하기 위한 JVS Book 노트북과 JVS Box 미니 PC 출시 계획
■ AI 코딩 스타트업 Lovable, M&A 기회 적극 검토 중
■ 엘리자베스 워런 미 상원의원, 국방부의 앤스로픽 공급망 리스크 지적이 징벌적 대응일 가능성이 있다고 지적
■ HSBC, AI 도입 확대를 위해 David Rice를 CAIO로 임명
감사합니다.
■ 오픈AI, 전 메타 핵심 광고 임원 Dave Dugan 영입. 광고 영업 총괄 담당
■ 오픈AI, 핵융합 스타트업 Helion Energy와 전력 구매 협상 진행. 샘 올트먼은 이해상충을 피하기 위해 Helion 이사회에서 사임
■ 오픈AI, 챗GPT 내 파일 관리 및 재사용을 위한 Library 기능 도입
■ 앤스로픽,AI 기반 과학 연구와 발견을 공유하기 위한 ‘Anthropic Science’ 블로그 출시
■ 앤스로픽, Claude가 사용자 대신 컴퓨터를 직접 조작해 작업을 수행하는 기능 프리뷰로 출시
■ 메타, AI 협업 및 생산성 툴 개발 스타트업 Dreamer 팀 영입
■ 미니맥스, 멀티모달 통합 API 구매 모델 MiniMax Token Plan 출시
■ 알리바바, 기업 업무 자동화를 위한 AI 에이전트 Accio Work 출시
■ 알리바바, OpenClaw 기반 에이전트 경험을 디바이스로 확장하기 위한 JVS Book 노트북과 JVS Box 미니 PC 출시 계획
■ AI 코딩 스타트업 Lovable, M&A 기회 적극 검토 중
■ 엘리자베스 워런 미 상원의원, 국방부의 앤스로픽 공급망 리스크 지적이 징벌적 대응일 가능성이 있다고 지적
■ HSBC, AI 도입 확대를 위해 David Rice를 CAIO로 임명
감사합니다.
👍2
젠슨 황, “우리는 이미 AGI에 도달했다” 발언
렉스 프리드먼(Lex Friedman) 팟캐스트에서
“AI가 스스로 시작해서 성장시키고, 10억 달러 이상의 가치가 있는 기술 회사를 운영할 수 있는 시점이 언제라고 보느냐”는 질문에 대한 답변
→ 지속 가능한 기업 운영이 아닌 단기적 바이럴 성공 기준. 질문자가 정의한 AGI도 일반적으로 정의되는 AGI와 괴리 존재
https://youtu.be/vif8NQcjVf0
렉스 프리드먼(Lex Friedman) 팟캐스트에서
“AI가 스스로 시작해서 성장시키고, 10억 달러 이상의 가치가 있는 기술 회사를 운영할 수 있는 시점이 언제라고 보느냐”는 질문에 대한 답변
지금이라고 생각합니다. 우리는 이미 AGI에 도달했다고 봅니다.
가능하다고 봅니다. 이유는 이겁니다. 당신은 ‘10억 달러’라고만 했고, ‘지속적으로’라고는 말하지 않았어요
어떤 Claw 같은 시스템이 웹 서비스를 만들고, 흥미로운 작은 앱을 하나 만들어서 갑자기 수십억 명이 50센트씩 쓰게 되는 상황도 충분히 가능하다고 생각합니다.
그리고 나서 얼마 지나지 않아 그 서비스가 사라질 수도 있겠죠.
실제로 인터넷 초창기에도 그런 유형의 회사들이 많이 있었습니다.
그리고 그 당시 웹사이트들 대부분은, 오늘날 OpenClaw가 만들어낼 수 있는 것보다 특별히 더 정교한 수준은 아니었습니다.
다만 그게 정확히 어떤 형태일지는 모르겠어요. 당시에도 그런 회사들을 미리 예측할 수는 없었거든요.
→ 지속 가능한 기업 운영이 아닌 단기적 바이럴 성공 기준. 질문자가 정의한 AGI도 일반적으로 정의되는 AGI와 괴리 존재
https://youtu.be/vif8NQcjVf0
❤6
오픈AI, 신규 펀딩 관련 투자자 공유 재무 문서에 리스크 요인 명시
: 거래 관련 리스크(Risks Related to the Transaction)와 사업 관련 리스크(Risks Related to our Business)섹션 포함
: 마이크로소프트와의 긴밀한 관계가 잠재적 리스크가 될 수 있다고 언급. MS가 자금 조달과 컴퓨팅의 상당 부분을 담당하고 있다는 내용
“마이크로소프트가 우리와의 상업적 파트너십을 수정 또는 종료하거나, 우리가 사업 파트너를 성공적으로 다각화하지 못할 경우, 우리의 사업, 전망, 운영 성과 및 재무 상태에 부정적인 영향을 미칠 수 있다.”
: 이외에도 막대한 자본 지출, 컴퓨팅 자원 의존, xAI와의 지속적인 소송, 오픈AI 공익법인의 구조 등을 주요 리스크로 언급
: 문서에 따르면 ‘30년까지 약 6,650억 달러 규모의 컴퓨팅 관련 지출 약정을 보유하고 있으며, “컴퓨팅 수요는 매우 동적이며 향후 크게 확대될 수 있다”고 덧붙임
: AI 모델 학습 및 운영에 막대한 컴퓨팅 자원이 필요하며, 글로벌 반도체 공급 부족이 사업에 타격을 줄 수 있다는 리스크 요인도 언급(TSMC 관련 지정학 리스크)
: 향후 운영 성과는 마이크로소프트 외 다른 파트너들과의 관계를 성공적으로 구축할 수 있는 능력에 달려 있다는 내용도 포함
: 오픈AI 대변인은 성명에서 “잠재적인 IPO와는 무관한 일반적 법적 리스크 공시”라고 설명
https://t.me/Samsung_Global_AI_SW
: 거래 관련 리스크(Risks Related to the Transaction)와 사업 관련 리스크(Risks Related to our Business)섹션 포함
: 마이크로소프트와의 긴밀한 관계가 잠재적 리스크가 될 수 있다고 언급. MS가 자금 조달과 컴퓨팅의 상당 부분을 담당하고 있다는 내용
“마이크로소프트가 우리와의 상업적 파트너십을 수정 또는 종료하거나, 우리가 사업 파트너를 성공적으로 다각화하지 못할 경우, 우리의 사업, 전망, 운영 성과 및 재무 상태에 부정적인 영향을 미칠 수 있다.”
: 이외에도 막대한 자본 지출, 컴퓨팅 자원 의존, xAI와의 지속적인 소송, 오픈AI 공익법인의 구조 등을 주요 리스크로 언급
: 문서에 따르면 ‘30년까지 약 6,650억 달러 규모의 컴퓨팅 관련 지출 약정을 보유하고 있으며, “컴퓨팅 수요는 매우 동적이며 향후 크게 확대될 수 있다”고 덧붙임
: AI 모델 학습 및 운영에 막대한 컴퓨팅 자원이 필요하며, 글로벌 반도체 공급 부족이 사업에 타격을 줄 수 있다는 리스크 요인도 언급(TSMC 관련 지정학 리스크)
: 향후 운영 성과는 마이크로소프트 외 다른 파트너들과의 관계를 성공적으로 구축할 수 있는 능력에 달려 있다는 내용도 포함
: 오픈AI 대변인은 성명에서 “잠재적인 IPO와는 무관한 일반적 법적 리스크 공시”라고 설명
https://t.me/Samsung_Global_AI_SW
👍4❤2
오픈AI Codex, 소프트웨어 재설계 인프라로 진화
→ Codex는 기존 시스템을 자동으로 리팩토링하는 핵심 생산성 인프라로 자리잡는 중
https://t.me/Samsung_Global_AI_SW
Codex 팀은 앞으로의 모델 발전에 맞춰 확장 가능하도록 시스템 전반을 사실상 end-to-end로 재설계하는 작업을 진행 중이다. 그리고 이 모든 리팩토링을 Codex가 도와주고 있어서 다행이다. 그렇지 않았다면 몇 달은 걸렸을 것이다.
→ Codex는 기존 시스템을 자동으로 리팩토링하는 핵심 생산성 인프라로 자리잡는 중
https://t.me/Samsung_Global_AI_SW
👍3
딥시크, 채용 공고를 통해 에이전틱 AI 전환 본격화
: 채용 직무에는 ‘에이전트 딥러닝 알고리즘 연구원’, ‘에이전트 데이터 평가 전문가’, 에이전트 인프라 엔지니어’ 등 포함
: 공고에서는 검색, 콘텐츠 생성, 멀티모달 및 에이전트 시나리오에서 딥시크 모델 적용 관여할 것을 요구
: 또한 강화학습 관련 숙련도 강조. Claude Code와 Cursor 능가 목표 명시
: 차기 모델 V4는 코딩 및 장문 컨텍스트 기반 소프트웨어 엔지니어링 작업에 최적화되었다는 보도. 자국 반도체 기업 협력
: OpenClaw 확산 등 중국 내 에이전트 붐 속 자율 실행형 AI로 전략 전환
https://t.me/Samsung_Global_AI_SW
: 채용 직무에는 ‘에이전트 딥러닝 알고리즘 연구원’, ‘에이전트 데이터 평가 전문가’, 에이전트 인프라 엔지니어’ 등 포함
: 공고에서는 검색, 콘텐츠 생성, 멀티모달 및 에이전트 시나리오에서 딥시크 모델 적용 관여할 것을 요구
: 또한 강화학습 관련 숙련도 강조. Claude Code와 Cursor 능가 목표 명시
: 차기 모델 V4는 코딩 및 장문 컨텍스트 기반 소프트웨어 엔지니어링 작업에 최적화되었다는 보도. 자국 반도체 기업 협력
: OpenClaw 확산 등 중국 내 에이전트 붐 속 자율 실행형 AI로 전략 전환
https://t.me/Samsung_Global_AI_SW
👍2
앤스로픽, Claude의 컴퓨터 유즈 기능 공개
: Claude Code와 Cowork에 적용. 화면 인식 기반으로 마우스, 키보드 조작 및 브라우저 탐색 수행
: 파일 열기, 웹 탐색, 개발 도구 실행 등 실제 PC 작업을 직접 수행 가능
: Slack·구글 캘린더 등 커넥터 우선 활용, 미지원 도구는 화면 직접 조작으로 대응
: 지난주 : 모바일 및 데스크탑 연속 작업 기능인 ‘Dispatch’ 출시 → 원격 작업 위임 가능
: 컴퓨터 유즈 기능 결합 시 ‘완전한 작업 대행 에이전트’로 확장 가능성
https://claude.com/product/cowork#dispatch-and-computer-use
https://youtu.be/NAauIR6JFps
: Claude Code와 Cowork에 적용. 화면 인식 기반으로 마우스, 키보드 조작 및 브라우저 탐색 수행
: 파일 열기, 웹 탐색, 개발 도구 실행 등 실제 PC 작업을 직접 수행 가능
: Slack·구글 캘린더 등 커넥터 우선 활용, 미지원 도구는 화면 직접 조작으로 대응
: 지난주 : 모바일 및 데스크탑 연속 작업 기능인 ‘Dispatch’ 출시 → 원격 작업 위임 가능
: 컴퓨터 유즈 기능 결합 시 ‘완전한 작업 대행 에이전트’로 확장 가능성
https://claude.com/product/cowork#dispatch-and-computer-use
https://youtu.be/NAauIR6JFps
Claude
Cowork: Claude Code power for knowledge work | Claude by Anthropic
Give Claude access to your local files and let it complete tasks autonomously. Claude Cowork brings Claude Code's agentic capabilities to the desktop app for non-technical work.
👍3❤2
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/25)
■ 오픈AI, 100억 달러 규모 추가 펀딩 계약 근접. MGX, Coatue, Thrive Capital, Altimeter Capital 등이 참여 예정. 신규 펀딩 포함시 밸류에이션 8,500억 달러
■ 샘 올트먼, 안전 및 보안 조직에 대한 감독 권한을 내려놓고 자본 조달과 인프라에 집중. 차세대 AI 모델 Spud 초기 개발 완료 언급
■ 오픈AI, 영상 AI 플랫폼 앱 Sora 중단
■ 오픈AI, 디즈니와 파트너십을 3개월 만에 조기 종료. 3년간의 라이센싱 계약 및 10억 달러 투자 포함
■ 앤스로픽, Claude Code 내 작업 승인 여부를 AI가 스스로 판단해 자동 실행하는 자율 에이전트 기능 Auto Mode 공개
■ 마이크로소프트, 텍사스 애빌린 데이터센터 내 700MW 규모 캐파 임대 계약
■ 마이크로소프트-엔비디아, 원자력 AI 협력 발표. AI와 디지털 트윈을 활용해 원자력 발전의 인허가, 설계, 건설, 운영 전 과정을 표준화 및 자동화
■ 메타, 앤드류 보스워츠에게 AI For Work 이니셔티브 총괄 지위 부여. 조직 내 AI 도입을 통한 AI 네이티브 기업 전환 목적
■ 아마존, 로보틱스 스타트업 Fauna Robotics 인수를 통해 소비자용 휴머노이드 시장 진입
■ 아마존, 직원 감축 이후 내부 AI 에이전트 도입 가속화
■ AWS, 바레인 데이터센터가 드론 공격으로 이번 달 두번째 운영 장애 발생
■ ARM, AI 데이터센터 및 에이전틱 AI 워크로드용 AGI CPU 공개. 메타와 오픈AI가 초기 고객
■ Crusoe, Form Energy의 12GWh 규모 장기 저장 배터리 구매. 27년부터 공급 시작 예정
■ 데이터브릭스, AI 보안 스타트업 2곳(Antimatter, SiftD. Ai) 인수
■ 딥시크, 에이전틱 AI 관련 신규 채용 공고 확대
감사합니다.
■ 오픈AI, 100억 달러 규모 추가 펀딩 계약 근접. MGX, Coatue, Thrive Capital, Altimeter Capital 등이 참여 예정. 신규 펀딩 포함시 밸류에이션 8,500억 달러
■ 샘 올트먼, 안전 및 보안 조직에 대한 감독 권한을 내려놓고 자본 조달과 인프라에 집중. 차세대 AI 모델 Spud 초기 개발 완료 언급
■ 오픈AI, 영상 AI 플랫폼 앱 Sora 중단
■ 오픈AI, 디즈니와 파트너십을 3개월 만에 조기 종료. 3년간의 라이센싱 계약 및 10억 달러 투자 포함
■ 앤스로픽, Claude Code 내 작업 승인 여부를 AI가 스스로 판단해 자동 실행하는 자율 에이전트 기능 Auto Mode 공개
■ 마이크로소프트, 텍사스 애빌린 데이터센터 내 700MW 규모 캐파 임대 계약
■ 마이크로소프트-엔비디아, 원자력 AI 협력 발표. AI와 디지털 트윈을 활용해 원자력 발전의 인허가, 설계, 건설, 운영 전 과정을 표준화 및 자동화
■ 메타, 앤드류 보스워츠에게 AI For Work 이니셔티브 총괄 지위 부여. 조직 내 AI 도입을 통한 AI 네이티브 기업 전환 목적
■ 아마존, 로보틱스 스타트업 Fauna Robotics 인수를 통해 소비자용 휴머노이드 시장 진입
■ 아마존, 직원 감축 이후 내부 AI 에이전트 도입 가속화
■ AWS, 바레인 데이터센터가 드론 공격으로 이번 달 두번째 운영 장애 발생
■ ARM, AI 데이터센터 및 에이전틱 AI 워크로드용 AGI CPU 공개. 메타와 오픈AI가 초기 고객
■ Crusoe, Form Energy의 12GWh 규모 장기 저장 배터리 구매. 27년부터 공급 시작 예정
■ 데이터브릭스, AI 보안 스타트업 2곳(Antimatter, SiftD. Ai) 인수
■ 딥시크, 에이전틱 AI 관련 신규 채용 공고 확대
감사합니다.
👍5
[삼성 이영진] 글로벌 AI/SW
오픈AI, Sora 2 출시 : 이전 세대 모델보다 물리적으로 정확하고, 실패 상황까지 시뮬레이션. 사실적 모델링 가능 : 복잡한 지시사항을 따르며 여러 장면을 이어가는 제어 능력 향상 : 범용 영상 및 오디오 생성 시스템. 배경음, 대화, 효과음 동시 생성 지원. 현실 세계 요소 직접 주입 가능 : 새로운 iOS 소셜 앱 “Sora” 출시. 콘텐츠 제작, 리믹스, 탐색 기능. 카메오 기능을 통해 영상 출연 가능 안전 및 청소년 보호 장치 강화.…
오픈AI, Sora 앱 종료 발표
R.I.P Sora 앱(25.9.30-26.3.24)
→ 앱 뿐 아니라 API 중단 및 챗GPT 통합 계획 보류 보도. 디즈니 라이선싱 딜과 지분 투자도 철회
https://t.me/Samsung_Global_AI_SW
R.I.P Sora 앱(25.9.30-26.3.24)
우리는 Sora 앱과 작별을 고합니다.
Sora로 창작하고, 공유하고, 커뮤니티를 만들어준 모든 분들께 감사합니다.
여러분이 Sora로 만든 것들은 의미가 있었고, 이번 소식이 실망스러울 수 있다는 것도 잘 알고 있습니다.
앱과 API의 일정, 그리고 작업을 보존하는 방법에 대한 자세한 내용은 곧 공유하겠습니다. — Sora 팀
→ 앱 뿐 아니라 API 중단 및 챗GPT 통합 계획 보류 보도. 디즈니 라이선싱 딜과 지분 투자도 철회
https://t.me/Samsung_Global_AI_SW
😱4🔥1
오픈AI, 조직 개편과 차세대 모델 ‘Spud’ 사전 학습 완료
: 샘 올트먼은 내부 메모를 통해 조직 개편, 권한 조정, 제품 및 모델 로드맵 방향성 제시
: 올트먼은 안전 및 보안 팀에 대한 직접 관할을 내려놓고, 자본 조달, 공급망 관리, 데이터센터 구축에 집중
: 안전 팀은 마크 첸 CRO 산하 연구 조직으로 이동. 보안 팀은 그렉 브록먼 산하 스케일링 조직으로 재편
: 피지 시모가 이끄는 제품 조직 명칭을 AGI 배포(AGI Deployment)로 변경. 연구 중심에서 실제 배포 단계로의 전환 시사
: 차세대 AI 모델 코드명 ‘Spud’ 사전 학습 완료. 수주 내 공개 예정이며, 실질적 경제 성장 가속화 기대
: Sora 앱과 API 중단. 차세대 모델 구동을 위한 컴퓨팅 자원 재배치 및 우선순위 재정렬 목적
: Sora 연구팀은 월드 모델 연구로 전환. 로봇 공학 중심의 장기 시뮬레이션에 집중. 물리적 경제의 자동화 목표
https://t.me/Samsung_Global_AI_SW
: 샘 올트먼은 내부 메모를 통해 조직 개편, 권한 조정, 제품 및 모델 로드맵 방향성 제시
: 올트먼은 안전 및 보안 팀에 대한 직접 관할을 내려놓고, 자본 조달, 공급망 관리, 데이터센터 구축에 집중
: 안전 팀은 마크 첸 CRO 산하 연구 조직으로 이동. 보안 팀은 그렉 브록먼 산하 스케일링 조직으로 재편
: 피지 시모가 이끄는 제품 조직 명칭을 AGI 배포(AGI Deployment)로 변경. 연구 중심에서 실제 배포 단계로의 전환 시사
: 차세대 AI 모델 코드명 ‘Spud’ 사전 학습 완료. 수주 내 공개 예정이며, 실질적 경제 성장 가속화 기대
: Sora 앱과 API 중단. 차세대 모델 구동을 위한 컴퓨팅 자원 재배치 및 우선순위 재정렬 목적
: Sora 연구팀은 월드 모델 연구로 전환. 로봇 공학 중심의 장기 시뮬레이션에 집중. 물리적 경제의 자동화 목표
https://t.me/Samsung_Global_AI_SW
👍2❤1👏1
오픈AI, 챗GPT 쇼핑 탐색 기능 강화 및 ACP 기반 커머스 플랫폼 확장
: 챗GPT 내에서 제품 탐색, 비교, 의사결정을 통합하는 쇼핑 경험 출시
: 텍스트 대화 기반으로 조건을 구체화하고, 시각적 UI를 통해 상품을 직관적으로 탐색 가능
: 가격, 리뷰, 기능 등을 한 화면에서 비교 제공, 기존 탭 기반 검색 대비 탐색 효율 대폭 개선
: 이미지 업로드를 통한 유사 상품 추천 기능 추가, 탐색 방식 고도화
: Agentic Commerce Protocol(ACP)을 제품 탐색 영역까지 확장, 커머스 데이터 통합 레이어 구축
: ACP를 통해 판매자 카탈로그, 프로모션 데이터 연결. 향후 개인화·재고·배송 정보까지 확장 예정
: Target, Walmart, Sephora 등 주요 리테일러 참여, Shopify는 자동 연동 구조로 상품 노출 확대
: Instant Checkout 축소, 대신 판매자 자체 결제 시스템 유지
: Walmart는 챗GPT 내 앱 형태로 직접 통합, 계정 연동, 결제까지 확장된 커머스 경험 제공
: Free·Go·Plus·Pro 전 사용자 대상 출시, 챗GPT를 검색을 넘어 커머스 진입점으로 확장 목표
→ 결제 기능 직접 수행보다, 구매 결정에 영향을 미치는 탐색, 비교 단계에 집중하는 전략으로 전환
https://openai.com/index/powering-product-discovery-in-chatgpt/
: 챗GPT 내에서 제품 탐색, 비교, 의사결정을 통합하는 쇼핑 경험 출시
: 텍스트 대화 기반으로 조건을 구체화하고, 시각적 UI를 통해 상품을 직관적으로 탐색 가능
: 가격, 리뷰, 기능 등을 한 화면에서 비교 제공, 기존 탭 기반 검색 대비 탐색 효율 대폭 개선
: 이미지 업로드를 통한 유사 상품 추천 기능 추가, 탐색 방식 고도화
: Agentic Commerce Protocol(ACP)을 제품 탐색 영역까지 확장, 커머스 데이터 통합 레이어 구축
: ACP를 통해 판매자 카탈로그, 프로모션 데이터 연결. 향후 개인화·재고·배송 정보까지 확장 예정
: Target, Walmart, Sephora 등 주요 리테일러 참여, Shopify는 자동 연동 구조로 상품 노출 확대
: Instant Checkout 축소, 대신 판매자 자체 결제 시스템 유지
: Walmart는 챗GPT 내 앱 형태로 직접 통합, 계정 연동, 결제까지 확장된 커머스 경험 제공
: Free·Go·Plus·Pro 전 사용자 대상 출시, 챗GPT를 검색을 넘어 커머스 진입점으로 확장 목표
→ 결제 기능 직접 수행보다, 구매 결정에 영향을 미치는 탐색, 비교 단계에 집중하는 전략으로 전환
https://openai.com/index/powering-product-discovery-in-chatgpt/
Openai
Powering Product Discovery in ChatGPT
ChatGPT introduces richer, visually immersive shopping powered by the Agentic Commerce Protocol, enabling product discovery, side-by-side comparisons, and merchant integration.
👍2❤1
팔란티어 & 안두릴, 골든 돔 미사일 방어 시스템 소프트웨어 개발 컨소시엄 참여
: 컨소시엄은 올 여름 테스트를 목표로 소프트웨어를 준비 중. Aalyria, Scale AI, Swoop 등 AI, 네트워크 기업들도 참여
: 소프트웨어는 센서, 레이더, 요격체계를 연결하는 ‘지휘통제(C2) OS’ 역할로, 시스템의 핵심 아키텍처
: 실제 시연 성공 시 1,850억 달러 규모 방어 시스템의 중심 레이어로 자리잡으며, 장기 개발·유지보수 매출 기회 확보
: 프로젝트는 미 우주군 마이클 게틀라인 장군이 총괄하며, 소프트웨어는 유일하게 직속 조직에서 직접 관리
: 기존 방산 기업(Lockheed, Northrop 등)은 메인 컨트랙터가 아닌 테크 기업 하청 구조로 참여
https://t.me/Samsung_Global_AI_SW
: 컨소시엄은 올 여름 테스트를 목표로 소프트웨어를 준비 중. Aalyria, Scale AI, Swoop 등 AI, 네트워크 기업들도 참여
: 소프트웨어는 센서, 레이더, 요격체계를 연결하는 ‘지휘통제(C2) OS’ 역할로, 시스템의 핵심 아키텍처
: 실제 시연 성공 시 1,850억 달러 규모 방어 시스템의 중심 레이어로 자리잡으며, 장기 개발·유지보수 매출 기회 확보
: 프로젝트는 미 우주군 마이클 게틀라인 장군이 총괄하며, 소프트웨어는 유일하게 직속 조직에서 직접 관리
: 기존 방산 기업(Lockheed, Northrop 등)은 메인 컨트랙터가 아닌 테크 기업 하청 구조로 참여
https://t.me/Samsung_Global_AI_SW
👍4❤2
[삼성 이영진] 글로벌 AI/SW
중국 상무부, 메타-Manus 인수의 기술 수출 통제 위반 가능성 검토 : 메타의 마누스 인수는 미국 기업이 중국 AI 스타트업을 인수하는 드문 사례 : 중국 상무부는 마누스 인력과 기술의 싱가포르 이전과 이후 메타 매각이 중국 법률 상 수출 허가 대상에 해당하는지 여부 검토 시작 : 초기 단계로 공식 조사로 이어지지 않을 수도 있지만, 수출 허가가 필요하다는 판단의 경우 중국 정부는 거래에 개입할 수 있는 수단 확보. 극단적으로 거래 철회 압박 가능…
중국 규제 당국, Manus 공동 창업자 2인 출국 금지 조치
: 규제 당국은 메타의 20억 달러 규모 인수에 대한 투자 규정 위반 여부 검토 중
: Manus의 최고경영자 Xiao Hong과 최고과학자 Ji Yichao는 이달 초 베이징 National Development and Reform Commission(NDRC)에 소환되어 회의 진행
: 회의 이후 검토가 진행되는 동안 중국을 떠날 수 없다는 통보. 국내 이동은 허용
: 해당 사안 해결을 위해 Manus는 현재 법률 및 컨설팅 지원을 적극적으로 모색
https://t.me/Samsung_Global_AI_SW
: 규제 당국은 메타의 20억 달러 규모 인수에 대한 투자 규정 위반 여부 검토 중
: Manus의 최고경영자 Xiao Hong과 최고과학자 Ji Yichao는 이달 초 베이징 National Development and Reform Commission(NDRC)에 소환되어 회의 진행
: 회의 이후 검토가 진행되는 동안 중국을 떠날 수 없다는 통보. 국내 이동은 허용
: 해당 사안 해결을 위해 Manus는 현재 법률 및 컨설팅 지원을 적극적으로 모색
https://t.me/Samsung_Global_AI_SW
👍2😁1
트럼프 대통령, 대통령 과학기술자문위원회(PCAST) 위원 임명 발표
: 행정명령을 통해 설립. 과학기술 분야 최고 수준 인사들이 대통령 자문 및 미국 기술 리더십 강화 전략 제시
: 최대 24명 구성. 추가 위원 및 첫 회의 일정 추후 발표 예정
: 공동 의장은 David Sacks와 Michael Kratsios
: 임명 위원 리스트
- Marc Andreessen - a16z 공동창업자
- Sergey Brin - 구글 공동창업자
- Safra Catz - 오라클 CEO
- Michael Dell - 델 창업자
- Jacob DeWitte - 오클로 CEO
- Fred Ehrsam - 코인베이스 공동창업자
- Larry Ellison - 오라클 창업자
- David Friedberg - 딥테크, 바이오 투자자(The Production Board)
- Jensen Huang - 엔비디아 CEO
- John Martinis - 전 구글 Quantum AI 책임자
- Bob Mumgaard - 커먼웰스 퓨전 CEO
- Lisa Su - AMD CEO
- Mark Zuckerberg - 메타 CEO
https://www.whitehouse.gov/articles/2026/03/president-trump-announces-appointments-to-presidents-council-of-advisors-on-science-and-technology/
: 행정명령을 통해 설립. 과학기술 분야 최고 수준 인사들이 대통령 자문 및 미국 기술 리더십 강화 전략 제시
: 최대 24명 구성. 추가 위원 및 첫 회의 일정 추후 발표 예정
: 공동 의장은 David Sacks와 Michael Kratsios
: 임명 위원 리스트
- Marc Andreessen - a16z 공동창업자
- Sergey Brin - 구글 공동창업자
- Safra Catz - 오라클 CEO
- Michael Dell - 델 창업자
- Jacob DeWitte - 오클로 CEO
- Fred Ehrsam - 코인베이스 공동창업자
- Larry Ellison - 오라클 창업자
- David Friedberg - 딥테크, 바이오 투자자(The Production Board)
- Jensen Huang - 엔비디아 CEO
- John Martinis - 전 구글 Quantum AI 책임자
- Bob Mumgaard - 커먼웰스 퓨전 CEO
- Lisa Su - AMD CEO
- Mark Zuckerberg - 메타 CEO
https://www.whitehouse.gov/articles/2026/03/president-trump-announces-appointments-to-presidents-council-of-advisors-on-science-and-technology/
The White House
President Trump Announces Appointments to President’s Council of Advisors on Science and Technology
Today, President Donald J. Trump appointed the first members to his President’s Council of Advisors on Science and Technology (PCAST). Established by
❤4🤡2
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/26)
■ 구글, AI 메모리 압축 알고리즘 TurboQuant 공개. 추론 최적화에 집중
■ 구글, 신규 음악 생성 AI 모델 Lyria 3 Pro 발표. 최대 3분 길이 음악 트랙 생성
■ 애플, 구글과 계약을 통해 Gemini 모델에 대한 완전한 접근 권한을 자사 데이터센터 내에서 확보. 모델 증류도 가능 언급
■ 메타와 구글(YouTube)이 소셜미디어 중독 피해에 대한 책임을 인정받으며 300만 달러 배상 판결. 메타 측은 즉시 항소 의견
■ 일론 머스크, xAI의 AI 영상 생성 강화 계획. Grok Imagine 제품 업그레이드 시사
■ 메타, 창업 지원 및 AI 도입 확대를 위한 신규 이니셔티브 Meta Small Business 출시
■ 메타, AI 투자 확대에 대한 구조조정으로 700명 규모 감원 단행. 반대로 상위 경영진 보상은 강화
■ xAI 공동창업자 Manuel Kris 퇴사 발표
■ 바이트댄스, 자체 AI 창작 플랫폼 드리미나(Dreamina)에서 영상 생성 모델 Seedscne 2.0과 이미지 생성 모델 Seedream 5.0 Lite 공식 출시
■ 버니 샌더스 상원의원, AI Data Center Moratorium Act 제안. 미국 내 모든 데이터센터 신규 건설 및 업그레이드 중단(모라토리움) 및 미국산 GPU 수출 전면 금지 포함
■ 블랙스톤, 미국의 주요 데이터센터 개발사 Rowan Digital Infrastructure 인수 근접
■ AI 법률 스타트업 Harvey, 신규 펀딩 라운드에서 110억 달러 밸류 확인
■ 세일즈포스, 디렉터급 이상 직원에 대한 연봉 인상 중단
■ 크라우드스트라이크-인텔, 전략적 협력을 확대해 차세대 AI PC의 엔드포인트 보안 강화
감사합니다.
■ 구글, AI 메모리 압축 알고리즘 TurboQuant 공개. 추론 최적화에 집중
■ 구글, 신규 음악 생성 AI 모델 Lyria 3 Pro 발표. 최대 3분 길이 음악 트랙 생성
■ 애플, 구글과 계약을 통해 Gemini 모델에 대한 완전한 접근 권한을 자사 데이터센터 내에서 확보. 모델 증류도 가능 언급
■ 메타와 구글(YouTube)이 소셜미디어 중독 피해에 대한 책임을 인정받으며 300만 달러 배상 판결. 메타 측은 즉시 항소 의견
■ 일론 머스크, xAI의 AI 영상 생성 강화 계획. Grok Imagine 제품 업그레이드 시사
■ 메타, 창업 지원 및 AI 도입 확대를 위한 신규 이니셔티브 Meta Small Business 출시
■ 메타, AI 투자 확대에 대한 구조조정으로 700명 규모 감원 단행. 반대로 상위 경영진 보상은 강화
■ xAI 공동창업자 Manuel Kris 퇴사 발표
■ 바이트댄스, 자체 AI 창작 플랫폼 드리미나(Dreamina)에서 영상 생성 모델 Seedscne 2.0과 이미지 생성 모델 Seedream 5.0 Lite 공식 출시
■ 버니 샌더스 상원의원, AI Data Center Moratorium Act 제안. 미국 내 모든 데이터센터 신규 건설 및 업그레이드 중단(모라토리움) 및 미국산 GPU 수출 전면 금지 포함
■ 블랙스톤, 미국의 주요 데이터센터 개발사 Rowan Digital Infrastructure 인수 근접
■ AI 법률 스타트업 Harvey, 신규 펀딩 라운드에서 110억 달러 밸류 확인
■ 세일즈포스, 디렉터급 이상 직원에 대한 연봉 인상 중단
■ 크라우드스트라이크-인텔, 전략적 협력을 확대해 차세대 AI PC의 엔드포인트 보안 강화
감사합니다.
👍5❤1
구글의 TurboQuant, 메모리 효율성 향상이 가져올 추론 수요 폭발
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
구글이 발표한 TurboQuant는 AI 추론 과정에서 발생하는 KV 캐시 병목을 해결하기 위한 알고리즘입니다.
KV 캐시는 자주 사용되는 정보를 저장해 방대한 데이터베이스 참조 없이 즉시 정보를 불러올 수 있도록 하는 일종의 메모장인데요
병목 완화를 위해 고차원 벡터 크기를 줄이는 전통적 벡터 양자화를 통한 압축 기술 적용이 기존에도 연구되었습니다. 하지만 전통적 방식은 추가 메모리 오버헤드와 정확도 손실이 발생하는데요
반면 TurboQuant는 PolarQuant와 QJL을 결합해 벡터 양자화에서 메모리 오버헤드 문제를 최적으로 해결하는 압축 알고리즘입니다.
PolarQuant는 벡터를 좌표에서 각도(극좌표)로 변환해 데이터 구조를 단순화하고, QJL은 값을 +1과 -1 비트로 표현하는 수학적 기법으로 남은 오차를 보정합니다.
1단계 PolarQuant로 대부분 압축을 실행하고, QJL로 오류를 보정하는 통합 구조입니다.
사람들이 주목한 것은 결과인데요
1) KV 메모리 크기를 최소 6배 축소
2) 추가 학습 및 파인튜닝 없이 KV 캐시를 3비트까지 양자화
3) 모델 정확도를 유지하면서 빠른 실행 속도 달성
특히 H100 기준 4비트 TurboQuant는 32비트 비양자화 대비 8배의 어텐션 연산 속도를 달성했습니다.
KV 캐시 압축을 비롯한 추론 최적화는 지속적으로 연구가 진행되던 분야입니다. 중국 기업들도 상당한 노력을 기울이고 있구요
과거 딥시크의 MLA나 DSA도 KV 캐시로 인한 메모리 및 연산 병목 완화 목적의 연구입니다. MLA는 구조 변경 DSA는 선택적 어텐션을 통해 접근했습니다.
물론 구글의 TurboQuant는 KV 저장 및 사용 구조를 유지하면서 모델 수정 없이 바로 적용이 가능하고 이론적으로 무손실에 가까운 압축을 달성한다는 점에서는 차별화되는 부분이 있습니다.
TurboQuant 알고리즘이 활용된다면 추론 비용 하락을 달성할 수 있습니다. 하지만 오히려 수요는 폭발 할 것입니다. 속도 및 퀄리티 하향 없이 장기 컨텍스트 윈도우 및 대규모 배치의 활용이 가능하니까요
또한 로컬 모델에서도 대규모 컨텍스트 윈도우 활용이 가능해집니다. 온디바이스 개화로도 이어질 수 있는 포인트입니다.
추론 작업에 대한 메모리 공간이 추가로 생긴다고 하더라도 에이전트 AI 확대 속 이를 상회하고도 남는 전체 추론 수요 상승 트렌드는 이미 이어지고 있습니다.
작년 딥시크 이슈 때도 대두되었던 제본스의 역설(비용 하락에 따른 수요 급증)이 재확인될 가능성이 높다고 생각합니다. 쿼리와 토큰량의 기울기는 다시 한 번 가팔라질 수 있습니다.
세상을 뒤흔들고 있지만, 방금 나온 따끈한 새로운 기술은 아닙니다. 이미 25년 4월에 논문으로 공개된 내용입니다. 시스템 레벨에서 적용한 사례가 추가되어 블로그에 게시된 것입니다.
그리고 공개된 연구인 만큼 AI 산업 내 다른 플레이어의 활용도 열려있습니다.
또한 알고리즘은 추론 측면에서 적용됩니다. 학습 측면에서 모델 스케일링에 기반한 반도체 필요성은 여전합니다.
마지막으로 연구 성과가 실제 환경에서 적용되는 것에서 괴리가 존재할 수 있습니다. 이건 구글이 향후에 증명해야하는 부분이겠지요
저희도 AI 투자와 반도체에 긍정적인 뉴스라는 의견입니다.
(2026/3/26 공표자료)
안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.
구글이 발표한 TurboQuant는 AI 추론 과정에서 발생하는 KV 캐시 병목을 해결하기 위한 알고리즘입니다.
KV 캐시는 자주 사용되는 정보를 저장해 방대한 데이터베이스 참조 없이 즉시 정보를 불러올 수 있도록 하는 일종의 메모장인데요
병목 완화를 위해 고차원 벡터 크기를 줄이는 전통적 벡터 양자화를 통한 압축 기술 적용이 기존에도 연구되었습니다. 하지만 전통적 방식은 추가 메모리 오버헤드와 정확도 손실이 발생하는데요
반면 TurboQuant는 PolarQuant와 QJL을 결합해 벡터 양자화에서 메모리 오버헤드 문제를 최적으로 해결하는 압축 알고리즘입니다.
PolarQuant는 벡터를 좌표에서 각도(극좌표)로 변환해 데이터 구조를 단순화하고, QJL은 값을 +1과 -1 비트로 표현하는 수학적 기법으로 남은 오차를 보정합니다.
1단계 PolarQuant로 대부분 압축을 실행하고, QJL로 오류를 보정하는 통합 구조입니다.
사람들이 주목한 것은 결과인데요
1) KV 메모리 크기를 최소 6배 축소
2) 추가 학습 및 파인튜닝 없이 KV 캐시를 3비트까지 양자화
3) 모델 정확도를 유지하면서 빠른 실행 속도 달성
특히 H100 기준 4비트 TurboQuant는 32비트 비양자화 대비 8배의 어텐션 연산 속도를 달성했습니다.
KV 캐시 압축을 비롯한 추론 최적화는 지속적으로 연구가 진행되던 분야입니다. 중국 기업들도 상당한 노력을 기울이고 있구요
과거 딥시크의 MLA나 DSA도 KV 캐시로 인한 메모리 및 연산 병목 완화 목적의 연구입니다. MLA는 구조 변경 DSA는 선택적 어텐션을 통해 접근했습니다.
물론 구글의 TurboQuant는 KV 저장 및 사용 구조를 유지하면서 모델 수정 없이 바로 적용이 가능하고 이론적으로 무손실에 가까운 압축을 달성한다는 점에서는 차별화되는 부분이 있습니다.
TurboQuant 알고리즘이 활용된다면 추론 비용 하락을 달성할 수 있습니다. 하지만 오히려 수요는 폭발 할 것입니다. 속도 및 퀄리티 하향 없이 장기 컨텍스트 윈도우 및 대규모 배치의 활용이 가능하니까요
또한 로컬 모델에서도 대규모 컨텍스트 윈도우 활용이 가능해집니다. 온디바이스 개화로도 이어질 수 있는 포인트입니다.
추론 작업에 대한 메모리 공간이 추가로 생긴다고 하더라도 에이전트 AI 확대 속 이를 상회하고도 남는 전체 추론 수요 상승 트렌드는 이미 이어지고 있습니다.
작년 딥시크 이슈 때도 대두되었던 제본스의 역설(비용 하락에 따른 수요 급증)이 재확인될 가능성이 높다고 생각합니다. 쿼리와 토큰량의 기울기는 다시 한 번 가팔라질 수 있습니다.
세상을 뒤흔들고 있지만, 방금 나온 따끈한 새로운 기술은 아닙니다. 이미 25년 4월에 논문으로 공개된 내용입니다. 시스템 레벨에서 적용한 사례가 추가되어 블로그에 게시된 것입니다.
그리고 공개된 연구인 만큼 AI 산업 내 다른 플레이어의 활용도 열려있습니다.
또한 알고리즘은 추론 측면에서 적용됩니다. 학습 측면에서 모델 스케일링에 기반한 반도체 필요성은 여전합니다.
마지막으로 연구 성과가 실제 환경에서 적용되는 것에서 괴리가 존재할 수 있습니다. 이건 구글이 향후에 증명해야하는 부분이겠지요
저희도 AI 투자와 반도체에 긍정적인 뉴스라는 의견입니다.
(2026/3/26 공표자료)
👍11❤2
Forwarded from [삼성리서치] 테크는 역시 삼성증권
터보퀀트는 메모리 사용량을 줄일까?
[삼성증권 반도체, IT/이종욱]
어제 구글이 블로그를 통해 터보퀀트(TurboQuant) 기술을 소개했고, 마이크론 주가 하락(-3.4%)에 영향을 미친 것으로 보입니다.
1. 터보퀀트가 무엇일까
TurboQuant는 Transformer의 핵심 병목인 KV cache를 이론적 최적 수준으로 압축(양자화)하는 알고리즘입니다.
KV는 벡터값인데, 이 값을 바꾸는 것이 아니라 이 값을 읽은 기준선(좌표계) 바꿔서, 압축 손실을 최소화하는 최적의 좌표계를 찾는 방식입니다.
2. 터보퀀트가 메모리에 미치는 영향
계산량이 추가되고 캐시메모리 사용량을 줄이는 트레이드오프가 있긴 하지만, 현재 AI 속도의 병목은 캐시메모리이기 때문에 전체 속도를 높이고, 곧 AI 추론 비용을 낮출수 있습니다. 따라서 메모리를 덜 사용하면서 같은 성능을 낼 수 있는 AI 기술이라고 할수 있습니다.
3. 제본의 역설?
딥시크 이후로, 반도체 사용량을 최적화하려는 AI모델의 개선 노력은 계속되어 왔습니다. 그러나 효율적인 AI 모델은 오히려 전체 비용을 낮춰 더 많은 AI 계산 수요를 불러오고 있습니다. 최적화 모델들은 반도체 수요를 낮추는 것이 아니라 같은 반도체 자원으로 더 높은 성능의 AI 서비스를 구현하는데 사용되고 있습니다.
4. 무엇이 메모리 사용량을 결정할까
제일 말씀드리고 싶은 것이 이것입니다. 그럼 AI 메모리 수요에 영향을 미치는 인자는 무엇이 있을까요? 지금은 인프라 선점효과가 필요한 구간이기 때문에 보통의 가격과 수급 사이의 관계는 크지 않습니다(낮은 가격탄력성). 오히려 비즈니스 구조와 전략적 선택의 문제(생존문제)로 접근해야 합니다.
- AI 메모리 수요 감소요인은 주로 AI 기능이 고착화되는 지점에서 나타날 것입니다: AI서비스 개선 속도 둔화, AI 모델 기업끼리의 경쟁 구도 완화, AI산업 TAM 성장 둔화
- 다음과 같은 것은 수요에 영향을 미치지 않습니다: 디램과 반도체 가격, 데이터센터 비용, AI모델이나 클라우드 기업의 수익성, AI모델의 최적화와 비용절감
결론적으로 AI 업체들이 비용경쟁이 아니라 성능 경쟁을 하는한 비용 최적화는 반도체 수요에 영향을 미치지 않습니다. 우리가 걱정해야 할 순간은 AI로 더 할수 있는 기능이 별로 없거나 AI 업체들이 경쟁을 멈출때입니다.
감사합니다.
(2026/3/26 공표자료)
[삼성증권 반도체, IT/이종욱]
어제 구글이 블로그를 통해 터보퀀트(TurboQuant) 기술을 소개했고, 마이크론 주가 하락(-3.4%)에 영향을 미친 것으로 보입니다.
1. 터보퀀트가 무엇일까
TurboQuant는 Transformer의 핵심 병목인 KV cache를 이론적 최적 수준으로 압축(양자화)하는 알고리즘입니다.
KV는 벡터값인데, 이 값을 바꾸는 것이 아니라 이 값을 읽은 기준선(좌표계) 바꿔서, 압축 손실을 최소화하는 최적의 좌표계를 찾는 방식입니다.
2. 터보퀀트가 메모리에 미치는 영향
계산량이 추가되고 캐시메모리 사용량을 줄이는 트레이드오프가 있긴 하지만, 현재 AI 속도의 병목은 캐시메모리이기 때문에 전체 속도를 높이고, 곧 AI 추론 비용을 낮출수 있습니다. 따라서 메모리를 덜 사용하면서 같은 성능을 낼 수 있는 AI 기술이라고 할수 있습니다.
3. 제본의 역설?
딥시크 이후로, 반도체 사용량을 최적화하려는 AI모델의 개선 노력은 계속되어 왔습니다. 그러나 효율적인 AI 모델은 오히려 전체 비용을 낮춰 더 많은 AI 계산 수요를 불러오고 있습니다. 최적화 모델들은 반도체 수요를 낮추는 것이 아니라 같은 반도체 자원으로 더 높은 성능의 AI 서비스를 구현하는데 사용되고 있습니다.
4. 무엇이 메모리 사용량을 결정할까
제일 말씀드리고 싶은 것이 이것입니다. 그럼 AI 메모리 수요에 영향을 미치는 인자는 무엇이 있을까요? 지금은 인프라 선점효과가 필요한 구간이기 때문에 보통의 가격과 수급 사이의 관계는 크지 않습니다(낮은 가격탄력성). 오히려 비즈니스 구조와 전략적 선택의 문제(생존문제)로 접근해야 합니다.
- AI 메모리 수요 감소요인은 주로 AI 기능이 고착화되는 지점에서 나타날 것입니다: AI서비스 개선 속도 둔화, AI 모델 기업끼리의 경쟁 구도 완화, AI산업 TAM 성장 둔화
- 다음과 같은 것은 수요에 영향을 미치지 않습니다: 디램과 반도체 가격, 데이터센터 비용, AI모델이나 클라우드 기업의 수익성, AI모델의 최적화와 비용절감
결론적으로 AI 업체들이 비용경쟁이 아니라 성능 경쟁을 하는한 비용 최적화는 반도체 수요에 영향을 미치지 않습니다. 우리가 걱정해야 할 순간은 AI로 더 할수 있는 기능이 별로 없거나 AI 업체들이 경쟁을 멈출때입니다.
감사합니다.
(2026/3/26 공표자료)
❤6👍6
오픈AI, Codex 앱 유지 재확인
- Codex 총괄 Tibo
https://t.me/Samsung_Global_AI_SW
- Codex 총괄 Tibo
확실히 해두자면, Codex 앱은 계속 유지됩니다. 우리는 단지 이전보다 훨씬 더 많은 투자를 하고 있을 뿐이고, 곧 정말 멋지게 발전할 예정입니다.
https://t.me/Samsung_Global_AI_SW
🔥2👍1
문샷 AI, 홍콩 IPO 초기 논의 보도
: CICC 및 Goldman Sachs와 예비 협의 진행. 다만 상장 시점과 구체적 계획은 불확실
: 최근 180억 달러 밸류로 10억 달러 신규 펀딩 라운드 진행 보도
: 1월 홍콩 상장한 미니맥스와 Z ai는 공모가 대비 +505% 및 +492%
https://t.me/Samsung_Global_AI_SW
: CICC 및 Goldman Sachs와 예비 협의 진행. 다만 상장 시점과 구체적 계획은 불확실
: 최근 180억 달러 밸류로 10억 달러 신규 펀딩 라운드 진행 보도
: 1월 홍콩 상장한 미니맥스와 Z ai는 공모가 대비 +505% 및 +492%
https://t.me/Samsung_Global_AI_SW
👍2❤1