[삼성 이영진] 글로벌 AI/SW
7.78K subscribers
1.26K photos
8 videos
1.53K links
삼성증권 글로벌 AI/SW 담당 이영진
Download Telegram
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/26)

■ 구글, AI 메모리 압축 알고리즘 TurboQuant 공개. 추론 최적화에 집중

■ 구글, 신규 음악 생성 AI 모델 Lyria 3 Pro 발표. 최대 3분 길이 음악 트랙 생성

■ 애플, 구글과 계약을 통해 Gemini 모델에 대한 완전한 접근 권한을 자사 데이터센터 내에서 확보. 모델 증류도 가능 언급

■ 메타와 구글(YouTube)이 소셜미디어 중독 피해에 대한 책임을 인정받으며 300만 달러 배상 판결. 메타 측은 즉시 항소 의견

■ 일론 머스크, xAI의 AI 영상 생성 강화 계획. Grok Imagine 제품 업그레이드 시사

■ 메타, 창업 지원 및 AI 도입 확대를 위한 신규 이니셔티브 Meta Small Business 출시

■ 메타, AI 투자 확대에 대한 구조조정으로 700명 규모 감원 단행. 반대로 상위 경영진 보상은 강화

■ xAI 공동창업자 Manuel Kris 퇴사 발표

■ 바이트댄스, 자체 AI 창작 플랫폼 드리미나(Dreamina)에서 영상 생성 모델 Seedscne 2.0과 이미지 생성 모델 Seedream 5.0 Lite 공식 출시

■ 버니 샌더스 상원의원, AI Data Center Moratorium Act 제안. 미국 내 모든 데이터센터 신규 건설 및 업그레이드 중단(모라토리움) 및 미국산 GPU 수출 전면 금지 포함

■ 블랙스톤, 미국의 주요 데이터센터 개발사 Rowan Digital Infrastructure 인수 근접

■ AI 법률 스타트업 Harvey, 신규 펀딩 라운드에서 110억 달러 밸류 확인

■ 세일즈포스, 디렉터급 이상 직원에 대한 연봉 인상 중단

■ 크라우드스트라이크-인텔, 전략적 협력을 확대해 차세대 AI PC의 엔드포인트 보안 강화

감사합니다.
👍51
구글의 TurboQuant, 메모리 효율성 향상이 가져올 추론 수요 폭발

안녕하세요 삼성증권 글로벌 AI/SW 담당 이영진입니다.

구글이 발표한 TurboQuant는 AI 추론 과정에서 발생하는 KV 캐시 병목을 해결하기 위한 알고리즘입니다.

KV 캐시는 자주 사용되는 정보를 저장해 방대한 데이터베이스 참조 없이 즉시 정보를 불러올 수 있도록 하는 일종의 메모장인데요

병목 완화를 위해 고차원 벡터 크기를 줄이는 전통적 벡터 양자화를 통한 압축 기술 적용이 기존에도 연구되었습니다.  하지만 전통적 방식은 추가 메모리 오버헤드와 정확도 손실이 발생하는데요

반면 TurboQuant는 PolarQuant와 QJL을 결합해 벡터 양자화에서 메모리 오버헤드 문제를 최적으로 해결하는 압축 알고리즘입니다.

PolarQuant는 벡터를 좌표에서 각도(극좌표)로 변환해 데이터 구조를 단순화하고, QJL은 값을 +1과 -1 비트로 표현하는 수학적 기법으로 남은 오차를 보정합니다.

1단계 PolarQuant로 대부분 압축을 실행하고, QJL로 오류를 보정하는 통합 구조입니다.

사람들이 주목한 것은 결과인데요
1) KV 메모리 크기를 최소 6배 축소
2) 추가 학습 및 파인튜닝 없이 KV 캐시를 3비트까지 양자화
3) 모델 정확도를 유지하면서 빠른 실행 속도 달성

특히 H100 기준 4비트 TurboQuant는 32비트 비양자화 대비 8배의 어텐션 연산 속도를 달성했습니다.

KV 캐시 압축을 비롯한 추론 최적화는 지속적으로 연구가 진행되던 분야입니다. 중국 기업들도 상당한 노력을 기울이고 있구요 

과거 딥시크의 MLA나 DSA도 KV 캐시로 인한 메모리 및 연산 병목 완화 목적의 연구입니다. MLA는 구조 변경 DSA는 선택적 어텐션을 통해 접근했습니다.

물론 구글의 TurboQuant는 KV 저장 및 사용 구조를 유지하면서 모델 수정 없이 바로 적용이 가능하고 이론적으로 무손실에 가까운 압축을 달성한다는 점에서는 차별화되는 부분이 있습니다.

TurboQuant 알고리즘이 활용된다면 추론 비용 하락을 달성할 수 있습니다. 하지만 오히려 수요는 폭발 할 것입니다. 속도 및 퀄리티 하향 없이 장기 컨텍스트 윈도우 및 대규모 배치의 활용이 가능하니까요

또한 로컬 모델에서도 대규모 컨텍스트 윈도우 활용이 가능해집니다. 온디바이스 개화로도 이어질 수 있는 포인트입니다.

추론 작업에 대한 메모리 공간이 추가로 생긴다고 하더라도 에이전트 AI 확대 속 이를 상회하고도 남는 전체 추론 수요 상승 트렌드는 이미 이어지고 있습니다.

작년 딥시크 이슈 때도 대두되었던 제본스의 역설(비용 하락에 따른 수요 급증)이 재확인될 가능성이 높다고 생각합니다. 쿼리와 토큰량의 기울기는 다시 한 번 가팔라질 수 있습니다.

세상을 뒤흔들고 있지만, 방금 나온 따끈한 새로운 기술은 아닙니다. 이미 25년 4월에 논문으로 공개된 내용입니다. 시스템 레벨에서 적용한 사례가 추가되어 블로그에 게시된 것입니다.

그리고 공개된 연구인 만큼 AI 산업 내 다른 플레이어의 활용도 열려있습니다.

또한 알고리즘은 추론 측면에서 적용됩니다. 학습 측면에서 모델 스케일링에 기반한 반도체 필요성은 여전합니다.

마지막으로 연구 성과가 실제 환경에서 적용되는 것에서 괴리가 존재할 수 있습니다. 이건 구글이 향후에 증명해야하는 부분이겠지요

저희도 AI 투자와 반도체에 긍정적인 뉴스라는 의견입니다.

(2026/3/26 공표자료)
👍112
터보퀀트는 메모리 사용량을 줄일까?
[삼성증권 반도체, IT/이종욱]


어제 구글이 블로그를 통해 터보퀀트(TurboQuant) 기술을 소개했고, 마이크론 주가 하락(-3.4%)에 영향을 미친 것으로 보입니다.

1. 터보퀀트가 무엇일까
TurboQuant는 Transformer의 핵심 병목인 KV cache를 이론적 최적 수준으로 압축(양자화)하는 알고리즘입니다.
KV는 벡터값인데, 이 값을 바꾸는 것이 아니라 이 값을 읽은 기준선(좌표계) 바꿔서, 압축 손실을 최소화하는 최적의 좌표계를 찾는 방식입니다.

2. 터보퀀트가 메모리에 미치는 영향
계산량이 추가되고 캐시메모리 사용량을 줄이는 트레이드오프가 있긴 하지만, 현재 AI 속도의 병목은 캐시메모리이기 때문에 전체 속도를 높이고, 곧 AI 추론 비용을 낮출수 있습니다. 따라서 메모리를 덜 사용하면서 같은 성능을 낼 수 있는 AI 기술이라고 할수 있습니다.

3. 제본의 역설?
딥시크 이후로, 반도체 사용량을 최적화하려는 AI모델의 개선 노력은 계속되어 왔습니다. 그러나 효율적인 AI 모델은 오히려 전체 비용을 낮춰 더 많은 AI 계산 수요를 불러오고 있습니다. 최적화 모델들은 반도체 수요를 낮추는 것이 아니라 같은 반도체 자원으로 더 높은 성능의 AI 서비스를 구현하는데 사용되고 있습니다.

4. 무엇이 메모리 사용량을 결정할까
제일 말씀드리고 싶은 것이 이것입니다. 그럼 AI 메모리 수요에 영향을 미치는 인자는 무엇이 있을까요? 지금은 인프라 선점효과가 필요한 구간이기 때문에 보통의 가격과 수급 사이의 관계는 크지 않습니다(낮은 가격탄력성). 오히려 비즈니스 구조와 전략적 선택의 문제(생존문제)로 접근해야 합니다.
- AI 메모리 수요 감소요인은 주로 AI 기능이 고착화되는 지점에서 나타날 것입니다: AI서비스 개선 속도 둔화, AI 모델 기업끼리의 경쟁 구도 완화, AI산업 TAM 성장 둔화
- 다음과 같은 것은 수요에 영향을 미치지 않습니다: 디램과 반도체 가격, 데이터센터 비용, AI모델이나 클라우드 기업의 수익성, AI모델의 최적화와 비용절감

결론적으로 AI 업체들이 비용경쟁이 아니라 성능 경쟁을 하는한 비용 최적화는 반도체 수요에 영향을 미치지 않습니다. 우리가 걱정해야 할 순간은 AI로 더 할수 있는 기능이 별로 없거나 AI 업체들이 경쟁을 멈출때입니다. 

감사합니다.

(2026/3/26 공표자료)
6👍6
오픈AI, Codex 앱 유지 재확인

- Codex 총괄 Tibo

확실히 해두자면, Codex 앱은 계속 유지됩니다. 우리는 단지 이전보다 훨씬 더 많은 투자를 하고 있을 뿐이고, 곧 정말 멋지게 발전할 예정입니다.


https://t.me/Samsung_Global_AI_SW
🔥2👍1
문샷 AI, 홍콩 IPO 초기 논의 보도

: CICC 및 Goldman Sachs와 예비 협의 진행. 다만 상장 시점과 구체적 계획은 불확실

: 최근 180억 달러 밸류로 10억 달러 신규 펀딩 라운드 진행 보도

: 1월 홍콩 상장한 미니맥스와 Z ai는 공모가 대비 +505% 및 +492%

https://t.me/Samsung_Global_AI_SW
👍21
오픈AI, 성인용 챗 봇 출시 계획 무기한 연기

: 성적 AI 콘텐츠의 사회적 영향(중독성, 인간 관계 대체, 청소년 노출 등)에 대한 내부 및 투자자 우려 반영

: 명명시적 콘텐츠 생성과 불법 콘텐츠 필터링을 동시에 만족시키는 안전 정렬 모델 구현의 기술적 난이도 존재

: 사이드 프로젝트 축소 및 코어 생산성·에이전트 중심 전략 전환 과정에서 우선순위 재조정

https://t.me/Samsung_Global_AI_SW
2👎2🤣2👍1
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/27)

■ 오픈AI, 내부 반발과 리스크 우려 속 성인용 챗 봇 출시 계획을 무기한 연기

■ 오픈AI, 광고 파일럿 기준으로 연 매출 1억 달러 돌파

■ 구글, Gemini 3.1 Flash Live 모델 공개. 저지연 실시간 음성 대화 지원

■ 구글, 카메라와 음성을 활용해 AI와 실시간 대화하며 검색하는 Search Live 글로벌 확장

■ 구글, 유저들이 타 AI 앱에서 생성된 메모리, 컨텍스트를 Gemini로 가져올 수 있는 기능 도입

■ 구글, 헤드폰 활용 실시간 번역 기능을 iOS와 글로벌로 확대

■ 아마존, AI 반도체 부문 디렉터 Gadi Hutt 퇴사

■ 마이크로소프트, 클라우드 및 세일즈 조직 내 채용 동결

■ 애플, iOS 27에서 Siri에 외부 AI 어시스턴트 연동 허용 계획

■ 메타, 텍사스 엘 파소 데이터센터 투자를 기존 15억 달러에서 100억 달러로 확대

■ 메타, fMRI 기반 데이터로 인간의 시청각 자극에 대한 뇌 반응을 범용적으로 예측하는 뇌 파운데이션 모델 TRIBE v2를 공개

■ 팔란티어, Bain & Company와 주요 경영 컨설팅 파트너십 확대 발표

■ Z. Ai, GLM-5-Turbo를 GLM Coding Plan 유저 대상으로 확대 배포

■ 네비우스, Nebius AI Cloud 3.5 출시. 서버리스 AI와 최신 GPU 옵션 추가. 플랫폼 툴 강화

■ 얀 르쿤, 기존 월드 모델의 학습 불완정성과 구조적 복잡성을 해결하는 LeWM(LeWorldModel) 논문 공개

■ 미스트랄 AI, 신규 오픈소스 음성 모델 Voxtral TTS 발표

■ 코히어, 자동 음성 인식(ASR)에 특화된 오픈소스 음성 모델 Transcribe 공개

■ X, CMO 포함 비기술 인력 20명 이상 감원

■ Aligned Data Centers, 26억 달러 부채 조달을 통해 AI 데이터센터 확장 가속

감사합니다.
👍3
[삼성 이영진] 글로벌 AI/SW
오픈AI 4Q IPO 준비? : 오픈AI의 4Q IPO 가능성 재보도. 다만 세부 일정은 변경될 수 있다는 내용. 재무조직 구축(블록 전 CAO Ajmere Dale와 도큐사인 전 CFO Cynthia Gaylor 영입)은 앞서 알려진 내용 : 지난 1월 말 보도와 비교하면 비공식 논의 수준에서 상장 실행 초기 단계 진입 해석. 3월 초 IPO 준비를 위한 로펌 선정 보도 존재. 전략 재편 진행 중 : 젠슨 황은 오픈AI가 올해 상장할 것으로 예상하기…
앤스로픽, 4Q IPO 계획 보도

: 상장을 통해 600억 달러 이상 조달 예상(스페이스X는 750억 달러 조달 예상)

: IPO 시점이나 여부는 변화할 수 있으나 로펌 협력 등 구체적 준비 작업 진행 중

: 앤스로픽이 오픈AI보다 먼저 상장할 가능성이 높다고 평가 받는 중. 개발자 및 기업 고객 중심 전략과 짧은 수익화 경로의 장점

: 규제 당국과 상장 논의 과정에서 클라우드 사업자가 재판매하는 AI 모델 매출 인식 방식과 매출 고성장 및 서버 비용 추정 방식 등이 주요 검토 대상 전망

https://t.me/Samsung_Global_AI_SW
👍2
오픈AI, 광고 사업 연 매출 1억 달러 돌파

: 광고 파일럿 출시 6주 만에 연 환산 매출 1억 달러 달성

: 현재 무료 및 저가 요금제 유저 중 20% 미만에게 광고 노출. 85% 이상 유저는 광고 노출 대상이 될 수 있는 상태

: 광고주 600개 이상 확보, 4월 중 광고주가 직접 광고를 집행할 수 있는 셀프서브(self-serve) 시스템 출시 목표

: 광고 관련성 개선 집중. “관련성이 낮다”고 평가된 광고 비율은 7% 미만. 동시에 사용자 경험 훼손 최소화

: 이번 주 초 전 메타 광고 임원 출신인 Dave Dugan을 광고 사업 총괄로 영입. 광고 사업을 캐나다, 호주, 뉴질랜드 등 다른 지역으로 확대하는 방안도 검토 중

: ‘26년 챗GPT 소비자 사업에서 매출 170억 달러 전망(무료 사용자 대상 광고 수익 포함) 2월 말 기준 오픈AI ARR은 250억 달러

https://t.me/Samsung_Global_AI_SW
👍3
[삼성 이영진] 글로벌 AI/SW
앤스로픽, 국방부 상대 소송 제기 : 캘리포니아 연방 법원과 워싱턴 D.C 항소 법원에 소송 제기. ”헌법은 정부가 막대한 권력을 이용해 보호된 표현을 이유로 기업을 처벌하는 것을 허용하지 않는다“고 주장 : 구글 딥마인드 수석 과학자 제프 딘 포함 40명의 오픈AI 및 구글 직원은 국방부의 공급망 위험 지정에 반대하는 법정 의견서(amicus brief) 제출 ■ 소장에서 제시된 앤스로픽의 주요 주장 1. 공급망 위험 지정은 위헌적 조치 :…
미 연방법원, 앤스로픽의 공급망 위험 지정 조치 중단

: 캘리포니아 연방법원은 앤스로픽을 안보 위협으로 분류하고 정부의 모델 사용을 금지한 것이 표현의 자유를 침해했다고 판결

: 법원은 앤스로픽이 본안 소송에서도 승소할 가능성이 높다고 판단하며 가처분 인용

: 연방 기관의 앤스로픽 기술 사용 중단을 지시한 대통령 명령 적용을 중단하고, 공급망 위험 지정 조치 역시 집행 금지. 정부에 대해 4/6일까지 판결 이행 상황 보고 요구

: 앤스로픽 측은 공급망 리스크 지정이 적법 절차 위반이자 정치적 견해 차이에 대한 보복이라고 주장

: 해당 조치로 수억 달러 규모 계약 취소 및 지연 등 사업 영향 발생. 피해에 대한 구제도 요청

: 관련 법적 쟁점이 분리되어 있어 추가 소송도 병행 진행중. 정부는법원의 가처분 결정에 대해 항소할 의사 시사

https://t.me/Samsung_Global_AI_SW
3👍3
[삼성 이영진] 글로벌 AI/SW
앤스로픽, Claude 사용량 2배 이벤트 : 3/13~3/27, 피크 시간대(EST 08:00–14:00 / PT 05:00–11:00) 제외 비혼잡 시간대에 5시간 기준 사용량 한도 2배 : 한국시간 기준 피크 시간대: 21:00–03:00(기존 한도 유지) : 주말은 하루 종일 사용량 2배 https://support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion
앤스로픽, Claude 피크 시간대 이용 제한 조정 - Claude Code 팀 Thalia Shihipar

Claude 수요 증가에 대응하기 위해, 피크 시간대 동안 무료/Pro/Max 구독자의 5시간 세션 제한을 조정하고 있습니다. 주간 총 사용 한도는 변하지 않습니다.

평일 기준 태평양 시간 오전 5시-11시 / GMT 오후 1시-7시 동안에는 이전보다 더 빠르게 5시간 세션 한도에 도달하게 됩니다.

영향을 완화하기 위해 여러 효율 개선을 적용했지만, 약 7%의 사용자(특히 Pro 요금제)는 이전보다 더 자주 세션 한도에 도달하게 될 것입니다.

토큰 사용량이 많은 백그라운드 작업은 비혼잡 시간(off-peak)으로 옮기면 세션을 더 오래 사용할 수 있습니다.

전체 주간 한도는 동일하며, 단지 한 주 동안의 분배 방식만 바뀌는 것입니다.

불편을 드린 점 알고 있습니다. 우리는 계속해서 효율적인 확장을 위해 투자하고 있으며, 진행 상황을 계속 공유하겠습니다.

→ Show me the Capa. 한국시간 기준 밤 10시~새벽 4시

https://t.me/Samsung_Global_AI_SW
👍2
마이크로소프트, 클라우드와 북미 영업 조직 채용 동결

: 수만 명 규모의 Azure 및 영업 조직에서 신규 채용 전면 중단(오퍼 인력 제외). 비용 억제 및 수익성 개선 목적. Azure 마진 격차 해소를 핵심 과제로 설정

: 전사적 조치는 아니며 Copilot 등 AI 핵심 엔지니어링 조직은 채용 지속. 회계연도(6월)을 앞두고 채용 속도 조절 및 인력 감축은 드문 일은 아님

: 메타, 구글, AWS 등 빅테크와 아틀라시안 등 소프트웨어 기업 전반에서 AI 투자 확대에 따른 인력 조정 확산

: MS의 지난 회계연도 말 기준 직원 22만 8,000명으로 전년과 동일한 수준. 사내 AI 도구 활용 증가 기반 인력 효율 개선으로 향후 몇 년간 전체 인력 규모 정체 전망

https://t.me/Samsung_Global_AI_SW
👍1
앤스로픽, 신규 AI 모델 개발 및 테스트 인정

: 앤스로픽, 신규 AI 모델 개발 및 초기 고객 대상 테스트 진행 인정. 기존 공개 모델 대비 성능 도약(step change) 가장 강력한 모델

: 해당 모델 존재는 공개 데이터 캐시 유출을 통해 드러남. 모델명 Claude Mythos, 학습 완료 상태

: 모델 티어는 Capybara로, 기존 Opus 상위 등급. 소프트웨어 코딩, 학문적 추론, 사이버보안 테스트에서 큰 폭 성능 개선

: Mythos = 모델 이름 / Capybara = 신규 최상위 티어. 동일 파운데이션 모델을 지칭하는 다른 표현

: 초기에는 소수 enterprise 고객 대상 early access 형태로 제한적 배포. 높은 운영 비용으로 일반 공개는 지연 가능성

: 모델이 전례 없는 사이버보안 리스크를 가질 수 있다고 내부 문서에서 언급. 단순 성능 향상을 넘어 offensive capability 강화 시사

: 공개 데이터에는 유럽 CEO 초청 서밋 정보도 포함. 대기업 대상 AI 판매 전략의 일환

: 약 3,000개 미공개 콘텐츠 자산 노출. 제품 출시 직전 단계에서 발생한 유출로 추정

→ 프론티어 AI 기업은 공개 모델보다 강력한 내부 모델 보유 중(ex, 앤스로픽 Claude Mythos, 오픈AI Spud)

https://t.me/Samsung_Global_AI_SW
👍3
영상 생성 AI 트래픽 점유율 추이(by Similarweb)

: 오픈AI Sora가 감소하고, xAI Grok Imagine이 성장

: 다만 공개적으로 접근 가능한 제품 URL 트래픽 기반. 일부는 플랫폼 내에서 사용되기 때문에, 해당 사용량은 완전히 반영되지 않았을 수 있다는 한계 명시

https://t.me/Samsung_Global_AI_SW
👍21
Z. ai, GLM 코딩 플랜 유저 대상 GLM-5.1 공개

: Claude Code 환경 내 테스트에서 Opus 4.6에 근접

https://t.me/Samsung_Global_AI_SW
👍2
Crusoe, 텍사스 애빌린에 마이크로소프트용 900MW AI 팩토리 캠퍼스 구축

: 신규 캠퍼스는 기존 애빌린 AI 캠퍼스와 인접. 전체 사이트 예상 캐파는 약 2.1GW(기존 1.2GW → 오라클/오픈AI)

: 현재 부지 정리 및 준비 작업 진행 중. 첫 건물은 27년 중반 전력 공급 예정

: 전용 발전소 기반 에너지 통합, 초고밀도 GPU 컴퓨팅 대응, 수자원 효율 냉각 구조

→ 기존 보도된 MS 캐파 계약 체결 규모(700MW) 대비 상승. 과거 애빌린 확장 관련 보도(800MW)와 비교해도 더 큰 규모로 해석 가능

https://www.crusoe.ai/resources/newsroom/crusoe-announces-new-900-mw-ai-factory-campus-in-abilene-texas-to-support-microsoft-ai-infrastructure
👍31
샘 올트먼, 미시간 Stargate 데이터센터 건설이 본격적인 구조물 단계에 진입

이번 주, Oracle 및 Related Digital과 함께 진행 중인 미시간 Stargate 부지에서 첫 철골 구조물이 올라갔습니다


https://t.me/Samsung_Global_AI_SW
👍3
구글, 앤스로픽 임차 데이터센터 금융 지원 협상

: 앤스로픽이 임차한 텍사스 2,800에이커 규모 데이터센터 캠퍼스에 자금 지원 추진

: 운영사 Nexus Data Centers 대상 건설 대출 제공 구조. 알파벳 신용 기반으로 프로젝트 조달 비용 절감 가능

: 초기 단계 자금 조달 규모 50억 달러 이상 예상. 은행 컨소시엄 지원

: ‘26년 말까지 500MW 전력 확보 목표. 장기적으로 최대 7.7GW까지 확장 잠재력

: 주요 가스 파이프라인 인접 입지. 전력망을 거치지 않고 직접 전력을 공급받는 behind-the-meter 방식 전력 조달

: 구글은 Fluidstack + TeraWulf 딜을 통해 앤스로픽 컴퓨팅 캐파를 금융 인프라 구조로 간접 확장

https://t.me/Samsung_Global_AI_SW
👍3
Reasoning Thinking에서 Agentic Thinking으로

- 전 알리바바 Qwen 팀 리더 Junyang Lin 포스팅

: RL 기반 추론 모델(o1, R1)은 정확성 중심 학습을 가능하게 했으며, 성능 향상의 핵심이 모델 자체보다 인프라와 검증 시스템으로 이동

: 추론 모델 확산은 사전학습(Pre Training) 중심에서 사후학습(Post Training), 강화학습(RL) 스케일링 시대로의 전환을 의미

: Thinking vs Instruct 통합은 데이터 분포와 목적 충돌로 인해 어려우며, 부적절한 결합 시 두 성능 모두 저하 → 일부는 분리, 일부는 hybrid 전략 유지

: 통합의 핵심은 단순 공존이 아니라 reasoning effort를 연속적으로 조절하는 compute policy 구현 여부

: 앤스로픽의 접근은 긴 추론보다 작업 적합성(코딩, 에이전트)에 초점을 두며, Reasoning을 목적이 아니라 유틸리티를 위한 수단으로 재정의

: AI 발전 방향이 모델 중심에서 에이전트 중심으로 이동하며, 계획, 도구 사용, 환경 상호작용, 장기 수행 능력이 핵심으로 부상

: Agentic thinking은 “얼마나 오래 생각할 수 있는가”가 아니라 “행동을 지속 가능하게 만드는 사고인가”로 정의. 도구 선택, 실행, 피드백 반영, 장기 일관성이 중요

: Agentic RL은 환경(툴, 브라우저, API 등)이 학습의 일부가 되며, 병목이 모델에서 시스템 아키텍처 및 환경 설계로 이동

: Training과 Inference 분리 필요성 증가 → 툴 레이턴시, 환경 상호작용으로 인해 rollout 효율 및 GPU 활용 저하 문제 발생

: 환경 자체가 핵심 경쟁 요소로 부상 (안정성, 현실성, 다양성, 피드백 품질, 폭주 방지 등)

: 툴 사용 확대로 Reward Hacking 리스크 증가 → 환경 설계, 평가자 강화, anti-cheating 구조 중요성 확대

: 미래 시스템은 단일 모델이 아닌 orchestrator + specialist + sub-agent 기반 멀티 에이전트 구조로 진화

: AI 경쟁력의 원천은 모델, 알고리즘에서 환경 설계, 시스템 통합, 에이전트 오케스트레이션, 피드백 루프로 이동

: 핵심 지표는 “얼마나 잘 생각하느냐”보다 “실제로 문제를 해결하느냐”로 변화

https://x.com/JustinLin610/status/2037116325210829168
👍3
[삼성 이영진] 글로벌 AI/SW 뉴스 🤖 (26/3/30)

■ 구글, 앤스로픽이 임차한 텍사스 데이터센터 캠퍼스 자금 지원. 운영사 Nexus Data Centers 대상 건설 대출 제공

■ 구글, 내부 코딩용 에이전트 Agent Smith를 작업 자동화에 활용

■ Crusoe, 텍사스 애빌린에 마이크로소프트용 900MW AI 팩토리 캠퍼스 구축

■ 애플, 구글 출신 릴리안 리콘을 AI 제품 마케팅 부문 VP로 영입. Apple Intellignce 및 Siri 포함 AI 플랫폼 제품 마케팅과 관리 총괄

■ 소프트뱅크, 400억 달러 규모 대출 조달 1년 만기 단기 대출. 오픈AI에 대한 투자 약정 300억 달러 이행 목적

■ 영국 정부, 데이터 주권과 프라이버시 우려 속 NHS의 팔란티어 계약 해지 검토 보도

■ xAI, 마지막 공동창업자 Ross Nordeen 퇴사

■ Physical Intelligence, 110억 달러 밸류로 10억 달러 신규 펀딩 논의. 로보틱스용 범용 AI 모델 개발

감사합니다.
👍4