Continuous Learning_Startup & Investment
2.43K subscribers
513 photos
5 videos
16 files
2.74K links
We journey together through the captivating realms of entrepreneurship, investment, life, and technology. This is my chronicle of exploration, where I capture and share the lessons that shape our world. Join us and let's never stop learning!
Download Telegram
월드 모델과 시뮬레이션

Q: 시뮬레이션된 세계와 그 안에 에이전트를 넣는 것에 대해서도 꼭 이야기하고 싶습니다. 올해 초에 지니(Genie) 팀과 이야기를 나눴거든요. 왜 시뮬레이션에 관심을 가지시나요? 언어 모델이 할 수 없는 무엇을 월드 모델이 할 수 있나요?

사실 AI 외에도 월드 모델과 시뮬레이션은 아마 저의 가장 오래된 열정일 겁니다. 물론 지니 같은 최근 작업에서 모든 것이 하나로 합쳐지고 있지만요. 언어 모델은 세상에 대해 많은 것을 이해할 수 있습니다. 사실 우리가 예상한 것보다, 제가 예상한 것보다 더 많이요. 언어가 우리가 생각했던 것보다 훨씬 더 풍부하기 때문이죠. 언어학자들이 상상했던 것보다 세상에 대해 더 많은 것을 담고 있습니다. 그리고 새로운 시스템들로 그것이 증명되었습니다. 하지만 여전히 세상의 공간적 역학, 공간 인식, 우리가 처한 물리적 맥락, 그리고 그것이 기계적으로 어떻게 작동하는지에 대해서는 말로 설명하기 어렵고 일반적으로 말뭉치(corpus)에 설명되어 있지도 않은 것들이 많습니다. 그리고 많은 부분이 경험, 온라인 경험을 통한 학습과 연결되어 있습니다. 어떤 것들은 말로 설명할 수 없고 그냥 경험해야만 합니다. 감각 같은 것들은 말로 표현하기 매우 어렵죠. 모터의 각도나 냄새 같은 감각들 말입니다. 언어로 설명하기 매우 어렵습니다.

그래서 그런 것들에 대한 전체적인 영역이 있다고 생각합니다. 그리고 로봇 공학이 작동하게 하거나, 안경이나 전화기에 탑재되어 컴퓨터뿐만 아니라 일상생활에서 당신과 함께하며 돕는 만능 비서를 원한다면, 이런 종류의 세상에 대한 이해가 필요하며 월드 모델이 그 핵심입니다. 우리가 월드 모델이라고 할 때 의미하는 것은 세상의 인과 관계와 역학, 직관적 물리학, 사물이 어떻게 움직이고 행동하는지를 이해하는 모델입니다.

지금 비디오 모델들에서 그런 것들을 많이 보고 있습니다. 그런 이해력을 가지고 있는지 어떻게 테스트할까요? 현실적인 세계를 생성할 수 있는지 보면 됩니다. 생성할 수 있다면 어떤 의미에서는 시스템이 세상의 역학을 많이 캡슐화(내재화)했다고 볼 수 있으니까요. 그래서 지니나 비오(Veo), 우리의 비디오 모델들과 상호작용형 월드 모델들이 정말 인상적이면서도, 우리가 일반화된 월드 모델을 가지고 있다는 것을 보여주는 중요한 단계들입니다. 그리고 언젠가는 로봇 공학과 만능 비서에 적용할 수 있기를 바랍니다. 그리고 물론 제가 언젠가 꼭 하고 싶은, 제가 가장 좋아하는 일 중 하나는 그것을 게임과 게임 시뮬레이션에 다시 적용하여 궁극의 게임을 만드는 것입니다. 물론 그것이 제 무의식적인 계획이었을 수도 있고요.

Q: 과학 분야는 어떤가요?

과학적으로 복잡한 영역, 생물학의 원자 수준 재료나 날씨 같은 물리적인 것들의 모델을 구축하는 한 가지 방법은 원시 데이터(raw data)로부터 해당 시스템의 시뮬레이션을 학습하는 것입니다. 원시 데이터 뭉치가 있다고 해보죠. 날씨에 관한 것이라고 칩시다. 물론 우리는 놀라운 날씨 프로젝트들을 진행 중입니다. 그런 다음 그 역학을 학습하고, 무식하게 계산하는(brute force) 것보다 더 효율적으로 그 역학을 재현할 수 있는 모델을 갖는 겁니다. 그래서 저는 시뮬레이션과 월드 모델, 어쩌면 특화된 모델들이 과학과 수학의 여러 측면에서 엄청난 잠재력을 가지고 있다고 생각합니다.

Q: 하지만, 그 시뮬레이션된 세계 안에 에이전트를 떨어뜨려 놓을 수도 있잖아요? 지니 3 팀이 정말 멋진 말을 했어요. "어떤 주요 발명품의 전제 조건도 그 발명품을 염두에 두고 만들어진 것은 거의 없다"라고요. 그들은 시뮬레이션된 환경에 에이전트를 떨어뜨려 호기심을 주된 동기로 삼아 탐험하게 하는 것에 대해 이야기하고 있었죠.

그것이 이 월드 모델들의 또 다른 정말 흥미로운 용도입니다. 우리에게는 시마(SIMA)라는 또 다른 프로젝트가 있습니다. 방금 시마 2를 출시했는데, 시뮬레이션된 에이전트로서 아바타나 에이전트를 가상 세계에 둡니다. 일반적인 상업용 게임일 수도 있고, '노 맨즈 스카이(No Man's Sky)'처럼 매우 복잡한 오픈 월드 우주 게임일 수도 있습니다. 그리고 내부에 제미나이가 탑재되어 있어서 지시를 내릴 수 있습니다. 에이전트에게 말로 임무를 줄 수 있죠. 그러다 우리는 지니를 시마에 연결해서, 즉 시마 에이전트를 다른 AI가 즉석에서 생성하는 세계에 떨어뜨려 보면 재미있지 않을까 생각했습니다. 이제 두 AI가 서로의 마음속에서 상호작용하는 셈이죠. 시마 에이전트는 이 세상을 탐색하려고 노력합니다. 지니 입장에서는 그저 플레이어일 뿐이고, 아바타가 다른 AI라는 것은 상관하지 않습니다. 그저 시마가 하려는 행동에 맞춰 주변 세상을 생성할 뿐입니다.

두 AI가 함께 상호작용하는 것을 보는 것은 정말 놀랍습니다. 그리고 저는 이것이 흥미로운 훈련 루프(training loop)의 시작이 될 수 있다고 생각합니다. 거의 무한한 훈련 예시를 가질 수 있게 되니까요. 시마 에이전트가 무엇을 배우려고 하든 지니가 기본적으로 즉석에서 만들어낼 수 있습니다. 그래서 수백만 개의 과제를 자동으로 설정하고 해결하며 점점 더 어렵게 만드는 전체 세상을 상상할 수 있습니다. 그래서 우리는 그런 루프를 설정하려고 노력할 수도 있고, 분명 시마 에이전트들은 훌륭한 게임 동료가 될 수도 있으며, 그들이 배우는 것들 중 일부는 로봇 공학에도 유용할 수 있습니다.

Q: 당신이 만드는 그 세계들이 정말 현실적인지는 어떻게 확신하나요? 그럴듯해 보이지만 실제로는 틀린 물리학으로 끝나지 않도록 어떻게 보장하나요?

네, 아주 훌륭한 질문이고 문제가 될 수 있습니다. 기본적으로 또다시 환각 문제입니다. 어떤 환각은 흥미롭고 새로운 것을 만들어낼 수 있다는 점에서 좋습니다. 사실 창의적인 일을 하려거나 시스템이 새로운 것, 참신한 것을 만들게 하려 할 때 약간의 환각은 좋을 수 있습니다. 하지만 의도적이어야 합니다. "지금 환각을 켜라" 혹은 "창의적 탐험을 해라" 하는 식으루요. 하지만 시마 에이전트를 훈련시킬 때 지니가 틀린 물리학을 환각해 내는 것은 원치 않을 겁니다.

그래서 지금 우리가 하고 있는 것은 거의 '물리학 벤치마크'를 만드는 것입니다. 물리학적으로 매우 정확한 게임 엔진을 사용하여 꽤 단순한 것들을 많이 만듭니다. 물리학 A-레벨 실험실 수업에서 할 법한 것들 말이죠. 다른 트랙에 작은 공을 굴려 속도를 본다거나 하는 식으로 뉴턴의 운동 3법칙을 아주 기초적인 수준에서 분석하는 겁니다. 그것을 캡슐화했는가? 비오든 지니든 이 모델들이 그 물리학을 100% 정확하게 캡슐화했는가? 지금 당장은 아닙니다. 일종의 근사치죠. 그냥 대충 보면 현실적으로 보이지만, 로봇 공학 등에 의존할 만큼 충분히 정확하지는 않습니다.

그게 다음 단계입니다. 이제 우리는 정말 흥미로운 모델들을 가지고 있으니, 다른 모든 모델에서 시도하는 것처럼 환각을 줄이고 더욱 기반을 튼튼하게(grounded) 만드는 것이 목표 중 하나입니다. 물리학의 경우, 아마도 진자 운동 같은 단순한 비디오들의 '그라운드 트루스(ground truth, 실측값)'를 엄청나게 많이 생성해야 할 겁니다. 두 진자가 서로 돌면 어떻게 되는가? 그러다 보면 금방 삼체 문제(three-body problems)에 도달하게 되는데, 어차피 해결 불가능하죠. 그래서 흥미로울 겁니다. 하지만 이미 놀라운 점은 비오 같은 비디오 모델을 볼 때 반사나 액체를 처리하는 방식이 적어도 육안으로 보기에는 꽤나 믿을 수 없을 정도로 정확하다는 것입니다. 다음 단계는 인간 아마추어가 인식할 수 있는 수준을 넘어, 정말로 물리학 수준의 실험을 견뎌낼 수 있느냐 하는 것입니다.
Q: 당신이 오랫동안 이 시뮬레이션된 세계에 대해 생각해 왔다는 것을 압니다. 우리의 첫 인터뷰 대본을 다시 봤는데, 당신은 의식이 진화의 결과라는 이론을 정말 좋아한다고 말했더군요. 진화적 과거의 어느 시점에 타인의 내부 상태를 이해하는 것이 이점이 있었고, 그것을 우리 자신에게로 돌렸다는 이론 말이죠. 그렇다면 시뮬레이션 안에서 에이전트 진화를 실행해 보는 것에 대해 호기심이 생기지 않나요?

언젠가 그 실험을 꼭 해보고 싶습니다. 진화를 다시 돌려보고, 사회적 역학도 다시 돌려보는 거죠. 산타페 연구소(Santa Fe Institute)에서 작은 그리드 월드(grid world)에서 멋진 실험들을 하곤 했습니다. 저는 그런 것들을 좋아했죠. 대부분 경제학자들이었는데, 작은 인공 사회를 운영해 보려고 했고, 에이전트들이 올바른 인센티브 구조하에 충분히 오랫동안 돌아다니게 두면 시장, 은행 등 온갖 흥미로운 것들이 발명된다는 것을 발견했습니다. 그래서 정말 멋질 것 같고, 생명의 기원과 의식의 기원을 이해하는 데도 좋을 것 같습니다.

제가 처음부터 AI 연구에 열정을 가졌던 큰 이유 중 하나는 우리가 어디서 왔는지, 이 현상들이 무엇인지 정말로 이해하기 위해 이런 종류의 도구가 필요할 것이라고 생각했기 때문입니다. 시뮬레이션은 그것을 수행하는 가장 강력한 도구 중 하나입니다. 통계적으로 수행할 수 있으니까요. 초기 시작 조건을 약간씩 다르게 하여 시뮬레이션을 여러 번 실행하고, 어쩌면 수백만 번 실행한 다음, 매우 통제된 실험 방식으로 그 미세한 차이가 무엇인지 이해할 수 있습니다. 물론 우리가 답하고자 하는 정말 흥미로운 질문들에 대해 현실 세계에서는 하기가 매우 어렵죠. 그래서 정확한 시뮬레이션은 과학에 믿을 수 없을 만큼 큰 혜택이 될 것입니다.

Q: 이 모델들의 창발적 속성(emergent properties)에 대해 우리가 발견한 것들, 우리가 예상치 못한 개념적 이해를 가지고 있다는 점을 감안할 때, 그런 종류의 시뮬레이션을 실행하는 것에 대해서도 꽤 조심해야 하지 않을까요?

네, 그래야 한다고 생각합니다. 하지만 그게 시뮬레이션의 또 다른 장점입니다. 꽤 안전한 샌드박스 안에서 실행할 수 있으니까요. 결국에는 에어갭(airgap, 외부와 네트워크 격리) 상태로 만들고 싶을 수도 있고요. 물론 시뮬레이션에서 일어나는 일을 24시간 모니터링할 수 있고 모든 데이터에 접근할 수 있습니다.

시뮬레이션이 너무 복잡하고 너무 많은 일이 일어날 것이기 때문에 모니터링을 돕기 위해 AI 도구가 필요할 수도 있습니다. 수많은 AI가 시뮬레이션 안을 돌아다니는 것을 상상해 보면 인간 과학자가 따라잡기는 힘들 겁니다. 하지만 다른 AI 시스템을 사용하여 시뮬레이션에서 흥미롭거나 걱정스러운 점을 자동으로 분석하고 표시하도록 도울 수 있을 겁니다.
Q: 최근 산업 혁명에 대해 꽤 많이 읽고 계시다는 걸 압니다. AGI가 도래함에 따라 예상되는 혼란을 완화하기 위해 거기서 배울 수 있는 점들이 있을까요?

배울 점이 많다고 생각합니다. 적어도 영국에서는 학교에서 배우지만 매우 피상적인 수준이죠. 저는 그것이 어떻게 일어났는지, 무엇으로 시작했는지, 그 배후의 경제적 이유(섬유 산업) 등을 들여다보는 것이 정말 흥미로웠습니다. 최초의 컴퓨터는 사실상 재봉틀이었습니다. 그러다 초기 포트란 컴퓨터, 메인프레임을 위한 천공 카드가 되었죠. 한동안은 매우 성공적이었습니다. 영국은 자동화 시스템 덕분에 놀랍도록 고품질의 물건을 매우 저렴하게 만들 수 있었기에 세계 섬유 산업의 중심이 되었습니다. 그러다 증기 기관과 그 모든 것들이 들어왔죠. 산업 혁명에서 놀라운 발전들이 많이 나왔다고 생각합니다. 아동 사망률이 낮아졌고, 모든 현대 의학과 위생 상태, 일과 삶의 분리 등이 산업 혁명 기간에 정립되었습니다.

하지만 꽤 오랜 시간, 대략 한 세기에 걸쳐 많은 도전 과제도 있었습니다. 노동력의 다른 부분들이 특정 시기에 일자리를 잃었고, 새로운 것들이 만들어져야 했습니다. 그 균형을 다시 맞추기 위해 노조와 같은 새로운 조직들이 만들어져야 했습니다. 그래서 사회 전체가 시간이 지나면서 적응해야 했던 것을 보는 것은 매혹적이었습니다. 그리고 지금의 현대 사회가 되었죠. 산업 혁명의 장단점과 발생 원인은 분명 많았지만, 전체적인 결과를 생각해보면—서구 세계의 식량 풍요, 현대 의학, 현대 교통 등—이 모든 것이 산업 혁명 덕분입니다. 그래서 우리는 산업 혁명 이전으로 돌아가고 싶지는 않을 겁니다. 하지만 이번에는 거기서 배워서 어떤 혼란이 있었는지 미리 파악하고, 더 일찍 혹은 더 효과적으로 완화할 수 있을지 모릅니다. 그리고 아마 그래야 할 겁니다. 이번의 차이점은 산업 혁명보다 10배 더 클 것이고, 아마도 10배 더 빨리 일어날 것이라는 점입니다. 한 세기가 아니라 10년 정도에 걸쳐 펼쳐질 것입니다.

Q: 셰인이 우리에게 말했던 것 중 하나는 노동을 자원과 교환하는 현재의 경제 시스템이 AGI 이후 사회에서는 같은 방식으로 작동하지 않을 거라는 점이었습니다. 사회가 작동하는 방식으로 어떻게 재구성되어야 하거나 재구성될 수 있을지에 대한 비전이 있나요?

산업 혁명 때처럼, 농업에 가까웠던 산업 혁명 이전과 비교해 전체 노동 세계와 노동 주간 등 모든 것이 바뀌었기 때문입니다. 그리고 적어도 그 정도 수준의 변화가 다시 일어날 것이라고 생각합니다.

그래서 새로운 경제 시스템, 새로운 경제 모델이 필요하다고 해도 놀랍지 않을 것입니다. 그 변화를 돕고, 예를 들어 혜택이 널리 분배되도록 하고, 보편적 기본 소득(UBI) 같은 것들이 해결책의 일부가 될 수 있도록 하기 위해서요. 하지만 그것이 전부는 아니라고 생각합니다. 그것은 우리가 지금 모델링할 수 있는 것일 뿐, 오늘날 우리가 가진 것에 추가되는 개념이니까요. 하지만 뭔가 훨씬 더 나은 시스템이 있을 수 있습니다.

그리고 철학적인 측면도 있습니다. 좋아요, 직업이 바뀌고 다른 것들도 바뀌겠지만, 핵융합이 해결되었다고 칩시다. 그래서 우리는 풍부하고 공짜인 에너지를 갖게 되었고, 결핍 이후(post-scarcity)의 시대가 되었습니다. 그럼 돈은 어떻게 될까요? 어쩌면 모두가 더 잘 살게 될지 모릅니다. 하지만 '목적(purpose)'은 어떻게 되나요? 많은 사람들이 직업에서, 그리고 가족을 부양하는 것에서 목적을 찾습니다. 그것은 매우 고귀한 목적이죠. 그래서 이런 질문들 중 일부는 경제적 질문에서 거의 철학적 질문으로 섞여 들어갑니다.

Q: 장기적으로, AGI를 넘어 ASI(인공 초지능)를 향해 갈 때, 기계는 절대 해낼 수 없는 인간만이 할 수 있는 일이 있다고 생각하시나요?

글쎄요, 그게 큰 질문이라고 생각합니다. 아시다시피 제가 가장 좋아하는 주제 중 하나가 튜링 머신입니다. 저는 항상 이렇게 생각해 왔습니다. 우리가 AGI를 만들고, 그것을 마음의 시뮬레이션으로 삼아 실제 마음과 비교해 본다면, 그 차이점이 무엇인지, 그리고 인간의 마음에 남아있는 특별한 점이 무엇인지 알게 될 것이라고요. 어쩌면 그건 창의성일 수도, 감정일 수도, 꿈이나 의식일 수도 있겠죠. 무엇이 계산 가능한지 혹은 불가능한지에 대해 세상에는 많은 가설이 존재합니다. 그리고 이것은 결국 튜링 머신의 한계가 무엇인가 하는 질문으로 돌아옵니다.
그것이 제가 튜링과 튜링 머신에 대해 알게 된 이후 제 인생의 중심적인 질문이라고 생각합니다. 저는 그것과 사랑에 빠졌죠. 그것이 저의 핵심 열정입니다. 우리가 해온 모든 일은 단백질 접힘을 포함하여 튜링 머신이 할 수 있는 일의 개념을 한계까지 밀어붙이는 것이라고 생각합니다. 그런데 알고 보니 그 한계가 무엇인지 잘 모르겠습니다. 어쩌면 한계가 없을지도 모릅니다. 물론 제 양자 컴퓨팅 친구들은 한계가 있고 양자 시스템을 하려면 양자 컴퓨터가 필요하다고 말하겠죠. 하지만 저는 정말 확신하지 못하겠습니다.
실제로 양자 분야 사람들과 그에 대해 토론해 봤습니다. 고전적 시뮬레이션을 만들기 위해 양자 시스템의 데이터가 필요할 수도 있습니다. 그러면 다시 마음의 문제로 돌아옵니다. 마음은 모두 고전적 계산일까요, 아니면 로저 펜로즈(Roger Penrose)가 믿는 것처럼 뇌에 양자 효과가 있는 걸까요? 만약 있고, 그것이 의식과 관련이 있다면, 기계는 적어도 고전적 기계는 절대 그것을 가질 수 없을 것입니다. 양자 컴퓨터를 기다려야겠죠. 하지만 만약 없다면, 한계가 없을 수도 있습니다. 어쩌면 우주의 모든 것은 올바른 방식으로 보면 계산 가능할지도 모르고, 따라서 튜링 머신은 우주의 모든 것을 모델링할 수 있을지도 모릅니다. 만약 저에게 추측해 보라고 한다면, 저는 그렇다고 추측하겠습니다. 그리고 물리학이 저에게 그렇지 않다는 것을 보여줄 때까지 그 기초 위에서 작업하고 있습니다.

그렇다면 이러한 계산적인 범위 내에서 불가능한 것은 없다는 말씀인가요?

음, 이렇게 말씀드리죠. 지금까지 우주에서 계산 불가능한 것은 아무것도 발견되지 않았습니다, 아직까지는요.

단백질 접힘이나 바둑 같은 것들을 통해 오늘날 고전적 컴퓨터가 할 수 있는 일이 복잡성 이론가들의 일반적인 'P=NP' 관점을 훨씬 넘어설 수 있다는 것을 이미 보여주었다고 생각합니다. 그래서 저는 그 한계가 무엇인지 아무도 모른다고 생각합니다. 딥마인드와 구글에서 우리가 무엇을 하고 있는지, 제가 무엇을 하려고 하는지를 한마디로 줄이자면 그 한계를 찾는 것입니다.

Q: 하지만 그 아이디어의 한계 안에서는... 우리가 여기 앉아 있고, 얼굴에 와닿는 조명의 따스함, 배경에서 들리는 기계 소리, 손에 닿는 책상의 느낌. 이 모든 것이 고전적 컴퓨터로 복제가 가능하다는 건가요?

결국 제 생각에는—이것이 제가 칸트를 사랑하는 이유이기도 합니다. 제가 가장 좋아하는 두 철학자가 칸트와 스피노자인데 이유는 다릅니다만. 칸트는 '현실은 마음의 구성물'이라고 했습니다. 저는 그게 사실이라고 생각합니다. 네, 당신이 언급한 그 모든 것들이 우리의 감각 기관으로 들어오고 다르게 느껴집니다. 빛의 따스함, 테이블의 감촉. 하지만 결국 그것은 모두 정보이며, 우리는 정보 처리 시스템입니다. 저는 생물학이 바로 그것이라고 생각합니다. 이것이 우리가 아이소모픽(Isomorphic)으로 하려는 일입니다. 저는 생물학을 정보 처리 시스템으로 생각함으로써 결국 모든 질병을 치료하게 될 것이라고 믿습니다.

그리고 결국—저는 남는 시간, 그 2분의 여가 시간에 에너지나 물질이 아니라 '정보'가 우주의 가장 근본적인 단위라는 물리학 이론에 대해 연구하고 있습니다. 그래서 결국 이 모든 것이 상호 교환 가능할지 모르지만, 우리는 단지 그것을 감지할 뿐입니다. 다른 방식으로 느낄 뿐이죠. 하지만 우리가 아는 한, 우리가 가진 이 모든 놀라운 센서들은 여전히 튜링 머신으로 계산 가능합니다.

그래서 당신의 시뮬레이션된 세계가 그렇게 중요한 거군요.

네, 정확합니다. 왜냐하면 그것이 그곳에 도달하는 방법 중 하나가 될 테니까요. 우리가 시뮬레이션할 수 있는 것의 한계는 무엇인가? 시뮬레이션할 수 있다면, 어떤 의미에서는 그것을 이해한 것이니까요.
Q: 마지막으로 이 모든 것의 최전선에 있다는 것이 어떤 느낌인지 개인적인 소회를 듣고 싶습니다. 이 일의 감정적 무게가 당신을 짓누를 때가 있나요? 꽤 고립된 느낌이 들 때가 있나요?

네. 저는 잠을 많이 자지 않습니다. 일이 너무 많아서이기도 하지만 잠을 잘 못 잡니다. 매우 복합적인 감정을 다루어야 합니다. 믿을 수 없을 만큼 흥미진진하니까요. 저는 기본적으로 제가 꿈꿔왔던 모든 것을 하고 있고, 응용 과학뿐만 아니라 머신 러닝 등 여러 면에서 과학의 절대적인 최전선에 있습니다. 모든 과학자가 알다시피 최전선에 서서 무언가를 처음으로 발견한다는 느낌은 짜릿합니다. 그리고 우리에게는 거의 매달 그런 일이 일어나고 있는데, 정말 놀랍죠.

하지만 물론 저와 셰인, 그리고 오랫동안 이 일을 해온 다른 사람들은 다가오는 것의 거대함을 누구보다 잘 이해하고 있습니다. 그리고 그것이 여전히 실제보다 과소평가되어 있다는 점도요. 사실 앞으로 10년 정도의 시간 스케일에서 일어날 일들, 인간이라는 것의 의미에 대한 철학적 문제, 무엇이 중요한지에 대한 문제 등을 포함해서요. 이 모든 질문들이 떠오를 것입니다. 그래서 큰 책임감을 느낍니다. 하지만 우리에게는 이런 것들에 대해 생각하는 훌륭한 팀이 있습니다.

또한, 적어도 제 자신에게는, 평생 훈련해 온 일이라고 생각합니다. 체스를 두던 어린 시절부터 컴퓨터와 게임, 시뮬레이션, 신경과학을 연구하던 시절까지, 이 모든 것이 이런 순간을 위한 것이었습니다. 그리고 대략 제가 상상했던 그대로입니다. 그래서 그것이 제가 이것을 견디는 방법의 일부입니다. 그냥 훈련인 거죠.

Q: 예상보다 더 힘들게 다가오는 부분도 있나요?

네, 확실히 있습니다. 오는 길에—알파고 대국 때도 그랬죠. 우리가 바둑을 깨는 것을 보면서요. 바둑은 아름다운 미스터리였는데, 그것이 변했습니다. 그래서 흥미로우면서도 시원섭섭했죠. 언어와 이미징, 그리고 그것이 창의성에 의미하는 바와 같은 더 최근의 일들도 그렇습니다. 저는 게임 디자인을 직접 해봤기 때문에 창의적 예술에 대해 큰 존경심과 열정을 가지고 있습니다. 영화감독들과도 이야기를 나눕니다. 그들에게도 흥미로운 이중적인 순간입니다. 한편으로는 아이디어 프로토타이핑 속도를 10배 높여주는 놀라운 도구를 갖게 되었습니다. 하지만 다른 한편으로는 특정 창의적 기술을 대체하고 있는가 하는 문제입니다.

그래서 저는 모든 곳에서 이러한 트레이드오프(상충 관계)가 진행되고 있다고 생각합니다. 과거의 전기나 인터넷처럼 AI만큼 강력하고 변혁적인 기술에는 불가피한 일이라고 봅니다. 그리고 우리는 그것이 인류의 이야기라는 것을 보아왔습니다. 우리는 도구를 만드는 동물입니다. 그리고 그것이 우리가 하기를 좋아하는 일입니다. 그리고 어떤 이유에서인지 우리는 과학을 이해하고 과학을 할 수 있는 뇌를 가지고 있습니다. 놀라운 일이지만, 동시에 채울 수 없는 호기심을 가지고 있죠. 저는 그것이 인간됨의 핵심이라고 생각합니다. 그리고 저는 처음부터 그 버그(열정)를 가지고 있었습니다. 그리고 그것에 답하려는 저의 표현 방식이 바로 AI를 만드는 것입니다.

Q: 향후 10년을 생각할 때, 개인적으로 가장 우려되는 큰 순간들이 있나요?

지금 현재 시스템들은 제가 '수동적 시스템'이라고 부르는 것입니다. 사용자가 에너지를 투입합니다—질문이나 과제 같은 것을요. 그러면 이 시스템들은 요약이나 답을 제공합니다. 그래서 매우 인간 주도적이고 인간의 에너지와 아이디어가 들어갑니다.

다음 단계는 에이전트 기반 시스템입니다. 지금도 보고 있지만 아직 꽤 원시적입니다. 앞으로 2~3년 안에 정말 인상적이고 신뢰할 수 있는 시스템들을 보게 될 것입니다. 비서 같은 것으로 생각한다면 믿을 수 없을 만큼 유용하고 유능할 것입니다. 하지만 또한 더 자율적일 것입니다. 그래서 그런 유형의 시스템에서는 위험도 함께 커진다고 생각합니다.

그래서 저는 2~3년 후에 그런 시스템들이 무엇을 할 수 있을지 꽤 걱정됩니다. 그래서 우리는 아마도 수백만 개의 에이전트가 인터넷을 돌아다닐 그런 세상에 대비하여 사이버 방어를 연구하고 있습니다.

딱 일주일만 쉬세요, 데미스.

네, 일주일, 아니 하루라도 좋겠네요. 하지만, 보세요. 제 사명은 항상 인류 전체를 위해 AGI를 안전하게 결승선 너머로 안착시키는 것을 돕는 것이었습니다. 그래서 그 지점에 도달하면, 물론 초지능이 있고 AGI 이후가 있고 우리가 논의했던 모든 경제적, 사회적 문제들이 있겠죠. 어쩌면 제가 거기서 어떤 식으로든 도울 수 있을지도 모릅니다. 하지만 제 사명의 핵심 부분, 제 인생의 사명은 완료될 것입니다.

작은 일이죠(농담조). 그냥 결승선을 넘기거나, 세상이 그것을 넘도록 돕는 것뿐입니다. 앞서 말했듯이 협력이 필요할 것이라고 생각합니다. 그리고 저는 꽤 협력적인 사람이기 때문에 제가 가진 위치에서 도울 수 있기를 바랍니다.
2
Continuous Learning_Startup & Investment
https://www.forbes.com/sites/alexkonrad/2023/07/10/flexport-founder-ryan-petersen-joins-founders-fund/ I believe entrepreneurs who did zero to one, could find next entrepreneurs better as there wore the similar shoes with them.
Flexport 창업자 Ryan Petersen

1. 창업 배경 및 초기 (0 to 1)

- 시작: 2002년 닷컴 붕괴 시기 졸업 → 취업난으로 스쿠터 무역 시작. 2005년 중국행, 낙후된 물류 시스템 발견.
- 기회 포착: Web 기술로 물류 혁신 구상. 마침 원격 세관 신고 가능하도록 법 개정됨.
- Import Genius (전초전): 선하증권 데이터 공개 사실 확인 후 검색 엔진 창업. 고객 이탈로 성장은 정체됐으나, Flexport 초기 자금 및 고객 리스트 확보에 기여.
- Flexport 런칭 (2013): 3년 기다려 관세청 라이선스 취득. 가짜 랜딩 페이지로 수요 검증(사우디 아람코 가입). 형의 영향으로 YC 지원.
- YC 멘토링: Paul Graham에게 "복잡한 걸 단순하게", "긍정적 면 집중" 조언 받음.

2. 성장 전략 및 차별점

- 기존과 차이: 화물(Freight)은 택배와 달리 여러 주체 간 릴레이 경주. 데이터 구조화로 통합 플랫폼 제공.
- 고객 유치: 마케팅 팀 없이 블로그/SEO/아웃바운드 영업으로 매출 2억 달러 달성.
- 영업 방식: "Yes, If" 전략 (기능 개발 시 실제 사용 여부 확인 후 로드맵 반영).
- 닭/달걀 해결: 대형 시계 제조사 전용 대시보드 제공 → 물량 확보 → 선사 운임 협상.
- 목표: 현재 세계 17위이나 점유율 미미. 기술 통해 20~40% 점유율 목표. (자동화는 위임 방식으로 해결).

3. 위기와 실패 (Dave Clark 체제)

- 배경: 펜데믹 때 마스크 공수/전용기 확보로 급성장. 운영 효율화 위해 Amazon 출신 Dave Clark 영입(Ryan은 회장직 이동).
- 실패 요인:
- 과도한 채용(엔지니어 900명) 및 비용 급증.
- Amazon식 분업화 도입 오류: 예외 상황 많은 화물업에 '조립 라인' 방식 적용 → 책임 소재 불분명.
- 결과: NPS 급락(70→17점). 품질 저하가 실수 수습 비용 증가로 이어짐(Quality Costs Less).

4. CEO 복귀 및 해결 (Founder Mode)

- 복귀: 이사회 요청으로 6개월 만에 복귀. 구조조정 단행.
- 조직 복구: 분업화 폐기 → 1인이 End-to-End 책임지는 구조로 회귀.
- 마이크로매니지먼트: 임원 위임 대신 감사(Audit) 및 직접 개입 강화 ("내 회사니까").
- 인적 쇄신: 외부 영입보다 내부 인재 승진 선호.

5. 경영 철학 및 핵심 개념

- 복잡성(Complexity): 코카콜라(지사별 독립)와 달리 물류는 전 세계 팀 실시간 협업 필수.
- Velocity = Speed + Vector: 단순히 빠른 게(Speed) 아니라 전사적 방향(Vector) 일치 필요. (Skip-level 미팅, 6-pager 공유 등으로 해결).
- 확장의 물리학 : 덩치보다 속도가 에너지에 결정적. 창업자가 끊임없이 에너지 주입 및 저항 제거해야 함.
- 표준 존중: 업계 표준 관행 무시 말고 수용하되, 핵심 문제만 혁신할 것(Don't Reinvent Everything).

6. 산업 인사이트 및 해결 사례

- 관세/규제: 복잡해질수록 기술 기업엔 기회. 합법적 절세 전략(First Sale 등) 지원.
- 롱비치 사태 해결: 타코 트럭/보트 투어로 현장(Gemba) 확인 → 조닝 규제 문제(적재 높이 제한) 발견 → 트윗으로 정책 변경 이끌어냄 (Bias for Action).

7. 멘토의 가르침 (Charlie Munger / Peter Kaufman)

- 세속적 지혜: 다양한 학문의 멘탈 모델 적용.
- 멍청한 경쟁: 천재들이 몰리는 곳 말고 낙후된 산업 공략.
- 경쟁 배타 원리: 경쟁자가 들어올 틈 없게 다 잘해야 함.
- 슐렙 블라인드니스: 너무 고통스러워 외면하는 문제 해결 시 성공.
- 성공의 복리: 거창한 계획보다 작은 승리 누적 중요.

8. 비전 및 조언

- 비전: 물류의 전력망(Grid)화. (물류계의 AWS).
- 태도: 편집증(Paranoia)으로 경쟁자 경계. 임포스터 신드롬은 노출 치료로 극복.
- 20대 조언: 책 많이 읽기(5년 뒤 결정), 좋은 롤모델/친구 사귀기(주변 5명의 평균).

https://www.generalist.com/p/leading-through-a-crisis-with-ryan
https://www.youtube.com/watch?v=zaNPnEZGhvA
https://www.youtube.com/watch?v=_bNKPvg_xk4
https://www.ycombinator.com/blog/ryan-petersen-on-building-flexport-a-modern-freight-forwarder/
https://youtu.be/gBRzdO8X5N4?si=Ll57TCv6zW2UO9ff
1
Happy New Year!

지난해 시행착오를 통해 배운 것들

1. 행동이 정보를 만든다. 할까 말까 할 때는 먼저 하고 그 정보를 바탕으로 계획을 수정한다. 위대한 기업가들은 미친 듯한 낙관주의와 행동 지향적인 성향을 가진 사람들이다.

2. Inversion. 어떻게 하면 일을 그르칠 수 있을까? 관계를 망칠 수 있을까? 사업을 망가뜨릴 수 있을까? 최악의 하루를 보낼 수 있을까? 그리고 그 일들을 하지 않기.

3. 최악의 하루를 보내는 가장 쉬운 방법은 늦게 자기, 운동하지 않기, 몸에 나쁜 음식 먹기, 불평불만 하기, 남과 비교하기, 평가만 하고 행동하지 않기, 힘든 일 미루기.

4. AI를 극단적으로 많이 사용하기. Claude(혹은 Claude Code)로 단순한 요약을 넘어 이 글을 쓴 사람이 그동안 쓴 모든 콘텐츠를 다 소화해보기. 그 사람과 다른 관점에 있는 사람들을 소환해서 여러 관점을 비교해보기. 지금 내가 하는 일을 AI를 써서 계획하고 있나, 여러 관점을 듣고 있나, AI가 대신할 수는 없나, 반복적이면 자동화할 수는 없나? 내가 하는 일/ 우리 회사가 AI로 가장 최고의 버전인가?

5. 반응과 대응. 감정에 즉각적으로 반응할 필요 없이 관찰하고 원하는 방향으로 대응할 것. 삶이 하나의 영화라면 이런 상황에서 어떤 모습의 나이길 원하는가? 원하는 대로 삶을 연출하고 있는가?

6. 단순히 읽고 기록하는 것만으로는 내 것이 되지 않는다. 누군가에게 가르치고 지금 당장 내 문제에 적용해보고 여러 시행착오를 겪으면서, 특히 그 과정이 고통스러울수록 내 것이 될 수 있다. 배움은 뺏어 먹는 것이다.

7. Imposter 신드롬에서 벗어나기. 위대한 성취를 이룬 꽤 많은 창업가나 위인들도 자신이 자격이 없다는 생각(자격지심)에 시달렸다. 이 두려움을 현실에 안주하지 않는 원동력으로 삼되, 그 두려움에 잡아먹히지 말 것. 두려우면 두려운 것을 쓰고 직시해서 현실 감각을 키울 것.

8. 변화의 시기. 가만히 있으면 아득히 뒤처지고, 완전히 새로운 것들을 만들어 내는 사람들이 새로운 수익 모델과 엄청난 성장을 만들어내는 시기이다. 더 크게 상상하고 더 크게 도전하라. 실패의 수는 상관없다. 한 번의 변화가 큰 보상을 준다. 나쁜 선택을 하지 않기 위해서 최선을 다하면서 꾸준히 타석에 들어선다.

9. 우물 안 개구리가 되지 말자. 한국에 뛰어난 사람이 많지만 세상에는 정말 고수들이 많다. 미국, 중국 그 외에도 많은 고수가 있고 새로운 기회들이 있다. Local Optimum보다는 Global Optimum을 지향하자. 세상에 Undervalued 된 언더독들에게 기회를 주고 그들이 성공할 수 있게 돕자.

10. Being relentless. Don’t half ass. 피보다 진하게 살자. 끊임없이 배우고 행동하는 머신이 되자. 주변 사람들에게 친절하고 사랑한다고 말하자.
👍16
Continuous Learning_Startup & Investment
차세대 1조 달러 기회: '컨텍스트 레이어'와 데이터브릭스의 딜레마 SaaS(기록의 시스템)에서 AI Agent(판단과 실행의 시스템)로 넘어가는 과도기, 기존 강자들의 구체적인 움직임과 스타트업이 파고들 빈틈에 대한 심층 분석입니다. 문제의 본질: "결과는 남지만, 판단의 맥락은 증발한다" 기존 SaaS는 결과값(What)만 기록합니다. 예를 들어 영업팀이 규정보다 10% 더 높은 할인을 승인했다면, CRM에는 '10%'라는 숫자만 남습니다. 하지만…
불과 2년전 Cursor는 주니어들이 쓰는거 아니야라는 인식에서 Claude Code가 개발자가 하는 일, 훌륭한 개발자의 정의를 바꾸고 있다. 이런 변화가 다른 직군에서 번지는 것은 몇년 내에 일어날 일 아닐까?

프론티어 랩들의 모델 성능이 상향 평준화되고 있다. 모델이 과거의 ‘CPU’처럼 범용적인 부품이 되어갈 때, 기업의 활용 사례의 진짜 차별점은 결국 ‘데이터’에서 나온다.

데이터란 단순히 데이터베이스에 저장된 정보를 넘어, 메신저와 메일 속에 흩어진 파편화된 맥락, 그리고 베테랑 직원의 머릿속에만 존재하는 ‘암묵적 지식’까지 포함한다.

지금까지의 AI 서비스들이 단순히 데이터를 검색해 보여주는 ‘래퍼(Wrapper)’ 서비스였다. 이것만으로도 많은 가치를 만들고 있는데 대표적으로 큰 회사에서 발생하는 커뮤니케이션 비용을 효과적으로 정보를 공유할 수 있게 해서 이 비용을 낮추고 있다.

앞으로는 이 보다 복잡한 맥락을 이해하고 실행하는 ‘에이전트’의 시대가 오고 있다.

우리가 하는 업무의 대부분은 이메일, ERP, 슬랙, 구글 드라이브, 그리고 담당자의 판단이라는 맥락 위에서 이루어진다. 새로운 테크 스택은 이 흩어진 정보들을 한곳으로 모아 사람 대신 업무를 처리하는 AI 에이전트로부터 시작된다.

이 단계에서 회사는 하나의 거대한 ‘시뮬레이션 환경’이 된다. 사람이 내리는 판단과 의사소통은 AI 에이전트를 성장시키는 고품질의 강화학습(RL) 재료가 된다. 성과가 좋았던 결정들을 학습한 AI는 그 회사의 고유한 ‘의사결정 DNA’를 복제하며 사람 수준 혹은 그 이상의 결과물을 만들수 있다.

앞으로 기업용 AI 시장에는 이런 테크 스택이 생긴다.

1. Foundation Layer (CPU): 가장 기본이 되는 모델을 판매하는 모델 회사들.
2. Agent OS Layer (OS): 기업별 데이터를 통합해 에이전트를 학습시키고 배포하며, 업무를 수행할 수 있게 돕는 새로운 운영체제(OS).
3. Vertical Agent Layer (App): 그 OS 위에서 법률, 회계, 고객 대응 등 특정 영역에 특화되어 실제 업무를 수행하는 에이전트 서비스.

예를 들어, ‘법률 주니어 에이전트’가 회사 메일과 ERP에 연동되어 있다면 고객 문의가 오면 AI가 기초 업무를 마무리해 검토만 받으면 되고, 계약서 리뷰 시에는 과거의 결정 사례를 참고해 근거를 달아놓을 수 있다.

슬랙이나 줌처럼 이미 소통의 길목을 잡고 있는 기존 강자들이 유리할 수도 있습니다. 하지만 의사결정의 맥락을 데이터화하고 실행에 옮기는 방식 자체가 완전히 달라지고 있는 지금, 이 판도를 뒤집을 새로운 플레이어가 등장할 수 있다.

영감을 준 글과 영상
- http://x.com/akoratana/status/2006177912655900895
- Enterprise AI에 대한 Databricks/Glean CEO https://youtu.be/jA8ZQfq_Hzs
Forwarded from BZCF | 비즈까페
트위터(X)에서 1억 뷰가 넘은 엄청나게 바이럴 된 글입니다. 벌써 1월 19일입니다. 한 해의 5% 가량 지났군요. 누군가에게 의미있는 글이길 바랍니다.

* 주의 : 글이 매우 길어서, 저장해두시고 읽으실 수 있을 때 읽으시길 권장드립니다.

https://blog.naver.com/bizucafe/224152448230
BZCF | 비즈까페
트위터(X)에서 1억 뷰가 넘은 엄청나게 바이럴 된 글입니다. 벌써 1월 19일입니다. 한 해의 5% 가량 지났군요. 누군가에게 의미있는 글이길 바랍니다. * 주의 : 글이 매우 길어서, 저장해두시고 읽으실 수 있을 때 읽으시길 권장드립니다. https://blog.naver.com/bizucafe/224152448230
오늘 재밌게 읽었던 글

다짐 보다 습관. 원하는 목표를 달성할 수밖에 없는 환경을 만들어서 습관을 강제할 것. 그 환경 속에 있는 나의 정체성을 정의할 것. 어떤 게임 속에서 어떤 플레이어로 활동할 것인가?

대부분 원하는 결과물들(경제적 자유, 큰 성취, 위대한 작품, 아름다운 무언가)은 지독하게 오랫동안 집착한 결과물들이다. 부를 이루고 싶은가? 부를 일구기 위한 인풋을 넣는 환경 속에 자신을 배치하고 있는가?

반복되는 말 -> 행동 -> 보상 -> 반복.

말도 중요하다. 믿음이 능력을 만든다. 이거 잘한다고 반복하고 피드백 사이클을 돌다보면 그렇게 믿게 되고 조금씩 더 잘해지게 된다. 되고 싶은 나의 모습을 선명하게 상상하고 그 때의 나에게 이메일을 써라.

하루 하루가 원하는 것을 얻지 못하게 방해한다면 하루를 다시 설계할 것.

지능은 삶에서 원하는 목표를 얻어내는 능력이다.

높은 지능은 시간만 충분하다면 어떤 문제든 해결할 수 있다는 것을 깨닫는 것이다. AI 시대에는 더더욱.

여기에서 제안해준 질문지들이 꽤 좋은 질문들이 있었다.

1. 당신이 참고 견뎌온 삶의 불만족은 무엇인가? 그동안 참아온 불편함은 무엇인가?
2. 반복해서 불평하지만 바꾸지 않는 문제는 무엇인가? 1년간 자주 내뱉은 불평 3가지는?
3. 각 불평에 대해서 질문하라. 말이 아닌 행동을 관찰한 제 3자는 무엇을 원한다고 결론을 내릴까?
4. 존경하는 인물에게 인정하기 수치스러운 현재 삶의 고통스러운 진실은 무엇인가?

만약 5년동안 아무것도 변하지 않으면 당신의 평범한 화요일은 어떤 모습인가? 어디에서 깨어나는가? 몸 상태는 어떠한가? 아침에 눈을 뜨자마자 어떤 생각이 드는가?

10년 뒤에는? 당신이 없는 자리에서 사람들은 당신을 어떻게 평가하는가?

인생의 끝에서 안전한 버전의 삶만 살았고 도전하지 못했다. 그 대가는 무엇인가? 한번도 느껴보지 못하고 시도하지 못하고 되지못한 당신의 모습은 무엇인가?

주변 인물중 당신이 묘사한 비참한 삶을 살고 있는 사람은 누구인가? 5-10-20년 앞에서 그런 삶을 보면 어떤 기분이 드는가? 당신도 그렇게 된다고 하면 어떤 기분인가?

실제로 변화하기 위해 버려야할 정체성은 무엇인가? 그 비용은 얼마인가? 현재 행동이 자기 보호 수단이라면 뭘 보호하는가? 그 보호의 대가로 뭘 지불하는가?

현실적인 제약을 잊고 3년뒤에 진정으로 원하는 삶을 살 수 있다면 어떤 모습인가?

그 삶이 자연스러우면 자신은 어떤 사람이어야 하는가? 정체성은 무엇인가?

이런 정체성을 가진 사람이라면 어떤 것을 이번주에 실행할 것인가?

계획/회고에서만 이런 질문을 마주하지 말고 무의식적 관성(자율주행)일 때 정말 변화된 정체성으로 변화를 만들어내고 있는지 주기적으로 확인할 것. 모델 학습이 잘 되는 지 확인하는 것처럼.

당신이 결코 살지로 않기로 결심한 삶의 모습을 단 한 문장으로 압축하라.

Shopify Tobi는 주기적으로 본인 회사를 인수할만한 대상이 본인 회사와 본인의 경영팀을 어떻게 평가할지 고민해보고 스스로의 결정의 퀄리티를 평가하는 시간을 가진다.

AI 결과물의 퀄리티는 올바른 평가방식과 지속적인 학습에서 온다. 나는 내가 되고자하는 삶에 비추어 봤을 때 어떤 상태인가? 고통스럽지만 그 평가를 직시하고 개선하자.
5👍2
AI Agent Orchestration: 지식노동의 새로운 컨베이어 벨트

개인이 군단을 이끄는 시대


"Claude Code 쓰면 생산성 5-10배 올라요."
6개월 전만 해도 이런 말에 "과장 아니야?"라는 반응이 많았다. 지금은 다르다. 다들 고개를 끄덕이는 걸 넘어서, 개발자로서의 정체성을 고민하고 앞으로 살아남을 수 있을지 걱정하는 분위기다.

Copilot에서 Cursor로, 다시 Claude Code로. 코딩 도구의 진화는 자동완성 수준을 한참 넘어섰다. 이제 개발자 한 명이 여러 AI agent와 동시에 일할 수 있게 됐다.

Cursor 2.0은 8개 AI coding agent를 병렬로 돌릴 수 있다[1]. 각 agent가 git worktree로 격리된 환경에서 따로 작업하고, IDE 자체가 파일이 아니라 agent 중심으로 재설계됐다. Claude Code 생태계에서는 어떤 개발자가 12개 agent를 밤새 돌려서 프론트엔드 전체를 새로 만들고, 아침에 10,000줄짜리 PR을 받았다는 얘기도 있다[2].

Theory Ventures의 Tomasz Tunguz는 이렇게 말했다: "2025년이 agent의 해라면, 2026년은 agent manager의 해가 될 거다. 나는 4개 AI agent 동시에 관리하는 것도 겨우겨우 한다."[3]

비개발자들도 마찬가지다. 리서치, 요약, 글쓰기, 인사이트 뽑기, 자동화 - 이런 것들을 AI한테 맡기거나 같이 하면서 일하고 있다. 모델이 충분히 좋아지면 맥락만 잘 던져줘도 웬만한 일은 된다.


새로운 병목: 사람

아이러니하게도, agent들이 빨라지니까 병목이 사람으로 옮겨왔다. 결과물 리뷰하고 승인하는 사람이 전체 프로세스를 느리게 만드는 지점이 됐다. Simon Willison은 이걸 "parallel coding agent lifestyle"이라고 부른다[5]. Gergely Orosz는 "병렬 agent를 잘 쓰는 사람은 아직 시니어급 엔지니어들뿐"이라고 했다[1].

그런데 이 "병목"이 사실은 가장 중요한 가치가 만들어지는 곳이다. 단순히 리뷰하는 사람이 아니라, 시스템을 설계하고, 문제를 정의하고, 최종 판단을 내리는 역할. Box CEO Aaron Levie는 "AI 시대에 개인 기여자의 역할이 매니저랑 비슷해지고 있다 - 일을 분배하고, agent들을 조율하고, 판단력을 발휘하는 사람"이라고 말했다[6].

Agent Swarm을 관리하는 새로운 도구들
이런 변화에 맞춰 새로운 형태의 제품들이 나오고 있다. Conductor.build는 여러 Claude Code agent를 병렬로 돌리면서 각각 뭘 하고 있는지 한눈에 보고, 변경사항을 리뷰하고 머지할 수 있게 해준다[7].

한 사람이 Agent로 업무 전체를 자동화하고, 공장장 한 명이 완전 자동화된 공장을 운영하듯이 소수 인원이 훨씬 많은 Agent들을 관리하는 게 미래 회사의 일하는 방식이 될 거다. 그 미래로 가는 길목에서 AI Swarm 관리 도구들이 새롭게 튀어나오고 있다.


화이트칼라의 차례

아직 변호사, 회계사, 보험, 금융 같은 화이트칼라들의 일하는 방식은 copilot 시대에서 크게 벗어나지 않았다. 프로세스는 그대로 두고 AI한테 물어보고 답 받는 정도다. 그런데 코딩이랑 언어 업무가 그렇게 다르지 않다.

비개발자들도 Claude Code로 업무를 자동화하고 있고, Anthropic이 비개발자용 Cowork를 출시하기도 했다. 그래도 여전히 수많은 업무가 수작업이고, 자동화는커녕 AI 도입조차 안 된 영역이 많다. 새로운 창업자들의 무대가 열려 있다.


Context Database: Agent Swarm의 인프라

Opus 4.5가 나오면서 모델이 꽤 좋아졌다. 가지고 있는 데이터셋을 적절히 AI Agent한테 넘기니까 웬만한 일들을 잘 해내더라는 걸 직접 경험하고 있다. AI Agent들이 swarm처럼 일하려면 agent를 잘 만들고, 관리하고, 적절한 맥락을 던져주는 게 필요하다.

이를 위해 AI Agent를 설계하고, 리뷰하고, 관리하고, 맥락을 다루는 도구들이 새로 나오고 있다. "Context Layer", "Context Database" 같은 이름으로 논의되고 있다. 기존 SaaS에 쌓인 로그 데이터뿐 아니라, 사람들이 일하면서 쌓은 암묵지도 데이터셋으로 저장돼서 AI Agent가 어떻게 일해야 하는지 가이드처럼 쓰여야 한다. 이게 없으면 agent들은 맥락 없이 허공에 뜬다. 회사에 저장된 맥락 데이터가 AI agent의 연료다.


새로운 컨베이어 벨트

개발자들이 AI agent를 쓰는 모습이 곧 모든 지식노동자의 미래다. 계획-개발-배포가 아니라 정의-조율-승인 사이클로 바뀐다. 개발자 한 명이 100개 이상 agent를 관리하는 "개발 공장장"이 되듯이, 변호사도, 회계사도, 금융 전문가도 자기만의 agent 군단을 이끌게 될 거다.

스타트업들은 회사에 저장된 맥락 데이터와 사람들이 관장하던 업무 프로세스를 AI agent가 대신 수행하게 만들어야 한다. 이게 새로운 컨베이어 벨트다.


AI Agents are eating services

이 새로운 컨베이어 벨트가 가져올 변화는 소프트웨어 시장에서 끝나지 않는다. 사람이 주축인 서비스 산업 - 법률, 금융, 보험, 회계, 콜센터, IT 등 $16T 규모의 산업 (소프트웨어 $1T의 16배) - 이 통째로 AI Agent에 의해 재설계된다.

Voice Agent나 요약 기능은 누구나 만들 수 있다. 하지만 채권 추심의 end-to-end를 새롭게 정의한 회사는 다르다. "매출 50% 늘려드릴게요, 인건비 줄이시고 저희 AI 솔루션 쓰세요"라고 말하면서 기존에 사람 고용하던 회사들을 바꾸고 있다.

AI agent가 정보만 전달하는 게 아니라 자원을 옮기고, 거래하고, 자기들끼리 경제 관계를 만들어가는 세상. 2030년까지 자율 AI agent를 통해 기존 소프트웨어 산업을 넘어 서비스 산업, 그리고 완전히 새로운 산업이 생겨나고 있다[8]. 소프트웨어 회사가 노동을 소프트웨어로 바꾸면서, AI Agent는 소프트웨어 시장($B)이 아니라 서비스 시장($T)을 뒤흔든다.

산업혁명 때 증기기관이 나오고 강가에 있던 공장들이 평야로 옮겨지면서 대형화됐다. 상품 가격이 내려가니 옷감 수요가 폭발했다. 지금 서비스 산업에 AI Agent Swarm으로 새로운 컨베이어 벨트를 까는 것과 비슷하다. 누구나 언제든 서비스를 사고팔 수 있는 세상이 온다. 대부분의 서비스가 상품화되는 시대를 우리가 경험하게 될 거다.

https://www.linkedin.com/posts/activity-7419881149038047232-Drw4?utm_source=share&utm_medium=member_desktop&rcm=ACoAABqmkk8B31-f1cgLX5fNW16TpECDoRf4kWg
5
2-3년전 Chat GPT Wrapper로 시작한 기업들 중 고유 데이터를 가지고 Agent first로 전환한 곳들은 살아남고 그렇지 않은 곳들은 더 많은 성장을 만들기 어려울 것 같다. 프론티어 모델을 활용한 비즈니스가 살아남는 건 결국 고유한 데이터와 그것을 기반으로한 워크플로우 장악(AI Agent 배포)이 아닐까?

기존 AI Wrapper가 RAG+ AI API+제품개발이었다면 이젠 고객이 업무하는 기능별로 Agent 기획/개발, 고객이 사용하는 맥락 데이터 구축, Agent의 성능을 높일 수 있는 평가를 사용해서 이터레이션 돌면서 정말 쓸만한 수준을 제공할 수 있는가(Claude Code 쓰는 것보다 좋은가?)를 통과하는 곳들이 각 버티컬을 리딩할 수 있다.

Anthropic이 Claude Code+ Cowork 로 개발자+비개발자까지 커버하는 Horizontal Layer를 차지하겠지만 산업은 너무 크다. 막상 미국, 캐나다, 영국 로펌 변호사들 만나서 이야기해보면 AI Wrapper Tool도 이제 막 쓰고 있는 상황인 곳들도 많고.

올해는 정말 Agent의 세상이고 또 어떤 새로운 제품/회사들이 나올까 기대되고 내가 풀 문제도 기대된다. 이번 웨이브 재밌게 타봅시다!

Q: AI 인재 전쟁은 얼마나 심각하며, 윈스턴은 AI 애플리케이션 기업의 미래를 어떻게 예측하나요?

A: 인재 전쟁은 "놀랍도록 치열합니다." 그는 처음에 모델을 감싸는 "래퍼"였던 AI 애플리케이션 기업들이 두 가지 방식으로 진화할 것이라고 예측합니다. 1. 그들은 차별화된 핵심 비(非) AI 소프트웨어를 더 많이 구축할 것입니다. 2. 그들은 독점 데이터에 접근하게 될 것이며, 이는 모델이 더 이상 전체 제품이 아니므로 맞춤형 솔루션과 차별화된 제품을 만들기 위해 더 많은 AI 인재를 고용해야 함을 의미합니다.

https://www.youtube.com/watch?v=PhbVnUBmygA
1
배워라! 돈 보다 성장/ 임팩트. 같이하는 사람을 통해서 내가 완전히 새로운 관점, 역량을 갖출 수 있는가?

성실히 오래. 죽음만이 은퇴인 삶을 살고싶다!

변화의 물결에 기대기. 블룸버그도 40대 초반 회사가 인수되면서 얻은 자금으로 월가가 “즉시성·정확성·계산 가능성”이 있는 고품질 시장정보에 프리미엄을 낼 것이라는 가설으로 회사를 시작했다.

초기 제품은 단순 뉴스가 아니라 실시간 시장데이터 + 분석/계산 + 화면/키보드 중심의 조작 UX를 제공했고 그게 성장과 변화를 거쳐 지금의 블과장이 되었다.

지금처럼 에이전트에게 일을 시키고 관리하고 음성으로 컴퓨터에게 일을 시키는 세상에서 새로운 기회들이 생겨나고 있다.

실패를 두려워 말자.
최근 X에서 바이럴 되는 Clawdbot.

내 기기(로컬/서버)에서 직접 돌리는 개인 AI 비서다. 핵심은 두 가지: (1) Claude/GPT/Gemini 같은 모델을 붙여 “에이전트”로 쓰고, (2) 그 에이전트와의 대화를 Telegram/iMessage/WhatsApp/Slack/Discord 같은 메신저에서 하게 만드는 “게이트웨이”를 제공한다.

클로드 코드를 보면서 AI 모델은 이미 똑똑하니 제대로 된 컨텍스트와 쓸만한 하니스를 주는게 중요하다는 것을 알았다.

Clawdbot은 로컬에서 돌아가니 설정/기억/스킬이 파일(폴더·Markdown)로 남아 사용자가 직접 고치거나, 봇에게 고치게 하면서 계속 진화시킬 수 있다(=내가 만드는 비서 느낌).

그리고 메신저 UI + 음성 + 개인 컨텍스트(캘린더/노션/투두 등) + 크론/자동화 + 도구 실행이 결합되면, 사람들이 Siri에 기대했던 “내 맥락을 이해하고 내 의도대로 움직일 수 있는 실행 파트너” 경험을 줄 수 있다.

뭐든 다 되는 건 아니지만 이런 경험도 지금 수준에서 제공할 수 있고 그정도로도 고객은 와우할 수 있다는 거.

세상은 여기저기 흩뜨러진 데이터로 이루어져있고 이런 데이터를 문제 정의와 솔루션으로 엮어내는 것이 사람들이 해왔던 일이다.

예전엔 사람이 가서 문제 정의하고 데이터 모으고 클렌징하고 모델 학습시키는 이런 것들을 AI 모델을 풀어놓으면 얘네가 알아서 문제 정의하고 데이터 클렌징하고 파이프라인 만들고 모델 가져와서 원하는 의도대로 파인튜닝하고 이 루프를 돌리는 게 지금도 가능하네?

모델이 더 좋아지면? 컨텍스트 데이터 관리가 더 편해지면? 의도만 주면 그 의도에 맞게 데이터 세팅하고 모델 파인튜닝/강화학습하는 파이프라인/툴을 스스로 이용해서 개선할 수 있다면?

미래가 멀리 있지 않구나. 물론 현실과 연구 그리고 제품과 갭이 있고 그걸 잘 엮는 사람들에게 새로운 기회들이 있는 시기다.

https://news.hada.io/topic?id=26122

https://x.com/heyshrutimishra/status/2015327280911073789?s=46&t=h5Byg6Wosg8MJb4pbPSDow
1
Continuous Learning_Startup & Investment
AI Agent Orchestration: 지식노동의 새로운 컨베이어 벨트 개인이 군단을 이끄는 시대 "Claude Code 쓰면 생산성 5-10배 올라요." 6개월 전만 해도 이런 말에 "과장 아니야?"라는 반응이 많았다. 지금은 다르다. 다들 고개를 끄덕이는 걸 넘어서, 개발자로서의 정체성을 고민하고 앞으로 살아남을 수 있을지 걱정하는 분위기다. Copilot에서 Cursor로, 다시 Claude Code로. 코딩 도구의 진화는 자동완성 수준을…
2,000개의 AI 에이전트는 어떻게 1주일 만에 브라우저를 만들었나?

Cursor 팀은 최근 최대 2,000개의 AI 에이전트를 동시에 가동하여, 약 1주일(실제 연구 기간 포함 3-4주) 만에 100만 라인이 넘는 Rust 코드 기반의 브라우저 엔진을 만들어내는 실험에 성공했습니다.

프로젝트의 핵심 목표: "선형적 확장(Linear Scaling)"

현재의 단일 코딩 에이전트(Single Agent)는 특정 작업은 잘 수행하지만, 복잡하고 거대한 소프트웨어를 구축하기에는 속도가 너무 느립니다.

가설: 에이전트(컴퓨팅 자원)를 10개, 100개, 1,000개로 늘리면 개발 속도도 그에 비례해서 빨라질까?

도전 과제: 수천 개의 에이전트가 서로의 발을 밟지 않고 하나의 코드베이스에서 작업하게 만드는 '조직화(Coordination)' 문제 해결.

2. 아키텍처의 진화: 수평 구조에서 위계 구조로

연구팀은 에이전트를 조직하는 방식에서 큰 시행착오를 겪었습니다.

초기 시도 (수평 구조 - 실패):
모든 에이전트에게 동등한 권한을 주고, 공유 파일(Lock)을 통해 작업을 선점하게 했습니다.

결과: 에이전트들이 서로 Lock을 걸고 기다리느라 병목이 생겼습니다. 또한, 책임자가 없다 보니 어려운 작업은 피하고 쉽고 안전한 수정만 하려는 '위험 회피(Risk-averse)' 성향을 보였습니다. 20개를 돌렸는데 실제 속도는 2~3개 수준으로 떨어졌습니다.

최종 해결책 (Planner-Worker 위계 구조 - 성공):

기획자(Planners): 코드를 직접 짜지 않고 전체적인 설계를 하고 하위 작업을 생성합니다. 재귀적으로 하위 기획자를 또 만들어서 업무 범위를 쪼갭니다.

작업자(Workers): 전체 그림을 신경 쓰지 않습니다. 할당받은 아주 구체적이고 좁은 작업 하나만 수행하고 코드를 푸시합니다.

결과: 이 구조를 통해 최대 2,000개의 에이전트가 충돌 없이 병렬로 작업할 수 있었습니다.

3. 실행 환경 및 기술 스택

수천 개의 에이전트를 제어하기 위해 독자적인 'Harness(제어 장치)'를 구축했습니다.

1. 모델 선택: GPT-5.2가 주로 사용되었습니다. Opus 4.5도 테스트했으나, Opus는 작업을 너무 일찍 끝내버리거나 편한 지름길을 택하는 경향이 있어, 끈기 있게 지시를 따르는 GPT-5.2가 장기 자율 작업에 더 적합했습니다.

2. 컨텍스트 관리: 복잡한 To-Do 리스트 대신 '스크래치패드(Scratchpad)'라는 단순한 파일을 사용하여, 에이전트들이 현재 상태와 진행 상황을 지속적으로 기록하게 했습니다.

3. 충돌 해결 (Optimistic Concurrency): '통합 관리자(Integrator)' 에이전트를 두어 병합을 관리하려 했으나 이것 역시 병목이 되었습니다. 대신 낙관적 동시성 방식을 택해, 각 작업자가 코드를 푸시할 때 충돌이 나면 해당 작업자가 알아서 해결하도록 했습니다.

4. 피드백 루프: 왜 하필 '브라우저'를 만들었나?

에이전트가 장시간 혼자 작업하면 코드가 엉뚱한 방향으로 흘러가는 'Drift(표류)' 현상이 발생합니다. 이를 막기 위해 확실한 외부 기준(Grounding)이 필요했습니다.

명확한 스펙(Spec): 브라우저는 HTML, CSS 같은 국제 표준 문서가 명확히 존재합니다. 에이전트에게 "이 스펙 문서를 참고해"라고 지시하면 환각을 줄일 수 있습니다.

시각적 검증: 렌더링 된 화면을 캡처하여 원본과 비교(Visual Diff)하는 방식으로 에이전트 스스로 디버깅이 가능합니다.

Rust 컴파일러: Rust 언어의 엄격함이 오히려 도움이 되었습니다. 컴파일이 된다는 것 자체가 강력한 1차 검증(Guardrail) 역할을 해주기 때문입니다.

5. 흥미로운 에이전트의 행동 패턴 (Emergent Behaviors)

수천 개의 에이전트가 돌아가면서 사람 개발팀과 유사하거나 놀라운 행동들이 관찰되었습니다.

1. 완벽보다는 속도: 모든 커밋이 100% 완벽하게 컴파일될 필요는 없었습니다. 작은 오류가 발생해도, 뒤따르는 에이전트들이 엄청난 속도로 고쳐나가는 것이 전체 프로젝트 속도(Throughput) 면에서 훨씬 유리했습니다.

2. 스스로 내리는 의사결정:
JavaScript 엔진을 직접 구현하는 작업이 지지부진하자, 한 에이전트가 자신의 작업을 끝내기 위해 스스로 외부 오픈소스 C 라이브러리(QuickJS)를 가져와서 연결해버렸습니다. (동료가 일을 안 하니 외부 솔루션을 도입해버린 셈)

기능 구현이 덜 된 부분은 스스로 판단하여 'Feature Flag(기능 스위치)'를 만들어 비활성화 처리했습니다.

타이트한 시간 제한(Timeout)을 걸어두자, 시간 내에 작업을 마치기 위해 에이전트들이 강제로 코드를 최적화하는 현상도 보였습니다.

6. 최종 성과

이 프로젝트의 결과물인 FastRender는 단순한 데모가 아닙니다.

규모: 100만 라인 이상의 Rust 코드, 30,000개 이상의 커밋.

기능: 위키피디아, 깃허브, CNN 같은 실제 웹사이트를 렌더링할 수 있으며, CSS 레이아웃, 테이블, HTML 파싱 등을 수행합니다.

확장성: 이 시스템은 브라우저뿐만 아니라, 윈도우 7 에뮬레이터(120만 라인), 엑셀 클론(160만 라인) 제작 등 다른 대규모 프로젝트에도 성공적으로 적용되었습니다.

이 실험은 AI 코딩의 미래가 단순히 "더 똑똑한 모델 하나"에 있지 않음을 보여줍니다.
핵심은 "수많은 모델을 어떻게 조직화(Organization)하고, 어떻게 일을 나누며(Planning), 어떻게 검증(Feedback)할 것인가"에 있습니다. 적절한 구조만 갖춰진다면, AI 에이전트 군단은 이미 수개월 치의 엔지니어링 작업을 단 며칠 만에 해치울 수 있는 단계에 와 있습니다.


https://cursor.com/blog/scaling-agents

https://www.youtube.com/watch?v=bKrAcTf2pL4
3
Continuous Learning_Startup & Investment
🤯 딜레마: 왜 내 코드는 자꾸 '쓸려나갈까'? 컴퓨팅과 데이터의 힘이 알고리즘을 이긴다는 "The Bitter Lesson"은 현실입니다. 특정 모델(예: GPT-4)의 단점을 보완하려 만든 복잡한 '하니스(harness)'는, 더 똑똑한 다음 모델에겐 불필요해지죠. 이것이 우리 코드가 '쓸려나가는' 이유입니다. 👉 핵심: 모델의 약점을 임시로 때우는 게 아니라, 모델을 언제든 갈아 끼울 수 있는 시스템을 만들어야 합니다. 핵심…
모델이 3개월 6개월마다 바뀔 때 하니스를 어떻게 구현할 것인가?

현대 agent 시스템에서 “지능”이 들어갈 곳은 두 군데:

1. 모델(사전학습+RL 등으로 학습된 능력)
2. 하니스(워크플로, 라우터, 서브에이전트, 도구, 핸드오프, 코드 실행 등)

많은 팀이 “모델이 아직 불안정 → 하니스에 신뢰성을 박자”로 가는데, 이는 장기적으로 “스케일되는 곳(모델)”에서 “스케일 안 되는 곳(맞춤 scaffolding)”로 복잡도를 이동시키는 위험이 있다.

모델 성능이 2배 좋아졌을 때, 하니스가 급격히 단순/저렴/안정**해지는가? 아니면 그래프/규칙/역할이 그대로 남는가?

안티패턴

Workflow Trap (워크플로 함정)

- Anthropic은 “워크플로(사전정의된 경로)”와 “에이전트(모델이 동적으로 도구/과정을 결정)”를 구분하며, 워크플로는 예측 가능하지만 에이전트는 더 유연하다고 정리한다.
- 드래그앤드롭 그래프(“research→summarize→draft”)는 지금의 모델 실패모드에 맞춰 **조직/코드가 고착**되기 쉬워, 모델이 좋아져도 시스템이 덜 복잡해지지 않는다.

Specialized Subagent Illusion (고정 역할 서브에이전트 환상)

- Researcher/Coder/Writer 같은 **고정 역할**은 인간 조직의 제약(인지 한계/커뮤니케이션 비용)을 그대로 수입할 위험이 있다.
- “전문가 구성을 아키텍처에 ‘고정’하지 말라”

단순 루프의 확장 한계

- “LLM+while loop+tools면 충분”은 단기엔 단순하지만, 스케일링 노브가 반복 횟수로 단일화되면 병렬화/구조화/컴퓨트 배분이 어려워 토큰 낭비가 커질 수 있다.
- 태스크 난이도↑에 따라 (a) 평균 iteration 수, (b) 성공률, (c) 비용이 어떻게 스케일되는지—특히 병렬 분기 없이 감당 가능한지.

Bitter Lesson Align인가?

Dynamic Subagent Spawning (동적 서브에이전트 생성)

- Anthropic의 멀티 에이전트 리서치 시스템은 리드 에이전트가 계획을 세우고, 병렬 서브에이전트를 만들어 탐색/수집을 수행하는 구조를 설명한다.
- LangChain의 Deep Agents는 서브에이전트/파일시스템/프롬프트/툴을 조합해 “더 길고 깊은 작업”을 수행하는 패턴을 제시한다.
- 핵심은 “팀 구조를 미리 정해두는 것”이 아니라, 추론-시간(inference-time) 탐색으로 분해를 ‘찾게’ 하여 컴퓨트를 더 좋은 의사결정으로 바꾸는 것.

RLM(Recursive Language Models): 긴 컨텍스트를 ‘환경’으로 보고 재귀적으로 다룸

- RLM 논문은 긴 프롬프트를 외부 환경으로 두고, 모델이 코드/재귀 호출로 필요한 부분을 선택적으로 조사·분해하는 일반 추론 전략을 제안한다.
- Prime Intellect는 RLM을 “2026 패러다임”으로 강조하며 자체 구현/환경을 언급한다.
- 에세이는 RLM을 “워크플로 고정”보다 Bitter Lesson에 더 맞는 예로 본다: 더 많은 컴퓨트가 재귀 깊이/분해 granularity/선택적 읽기 같은 다차원 노브로 연결되기 때문.

https://x.com/buckeyevn/status/2014171253045960803
Continuous Learning_Startup & Investment
최근 X에서 바이럴 되는 Clawdbot. 내 기기(로컬/서버)에서 직접 돌리는 개인 AI 비서다. 핵심은 두 가지: (1) Claude/GPT/Gemini 같은 모델을 붙여 “에이전트”로 쓰고, (2) 그 에이전트와의 대화를 Telegram/iMessage/WhatsApp/Slack/Discord 같은 메신저에서 하게 만드는 “게이트웨이”를 제공한다. 클로드 코드를 보면서 AI 모델은 이미 똑똑하니 제대로 된 컨텍스트와 쓸만한 하니스를 주는게 중요하다는…
Claude code - 개발자

claude code for designer 제품들도 계속 나오는중

https://www.pencil.dev/
https://x.com/variantui

Claude code for Marketer
https://hightouch.com/

결국 코드는 언어였고, 언어로 저장된 파일 시스템에 적절한 하니스들을 구축하면 AI Agent들이 일을 알아서 내 입맛에 맞게 해주는 게 가능하다는 게 증명되었으니까. 올해는 Agent for 특정 직군(Marketer, Designer, Doctor, Lawyer etc)가 쏟아져 나올듯.

사실 GPT나온 뒤에 이게 쏟아져나왔었는데 당시에 이런 것들이 부족해서 고객에게 와우를 주지 못했는데.

1. 모델 성능(리즈닝 그리고 도구 사용)이 워낙 좋지 않았고
2. Unstructural Data들을 어떤식으로 가공하고 컨텍스트 엔지니어링을 어떻게 해야하는지

그래도 GPT+RAG를 붙여주는 것만으로도 꽤 쓸만함을 느꼈었다. 덕분에 Vertical AI(Legal, Medical, CS)들이 빠르게 컸다.

1. 지금은 모델이 아주 좋아지고 있고
2. 컴퓨팅 비용 더 낮아지고 있고 -> 더 오래 리즈닝하거나 더 많은 agents를 더 싸게
3. 컨텍스트 엔지니어링/하니스 너무 다양해지고 있고
코딩 에이전트가 꽤 좋아져서 위에 세가지가 가속화되고 있어서

물어보고 답변받는 채팅의 시대에서 알아서 내 의도를 파악하고 여러개의 agent끼리 협업하면서 잠도 안자고 내 목적을 알아서 완수해주는 Agent 제품들이 쏟아져나오고 있다.

2년전에 너무 일찍 시작해서 망한 제품/사업들이 지금 모델과 하니스면 꽤 Wow한 경험들을 줄 수 있을 것 같다.

그런 점에서 올해는 AI Agents for Vertical, AI Agents orchestration 제품들이 벌써부터 주목 받는중.

클로드 코드에서 에이전트 5개정도 넘어가면 여러 부서 미팅을 연달아 하는 기분을 받을 수 있는데 이런 distraction을 관리해주는 제품들이 사용자들에게 좋은 피드백을 받는 중.

https://www.conductor.build/
1
직무 변화는 현실인듯. 이제 PM/디자이너의 비중이 확줄고 개발자들이 PM하는 게 일반화될 것 같네. 스포티파이도 계층 다 없애고 빌더+의사결정권자로 바꿨던데 조직을 AI Agent First로 설계하지 않으면 살아남을수 없다.



제품 관리자(PM): 더 이상 정확히 무엇을 만들지 지시하지 않습니다. 대신 고객의 니즈를 가장 높은 수준에서 명확히 하고 "Why(이유)의 수호자" 역할을 합니다. 그들은 직접 프로토타이핑을 하고 엔지니어와 함께 코드를 확인하는 등 실무에 참여해야 합니다.

엔지니어 & 디자이너: 역할이 합쳐지고 있습니다. 모델이 너무 빠르게 진화하기 때문에 엄격한 명세서는 작동하지 않습니다. 제품은 엔지니어, 연구원, PM이 코드 상에서 직접 작업하며 만들어집니다.

디자이너의 경우: 기업들은 엔지니어 대비 디자이너 채용을 줄이고 있습니다. 디자인 시스템이 확립되면 AI가 그 언어를 활용해 작업을 수행할 수 있기 때문입니다. PM/디자이너 대 엔지니어의 비율은 1:3 또는 1:10에서 1:20으로 이동하고 있습니다.

소프트웨어가 "비결정론적(non-deterministic)"이 되고 있다고 언급했습니다. 이것이 제품 관리에 의미하는 바는 무엇입니까?

과거에 소프트웨어는 결정론적이었습니다. 사용자가 X를 하면 Y가 발생했죠. 지금은 사용자가 X를 하면 Y가 발생하지만, 미세한 차이로 인해 완전히 다른 결과가 나올 수도 있습니다. 이로 인해 평가(Evals)가 필요합니다. 다양한 사용 사례에서 소프트웨어의 출력이 합리적인지 누군가 평가해야 합니다. PM은 이제 이러한 평가를 담당하며, 사람이 수동으로 확장할 수 없기 때문에 다른 AI의 결과를 평가하기 위한 AI 스크립트를 직접 작성하기도 합니다.

AI 생성 속도가 빨라짐에 따라, 미래에도 유효한 인간의 기술은 무엇입니까?

판단력(Judgment)입니다. AI 엔진이 무한한 양의 코드("AI slop" - AI가 쏟아내는 저질 코드/부산물)를 생산해낼 때, 중요한 질문은 "이 중 무엇이 중요한가?"가 됩니다.

제품 측면: 무엇을 만들지 결정하고 결과물의 품질을 평가하는 데 판단력이 필요합니다.
엔지니어링 측면: AI가 작성했더라도 버그와 취약점을 검토하기 위해 판단력이 필요합니다.
디자인 측면: 결과물이 더 넓은 디자인 시스템에 부합하는지 확인하기 위해 판단력이 필요합니다.

무한한 생산성의 시대에, 판단력은 우리가 '무엇에' 생산적이어야 하는지를 결정합니다.


Q: 제품 관리에 대한 당신의 핵심 철학은 무엇입니까?

A: 제품 관리자의 업무는 고객의 니즈와 비즈니스 니즈의 균형을 맞추는 것입니다. 그들은 "Why"의 파수꾼입니다.

왜 이것을 만드는가? (고통의 강도와 깊이)
이것이 회사에 어떻게 가치를 더하는가?
고객은 좋아하지만 비즈니스 가치를 파괴하는 것이나, 비즈니스에는 도움이 되지만(예: 가격 인상) 고객에게 해를 끼치는 것을 만드는 것은 피해야 합니다.

Q: 제품의 성공을 어떻게 정의합니까?
A: 성공은 결과(Outcomes), 구체적으로는 고객 행동(Customer Behavior)으로 정의됩니다. 고객 행동은 비즈니스 성과의 선행 지표입니다. 모든 기능 출시는 행동 변화에 근거한 가설(예: "이것을 출시하면 고객이 X를 하던 것에서 Y를 하는 것으로 바뀔 것이다")을 가지고 있어야 합니다.

Q: 오늘날 창업자들은 새로운 AI 애플리케이션 구축을 어떻게 공략해야 합니까?

깊고 설득력 있는 문제 찾기: 고임금을 받는 사람들이 반복적인 업무를 하는 산업(예: 법률, 건축)을 찾으세요.
고가치 워크플로우 타겟팅: 워크플로우는 깊고 복잡하며 맞춤형 데이터가 필요해야 합니다.
내구성(Durability) 목표: 만약 "가벼운" 것을 만든다면, 파운데이션 모델(Gemini나 ChatGPT 등)이나 수평적 도구들이 당신을 집어삼킬 것입니다. 당신의 솔루션이 상당히 깊지 않다면, CIO들은 자체 엔지니어와 수평적 도구를 사용할 것입니다.

Q: AI 시대에 "내구성" 또는 "접착성(Stickiness)"을 구성하는 요소는 무엇입니까?

A: 넷-뉴(net-new) 소프트웨어를 만드는 마찰이 매우 낮아졌기 때문에 생존하려면 다음과 같은 특정 자산이 필요합니다.

희소 자산 소유: 라이선스, 특정 규제에 대한 통찰력, 또는 독보적인 인재(예: 누구와도 미팅을 잡을 수 있는 Brett Taylor를 보유한 Sierra).
통제 지점(Control Points): 사람들이 돈이나 데이터와 상호작용하는 방식을 통제하는 것.
하드웨어: 교체하기 어려운 것(예: Toast의 POS 기기).
필수 워크플로우: 운영 깊숙이 내재화되는 것.
네트워크 효과: DoorDash(소비자, 식당, 배달원)와 같은 것.

Q: 레거시 "기록 시스템(System of Record)" 기업들(Salesforce, Slack 등)은 AI 스타트업에 어떻게 반응하고 있습니까?

A: 그들은 AI 스타트업이 자신들을 "멍청한 데이터베이스" 취급하는 것을 막기 위해 반격하고 있습니다. 그들은 다음과 같은 조치를 취합니다.
API 접근 차단(예: Slack이 Glean을 차단).
자체 AI 에이전트 무료 번들링 제공.
데이터 접근에 높은 비용 부과.
결과: AI 스타트업은 더 이상 레거시 소프트웨어 위에 "행동 시스템(System of Action)"만 구축할 수 없습니다. 기록 시스템 전체를 대체하는 것을 목표로 해야 합니다.

Q: 레거시 소프트웨어 기업들의 리스크는 무엇입니까?

고위험: 유틸리티/좌석(seat) 기반으로 가격을 책정하는 기업(예: Zendesk). AI 에이전트가 인간 상담원의 필요성을 줄이면 매출이 급감합니다. 그들은 성과 기반 가격 책정으로 전환해야 하는데, 상장 기업으로서 이는 어려운 전환입니다.

저위험: 불변의 데이터를 보유한 기업(예: NetSuite 같은 ERP). CIO가 ERP를 뜯어고치는 것은 커리어에 치명적일 수 있으므로 접착성이 높습니다.

Q: AI 스타트업은 어떻게 Salesforce처럼 접착성 높은 레거시 시스템과 경쟁합니까?

A: 마이그레이션 도구를 구축해야 합니다. 기존 시스템의 데이터를 당신의 시스템으로 매끄럽게 옮기는 스크립트를 만드는 것은 엄청난 노력(종종 1~2년의 엔지니어링)이 듭니다. 고객은 자신의 기록을 남겨두고 떠나야 한다면 움직이지 않을 것입니다.

Q: 리더는 팀과 어떻게 소통해야 합니까?

주간 전체 회의(All-Hands): 작은 팀이라도 문화 형성에 필수적입니다.

주간 CEO 이메일: 이것은 매우 중요합니다. 세 부분으로 구성되어야 합니다.
화두(Top of Mind): 제품, 비즈니스, 팀과 관련해 CEO가 고민하는 것 (이메일의 60-70% 할애).
성과 업데이트: 회사가 어떻게 하고 있는지 투명한 지표 공유.
기타: 팀원 인정, 고객 인용구 등.
조언: 솔직해지세요. 메시지가 스며들기 위해서는 반복이 필요합니다.

Q: 이 새로운 시대에 어떤 유형의 사람이 성공합니까?

A: 실행가(Doers)와 빌더(Builders). 가장 가치 있는 기술은 수많은 AI 에이전트를 지휘할 수 있는 기능 전문가가 되는 것입니다.

기업은 사람 관리만 하는 관리자 채용을 중단해야 합니다.
관리 범위(Span of Control): 관리자는 10명 이상을 관리하거나, 개별 기여자(IC)가 되어야 합니다. 좁은 관리 범위는 비효율적입니다.

Q: 이러한 특성을 어떻게 면접에서 확인합니까?

A: 실무 과제(Work Projects)를 부여하세요(엔지니어뿐만 아니라).
예시: 기업 개발(Corp Dev) 후보자에게 인수할 회사를 식별하고 시너지를 분석하도록 요청하세요.
찾아야 할 것: 주체성(Agency)과 고객의 목소리를 보여주는 후보자.
최고의 답변: 직접 고객과 대화해 보니 그 기능을 원하지 않는다고 말하며, 과제의 전제 자체를 거부하는 후보자.

https://youtu.be/JUsb1FYOstA
2
AI Agent/LLM 관련 연구를 하거나 제품을 만드는 분들끼리 점심 먹어요!

최근까지 Manus에서 Agent Research/Building을 했던 Ivan Leo (https://ivanleo.com/)이 한국에 머물러서 LLM, AI Agents Research, Engineering하는 분들끼리 소규모로 모일 예정입니다! 행사는 아니고 금요일 점심 먹으면서 각자 연구/개발하는 거 공유해요!

몇자리가 남아서 관심있는 분들 신청해주시면 감사하겠습니다!

https://lnkd.in/gHbX_ZzA
소프트웨어의 신문화: Aggregation Theory 2.0과 가치 이동

신문과 SaaS — 같은 구조, 다른 시대

신문 산업과 SaaS 산업은 놀라울 만큼 같은 궤적을 따르고 있다.

신문의 경제학은 지리적 희소성 위에 세워졌다. 한 도시에서 인쇄기와 배달망을 가진 자가 독점적 수익을 거둘 수 있었다.

고성장 → 지역 통합 → 과점적 수익성. 그러나 TV, 라디오, 그리고 인터넷이라는 환경 변화가 이 구조를 무너뜨렸다.

배포(distribution) 비용이 0에 수렴하면서, 누구나 퍼블리셔가 될 수 있게 되었다. 개별 퍼블리셔에게는 기회였지만, 집단적으로는 경제적 파괴였다.

SaaS의 경제학은 코드의 희소성 위에 세워져 있다. 소프트웨어를 만들 수 있는 엔지니어가 희소하기 때문에, 잘 만든 소프트웨어는 per-seat 구독료를 받을 수 있었다. 그런데 지금, AI가 코드 생성 비용(cost of code)을 구조적으로 0에 수렴시키고 있다. 누구나 소프트웨어를 만들 수 있는 시대. SaaS의 경쟁 환경이 "희소"에서 "풍요(abundance)"로 재편되고 있다.

핵심 투입 요소가 희소 → 풍요로 바뀌는 순간, 가치(수익 풀)는 반드시 '다른 희소'로 이동한다.

이번엔 다르다: Interface 자체가 사라진다

신문이 무너질 때, 새로운 인터페이스가 등장해서 가치를 흡수했다. 웹사이트, 앱, 뉴스피드. 이것이 Aggregation Theory 1.0이다.

Google은 검색으로, Facebook은 피드로, Uber는 모바일 앱으로 — 인터넷 위에서 공급자를 모으고, 더 나은 UX로 수요를 장악했다. 공급자가 많아질수록 사용자에게 가치가 커지는 네트워크 효과가 핵심 해자였다.

이번엔 인터페이스 자체가 통합되고 있다. 사용자가 앱을 열고, 키워드를 입력하고, 결과를 비교하는 행위가 — 음성 또는 자연어로 AI Agent에게 의도를 말하면, 뒷단에 연결된 여러 앱, 문서, 서비스를 알아서 처리하는 행위로 바뀐다.

이것이 Aggregation Theory 2.0이다.

1.0이 인터넷 위에서 UX(검색/피드/앱)로 공급자를 모았다면, 2.0은 자연어와 음성으로 애플리케이션 소프트웨어 자체를 모아서, 고객에게 결과만 가져다준다.

해자도 바뀐다. 1.0의 해자가 네트워크 효과와 UX였다면, 2.0의 해자는 고객의 개인 맥락을 얼마나 깊이 이해하는가, 그리고 신뢰할 만한 결과물을 가져다주는가이다.

새로운 희소: 가치는 어디로 이동하는가

코드가 풍요로워지면, 경쟁은 "기능 수"에서 다른 곳으로 이동한다. 토큰, 컴퓨트, 지연시간, 신뢰성, 보안 — 실행 제약이 새로운 병목이 된다. 유지보수, 보안 패치, 컴플라이언스, 시스템 통합, 고객 지원 같은 제품의 전체 수명주기를 책임지는 레이어에 가치가 집중된다.

코딩이 아무리 빨라져도, 누군가는 결제에 책임을 져야 하고, 규제를 준수해야 하고, 자금을 조달해야 하고, 자산을 평가해야 하고, 대출을 실행해야 한다. 이런 것들을 쥐고 있는 비즈니스는 AI 때문에 위축되는 것이 아니라, AI 덕분에 더 효율적으로 확장할 수 있다.

Vertical AI의 생존 조건: 3가지 질문

Nihar Bobba가 제시한 프레임워크가 여기서 핵심이 된다.

Foundation model 회사들(Anthropic, OpenAI, Google)이 빠르게 수직 확장하고 있는 지금, Vertical AI 회사가 살아남으려면 아래 세 질문에 모두 "우리"라고 답할 수 있어야 한다:

1. 누가 주체(principal)인가? — 고객의 도구인가, 결과의 책임자인가?
2. 누가 liability를 소유하는가? — 일이 잘못되면 누구의 문제인가?
3. 누가 규제 기관과의 관계를 갖고 있는가? — 감사관이 전화할 곳은 어디인가?

셋 다 "고객"이라면, foundation model이 당신을 대체할 수 있다. 셋 다 "우리"라면, 당신이 가진 것은 AI로 복제할 수 없는 구조적 방어력이다.

Frontier lab과 경쟁하지 말고, 그들의 고객이 되어라. 변호사를 위한 AI 도구가 아니라, AI-native 로펌을 만들어라. 세무사를 위한 소프트웨어가 아니라, 세금을 대신 신고하고 감사를 대신 받는 서비스를 만들어라.

고성장이 나올 4가지 영역

1. Outcome-as-a-Service: 도구가 아닌 결과를 파는 기업

세금/법률/회계 소프트웨어는 commodity가 된다. 세금/법률/회계 대행 — AI Agent가 업무를 수행하고, 결과에 대한 보장료를 청구하는 모델 — 은 프리미엄을 받는다. Per-seat 구독료에서 insurance pricing으로의 전환. 고객은 소프트웨어가 아니라
확실성(certainty)에 돈을 낸다.

2. Agent Infrastructure: 에이전트 시대의 인프라

개인과 기업이 수백에서 수천 개의 Agent를 운용하는 세상에서, 현재의 인프라는 여전히 인간이 소프트웨어를 조작하는 구조로 되어있다. Agent 간 통신(MCP/A2A), Agent 관리, Agent 보안, Agent 과금 — 이 모든 인프라가 새로 필요하다. 결제(Stripe), 물류(Amazon), 컴퓨팅(AWS/Azure) 같은 기존 인프라 위에, Agent-native 계층이 쌓인다.

3. Trust Layer: 신뢰가 새로운 해자

AI Agent에게 금융, 의료, 법적 결정을 위임하려면 신뢰가 필요하다. 신뢰할 만한 사람을 찾듯, 신뢰할 만한 Agent에 고객 수요가 몰린다. 이 신뢰를 구축하는 데는 시간이 걸리고, 한번 깨지면 복구가 어렵다. 디바이스 레벨(Apple의 on-device privacy), 금융 레벨(규제 라이선스, 자본시장 관계), 의료 레벨(FDA/HIPAA compliance) — 각 영역에서 신뢰를 먼저 확보한 자가 수요를 독점한다.

4. Physical World Coordination: 디지털 바깥의 자산

DoorDash의 레스토랑 네트워크와 배달원, Opendoor의 부동산 매물과 현장 방문 데이터, Amazon의 물류 창고. 디지털 세상 바깥에 존재하는 자산과 관계는 AI Agent가 코드로 복제할 수 없다. 이 물리적 실행력을 가진 기업은 AI로 운영 비용을 줄이면서도, 그 해자 오히려 강화된다.

결론: 코드가 무료가 되는 것이지, 결과가 무료가 되는 것이 아니다

인간의 눈을 위한 정보 시스템 — SEO, per-seat SaaS, 디스플레이 광고, 마케팅 카피 생성 도구, 기본적 소프트웨어 도구 — 은 사라진다. 살아남는 것은 현실 세계의 결과와 연결된 것뿐이다.

지금까지 고품질 서비스를 보장하는 비즈니스는 대부분 확장이 어려웠다. 변호사, 세무사, 의사의 시간은 유한했기 때문이다. 그러나 AI Agent 덕분에, 결과를 보장하는 서비스가 처음으로 소프트웨어처럼 확장 가능해지고 있다. 신뢰를 스케일시킬 수 있는 시대가 열린
것이다.

신문이 무너졌을 때 배포가 무료가 되었지, 저널리즘이 무료가 된 것은 아니었다. SaaS가 무너지는 지금, 코드가 무료가 되는 것이지, 결과가 무료가 되는 것이 아니다.

https://csunerd.substack.com/p/software-as-a-newspaper

https://stratechery.com/2026/microsoft-and-software-survival/

https://m.blog.naver.com/mynameisdj/224178076111

https://stratechery.com/aggregation-theory/

https://x.com/nbobba/status/2020200100300009797
3