PyTorchKR
12 subscribers
24 links
PyTorchKR 커뮤니티의 새로운 글을 알립니다.
Download Telegram
[읽을거리&정보공유] [GN⁺] AI 이후의 소프트웨어: 하네스(Harness) 시대의 개막
by 9bow님

AI 이후의 소프트웨어: 하네스(Harness) 시대의 개막 글 소개

- 소프트웨어 시대의 종말은 하네스(harness) 시대의 시작 이며, 고정된 워크플로우와 관리형 DB로 작동하던 SaaS가 지능을 갖춘 AI로 대체되는 중

- AI는 강력하지만 야생마처럼 길들여지지 않은 상태로, 그 힘을 활용하기 위해서는 체계적 통제(domestication) 가 필요함

- AI 에이전트 하네스는 중심의 LLM을 둘러싼 7가지 핵심 구성요소 로 정의되며, 각 요소가 프로덕션 수준의 신뢰성과 성능을 좌우

- 모든 기업이 동일한 모델에 접근 가능한 시대에는 모델 자체가 아니라 하네스를 더 잘 설계하고 운용하는 쪽(best rider) 이 승리

- 빅랩들이 우선시하지 않는 수천 개의 분리된 시장 이 스타트업에게 기회로 남음

하네스 시대의 의미

- AI는 고정 워크플로우 기반의 SaaS와 관리형 데이터베이스를 지능(intelligence)으로 대체 하며...
[읽을거리&정보공유] Finance Skills: AI 코딩 에이전트에 금융 분석과 트레이딩 능력을 더하는 스킬 모음
by 9bow님

Finance Skills 소개

Finance Skills는 AI 코딩 에이전트에 금융 분석과 트레이딩 능력을 더해 주는 에이전트 스킬 모음입니다. Agent Skills 오픈 표준을 따르며, Claude Code를 비롯한 여러 에이전트 환경에 플러그인이나 개별 스킬 단위로 설치할 수 있습니다. 기업 가치평가, 실적 분석, 소셜 미디어 리서치 같은 금융 작업을 에이전트가 직접 수행하도록 각 작업의 절차를 스킬 파일로 정리해 둔 것이 핵심입니다. himself65가 만들어 MIT 라이선스로 공개했습니다.

이 프로젝트는 교육·정보 제공 목적임을 명확히 밝히고 있습니다. README는 "Nothing here constitutes financial advice" 라고 적으며, 투자 결정 전에는 스스로 조사하고 자격을 갖춘 금융 자문가와 상의하라고 안내합니다. 스킬이 다루는 분석은 의사결정의 보조 자료이지 투자 권유가 아니라는 점을 전제로 봐...
[블로그] PyTorch Compile은 어떻게 이렇게 빠를까: 커널 융합(Kernel Fusion) | 파이토치 한국 사용자 모임
by bot님

PyTorch의 컴파일러를 사용하면 모델이 최대 10배까지 빠르게 실행됩니다. 그런데 실제로 무슨 일이 일어나는 걸까요? 컴파일을 하지 않으면 GPU는 코드에 있는 각 torch 연산마다 커널(kernel), 즉 GPU에서 동작하는 함수를 실행합니다. 이로 인해 두 가지 큰 속도 저하가 발생합니다. 메모리에서 데이터를 옮기는 데 드는 시간과, 매번 새로운 커널을 시작할 때 드는 오버헤드입니다. GPU가 커널을 실행할 때마다 오버헤드 비용을 치르며, 중간 결과가 생길 때마다 메모리에 쓰고 다시 읽어야 합니다.

> When you use PyTorch’s compiler, your model runs faster, up to 10x faster. But what’s actually happening? Without compilation, the GPU runs a kernel, a functio...
[읽을거리&정보공유] MAI-Thinking-1 기술 보고서: 데이터 파이프라인부터 RL 인프라까지, 프런티어 모델 학습의 전 과정을 해부한 '힐 클라이밍 머신' (feat. Microsoft AI)
by 9bow님

"모델"이 아니라 "모델을 만드는 기계"를 공개하다

요즘 새로운 프런티어 모델 발표는 거의 매주 쏟아지지만, 정작 "이 모델을 어떻게 만들었는가"는 대부분 베일에 싸여 있습니다. 벤치마크 점수와 데모는 화려해도, 데이터를 어떻게 모으고 걸렀는지, 아키텍처 선택을 어떤 실험으로 검증했는지, 강화 학습을 수천 스텝 동안 무너지지 않게 유지하는 비결이 무엇인지는 좀처럼 공유되지 않습니다. Microsoft AI(MAI)가 공개한 109쪽 분량의 기술 보고서 MAI-Thinking-1: Building a Hill-Climbing Machine이 주목받는 이유가 여기에 있습니다. 이 보고서는 모델 하나를 자랑하는 문서가 아니라, 사전 학습 데이터 파이프라인부터 강화 학습 인프라, 평가, 레드티밍, 클러스터 운영까지 프런티어 모델 학습의 전 과정을 단계별로 해부한 가이드 에 가깝습니다.

보고서의 핵심 개념은 제목 그대로 **힐 클라이밍 머신...
[읽을거리&정보공유] SAM3DBody-cpp: 단일 카메라로 실시간 3D 전신을 복원하는 순수 C++ 추론 엔진
@9bow

SAM3DBody-cpp 소개

단일 카메라 한 대로 사람의 3차원 자세와 전신 메시를 실시간으로 복원하는 일은 보통 무거운 Python 딥러닝 스택을 필요로 합니다. SAM3DBody-cpp는 그 추론 과정을 순수 C++로 옮긴 독립 실행형 추론 엔진입니다. 런타임에는 Python 의존성이 전혀 없으며, BGR 이미지를 입력받아 사람별 신체 자세 파라미터와 카메라 변환(translation), 그리고 선택적으로 전체 3D 메시 정점과 70개의 신체·손 키포인트를 출력합니다.

SAM3DBody-cpp는 SAM-3D-Body 모델의 추론을 ONNX Runtimeggml로 실행합니다. 카메라 영상에서 추출한 자세를 표준 BVH 모션 캡처 파일로 내보낼 수 있어, 결과물을 Blender 같은 DCC 도구에 그대로 가져다 쓸 수 있습...
[읽을거리&정보공유] Google Research가 공개한 Agentic RAG: 부족한 정보를 끝까지 찾아내는 멀티 에이전트 검색
@9bow

Gemini Enterprise의 Agentic RAG 소개

검색 증강 생성(Retrieval-Augmented Generation, RAG)대규모 언어 모델(Large Language Model, LLM)이 학습하지 않은 사내 문서나 최신 데이터를 답변에 반영하기 위한 핵심 기법으로 자리 잡았습니다. 질문이 들어오면 관련 문서를 검색해 그 내용을 모델에 함께 넣어주는 방식인데, 이 덕분에 모델이 근거 없는 답을 지어내는 환각(hallucination))을 줄이고 출처에 기반한 답변을 만들 수 있습니다....
[읽을거리&정보공유] Anthropic이 Claude로 95% 자동화한 '셀프-서비스 데이터 분석 스택'에 대한 소개
@9bow

Anthropic의 셀프서비스 데이터 분석 소개

데이터 사이언스나 데이터 엔지니어링 팀이라면 누구나 공감하듯, 비전문가도 직접 데이터를 들여다보는 셀프서비스 분석(self-service analytics) 을 구축하는 일은 전통적으로 고된 작업이었습니다. 흔히 쓰이는 두 가지 접근은 각각 다른 방식으로 무너집니다. 첫째, 덜 기술적인 동료를 위해 넓고 비정규화된 테이블(wide denormalized table)을 만들어 데이터 모델을 더 접근하기 쉽게 만드는 방식은, 비즈니스가 커질수록 정의가 서로 어긋나는 중복 뷰(view)를 양산하고 SQL을 배울 의향이 없는 직원과의 간극을 좁혀주지도 못합니다. 둘째, 사용자를 위한 격리된 환경(ringfenced environment)을 따로 만드는 방식은 비즈니스 질문의 긴 꼬리(long tail)를 놓치고, 팀마다 작업을 사일로화하면서 지표와 대시보드가 비대해지는 결과로 이어집니다.

거...
[읽을거리&정보공유] [GN⁺] AI 시대, 가장 가치 있는 개발자는 장인이면서 빌더인 사람이 될 것
@9bow

AI 시대, 가장 가치 있는 개발자는 장인이면서 빌더인 사람이 될 것 글 소개

• AI 코딩 도구의 확산으로 누구나 빌더(builder) 가 될 수 있게 되면서, 손으로 코드를 짜는 장인(artisan) 의 가치가 재조명되는 중
• 2026년 4월 기준 Google 신규 코드의 75%가 AI 생성이며, 개발자 84%가 AI를 도입한 상황에서 코드 생산량이 인간이 따라잡을 수 없는 속도로 증가
• AI가 코딩 진입 장벽을 낮춰 개발자 정체성을 바꾸는 패러다임 시프트(paradigm shift) 가 진행 중이며, "개발자란 무엇인가"라는 질문이 다시 제기됨
• AI 생성 코드는 초기 단계 구축에는 유용하나, 안전하고 견고한 소프트웨어에는 전문성과 기술적 숙련이 여전히 필수
• 빠르게 만드는 빌더와 깊이 있는 장인이 결합된 장인-빌더 하이브리드가 새 시대 개발자의 핵심 차별점이 될 것

AI라는 새...
[읽을거리&정보공유] Product Manager Skills: AI 에이전트를 위한 49가지 제품 관리 스킬 프레임워크
@9bow

Product Manager Skills 소개

Product Manager Skills는 제품 관리(Product Management) 업무를 AI 에이전트가 전문가 수준으로 수행할 수 있도록 정리한 49개의 스킬과 6개의 커맨드 워크플로우 모음입니다. AI에게 "PRD를 써줘" 라고 프롬프트만 던지면 일반적이고 밋밋한 결과물이 나오기 쉽습니다. 문서의 각 섹션이 왜 필요한지, 이해관계자에게 어떤 질문을 던져야 하는지, 어떤 우선순위 프레임워크가 언제 무너지는지 같은 맥락이 빠져 있기 때문입니다. 이 프로젝트는 그 맥락 자체를 구조화된 스킬 파일로 만들어 에이전트에 장착하는 방식으로 문제에 접근합니다. Dean Peters가 만들어 공개했으며, Claude Code 플러그인 마켓플레이스 등록과 ZIP 패키지 배포를 통해 비개발자 PM도 설치할 수 있도록 구성되어 있습니다.

이 프로젝트의 설계 철학에서 눈에 띄는 점은 **사람과 에이전트...
[읽을거리&정보공유] Learn Harness Engineering: AI 코딩 에이전트를 신뢰할 수 있게 만드는 하네스 엔지니어링 강의
@9bow

Learn Harness Engineering 소개

Learn Harness Engineering은 AI 코딩 에이전트(coding agent)를 둘러싼 작업 환경을 어떻게 설계해야 모델이 실제 저장소에서 신뢰할 수 있게 동작하는지를 다루는 프로젝트 기반 강의입니다. 강력한 모델에 과제를 맡겨 본 사람이라면 익숙한 장면이 있습니다. 에이전트가 파일을 읽고 코드를 작성하며 그럴듯하게 진행하다가, 어느 순간 한 단계를 건너뛰고 테스트를 깨뜨린 채 "완료했습니다"라고 선언합니다. 강의는 이것을 모델의 문제가 아니라 하네스(harness)의 문제로 규정하고, 그 환경을 직접 만드는 방법을 가르칩니다.

여기서 말하는 하네스는 더 나은 프롬프트가 아니라, 모델이 그 안에서 작동하는 시스템 전체를 가리킵니다. 무엇을 어떤 순서로 할지 알려주는 지침, 무엇을 했고 무엇이 남았는지 디스크에 기록하는 상태, 통과한 테스트만 증거로 인정하는 검증, 한 번에...
[읽을거리&정보공유] Anthropic, 역대 가장 강력한 모델 Claude Fable 5와 사이버 방어용 Mythos 5 공개
@9bow

Claude Fable 5와 Mythos 5 소개

Anthropic이 2026년 6월 9일, 지금까지 일반에 공개한 어떤 모델보다도 능력이 앞선다고 밝힌 새 프런티어 모델 Claude Fable 5 를 공개했습니다. Anthropic은 Fable 5를 "Mythos-class" 모델, 즉 자사가 정의한 최상위 능력 등급의 모델을 일반 사용자가 안전하게 쓸 수 있도록 다듬은 버전이라고 설명합니다. 소프트웨어 엔지니어링, 지식 노동, 비전, 과학 연구 등 거의 모든 벤치마크에서 최고 수준(State of the Art)을 기록했고, 특히 작업이 길고 복잡할수록 기존 Claude 모델 대비 격차가 더 벌어진다고 합니다.

이번 발표에서 눈여겨볼 점은 단일 모델을 두 가지 이름으로 동시에 내놓았다는 것입니다. Claude Mythos 5 는 Fable 5와 **동일한 가중치...