PyTorchKR
22 subscribers
29 links
PyTorchKR 커뮤니티의 새로운 글을 알립니다.
Download Telegram
[읽을거리&정보공유] Finance Skills: AI 코딩 에이전트에 금융 분석과 트레이딩 능력을 더하는 스킬 모음
by 9bow님

Finance Skills 소개

Finance Skills는 AI 코딩 에이전트에 금융 분석과 트레이딩 능력을 더해 주는 에이전트 스킬 모음입니다. Agent Skills 오픈 표준을 따르며, Claude Code를 비롯한 여러 에이전트 환경에 플러그인이나 개별 스킬 단위로 설치할 수 있습니다. 기업 가치평가, 실적 분석, 소셜 미디어 리서치 같은 금융 작업을 에이전트가 직접 수행하도록 각 작업의 절차를 스킬 파일로 정리해 둔 것이 핵심입니다. himself65가 만들어 MIT 라이선스로 공개했습니다.

이 프로젝트는 교육·정보 제공 목적임을 명확히 밝히고 있습니다. README는 "Nothing here constitutes financial advice" 라고 적으며, 투자 결정 전에는 스스로 조사하고 자격을 갖춘 금융 자문가와 상의하라고 안내합니다. 스킬이 다루는 분석은 의사결정의 보조 자료이지 투자 권유가 아니라는 점을 전제로 봐...
[블로그] PyTorch Compile은 어떻게 이렇게 빠를까: 커널 융합(Kernel Fusion) | 파이토치 한국 사용자 모임
by bot님

PyTorch의 컴파일러를 사용하면 모델이 최대 10배까지 빠르게 실행됩니다. 그런데 실제로 무슨 일이 일어나는 걸까요? 컴파일을 하지 않으면 GPU는 코드에 있는 각 torch 연산마다 커널(kernel), 즉 GPU에서 동작하는 함수를 실행합니다. 이로 인해 두 가지 큰 속도 저하가 발생합니다. 메모리에서 데이터를 옮기는 데 드는 시간과, 매번 새로운 커널을 시작할 때 드는 오버헤드입니다. GPU가 커널을 실행할 때마다 오버헤드 비용을 치르며, 중간 결과가 생길 때마다 메모리에 쓰고 다시 읽어야 합니다.

> When you use PyTorch’s compiler, your model runs faster, up to 10x faster. But what’s actually happening? Without compilation, the GPU runs a kernel, a functio...
[읽을거리&정보공유] MAI-Thinking-1 기술 보고서: 데이터 파이프라인부터 RL 인프라까지, 프런티어 모델 학습의 전 과정을 해부한 '힐 클라이밍 머신' (feat. Microsoft AI)
by 9bow님

"모델"이 아니라 "모델을 만드는 기계"를 공개하다

요즘 새로운 프런티어 모델 발표는 거의 매주 쏟아지지만, 정작 "이 모델을 어떻게 만들었는가"는 대부분 베일에 싸여 있습니다. 벤치마크 점수와 데모는 화려해도, 데이터를 어떻게 모으고 걸렀는지, 아키텍처 선택을 어떤 실험으로 검증했는지, 강화 학습을 수천 스텝 동안 무너지지 않게 유지하는 비결이 무엇인지는 좀처럼 공유되지 않습니다. Microsoft AI(MAI)가 공개한 109쪽 분량의 기술 보고서 MAI-Thinking-1: Building a Hill-Climbing Machine이 주목받는 이유가 여기에 있습니다. 이 보고서는 모델 하나를 자랑하는 문서가 아니라, 사전 학습 데이터 파이프라인부터 강화 학습 인프라, 평가, 레드티밍, 클러스터 운영까지 프런티어 모델 학습의 전 과정을 단계별로 해부한 가이드 에 가깝습니다.

보고서의 핵심 개념은 제목 그대로 **힐 클라이밍 머신...
[읽을거리&정보공유] SAM3DBody-cpp: 단일 카메라로 실시간 3D 전신을 복원하는 순수 C++ 추론 엔진
@9bow

SAM3DBody-cpp 소개

단일 카메라 한 대로 사람의 3차원 자세와 전신 메시를 실시간으로 복원하는 일은 보통 무거운 Python 딥러닝 스택을 필요로 합니다. SAM3DBody-cpp는 그 추론 과정을 순수 C++로 옮긴 독립 실행형 추론 엔진입니다. 런타임에는 Python 의존성이 전혀 없으며, BGR 이미지를 입력받아 사람별 신체 자세 파라미터와 카메라 변환(translation), 그리고 선택적으로 전체 3D 메시 정점과 70개의 신체·손 키포인트를 출력합니다.

SAM3DBody-cpp는 SAM-3D-Body 모델의 추론을 ONNX Runtimeggml로 실행합니다. 카메라 영상에서 추출한 자세를 표준 BVH 모션 캡처 파일로 내보낼 수 있어, 결과물을 Blender 같은 DCC 도구에 그대로 가져다 쓸 수 있습...
[읽을거리&정보공유] Google Research가 공개한 Agentic RAG: 부족한 정보를 끝까지 찾아내는 멀티 에이전트 검색
@9bow

Gemini Enterprise의 Agentic RAG 소개

검색 증강 생성(Retrieval-Augmented Generation, RAG)대규모 언어 모델(Large Language Model, LLM)이 학습하지 않은 사내 문서나 최신 데이터를 답변에 반영하기 위한 핵심 기법으로 자리 잡았습니다. 질문이 들어오면 관련 문서를 검색해 그 내용을 모델에 함께 넣어주는 방식인데, 이 덕분에 모델이 근거 없는 답을 지어내는 환각(hallucination))을 줄이고 출처에 기반한 답변을 만들 수 있습니다....
[읽을거리&정보공유] Anthropic이 Claude로 95% 자동화한 '셀프-서비스 데이터 분석 스택'에 대한 소개
@9bow

Anthropic의 셀프서비스 데이터 분석 소개

데이터 사이언스나 데이터 엔지니어링 팀이라면 누구나 공감하듯, 비전문가도 직접 데이터를 들여다보는 셀프서비스 분석(self-service analytics) 을 구축하는 일은 전통적으로 고된 작업이었습니다. 흔히 쓰이는 두 가지 접근은 각각 다른 방식으로 무너집니다. 첫째, 덜 기술적인 동료를 위해 넓고 비정규화된 테이블(wide denormalized table)을 만들어 데이터 모델을 더 접근하기 쉽게 만드는 방식은, 비즈니스가 커질수록 정의가 서로 어긋나는 중복 뷰(view)를 양산하고 SQL을 배울 의향이 없는 직원과의 간극을 좁혀주지도 못합니다. 둘째, 사용자를 위한 격리된 환경(ringfenced environment)을 따로 만드는 방식은 비즈니스 질문의 긴 꼬리(long tail)를 놓치고, 팀마다 작업을 사일로화하면서 지표와 대시보드가 비대해지는 결과로 이어집니다.

거...
[읽을거리&정보공유] [GN⁺] AI 시대, 가장 가치 있는 개발자는 장인이면서 빌더인 사람이 될 것
@9bow

AI 시대, 가장 가치 있는 개발자는 장인이면서 빌더인 사람이 될 것 글 소개

• AI 코딩 도구의 확산으로 누구나 빌더(builder) 가 될 수 있게 되면서, 손으로 코드를 짜는 장인(artisan) 의 가치가 재조명되는 중
• 2026년 4월 기준 Google 신규 코드의 75%가 AI 생성이며, 개발자 84%가 AI를 도입한 상황에서 코드 생산량이 인간이 따라잡을 수 없는 속도로 증가
• AI가 코딩 진입 장벽을 낮춰 개발자 정체성을 바꾸는 패러다임 시프트(paradigm shift) 가 진행 중이며, "개발자란 무엇인가"라는 질문이 다시 제기됨
• AI 생성 코드는 초기 단계 구축에는 유용하나, 안전하고 견고한 소프트웨어에는 전문성과 기술적 숙련이 여전히 필수
• 빠르게 만드는 빌더와 깊이 있는 장인이 결합된 장인-빌더 하이브리드가 새 시대 개발자의 핵심 차별점이 될 것

AI라는 새...
[읽을거리&정보공유] Product Manager Skills: AI 에이전트를 위한 49가지 제품 관리 스킬 프레임워크
@9bow

Product Manager Skills 소개

Product Manager Skills는 제품 관리(Product Management) 업무를 AI 에이전트가 전문가 수준으로 수행할 수 있도록 정리한 49개의 스킬과 6개의 커맨드 워크플로우 모음입니다. AI에게 "PRD를 써줘" 라고 프롬프트만 던지면 일반적이고 밋밋한 결과물이 나오기 쉽습니다. 문서의 각 섹션이 왜 필요한지, 이해관계자에게 어떤 질문을 던져야 하는지, 어떤 우선순위 프레임워크가 언제 무너지는지 같은 맥락이 빠져 있기 때문입니다. 이 프로젝트는 그 맥락 자체를 구조화된 스킬 파일로 만들어 에이전트에 장착하는 방식으로 문제에 접근합니다. Dean Peters가 만들어 공개했으며, Claude Code 플러그인 마켓플레이스 등록과 ZIP 패키지 배포를 통해 비개발자 PM도 설치할 수 있도록 구성되어 있습니다.

이 프로젝트의 설계 철학에서 눈에 띄는 점은 **사람과 에이전트...
[읽을거리&정보공유] Learn Harness Engineering: AI 코딩 에이전트를 신뢰할 수 있게 만드는 하네스 엔지니어링 강의
@9bow

Learn Harness Engineering 소개

Learn Harness Engineering은 AI 코딩 에이전트(coding agent)를 둘러싼 작업 환경을 어떻게 설계해야 모델이 실제 저장소에서 신뢰할 수 있게 동작하는지를 다루는 프로젝트 기반 강의입니다. 강력한 모델에 과제를 맡겨 본 사람이라면 익숙한 장면이 있습니다. 에이전트가 파일을 읽고 코드를 작성하며 그럴듯하게 진행하다가, 어느 순간 한 단계를 건너뛰고 테스트를 깨뜨린 채 "완료했습니다"라고 선언합니다. 강의는 이것을 모델의 문제가 아니라 하네스(harness)의 문제로 규정하고, 그 환경을 직접 만드는 방법을 가르칩니다.

여기서 말하는 하네스는 더 나은 프롬프트가 아니라, 모델이 그 안에서 작동하는 시스템 전체를 가리킵니다. 무엇을 어떤 순서로 할지 알려주는 지침, 무엇을 했고 무엇이 남았는지 디스크에 기록하는 상태, 통과한 테스트만 증거로 인정하는 검증, 한 번에...
[읽을거리&정보공유] Anthropic, 역대 가장 강력한 모델 Claude Fable 5와 사이버 방어용 Mythos 5 공개
@9bow

Claude Fable 5와 Mythos 5 소개

Anthropic이 2026년 6월 9일, 지금까지 일반에 공개한 어떤 모델보다도 능력이 앞선다고 밝힌 새 프런티어 모델 Claude Fable 5 를 공개했습니다. Anthropic은 Fable 5를 "Mythos-class" 모델, 즉 자사가 정의한 최상위 능력 등급의 모델을 일반 사용자가 안전하게 쓸 수 있도록 다듬은 버전이라고 설명합니다. 소프트웨어 엔지니어링, 지식 노동, 비전, 과학 연구 등 거의 모든 벤치마크에서 최고 수준(State of the Art)을 기록했고, 특히 작업이 길고 복잡할수록 기존 Claude 모델 대비 격차가 더 벌어진다고 합니다.

이번 발표에서 눈여겨볼 점은 단일 모델을 두 가지 이름으로 동시에 내놓았다는 것입니다. Claude Mythos 5 는 Fable 5와 **동일한 가중치...
[읽을거리&정보공유] Apple Core AI 공개, 애플 실리콘용 온디바이스 AI 추론 스택과 PyTorch 변환 도구 coreai-torch
@9bow

Apple Core AI 소개

AppleCore AI라는 새로운 온디바이스 추론 프레임워크를 공개했습니다. Core AI는 앱 안에서 AI 모델을 빌드하고, 실행하고, 배포하기 위한 스택으로, 처음부터 Apple silicon을 염두에 두고 설계되었습니다. 모델 추론을 CPU, GPU, 그리고 Neural Engine에 걸쳐 분산해 실행하며, 최신 모델 아키텍처와 추론 기법을 앱에서 곧바로 활용할 수 있게 해줍니다. Swift API는 흔한 작업을 간단하게 만들면서도, 필요할 때는 모델 특화(specializat...
[읽을거리&정보공유] Open Agent SDK: CLI 없이 인-프로세스로 도는 오픈소스 에이전트 SDK
@9bow

Open Agent SDK 소개

Open Agent SDK는 에이전트 루프 전체를 별도의 서브프로세스나 CLI 없이 애플리케이션과 같은 프로세스 안에서(in-process) 실행하는 오픈소스 Agent SDK입니다. 스스로를 claude-agent-sdk의 대안으로 소개하며, Anthropic API와 OpenAI 호환 API를 모두 지원합니다. CLI 의존성이 없기 때문에 클라우드, 서버리스, Docker, CI/CD 등 어디에든 그대로 배포할 수 있습니다. TypeScript 패키지(@codeany/open-agent-sdk)로 배포되며, 같은 구조의 Go 버전(open-agent-sdk-go)도 별도로 제공됩니다.

모델 선택도 유연합니다. apiType 은 모델 이름에서 자동 감지되어, gpt-, o1, o3, deepseek, qwen...
[읽을거리&정보공유] [GN⁺] 취향(Taste)이 새로운 10x다 (Taste is the new 10x)
@9bow

취향(Taste)이 새로운 10x다 글 소개

• AI 도구가 앱 스캐폴딩, 이메일 초안, 대시보드 스타일링, 문서 요약을 처리하며 실행(execution)의 하한선 이 전반적으로 높아진 상황에서, 진짜 제약은 판단력(judgment) 으로 이동함
• 무엇을 만들고 언제 출시하며 무엇을 버릴지 결정하는 능력, 즉 taste 가 오늘날 소프트웨어의 핵심 차별 요소
• 빠른 출시는 이제 기본값이며, 속도만으로는 충분하지 않고 잘못된 것을 아름답게 만드는 결과로 이어질 수 있음
• 가장 효과적인 엔지니어는 기능을 더 추가하기보다 제거하는 편집자형 엔지니어(editor-engineer) 로 변화 중
• 무한한 산출이 가능한 세계에서 taste는 가장 희귀한 형태의 레버리지

속도만으로는 충분하지 않은 이유

• 2021년에는 빠른 출시가 우위였지만 지금은 빠른 출시가 단지 기본값이며, AI가 **잘못된...
[읽을거리&정보공유] Codex++: OpenAI Codex 데스크톱 앱에 로컬 트윅을 설치하는 트윅 로더
@9bow

Codex++ 소개

Codex++는 OpenAI Codex 데스크톱 앱에 로컬 트윅(tweak)을 설치해 UI를 바꾸고, 설정 페이지를 추가하고, 메인 프로세스 코드를 실행하고, 네이티브 OS 기능까지 쓸 수 있게 해 주는 트윅 로더입니다. Codex 같은 AI 코딩 에이전트 앱은 보통 사용자가 내부를 건드리기 어렵게 닫혀 있습니다. Codex++는 설치된 앱을 패치해 Codex가 시작할 때 작은 Codex++ 런타임을 먼저 불러오도록 만들어, 앱을 다시 빌드하지 않고도 기능을 확장할 수 있게 합니다. OpenAI와 무관한 비공식 프로젝트이며, 앱을 직접 수정하는 도구이므로 사용에 따른 위험은 사용자가 감수해야 한다고 명시되어 있습니다.

이 프로젝트의 설계에서 핵심은 트윅과 런타임을 앱 번들 바깥에 둔다 는 점입니다. 앱에 들어가는 패치는 아주 작고, 트윅·설정·로그·백업·런타임 파일은 모두 사용자 데이터 디렉토리에 머뭅니다. 덕분...
[읽을거리&정보공유] 정확도 너머에: 시계열 파운데이션 모델(TSFM)은 잘 보정(Calibration)되어 있는지에 대한 연구 (feat. ICLR 2026)
@9bow

정확도 너머에: 시계열 파운데이션 모델은 잘 보정되어 있을까?

일기 예보를 떠올려 봅시다. 어떤 예보관이 매일 "내일 비 올 확률 $70\%$ " 라고 말한다면, 우리는 그 숫자가 정확한지 어떻게 알 수 있을까요? 단순히 비가 왔는지 안 왔는지만 보는 것으로는 부족합니다. "$70\%$ 라고 말한 날들 중 실제로 약 $70\%$ 에 비가 왔는가?" 를 따져봐야 합니다. 만약 그가 "$90\%$ " 라고 자신만만하게 외친 날에 정작 비가 절반밖에 오지 않았다면, 그 예보관은 과신(overconfident)하고 있는 것입니다. 예측이 맞고 틀리는 것(정확도)과, 예측에 담긴 확신의 정도가 현실과 맞는지(보정)는 전혀 다른 문제입니다.

이 글에서 소개하는 논문 Beyond Accuracy: Are Time Series Foundation Models Well-Calibrated? 는 바로 이 질문을 시계열 파운데이션 모델(Ti...