[읽을거리&정보공유] Dnotitia, 검열을 제거하고 한국어를 강화한 Qwen 3.5/3.6 기반 오픈 LLM 패밀리 DNA 3.0 공개
by 9bow님
by 9bow님
PyTorchKR
Dnotitia, 검열을 제거하고 한국어를 강화한 Qwen 3.5/3.6 기반 오픈 LLM 패밀리 DNA 3.0 공개
DNA 3.0 소개 국내 AI 기업 Dnotitia(디노티시아)가 자사의 한국어 특화 대형 언어 모델 제품군인 DNA 3.0 을 Hugging Face에 공개했습니다. DNA 3.0는 알리바바 Qwen 팀의 Qwen 3.5/3.6 기반 모델 위에 추가 후처리(post-training)를 적용한 모델군으로, 0.8B부터 397B까지 여덟 가지 크기로 구성되어 있습니다. 작게는 0.8B 밀집(dense) 모델부터 크게는 활성 파라미터 17B의 397B 전문가…
[읽을거리&정보공유] RuView: 비디오 없이 WiFi 신호만으로 존재와 호흡, 심박을 감지하는 센싱 플랫폼
by 9bow님
by 9bow님
PyTorchKR
RuView: 비디오 없이 WiFi 신호만으로 존재와 호흡, 심박을 감지하는 센싱 플랫폼
RuView 소개 RuView는 카메라나 웨어러블 기기 없이 일반 WiFi 신호의 변화만으로 공간 안의 사람을 감지하고, 호흡과 심박 같은 생체 신호까지 측정하는 WiFi 센싱(WiFi sensing) 플랫폼 입니다. 사람이 움직이거나 호흡할 때 공기 중을 채우고 있는 WiFi 전파에는 미세한 교란이 생기는데, RuView는 ESP32 센서로 캡처한 채널 상태 정보(Channel State Information, CSI)에서 이 교란을 추출해 누가 어디에…
[읽을거리&정보공유] Anthropic, AI 에이전트 배포를 위한 Zero Trust 보안 프레임워크 eBook 공개 [영문/PDF/36p]
by 9bow님
by 9bow님
PyTorchKR
Anthropic, AI 에이전트 배포를 위한 Zero Trust 보안 프레임워크 eBook 공개 [영문/PDF/36p]
Zero Trust for AI Agents / AI 에이전트를 위한 제로 트러스트 보안 프레임워크 발행 / Published by: Anthropic의 Claude Security 팀 발행일 / Published: 2026년 5월 27일 (eBook 작성 기준일 2026년 5월 18일) 분량 / Length: 영문 PDF 36쪽 eBook PDF 다운로드 / Download PDF Zero Trust for AI Agents 소개 Zero Trust…
[읽을거리&정보공유] 사고 패치(Thought Patching): 프롬프트를 가중치로 바꾸는 모델 편집에 대한 연구 (feat. Google)
by 9bow님
by 9bow님
PyTorchKR
사고 패치(Thought Patching): 프롬프트를 가중치로 바꾸는 모델 편집에 대한 연구 (feat. Google)
프롬프트를 가중치로 바꾸는 사고 패치(Thought Patching) 연구 소개 시스템 프롬프트에 정성껏 적어둔 지시문은 대화가 끝나면 사라집니다. 같은 지시를 다음 요청에도 적용하려면 매번 같은 토큰을 다시 입력하고, 그만큼의 어텐션 연산 비용을 다시 지불해야 합니다. Google Research의 이번 논문 Transmuting prompts into weights 는 이 문제를 풀기 위해, 프롬프트가 모델 내부에 일으키는 효과를 사고 벡터(thought…
[읽을거리&정보공유] FLUX.2 klein LoRA 파인튜닝 가이드, RTX 4090 하나로 60분 만에 나만의 스타일 학습하기
by 9bow님
by 9bow님
PyTorchKR
FLUX.2 klein LoRA 파인튜닝 가이드, RTX 4090 하나로 60분 만에 나만의 스타일 학습하기
FLUX.2 klein 소개: 소비자용 GPU 한 장으로 파인튜닝하는 오픈 웨이트 이미지 생성 모델 FLUX.2 klein은 Black Forest Labs가 공개한 FLUX.2 제품군의 소형 오픈 웨이트 이미지 생성 모델로, 4B 모델 기준 24GB VRAM의 소비자용 GPU 한 장에서 LoRA 파인튜닝까지 가능한 것이 특징입니다. Hugging Face 공식 블로그에 공개된 이번 가이드는 RTX 4090 한 장으로 약 1시간, GPU를 빌릴 경우 약…
[읽을거리&정보공유] Odysseus: 내 하드웨어에서 데이터까지 직접 관리하는 자체 호스팅 AI 워크스페이스
by 9bow님
by 9bow님
PyTorchKR
Odysseus: 내 하드웨어에서 데이터까지 직접 관리하는 자체 호스팅 AI 워크스페이스
Odysseus 소개 ChatGPT나 Claude 같은 클라우드 AI 서비스는 편리하지만, 대화 내용과 문서, 메일 같은 데이터가 모두 외부 서버를 거칩니다. Odysseus는 이 경험을 내 하드웨어 위로 그대로 옮겨 오는 것을 목표로 하는 자체 호스팅(self-hosted) AI 워크스페이스입니다. 로컬 우선(local-first), 프라이버시 우선을 원칙으로, 내 기기에서 내 데이터로 돌아갑니다. Odysseus는 채팅 하나에 머무르지 않고, 에이전트…
[읽을거리&정보공유] DPO로 텍스트 퇴화 줄이기: 모델의 실패 출력을 거부 쌍으로 쓰는 방법에 대한 연구 (feat. DharmaOCR)
by 9bow님
by 9bow님
PyTorchKR
DPO로 텍스트 퇴화 줄이기: 모델의 실패 출력을 거부 쌍으로 쓰는 방법에 대한 연구 (feat. DharmaOCR)
챗봇 정렬을 넘어선 DPO 활용 소개 직접 선호 최적화(Direct Preference Optimization, DPO) 는 지금까지 거의 전적으로 챗봇의 답변을 사람의 선호에 맞추는 정렬(alignment) 용도로 쓰여 왔지만, Dharma AI가 공개한 이번 글은 DPO를 "모델 자신의 실패 출력을 거부 쌍(rejected pair)으로 재활용하여 특정 실패 모드를 직접 억제하는 도구" 로 쓸 수 있음을 OCR 도메인에서 실증한 사례입니다. 테스트한…
[읽을거리&정보공유] [2026/06/01 ~ 07] 이번 주에 살펴볼 만한 AI/ML 논문 모음
by 9bow님
by 9bow님
PyTorchKR
[2026/06/01 ~ 07] 이번 주에 살펴볼 만한 AI/ML 논문 모음
[2026/06/01 ~ 07] 이번 주에 살펴볼 만한 AI/ML 논문 모음 PyTorchKR🔥🇰🇷 🤔💭 이번 주 선정된 10편의 논문들을 살펴보면, 대규모 언어 모델(LLM) 기반 에이전트의 상태 관리, 추론 효율화, 그리고 실제 환경에서의 안전성과 검증 가능성을 중심으로 빠르게 수렴하고 있습니다. 특히, 에이전트의 효율성을 극대화하는 구조적 변화부터 트랜스포머 아키텍처의 근본적인 재설계, 그리고 현실 세계의 동적 환경에 적응하는 강건성 확보까지 흥미로운…
[읽을거리&정보공유] CC Gateway: Claude Code의 API 텔레메트리를 하나의 정체성으로 정규화하는 리버스 프록시
by 9bow님
by 9bow님
PyTorchKR
CC Gateway: Claude Code의 API 텔레메트리를 하나의 정체성으로 정규화하는 리버스 프록시
CC Gateway 소개 CC Gateway는 Claude Code와 Anthropic API 사이에 놓여 기기 식별 정보와 환경 텔레메트리(telemetry)를 하나의 정규(canonical) 프로필로 통일하는 리버스 프록시(reverse proxy)입니다. 작성자는 Claude Code가 "640+ telemetry event types" 를 세 개의 병렬 채널로 수집하고 "40+ environment dimensions" 로 기기를 식별한다고 설명하며…
[읽을거리&정보공유] Jeju-Standard Korean Translator: 제주 방언과 표준어를 양방향 번역하는 88M 규모의 모델
by 9bow님
by 9bow님
PyTorchKR
Jeju-Standard Korean Translator: 제주 방언과 표준어를 양방향 번역하는 88M 규모의 모델
Jeju-Standard Korean Translator 소개 제주 방언(제주어, Jejueo)은 한반도 표준어와 음운, 어휘, 어미 체계가 크게 달라 같은 한국어 화자라도 알아듣기 어려운 경우가 많습니다. 옛 한국어의 흔적인 아래아(ᆞ) 같은 음절이 살아 있고, 종결 어미와 보조 용언의 쓰임이 독특해서 단순한 사투리를 넘어 별도의 언어 변종으로 다뤄지기도 합니다. 유네스코는 2010년 세계 위기 언어 지도(UNESCO Atlas of the World's…
[읽을거리&정보공유] Paseo: Claude Code, Codex 등 코딩 에이전트를 휴대폰과 데스크톱에서 쓰는 셀프 호스팅 도구
by 9bow님
by 9bow님
PyTorchKR
Paseo: Claude Code, Codex 등 코딩 에이전트를 휴대폰과 데스크톱에서 쓰는 셀프 호스팅 도구
Paseo 소개 Paseo는 Claude Code, Codex, Copilot, OpenCode, Pi 같은 코딩 에이전트 CLI들을 하나의 인터페이스로 묶어주는 셀프호스팅(Self-hosted) 도구입니다. 코딩 에이전트가 여러 종류로 늘어나면서 작업마다 다른 CLI를 열고, 자리를 비우면 진행 상황을 확인할 수 없는 불편이 생겼습니다. Paseo는 "Run agents in parallel on your own machines. Ship from your…
[읽을거리&정보공유] OpenAI가 공개한, 소프트웨어 개발 주기별 AI 네이티브 엔지니어링 팀 구축 가이드 (feat. Codex)
by 9bow님
by 9bow님
PyTorchKR
OpenAI가 공개한, 소프트웨어 개발 주기별 AI 네이티브 엔지니어링 팀 구축 가이드 (feat. Codex)
AI 네이티브 엔지니어링 팀 구축 가이드 소개 OpenAI가 Codex 공식 문서에 공개한 'Building an AI-Native Engineering Team' 가이드는, 소프트웨어 개발 생명주기(Software Development Lifecycle, SDLC) 의 계획부터 배포까지 7단계 전반에 코딩 에이전트를 도입하려는 엔지니어링 조직을 위한 실무 지침서입니다. 각 단계마다 기존 방식의 병목이 무엇인지, 코딩 에이전트가 어떻게 돕는지, 그리고…
[읽을거리&정보공유] Cursor Cookbook: Cursor SDK와 Cloud Agents 실습 예제를 모은 공식 저장소
by 9bow님
by 9bow님
PyTorchKR
Cursor Cookbook: Cursor SDK와 Cloud Agents 실습 예제를 모은 공식 저장소
Cursor Cookbook 소개 Cursor Cookbook은 Cursor 팀이 직접 운영하는 공식 예제 저장소로, "small examples for building with Cursor" 라는 한 줄로 자기 위치를 정의합니다. 코딩 에이전트를 자체 앱·스크립트·워크플로에서 호출하는 Cursor SDK와, AWS 같은 고객 관리 인프라 위에 에이전트 워커를 띄우는 Cloud Agents 두 축을 실습 가능한 형태로 모아 둔 자료입니다. Cursor…
[읽을거리&정보공유] [GN⁺] AI 이후의 소프트웨어: 하네스(Harness) 시대의 개막
by 9bow님
AI 이후의 소프트웨어: 하네스(Harness) 시대의 개막 글 소개
- 소프트웨어 시대의 종말은 하네스(harness) 시대의 시작 이며, 고정된 워크플로우와 관리형 DB로 작동하던 SaaS가 지능을 갖춘 AI로 대체되는 중
- AI는 강력하지만 야생마처럼 길들여지지 않은 상태로, 그 힘을 활용하기 위해서는 체계적 통제(domestication) 가 필요함
- AI 에이전트 하네스는 중심의 LLM을 둘러싼 7가지 핵심 구성요소 로 정의되며, 각 요소가 프로덕션 수준의 신뢰성과 성능을 좌우
- 모든 기업이 동일한 모델에 접근 가능한 시대에는 모델 자체가 아니라 하네스를 더 잘 설계하고 운용하는 쪽(best rider) 이 승리
- 빅랩들이 우선시하지 않는 수천 개의 분리된 시장 이 스타트업에게 기회로 남음
하네스 시대의 의미
- AI는 고정 워크플로우 기반의 SaaS와 관리형 데이터베이스를 지능(intelligence)으로 대체 하며...
by 9bow님
AI 이후의 소프트웨어: 하네스(Harness) 시대의 개막 글 소개
- 소프트웨어 시대의 종말은 하네스(harness) 시대의 시작 이며, 고정된 워크플로우와 관리형 DB로 작동하던 SaaS가 지능을 갖춘 AI로 대체되는 중
- AI는 강력하지만 야생마처럼 길들여지지 않은 상태로, 그 힘을 활용하기 위해서는 체계적 통제(domestication) 가 필요함
- AI 에이전트 하네스는 중심의 LLM을 둘러싼 7가지 핵심 구성요소 로 정의되며, 각 요소가 프로덕션 수준의 신뢰성과 성능을 좌우
- 모든 기업이 동일한 모델에 접근 가능한 시대에는 모델 자체가 아니라 하네스를 더 잘 설계하고 운용하는 쪽(best rider) 이 승리
- 빅랩들이 우선시하지 않는 수천 개의 분리된 시장 이 스타트업에게 기회로 남음
하네스 시대의 의미
- AI는 고정 워크플로우 기반의 SaaS와 관리형 데이터베이스를 지능(intelligence)으로 대체 하며...
[읽을거리&정보공유] Finance Skills: AI 코딩 에이전트에 금융 분석과 트레이딩 능력을 더하는 스킬 모음
by 9bow님
Finance Skills 소개
Finance Skills는 AI 코딩 에이전트에 금융 분석과 트레이딩 능력을 더해 주는 에이전트 스킬 모음입니다. Agent Skills 오픈 표준을 따르며, Claude Code를 비롯한 여러 에이전트 환경에 플러그인이나 개별 스킬 단위로 설치할 수 있습니다. 기업 가치평가, 실적 분석, 소셜 미디어 리서치 같은 금융 작업을 에이전트가 직접 수행하도록 각 작업의 절차를 스킬 파일로 정리해 둔 것이 핵심입니다. himself65가 만들어 MIT 라이선스로 공개했습니다.
이 프로젝트는 교육·정보 제공 목적임을 명확히 밝히고 있습니다. README는 "Nothing here constitutes financial advice" 라고 적으며, 투자 결정 전에는 스스로 조사하고 자격을 갖춘 금융 자문가와 상의하라고 안내합니다. 스킬이 다루는 분석은 의사결정의 보조 자료이지 투자 권유가 아니라는 점을 전제로 봐...
by 9bow님
Finance Skills 소개
Finance Skills는 AI 코딩 에이전트에 금융 분석과 트레이딩 능력을 더해 주는 에이전트 스킬 모음입니다. Agent Skills 오픈 표준을 따르며, Claude Code를 비롯한 여러 에이전트 환경에 플러그인이나 개별 스킬 단위로 설치할 수 있습니다. 기업 가치평가, 실적 분석, 소셜 미디어 리서치 같은 금융 작업을 에이전트가 직접 수행하도록 각 작업의 절차를 스킬 파일로 정리해 둔 것이 핵심입니다. himself65가 만들어 MIT 라이선스로 공개했습니다.
이 프로젝트는 교육·정보 제공 목적임을 명확히 밝히고 있습니다. README는 "Nothing here constitutes financial advice" 라고 적으며, 투자 결정 전에는 스스로 조사하고 자격을 갖춘 금융 자문가와 상의하라고 안내합니다. 스킬이 다루는 분석은 의사결정의 보조 자료이지 투자 권유가 아니라는 점을 전제로 봐...
[블로그] PyTorch Compile은 어떻게 이렇게 빠를까: 커널 융합(Kernel Fusion) | 파이토치 한국 사용자 모임
by bot님
PyTorch의 컴파일러를 사용하면 모델이 최대 10배까지 빠르게 실행됩니다. 그런데 실제로 무슨 일이 일어나는 걸까요? 컴파일을 하지 않으면 GPU는 코드에 있는 각 torch 연산마다 커널(kernel), 즉 GPU에서 동작하는 함수를 실행합니다. 이로 인해 두 가지 큰 속도 저하가 발생합니다. 메모리에서 데이터를 옮기는 데 드는 시간과, 매번 새로운 커널을 시작할 때 드는 오버헤드입니다. GPU가 커널을 실행할 때마다 오버헤드 비용을 치르며, 중간 결과가 생길 때마다 메모리에 쓰고 다시 읽어야 합니다.
> When you use PyTorch’s compiler, your model runs faster, up to 10x faster. But what’s actually happening? Without compilation, the GPU runs a kernel, a functio...
by bot님
PyTorch의 컴파일러를 사용하면 모델이 최대 10배까지 빠르게 실행됩니다. 그런데 실제로 무슨 일이 일어나는 걸까요? 컴파일을 하지 않으면 GPU는 코드에 있는 각 torch 연산마다 커널(kernel), 즉 GPU에서 동작하는 함수를 실행합니다. 이로 인해 두 가지 큰 속도 저하가 발생합니다. 메모리에서 데이터를 옮기는 데 드는 시간과, 매번 새로운 커널을 시작할 때 드는 오버헤드입니다. GPU가 커널을 실행할 때마다 오버헤드 비용을 치르며, 중간 결과가 생길 때마다 메모리에 쓰고 다시 읽어야 합니다.
> When you use PyTorch’s compiler, your model runs faster, up to 10x faster. But what’s actually happening? Without compilation, the GPU runs a kernel, a functio...