Big Data AI

🚨 Хотите парсить сложные PDF с точностью уровня SOTA, полностью локально? 📄🔍

Модель GLM-OCR всего с 0.9 млрд параметров можно просто загрузить в LM Studio и запускать почти на любом компьютере. 🥔

🧠 0.9B параметров
💾 Работает на менее чем 1.5GB VRAM (или около 1GB в квантованном виде)
💸 Никаких расходов на API
🔒 Полная приватность данных

Desktop-AI для работы с документами официально наступил. 💻⚡

https://huggingface.co/zai-org/GLM-OCR

❤12

1.63K views12:02

Big Data AI

Forwarded from Machinelearning

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

Kimodo: диффузионная модель для генерации 3D-движений людей.

NVIDIA выложила в открытый доступ проект Kimodo - генеративную модель на основе диффузии, которая создает реалистичные трехмерные движения для человеческих и робототехнических скелетов.

Kimodo принимает на вход текстовые промпты и ключевые позы всего тела, позиции и вращения конечностей, двухмерные пути и контрольные точки. Это позволяет точно управлять генерацией: от общего описания наподобие "персонаж идет и садится на стул" до детального контроля положения рук и ног в кадрах.

Всего доступно 5 вариантов модели для 3 типов скелетов: SOMA, SMPL-X и Unitree G1. Первые два ориентированы на анимацию аватаров, третий - на робота Unitree G1.

Модели, обученные на полном датасете Bones Rigplay 1 (700 часов), NVIDIA рекомендует как основные рабочие.

Варианты на сете BONES-SEED (288 часов) предназначены для бенчмаркинга и сравнения с собственными разработками.

Для работы с Kimodo предусмотрены 3 интерфейса:

🟢Интерактивное веб-демо с таймлайн-редактором;
🟢CLI-утилита для пакетной генерации;
🟢Python API для тонкой настройки .

Под инференс потребуется около 17 ГБ видеопамяти, модели запускали на RTX 3090, RTX 4090 и NVIDIA A100.

🟡

Интеграция с робототехническим стеком NVIDIA.

ProtoMotions позволяет брать сгенерированные движения и обучать на них физически корректные политики управления в GPU-ускоренной симуляции — как для аватаров, так и для Unitree G1.

Через General Motion Retargeting движения, созданные на скелете SMPL-X, можно перенести на произвольных роботов.

📌Лицензирование:

Код проекта под Apache 2.0, большинство моделей под NVIDIA Open Model License.

Вариант SMPL-X имеет более ограниченную NVIDIA R&D Model License, она допускает только исследовательское применение.

🟡

Набор моделей

🟡

Техотчет

🖥

Github

@ai_machinelearning_big_data

#AI #ML #Robotics #Kimodo #NVIDIA

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍3

1.24K views09:56

Big Data AI

Эффективны ли ваши ETL-процессы?

👁

Проверьте это с бесплатным чек-листом

Без регулярного аудита ETL-пайплайны начинают деградировать: растут затраты, ломаются дашборды, а решения принимаются на битых данных. При этом на полноценный аудит часто не хватает времени.

Эксперты Cloud․ru собрали чек-лист для простой и быстрой диагностики ETL-процессов. Внутри — опыт и лайфхаки в работе с данными.

По чек-листу можно оценить надежность, масштабируемость, управляемость и безопасность вашей Data-инфраструктуры, а еще соответствие cloud native-подходу.

Как это работает
1️⃣Пройдите чек-лист

2️⃣Подсчитайте баллы за реализованные практики

3️⃣Определите уровень зрелости ETL-процессов

4️⃣Получите персональные рекомендации от эксперта Cloud․ru

Забрать чек-лист

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍1🔥1

1.53K views08:03

Big Data AI

🌐 Инфраструктура открытых данных Бразилии

br/acc — это проект, который объединяет открытые данные из различных государственных источников Бразилии в единую графовую структуру. Он предоставляет доступ к информации о компаниях, здравоохранении, образовании и многом другом, позволяя пользователям исследовать связи и делать выводы.

🚀 Основные моменты:
- 45 модулей ETL для обработки данных
- Графовая база данных Neo4j для нормализованных сущностей
- React-фронтенд для поиска и анализа
- Публичный API для доступа к графовым данным
- Соответствие требованиям LGPD для безопасности данных

📌 GitHub: https://github.com/World-Open-Graph/br-acc

#python

❤4❤‍🔥3🔥2

1.79K views10:10

Big Data AI

Шпаргалка по Claude

👍6🥰6🔥2🤮1

1.93K views15:14

Big Data AI

😁7❤5

1.43K views06:29

Big Data AI

Почему одного CLAUDE.md недостаточно и что реально дают Hooks в Claude Code

Многие ограничиваются CLAUDE.md и на этом останавливаются. Но это всего лишь рекомендации для модели, а не строгие правила. Claude старается им следовать, но не всегда.

Отсюда и проблемы: может забыть прогнать линтер, выполнить нежелательную команду или «закончить» задачу с падающими тестами.

Hooks решают это иначе. Они не про просьбы, а про контроль. Любое действие проходит через этапы - до выполнения, после и перед завершением. И в каждый из этих моментов можно встроить свои проверки.

Например, перед запуском команды можно отфильтровать опасные действия и просто не дать им выполниться. После - автоматически привести код в порядок. А перед завершением — не выпустить результат, пока тесты не проходят.

Важный момент - коды завершения. Только exit code 2 действительно останавливает выполнение и возвращает ошибку обратно модели. Остальные коды не дают нужного контроля.

В итоге разница простая:
CLAUDE.md - это возможность того, что всё будет сделано правильно
Hooks - это гарантия, что иначе просто не получится.

❤7🔥5👍3🤔2👎1🥰1

1.25K views09:48

Big Data AI

ИИ начал находить настоящие баги в ядре Linux. И никто не понимает, почему именно сейчас

Грег Кроа-Хартман, один из ключевых мейнтейнеров ядра Linux, заявил что ситуация с AI-сгенерированными баг-репортами кардинально изменилась.

Ещё недавно это был поток мусора - теперь это реальные баги с рабочими патчами.
Его слова: «Что-то произошло месяц назад, и мир переключился.

Теперь к нам приходят настоящие отчёты». И это не только Linux - по его словам, все крупные open source проекты видят то же самое. Команды безопасности общаются между собой неформально, и картина везде одинаковая.

Никто не понимает, что именно изменилось. Кроа-Хартман говорит прямо: «Мы не знаем. Никто не знает почему. То ли инструменты стали сильно лучше, то ли люди просто начали пробовать. Похоже, что это много разных групп и компаний одновременно».
Ядро Linux справляется - команда большая и распределённая.

Баги мелкие, не критические, но поток реальный и не замедляется.

А вот для маленьких open source проектов это проблема. У них просто нет людей, чтобы обработать внезапный наплыв качественных AI-репортов.

Раньше страдали от мусорных репортов, теперь страдают от настоящих.
По сути мы наблюдаем момент, когда AI-инструменты для поиска уязвимостей перешли из категории «игрушка» в категорию «инфраструктура». И open source к этому не готов.

https://vc.ru/dev/2830028-ii-nashel-bagi-kotorye-lyudi-propuskali-30-let-meinteiner-linux-my-ne-ponimaem-chto-proizoshlo

🐍 Linux полезные ресурсы 🚀Max

@linuxkalii

🔥4👍2❤1

794 views09:27

Big Data AI

🤣5

635 views12:03

About

Blog

Apps

Platform