Big Data AI
18.7K subscribers
1.05K photos
150 videos
19 files
1.05K links
@haarrp - админ

Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям

@data_analysis_ml - анализ данных

@ai_machinelearning_big_data

@itchannels_telegram - важное для программиста

РКН: clck.ru/3Fmqxe
Download Telegram
🎨 Создание изображений с LongCat-Image

LongCat-Image — это открытая двуязычная модель для генерации изображений, ориентированная на высокую эффективность и качество. Она превосходит многие существующие модели по производительности и точности, особенно в рендеринге китайского текста и фотореализме.

🚀Основные моменты:
- 6B параметров с высокой производительностью
- Лучшая в своем классе обработка изображений
- Высокая точность рендеринга китайских символов
- Превосходный фотореализм в сгенерированных изображениях
- Полный набор инструментов для разработчиков

📌 GitHub: https://github.com/meituan-longcat/LongCat-Image

#python
👍3🔥21
🧠 Skill Seeker: Автоматизация создания Claude AI навыков

Skill Seeker позволяет быстро преобразовать любую документацию в навыки для Claude AI. Инструмент автоматически извлекает, организует и улучшает контент, создавая готовые к загрузке пакеты. Это экономит время и усилия разработчиков, позволяя им сосредоточиться на более важных задачах.

🚀Основные моменты:
- Автоматический сбор данных с любых сайтов документации
- AI-улучшение для создания качественных справочных материалов
- Поддержка множества языков программирования
- Готовые шаблоны для популярных фреймворков
- Бесплатное локальное улучшение без API-расходов

📌 GitHub: https://github.com/yusufkaraaslan/Skill_Seekers

#python
6🔥2
🚀 4D Видео Представление с Trace Anything

Trace Anything предлагает инновационное представление видео в 4D с помощью полей траекторий. Модель эффективно оценивает траектории для любых видео и изображений, позволяя пользователям исследовать результаты в интерактивном 3D-формате.

🚀Основные моменты:
- Моделирует каждую пиксельную траекторию в 3D.
- Поддерживает любые видео и наборы изображений.
- Интерактивный 3D-обозреватель для визуализации результатов.
- Официальная реализация на PyTorch.

📌 GitHub: https://github.com/ByteDance-Seed/TraceAnything

#python
👍41🥰1
🤖 Симулятор Интеллектуальных Роботов (IR-SIM)

IR-SIM — это легкий симулятор роботов на Python, предназначенный для навигации, управления и обучения с подкреплением. Он предлагает простой интерфейс для моделирования роботов и окружений с поддержкой обнаружения столкновений, что делает его идеальным для учебных и исследовательских целей.

🚀Основные моменты:
- Моделирование различных платформ и сенсоров роботов.
- Легкая настройка сценариев с помощью YAML.
- Визуализация результатов симуляции для отладки.
- Поддержка обнаружения столкновений и настраиваемых политик поведения.
- Подходит для многопользовательского обучения с подкреплением.

📌 GitHub: https://github.com/hanruihua/ir-sim

#python
👍5
🤖 KISS: Простой фреймворк для создания AI-агентов

KISS (Keep It Simple, Stupid) предлагает минималистичный подход к разработке AI-агентов, избавляя от сложных конфигураций и абстракций. Создавайте и управляйте агентами с помощью обычного Python-кода, используя нативные функции для повышения эффективности.

🚀 Основные моменты:
- Легкость в создании и управлении AI-агентами.
- Использование нативного вызова функций для точности.
- Поддержка многопоточности и эволюции агентов.
- Интерактивные примеры и документация для быстрого старта.

📌 GitHub: https://github.com/ksenxx/kiss_ai

#python
5🥰2🔥1
🔬 Прогнозирование биомолекулярных структур с Protenix

Protenix — это открытый инструмент для высокоточного прогнозирования структур белков, который поддерживает исследования в области вычислительной биологии и разработки лекарств. Он предлагает доступные и расширяемые решения для научного сообщества.

🚀 Основные моменты:
- Высокая точность предсказаний, превосходящая AlphaFold3.
- Поддержка различных форматов данных и улучшенные функции обучения.
- Интеграция с другими проектами для оценки и дизайна белков.
- Открытый доступ к полному набору инструментов и данным.

📌 GitHub: https://github.com/bytedance/Protenix

#python
👍6🔥53🥰3
🧩 Claw Compactor: Уменьшите затраты на токены AI

Claw Compactor — инструмент для эффективной компрессии данных AI-агентов. Он использует 5 слоев сжатия для уменьшения объема памяти и снижения затрат на токены, сохраняя при этом важные факты. Простой в использовании, он позволяет значительно оптимизировать работу с большими объемами данных.

🚀 Основные моменты:
- Пять слоев компрессии для максимальной экономии
- Без затрат на LLM — все методы детерминированы
- Потеря данных минимальна благодаря правилам и оптимизации
- Поддержка китайского, японского и корейского языков
- Одной командой можно запустить весь процесс

📌 GitHub: https://github.com/aeromomo/claw-compactor

#python
👍4
🌐 Инфраструктура открытых данных Бразилии

br/acc — это проект, который объединяет открытые данные из различных государственных источников Бразилии в единую графовую структуру. Он предоставляет доступ к информации о компаниях, здравоохранении, образовании и многом другом, позволяя пользователям исследовать связи и делать выводы.

🚀 Основные моменты:
- 45 модулей ETL для обработки данных
- Графовая база данных Neo4j для нормализованных сущностей
- React-фронтенд для поиска и анализа
- Публичный API для доступа к графовым данным
- Соответствие требованиям LGPD для безопасности данных

📌 GitHub: https://github.com/World-Open-Graph/br-acc

#python
4❤‍🔥3🔥2
🧠 LLM Wiki: Автоматизированная база знаний

LLM Wiki — это кроссплатформенное приложение, которое превращает ваши документы в организованную, взаимосвязанную базу знаний. Оно анализирует источники, создает и поддерживает актуальность вики, сохраняя информацию для будущих запросов.

🚀 Основные моменты:
- Двухступенчатый анализ и генерация страниц
- Автоматическое обнаружение кластеров знаний
- Векторный семантический поиск
- Интеграция с Obsidian для удобства работы
- Поддержка импорта папок и веб-контента

📌 GitHub: https://github.com/nashsu/llm_wiki

#python
1👍1
🚀 Запуск моделей на Mac без ограничений по RAM

Этот репозиторий позволяет запускать большие модели ИИ на Mac, даже если они не помещаются в оперативную память. Используя технологию Flash Streaming, вы можете работать с моделями, которые требуют больше памяти, чем доступно, при этом обеспечивая высокое качество вывода.

🚀 Основные моменты:
- Поддержка моделей до 35B с использованием Flash Streaming.
- Работает на любом Mac с 16 GB RAM.
- Высокая скорость обработки и качество вывода.
- Удобные команды для взаимодействия с агентом.

📌 GitHub: https://github.com/walter-grace/mac-code

#python
👍4
🚀 Browser Harness - это легкий инструмент, позволяющий LLM выполнять любые задачи в браузере с полной свободой действий. Он самозаживляющийся и работает напрямую с Chrome через WebSocket, позволяя агенту добавлять недостающие функции по мере выполнения задач.

Основные моменты:
- Полная свобода действий для LLM в браузере.
- Самообучение: агент создает недостающие функции.
- Поддержка бесплатных удаленных браузеров.
- Простой и понятный код (~592 строки Python).
- Возможность добавления новых доменных навыков.

📌 GitHub: https://github.com/browser-use/browser-harness

#python
6