Фокусируется на предобработке данных: работе с пропусками, выбросами, кодировании категориальных признаков, трансформациях и отборе признаков, сохраняя совместимость с пайплайнами sklearn.
🔵 Работа с пропусками: Mean/Median/Mode, Arbitrary, End Tail Imputation🔵 Обработка выбросов: IQR, Z-score, Winsorization, capping🔵 Кодирование категорий: One-Hot, Ordinal, Target Mean, Rare Label Encoding🔵 Математические трансформации: log, box-cox, yeo-johnson, power🔵 Отбор признаков: корреляция, константные признаки, дубликаты🔵 Полная совместимость со sklearn Pipeline
pip install feature-enginePlease open Telegram to view this post
VIEW IN TELEGRAM
❤🔥2👍1🔥1
Позволяет удобно извлекать текст и структуру из сканов PDF, фильтруя заголовки, колонтитулы и другие лишние элементы.
🔵 Конвертация PDF в Markdown с сохранением структуры🔵 Конвертация PDF в EPUB с автоматическим построением глав и оглавления🔵 Поддержка отсканированных PDF и OCR-распознавания текста🔵 Анализ макета страниц (колонки, блоки, порядок чтения)🔵 Фильтрация колонтитулов, номеров страниц и лишних элементов🔵 Извлечение изображений, таблиц и формул🔵 Локальная работа без обязательного подключения к интернету🔵 Интеграция с LLM для интеллектуального анализа структуры документа
pip install pdf-craftPlease open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤🔥2🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
Позволяет читать и слушать книги в терминале, превращая текст из разных форматов в озвученное содержимое.
🔵 Поддержка чтения книг прямо в терминале🔵 Озвучивание текста с помощью Text-to-Speech🔵 Работа с форматами EPUB, PDF, TXT, DOCX, HTML, Markdown и RTF🔵 Модульная система TTS с онлайн и оффлайн-движками🔵 Подсветка текста синхронно с озвучиванием🔵 Настройка скорости речи, голоса и языка🔵 Сохранение прогресса чтения между запусками🔵 Управление с клавиатуры и поддержка Vim-подобных хоткеев🔵 Кроссплатформенная работа (Linux, macOS, Windows через WSL)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤🔥2👍2
⚒️ FlagScale — это комплексный набор инструментов для работы с крупными языковыми моделями, направленный на поддержку полного жизненного цикла больших моделей — от разработки и обучения до развёртывания и сервирования.
📌 Основные особенности:
📱 Репозиторий
➡️ Справочник Программиста. Подписаться
🔵 Поддержка полного жизненного цикла LLM: обучение, дообучение и инференс🔵 Масштабирование на multi-GPU и multi-node кластерах🔵 Интеграция с Megatron-LM и vLLM🔵 Единая система конфигураций на базе Hydra (YAML)🔵 Оптимизация вычислений и эффективное использование ресурсов🔵 Поддержка популярных LLM (LLaMA, Qwen, Mixtral, DeepSeek и др.)🔵 Запуск и управление задачами через единый CLI🔵 Ориентация на гетерогенные и распределённые среды
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2❤🔥1👍1