194K subscribers
3.56K photos
543 videos
17 files
4.3K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Forwarded from Spark in me
Третья статья из цикла статей про анализ сайтмапов.
А сможете ли вы понять, чем в реальности отличаются кластеры слов?
Я не смог =)

https://spark-in.me/post/sitemap-scraping-part-3

#data_science
Forwarded from Spark in me
То, что показалось интересным из презентаций Avito Data Science Meetup.

То, что используется для предсказания популярности статей:
- Embeddings - https://goo.gl/zb9G7X
- Используемые модели и методы - https://goo.gl/jzzkaE

Способы построения рекомендаций Озоном:
- Технологии - https://goo.gl/YTu47r
- Модели - https://goo.gl/mMXJ4s
- Какие логия парсятся - https://goo.gl/9mpVAv
- Как считают сопутствующие товары - https://goo.gl/BnCSPd
- Персональные рекомендации (по сути коллаборативный фильтеринг) - https://goo.gl/E818ab
- Аксуссуары (по сути декартово расстояние) - https://goo.gl/wL9a97


#data_science
#internet
Forwarded from Spark in me (Alexander )
Вот как оказывается фейсбук определяет лица на фото
- Сначала картинки упрощаются с использованием градиентов
- Потом картинки лиц поворачиваются с использованием специального алгоритма
- Потом тренируются embeddings для лиц
- Потом с помощью "простых" алгоритмов типа SVM выбираются нужные классы для лиц

Ссылка
- https://goo.gl/zeeNBi

Библиотека для определения лиц
- https://github.com/ageitgey/face_recognition#face-recognition

#data_science
Интересное в мире DS/ML (в этот раз негусто):

- Andrew Ng открыл новый курс на Курсере про Deep Learning - ссылка выше (было)
- Facebook полностью перешел на нейросети для перевода - https://goo.gl/VhjA9H
- Pytorch v0.2 - https://goo.gl/99QpB3 - может кому-то актуально
- Люди из Salesforce тренируют LTSM сети для перевода с одного языка на другой, берут получившийся декодер (часть сети) и используют его чтобы скормить его выход другим нейросетям, которые делают более простые вещи - https://goo.gl/6Kt77o

#data_science
@computer_science_and_programming :

Welcome to the world of:
* #Artificial #Intelligence,
* #Deep #Learning,
* #Machine #Learning,
* #Data #Science
* #Python Programming language
* and more advanced research
You will find up-to-date books📚 links🔗 and more you wanted.
Join us and learn hot topics of Computer Science together.👇👇👇

@computer_science_and_programming
⭐️ Towards Building the Federated GPT: Federated Instruction Tuning

Shepherd: A lightweight, foundational framework enabling federated instruction tuning for large language models


Модель для фундаментальной основы для изучения федеративной тонкой настройки LLM.

🖥 Github: https://github.com/jayzhang42/federatedgpt-shepherd

Paper: https://arxiv.org/pdf/2305.05644.pdf

📌 Data Preparation: https://github.com/jayzhang42/federatedgpt-shepherd#Data_Preparation

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🐼 PandaLM: ReProducible and Automated Language Model Assessment

Judge large language model, named PandaLM, which is trained to distinguish the superior model given several LLMs. PandaLM's focus extends beyond just the objective correctness of responses, which is the main focus of traditional evaluation datasets.

PandaLM - обеспечивает автоматизированные сравнения между различными большими языковыми моделями (LLM). Задавая одинаковый контекст, PandaLM может сравнивать ответы различных LLM и предоставлять причину решения вместе с эталонным ответом.


🖥 Github: https://github.com/weopenml/pandalm

📕 Paper: https://arxiv.org/abs/2306.05087v1

🔗 Dataset: https://github.com/tatsu-lab/stanford_alpaca#data-release

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🔦Relighting Neural Radiance Fields with Shadow and Highlight Hints

В данной работе представлен новый подход к изменении освещенности объекта на основе небольшого набора неструктурированных фотографий объекта, освещенного движущимся точечным источником света, отличным от позиции обзора.

git clone https://github.com/iamNCJ/NRHints.git
cd NRHints
pip install -r requirements.txt

🖥 Github: https://github.com/iamNCJ/NRHints

🚀 Project: https://nrhints.github.io/

📕 Paper: https://nrhints.github.io/pdfs/nrhints-sig23.pdf

⭐️ Dataset: https://github.com/iamNCJ/NRHints#data-and-models

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 Параллельные стратегии с Jax: обучающий туториал.

Обучение LLM требует огромных вычислительных ресурсов. Поскольку размеры моделей исчисляются миллиардами параметров, специализированные методы распараллеливания необходимы для того, чтобы сделать обучение выполнимым.

В статье "Исследование параллельных стратегий с Jax" подробно рассматривается реализация некоторых стратегий масштабирования в Jax - фреймворке Python, предназначенном для высокопроизводительных численных вычислений с поддержкой ускорителей GPU и TPU.

Стратегии, описанные в туториале с примерами кода и иллюстрациями:

🟢Data Parallelism - распределение данных между несколькими устройствами, которые одновременно обучают модель;  

🟢Tensor Parallelism - распределение весов модели между устройствами, позволяет каждому устройству обрабатывать свою часть тензора параллельно; 

🟢Pipeline Parallelism разделяет модель на этапы, которые выполняются последовательно на разных устройствах; 

🟢Mixture-of-Experts использует множество специализированных экспертов для обработки различных частей входных данных, что позволяет масштабировать модель до огромных размеров.


▶️ Автор статьи - Александр Самарин, Lead ML Engineer в Huawei c 5-ти летнем опытом в глубоком обучении.


@ai_machinelearning_big_data

#AI #ML #LLM #JAX #Tutorial
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 D-FINE: метод регрессии bounding box в детекторах объектов на основе DETR.

D-FINE - детектор объектов в режиме реального времени, который предлагает улучшение регрессии bounding box в моделях DETR . D-FINE обладает высокой точностью локализации, определяя регрессию рамок как процесс итеративного уточнения распределений вероятностей.

D-FINE состоит из двух компонентов:

🟠Мелкозернистое уточнение распределения (Fine-grained Distribution Refinement, FDR).

FDR преобразует процесс регрессии из предсказания фиксированных координат в итеративное уточнение распределений вероятностей. Эта техника дает более детальное промежуточное представление, что повышает точность локализации.

🟠Глобальная оптимальная локализованная самодистилляция (Global Optimal Localization Self-Distillation, GO-LSD).

GO-LSD - двунаправленная стратегия оптимизации, которая передает знания о локализации из уточненных распределений в более ранние слои модели через самодистилляцию.

Старшие версии D-FINE-L и D-FINE-X достигают 54,0% и 55,8% AP на наборе данных COCO соответственно, работая со скоростью 124 и 78 FPS на GPU NVIDIA T4.

При предварительном обучении на Objects365 D-FINE-L и D-FINE-X показывают 57,1% и 59,3% AP, что выше всех существующих детекторов реального времени.

Разработчики D-FINE предлагают несколько предобученных моделей на датасетах Objects365 и COCO под разные задачи и мощности. Все модели поддерживают инференс на изображениях и видео с использованием ONNX Runtime, TensorRT и PyTorch:

🟢D-FINE-S: Самая компактная и быстрая модель (3.49 мс на T4 GPU);

🟢D-FINE-M: Модель среднего размера, баланс между точностью и скоростью (5.62 мс на T4 GPU);

🟢D-FINE-L: Модель высокой точности (8.07 мс на T4 GPU);

🟢D-FINE-X: Самая крупная и точная модель (12.89 мс на T4 GPU).

D-FINE предоставляет инструменты для обучения, бенчмаркинга, визуализации с помощью FiftyOne и инструкции по организации наборов данных.

▶️Локальный инференс на примере ONNX:

# Create env via conda
conda create -n dfine python=3.11.9
conda activate dfine

# Install requirements for inference
pip install -r tools/inference/requirements.txt

# Install ONNX
pip install onnx onnxsim

# Choose a model
export model=l # s, m, x

# Inference
python tools/inference/onnx_inf.py --onnx model.onnx --input image.jpg # video.mp4


📌Лицензирование: Apache 2.0 License.


🟡Arxiv
🖥Github


@ai_machinelearning_big_data

#AI #ML #DETR #DFine #Detection
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM