Data Portal | Data Science & Машиннное обучение
8.61K subscribers
99 photos
34 videos
4 files
135 links
Присоединяйтесь к нашему каналу и погрузитесь в мир для дата сайентиста

Связь: @devmangx
Download Telegram
Машинное обучение с использованием Python. Сборник рецептов: практические решения от предобработки до глубокого обучения, 2 изд

Автор: Кайл Галлатин, Крис Элбон
Год: 2024

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍131
Очень подробный гайд по созданию LLaMa-3 с нуля!

Крутой репозиторий, в котором реализована llama 3 с нуля - умножение матриц с помощью multiple heads, позиционное кодирование (способ кодирования позиции слова внутри эмбеддинга), реализация механизма внимания и все остальное, здесь тщательно описано и объяснено

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Maestro — это инструмент искусственного интеллекта, который использует возможности передовых нейронных сетей для выполнения ваших задач.

Этот Python-скрипт задействует до трех моделей ИИ для решения задач: Мощная связка из GPT-4o, Claude-3.5 и LlaMa 3, работающих вместе для решения ваших задач.

Роли моделей следующие:
🟡 ORCHESTRATOR MODEL — управляет всем процессом.Модель принимает ваш промпт, разбивает её на более мелкие задачи и передает их следующей модели.

🟡 SUB AGENT MODEL — выполняет ключевые функции проекта, такие как написание кода, генерация текста и многое другое.

🟡 REFINER MODEL — оптимизирует и улучшает результаты предыдущхи моделей, исправляет ошибки, делает текст более естественным и многое другое.

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10
Открытый курс по ML с видео и лекциями от Амстердамского университета

Этот курс покрывает множество тем ML, вот некоторые из них:
— Gaussian Mixture Models
— PCA (Principal Component Analysis)
— SVM (Support Vector Machines)
— Bootstrapping, Feature Bagging

К каждой теме приводится pdf с основными формулами и видео с подробным объяснением, в целом очень годный курс

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆7👍2
The Little Learner: чудесное машинное обучение

Автор: Фридман Д. П., Мендхекар А.
Год: 2024

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Топ на выходные: два сайта с наборами задач для тренировки навыков ML и AI.

Внутри задачки разной сложности в категориях линейной алгебры, machine и deep learning — идеально, если видите своё будущее в нейросетях.

Deep-ML и Tensorgym — не благодарите

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍72
Data Scientist Handbook 2024

В этом репозитории собраны множество полезных ресурсов, которые помогут прокачать ваши навыки. Среди собранных ресурсов есть как платные, так и бесплатные

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥1
Наконец-то появился мощный курс по LLM для тех, кто хочет углубиться в тему 🔥

Вас ждут лекции о промт-инжиниринге, файнтюнинге (как и зачем это делать?), а также о RAG — методе, позволяющем обучить ChatGPT на нужных данных без файнтюна. Кроме того, вы узнаете, как оценивать LLM-модели.

Этот курс уникален: все лекции записаны опытными специалистами из Meta, Anthropic, Mistral и других передовых компаний в сфере ИИ.

Курс включает текстовые саммари, презентации, примеры кода и полезные ссылки на ресурсы.

Требования минимальны: базовые знания в области LLM и понимание ключевых терминов.

Ссылка на курс — здесь

👉 @DataSciencegx | #курсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
👩‍💻 Best-of Machine Learning with Python

Это репозиторий с 920 библиотеками и фреймворками на Python для машинного обучения. Все проекты ранжированы по качеству.

Репозиторий можно использовать как источник инструментов под различные нужды, в частности:

для непосредственно машинного обучения;
для визуализации данных;
для работы с финансовыми, медицинскими и другими особыми данными;
для оптического распознавания символов;
для поиска ближайших элементов в больших наборах данных, основываясь на их векторных представлениях.

🔜 Ссылка на репозиторий

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72
This media is not supported in your browser
VIEW IN TELEGRAM
🤩 Deep Learning Models

Репозиторий с коллекцией моделей и архитектур глубокого обучения. Все они представлены в Jupyter Notebook.

Репо охватывает модели:

— Перцептрон;
— Многослойный перцептрон;
— Свёрточные нейронные сети (AlexNet, LeNet и др.);
— Transformers;
— Генеративно-состязательные сети (GAN);
— Графовые нейронные сети.

🔜 Ссылка на репозиторий

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92
Основы инженерии данных: как создавать надёжные системы обработки данных

Автор: Д. Рис, М. Хоусли
Год: 2024

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5
Бесплатные материалы с теорией и практикой математики для Data Science

Авторы из Amazon написали целый раздел по математике для сайта d2l.ai. Там есть про:

векторы и линейные преобразования;
спектральное разложение матрицы;
дифференциальное исчисление;
анализ функций многих переменных;
интегральное исчисление;
метод максимального правдоподобия;
распределения;
статистику;
теорию информации.

Материал изложен на английском, но зато хорошо структурирован и сопровождается всеми необходимыми формулами и примерами кода.

Крутой бонус – можно выбрать диалект, на котором вам будут показываться примеры – PyTorch, Keras или MXNET.

🔜 Изучить всё можно по этой ссылке

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114
Отличные визуальные объяснения ключевых концепций и алгоритмов машинного обучения

MLU-Explain — проект Amazon, созданный для упрощения изучения теоретических и практических основ машинного обучения

Каждая из представленных тем сопровождается доступными объяснениями и интерактивными графиками:
Нейронные сети
Equality of odds
Логистическая регрессия
Линейная регрессия
Обучение с подкреплением
Случайный лес и др.

🔜 Перейти на сайт

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5🔥2
Базовая математика для искусственного интеллекта

Автор: Нельсон Хала
Год: 2024

⬇️ Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥1
Теоретические основы популярных алгоритмов машинного обучения и их реализация с нуля на Python

Автор «Хабра» Егор Захаренко составил список собственных статей с описанием популярных алгоритмов классического машинного обучения. К каждой статье прилагается код на Python.

Обучение с учителем

Линейная регрессия и её модификации
Логистическая и Softmax-регрессии
Линейный дискриминантный анализ (LDA)
Наивный байесовский классификатор
Метод опорных векторов (SVM)
Метод K-ближайших соседей (KNN)
Дерево решений (CART)
Бэггинг и случайный лес
Алгоритмы AdaBoost (SAMME & R2)
Градиентный бустинг и его модификации
Стекинг и блендинг

Обучение без учителя

Метод главных компонент (PCA)
Популярные алгоритмы кластеризации

🔜 Ноутбуки с алгоритмами можно скачать на Kaggle и GitHub.

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥6
Расширенная аналитика с PySpark: Практические примеры анализа больших наборов данных с использованием Python и Spark

Автор: Акаш Тандон, Сэнди Райза, Ури Ласерсон
Год: 2023

⬇️ Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍74
🔥 Практическое видео по работе с базовым набором DS-инструментов

Видео с введением в основные библиотеки и инструменты для науки о данных и машинного обучения. Предназначено для начинающих.

Таймкоды:
Программирование на Python
Анализ данных с Pandas
Анализ данных с NumPy
Визуализация данных с Matplotlib
Визуализация данных с Seaborn
Визуализация данных с Plotly
Проект по анализу данных
Машинное обучение со Scikit-learn
Проект по машинному обучению

🔜 Ссылка на ролик

👉 @DataSciencegx | #курсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13
Python для data science

Автор: Васильев Ю.
Год: 2023

⬇️ Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
🔥 Почти 1000 опенсорсных LLM-инструментов

На этом сайте каждые 6 часов обновляется llama-police — список инструментов на основе больших языковых моделей (LLM) с открытым исходным кодом. В таблице перечислены репозитории таких проектов, их краткое описание, количество контрибьюторов, звёзд и т.д.

🔜 Большинство из проектов также можно найти в cool-llm-repos на GitHub.

🔜 Ссылка на сайт

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Probability_Cheat_Sheet.pdf
3.7 MB
🔥 Несколько полезных шпаргалок для дата-сайентистов

Могут пригодиться при подготовке к собеседованию.

Введение в теорию вероятностей
Обзор способов визуализации данных
Описательная статистика

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍51