Data Portal | Data Science & Машиннное обучение
8.59K subscribers
105 photos
37 videos
4 files
142 links
Присоединяйтесь к нашему каналу и погрузитесь в мир для дата сайентиста

Связь: @devmangx
Download Telegram
Репозиторий, в котором перечислены потенциальные источники, которые помогут вам в подготовке к собеседованию по Data Science/Machine Learning. Часто добавляются новые ресурсы

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Машинное обучение для абсолютных новичков. Вводный курс, изложенный простым языком

Автор: Оливер Теобальд
Год: 2024

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51
Что не так с вашим кодом, сгенерированным большими языковыми моделями?

📖 Читать: ссылка

👉 @DataSciencegx | #cтатья
Please open Telegram to view this post
VIEW IN TELEGRAM
Полезный открытый учебник по Machine Learning

Здесь собрана коллекция задачек о нейросетях, параллельно даётся необходимая теория с объяснением
Очень годно, рекомендую

Что внутри?
├╼ всего лишь функция
├╼ градиентный спуск
├╼ алгоритм обратного распространения ошибки
├╼ что выплёвывает нейросеть
├╼ свёрточные сети
├╼ нейросети – конструктор LEGO
├╼ рекуррентные сети
╰╼ матричное дифференцирование

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43
Введение в автоматизированное машинное обучение

Автор: Хуттер Ф., Коттхофф Л., Ваншорен Х.
Год: 2023

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
7🤯2
Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

📖 Читать: ссылка

👉 @DataSciencegx | #cтатья
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Follow-Your-Emoji — метод, позволяющий тонко контролировать движения головы и лица

Причём этот метод позволяет управлять движениями произвольных лиц, в том числе нарисованных в разных стилях, а также скульптур и т.д.
Даже движения морды животных можно так анимировать

Метод основан на недавнем исследовании Yue Ma, Hongyu Liu, Hongfa Wang и их команды из Гонконгского университета

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6😁1🌭1
Машинное обучение с использованием Python. Сборник рецептов: практические решения от предобработки до глубокого обучения, 2 изд

Автор: Кайл Галлатин, Крис Элбон
Год: 2024

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍131
Очень подробный гайд по созданию LLaMa-3 с нуля!

Крутой репозиторий, в котором реализована llama 3 с нуля - умножение матриц с помощью multiple heads, позиционное кодирование (способ кодирования позиции слова внутри эмбеддинга), реализация механизма внимания и все остальное, здесь тщательно описано и объяснено

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Maestro — это инструмент искусственного интеллекта, который использует возможности передовых нейронных сетей для выполнения ваших задач.

Этот Python-скрипт задействует до трех моделей ИИ для решения задач: Мощная связка из GPT-4o, Claude-3.5 и LlaMa 3, работающих вместе для решения ваших задач.

Роли моделей следующие:
🟡 ORCHESTRATOR MODEL — управляет всем процессом.Модель принимает ваш промпт, разбивает её на более мелкие задачи и передает их следующей модели.

🟡 SUB AGENT MODEL — выполняет ключевые функции проекта, такие как написание кода, генерация текста и многое другое.

🟡 REFINER MODEL — оптимизирует и улучшает результаты предыдущхи моделей, исправляет ошибки, делает текст более естественным и многое другое.

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10
Открытый курс по ML с видео и лекциями от Амстердамского университета

Этот курс покрывает множество тем ML, вот некоторые из них:
— Gaussian Mixture Models
— PCA (Principal Component Analysis)
— SVM (Support Vector Machines)
— Bootstrapping, Feature Bagging

К каждой теме приводится pdf с основными формулами и видео с подробным объяснением, в целом очень годный курс

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆7👍2
The Little Learner: чудесное машинное обучение

Автор: Фридман Д. П., Мендхекар А.
Год: 2024

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Топ на выходные: два сайта с наборами задач для тренировки навыков ML и AI.

Внутри задачки разной сложности в категориях линейной алгебры, machine и deep learning — идеально, если видите своё будущее в нейросетях.

Deep-ML и Tensorgym — не благодарите

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍72
Data Scientist Handbook 2024

В этом репозитории собраны множество полезных ресурсов, которые помогут прокачать ваши навыки. Среди собранных ресурсов есть как платные, так и бесплатные

Ссылка: тык

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥1
Наконец-то появился мощный курс по LLM для тех, кто хочет углубиться в тему 🔥

Вас ждут лекции о промт-инжиниринге, файнтюнинге (как и зачем это делать?), а также о RAG — методе, позволяющем обучить ChatGPT на нужных данных без файнтюна. Кроме того, вы узнаете, как оценивать LLM-модели.

Этот курс уникален: все лекции записаны опытными специалистами из Meta, Anthropic, Mistral и других передовых компаний в сфере ИИ.

Курс включает текстовые саммари, презентации, примеры кода и полезные ссылки на ресурсы.

Требования минимальны: базовые знания в области LLM и понимание ключевых терминов.

Ссылка на курс — здесь

👉 @DataSciencegx | #курсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
👩‍💻 Best-of Machine Learning with Python

Это репозиторий с 920 библиотеками и фреймворками на Python для машинного обучения. Все проекты ранжированы по качеству.

Репозиторий можно использовать как источник инструментов под различные нужды, в частности:

для непосредственно машинного обучения;
для визуализации данных;
для работы с финансовыми, медицинскими и другими особыми данными;
для оптического распознавания символов;
для поиска ближайших элементов в больших наборах данных, основываясь на их векторных представлениях.

🔜 Ссылка на репозиторий

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72
This media is not supported in your browser
VIEW IN TELEGRAM
🤩 Deep Learning Models

Репозиторий с коллекцией моделей и архитектур глубокого обучения. Все они представлены в Jupyter Notebook.

Репо охватывает модели:

— Перцептрон;
— Многослойный перцептрон;
— Свёрточные нейронные сети (AlexNet, LeNet и др.);
— Transformers;
— Генеративно-состязательные сети (GAN);
— Графовые нейронные сети.

🔜 Ссылка на репозиторий

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍92
Основы инженерии данных: как создавать надёжные системы обработки данных

Автор: Д. Рис, М. Хоусли
Год: 2024

📂 Скачать книгу

👉 @DataSciencegx | #книги
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5
Бесплатные материалы с теорией и практикой математики для Data Science

Авторы из Amazon написали целый раздел по математике для сайта d2l.ai. Там есть про:

векторы и линейные преобразования;
спектральное разложение матрицы;
дифференциальное исчисление;
анализ функций многих переменных;
интегральное исчисление;
метод максимального правдоподобия;
распределения;
статистику;
теорию информации.

Материал изложен на английском, но зато хорошо структурирован и сопровождается всеми необходимыми формулами и примерами кода.

Крутой бонус – можно выбрать диалект, на котором вам будут показываться примеры – PyTorch, Keras или MXNET.

🔜 Изучить всё можно по этой ссылке

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114
Отличные визуальные объяснения ключевых концепций и алгоритмов машинного обучения

MLU-Explain — проект Amazon, созданный для упрощения изучения теоретических и практических основ машинного обучения

Каждая из представленных тем сопровождается доступными объяснениями и интерактивными графиками:
Нейронные сети
Equality of odds
Логистическая регрессия
Линейная регрессия
Обучение с подкреплением
Случайный лес и др.

🔜 Перейти на сайт

👉 @DataSciencegx | #ресурсы
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5🔥2