Data Science | Machinelearning [ru]
18.1K subscribers
448 photos
13 videos
29 files
3.13K links
Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence)

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD
Download Telegram
📝 Подборка вакансий для джунов

Младший аналитик
Python, SQL, Microsoft Excel, Анализ данных, Машинное обучение, Нейронные сети
от 130 000 ₽ на руки | 1–3 года

Консультант-аналитик [ССД Oracle]
SQL, Oracle, Английский язык, Аналитика, Системное тестирование
Уровень дохода не указан | 1–3 года

Инженер данных/Data Engineer в Управление анализа данных
SQL, Apache Hadoop, Bitbucket, Jira, Confluence
Уровень дохода не указан | 1–3 года
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ Пишем свою Diffusion модель с нуля

Статья предлагает разобраться в устройстве Diffusion моделей, их математике и принципах работы. Автор делится простыми объяснениями, примерами кода и результатами генерации изображений на собственной модели.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📝 Подборка вакансий для мидлов

Data-аналитик
SQL, Tableau, Amplitude, PostgreSQL
от 200 000 до 300 000 ₽ на руки | 1–3 года

Data Scientist (генерация графических изображений)
Python, YOLO8, Stable Diffusion 1.5, OpenCV, RASA, NLP, LLMs
от 200 000 до 500 000 ₽ на руки | 3–6 лет

Data Scientist (модели PD)
Python, SQL, Machine Learning, A/B Testing, Risk Modeling
Уровень дохода не указан | 3–6 лет
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ Машинное обучение: Наивный байесовский классификатор. Теория и реализация. С нуля

Статья описывает три основные разновидности наивного байесовского классификатора: мультиномиальный, гауссовский и бернулли. Рассмотрены их теоретические основы, особенности и примеры реализации.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
📝 Подборка вакансий для сеньоров

Data Engineer
Python, SQL, Apache Airflow, Greenplum, Apache Spark
от 250 000 ₽ на руки | 1–3 года

Senior Data Scientist (FinTech)
Python, Pandas, NumPy, SciKit-Learn, PyTorch, TensorFlow, SQL, Теорвер и матстат
от 300 000 ₽ на руки | Более 6 лет

Senior Data Engineer
Apache Hadoop, Spark (batch/streaming), Scala, SQL, Parquet, Hive, Kafka, HBase, ClickHouse, PostgreSQL, Airflow, Zeppelin, Jupyter, S3 MinIO
Уровень дохода не указан | от 5 лет
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ Умножение троичных матриц для нейросетей

Статья исследует использование троичных значений (-1, 0, 1) в нейросетевых матрицах. Рассматриваются методы хранения тритов с использованием 32-битной арифметики и подходы к их быстрому умножению через оптимизацию памяти.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
⚙️ Инфраструктура для Data-Engineer BI-tools

В этой статье я хотел бы показать куда уходят данные и что с ними происходит, когда пайплайны дата-инженеров заканчивают работу.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Дообучаем языковую модель GPT2 с помощью Torch

Статья углубляется в дообучение языковых моделей, используя DistilGPT2 на данных QuyenAnhDE/Diseases_Symptoms. Рассматривается процесс настройки модели для генерации симптомов на основе заболеваний, с возможностью расширения логики.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
📢 Делай демо своих решений

Закрыл задачу, но никто не понимает, насколько крутое решение ты сделал? Это минус не только для команды, но и для твоей репутации.

👉 Совет: каждую значимую доработку презентуй команде. Покажи, как работает функционал, объясни, почему выбрал этот подход. Это не только помогает коллегам разобраться, но и показывает твой вклад в общий результат.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔎 Подборка зарубежных вакансий

Marketing Analyst
🟢SQL, Power BI, Marketing Analysis, Google Analytics, Business English, API
🟢от 2 500 до 4 000 $ до вычета налогов | 1–3 года

Data Scientist (mobile+web)
🟢Big Data, Amplitude, Power BI, A/B Testing, Predictive Modeling, Python
🟢от 4 000 $ до вычета налогов | 3–6 лет

Data Analyst & Mathematical
🟢Python, Теория вероятностей, Математическая статистика, Статистический анализ, Оптимизационное моделирование
🟢Уровень дохода не указан | 3–6 лет
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Как удалить Excel навсегда: делегируем юнит-экономику на Wildberries нейронке

Статья объясняет, как нейросети помогают оптимизировать юнит-экономику продавцов на WB, особенно при работе с большим ассортиментом. Рассматриваются подходы к автоматизации анализа и принятию решений.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👀 Сравнение 30 фотореалистичных ИИ-изображений: Flux1.1 против SD3.5

В статье обсуждаются возможности Flux1.1 Pro и SD3.5 Large в генерации фотореалистичных изображений. Описаны различия моделей и их результаты после разделения команды разработчиков.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
➡️ Глубокое обучение: Алгоритм обратного распространения ошибки. Теория и реализация. С нуля

Обратное распространение ошибки — основа обучения нейросетей. В статье: архитектура, расчет производных, реализация сетей для задач «ИЛИ» и MNIST. Простые шаги к пониманию алгоритма!

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔎 Подборка вакансий для джунов

AI/Data Specialist (Эксперт по AI/ML / Data Ops)
🟢Python, pandas, numpy, scikit-learn, PyTorch, TensorFlow, MLOps, CI/CD, ML-пайплайны, компьютерное зрение, обработка естественного языка
🟢от 180 000 до 300 000 ₽ на руки | 1–3 года опыта

Аналитик SQL / Data Analyst
🟢SQL, PostgreSQL, MySQL, Python, ETL, Airflow, API, анализ данных, визуализация данных, BI-инструменты, DataLens
🟢от 110 000 ₽ на руки | 1–3 года опыта

Аналитик данных/data analyst контактного центра (CPA nutra)
🟢Excel, анализ данных, BI-отчётность, оптимизация процессов, контактные центры, CPA nutra
🟢от 80 000 ₽ на руки | 1–3 года опыта
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Данные — это ископаемое топливо для ИИ. Правда, что мы его исчерпали?

В статье обсуждается заявление Ильи Суцкевера о том, что данные для ИИ сравнимы с ископаемым топливом, и их запас исчерпан. Объясняется концепция энтропии данных и её значение для LLM.

Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM