Data Science | Machinelearning [ru] – Telegram

Data Science | Machinelearning [ru]

17.9K subscribers

460 photos

14 videos

29 files

3.32K links

Статьи на тему data science, machine learning, big data, python, математика, нейронные сети, искусственный интеллект (artificial intelligence)

По вопросам рекламы или разработки - @g_abashkin

РКН: https://vk.cc/cJPGXD

Download Telegram

About

Blog

Apps

Platform

Data Science | Machinelearning [ru]

17.9K subscribers

Data Science | Machinelearning [ru]

🛍

Искусственный интеллект в ритейле: как он предсказывает вашу следующую покупку в приложении

Разбираем Next Basket Recommendation (NBR) — метод предсказания товаров, которые пользователь добавит в корзину. Рассмотрим метрики оценки, частотные и нейросетевые подходы в онлайн-ритейле.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

2.93K views10:07

Data Science | Machinelearning [ru]

⚙️

Что такое functools.partial в Python и зачем он нужен?

functools.partial позволяет создавать новые функции на основе существующих, фиксируя некоторые аргументы. Это полезно для упрощения кода, повышения читаемости и работы с колбэками.

➡️

Пример:

from functools import partial

def power(base, exponent):
    return base ** exponent

square = partial(power, exponent=2)  # Фиксируем степень = 2
cube = partial(power, exponent=3)  # Фиксируем степень = 3

print(square(5))  # 25
print(cube(2))    # 8

🗣️ partial() фиксирует аргумент exponent, создавая новые функции square и cube. Теперь square(5) эквивалентно power(5, 2), но код чище.

🖥

Подробнее тут

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2👎1

3.17K views14:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для мидлов

Data Scientist
• Python, BI
• Уровень дохода не указан | 1–3 года

Data Engineer
• PostgreSQL, Apache Airflow, Greenplum, DWH, ETL
• Уровень дохода не указан | 3–6 лет

AI Data Analysis Specialist
• Python, NLP, Power BI, Анализ данных, BI, Визуализация, Tableau, Английский язык
• Уровень дохода не указан | 1–3 года

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1🔥1

2.76K views18:07

Data Science | Machinelearning [ru]

🔧 ТОП-10 опенсорсных инструментов для работы с ИИ в 2025 году

Детальный разбор 10 самых перспективных инструментов для работы с ИИ в 2025 году. От создания умных ассистентов до построения мощных RAG-систем — разбираем возможности, сравниваем производительность, безопасность и простоту интеграции каждого решения.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

3K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Парсинг и подсчёт количества слов в текстовом файле

Напишите функцию на Python, которая принимает путь к текстовому файлу и возвращает словарь с подсчётом количества уникальных слов. Слова должны сравниваться без учёта регистра, а знаки препинания должны быть удалены.

Пример:

# Содержимое файла example.txt:
# "Hello, world! This is a test. Hello again."

result = count_words_in_file("example.txt")
print(result)
# Ожидаемый результат:
# {'hello': 2, 'world': 1, 'this': 1, 'is': 1, 'a': 1, 'test': 1, 'again': 1}

Решение задачи🔽

import string
from collections import Counter

def count_words_in_file(file_path):
with open(file_path, 'r', encoding='utf-8') as f:
text = f.read().lower()
text = text.translate(str.maketrans('', '', string.punctuation))
words = text.split()
return dict(Counter(words))

# Пример использования
result = count_words_in_file("example.txt")
print(result)

Please open Telegram to view this post

VIEW IN TELEGRAM

👎3❤2👍1🔥1🐳1

3.07K views18:07

Data Science | Machinelearning [ru]

🧠

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц

Как машинное обучение помогает управлять ускорителями частиц? В статье раскрываются примеры применения нейронных сетей, обучения с подкреплением и байесовской оптимизации для стабилизации и настройки пучков частиц.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4

3.03K views10:07

Data Science | Machinelearning [ru]

📝

Подборка вакансий для сеньоров

Data Engineer
• Python, CI/CD, Apache Spark, Apache Hadoop
• от 250 000 до 320 000 ₽ | от 2 лет опыта

Data Scientist (E-com)
• Python, SQL
• Уровень дохода не указан | от 1 года опыта

Data Scientist (middle)
• Python, SQL, A/B тестирование, Математическая статистика
• Уровень дохода не указан | от 1 года опыта

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

2.97K views14:07

Data Science | Machinelearning [ru]

📈

Подборка статей для вашей карьеры

• «Снова упала?» Как поднять самооценку и зачем мы сравниваем себя с другими, даже если от этого больно

• Из учителя в QA: мой путь в IT

• Рынок дата-инженеров и прогноз на 2025

• Как сделать резюме, которое дойдёт до работодателя. Фильтры ATS в 2025 году

• Ошибайся смело: жизненные уроки из мира machine learning

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1

2.91K views18:07

Data Science | Machinelearning [ru]

🤔

Топология в нейросетях?

Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4

2.87K views10:07

Data Science | Machinelearning [ru]

⚙️

Что такое logging в Python?

logging — это встроенный модуль Python для создания логов, которые помогают отлаживать и мониторить работу приложений.

➡️

Пример:

import logging

# Настройка базового уровня логирования
logging.basicConfig(level=logging.INFO)

# Создание лога
logging.info("Приложение запущено")
logging.warning("Это предупреждение!")
logging.error("Произошла ошибка")

🗣️ В этом примере модуль logging создаёт сообщения разного уровня важности. Логирование позволяет отслеживать работу приложений и находить проблемы в коде.

🖥

Подробнее тут

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4🔥1

3.11K views14:07

Data Science | Machinelearning [ru]

❓

Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии

Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥1🐳1

3.19K views18:07

Data Science | Machinelearning [ru]

👩‍💻

Линейная регрессия и её регуляризация в Scikit-learn

Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤3🔥1🐳1

3.33K views10:07

Data Science | Machinelearning [ru]

💡 Пиши код так, чтобы не пришлось его объяснять

Тебя уже дважды спрашивали, как работает твой код, а ты сам еле вспоминаешь?

👉 Совет: если код требует объяснения — значит, его можно улучшить. Улучши имена переменных, избавься от хитрых решений, добавь комментарии только там, где действительно нужно. Хороший код читается, как книга, а не как зашифрованное послание.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤2🐳1

3.17K views14:07

Data Science | Machinelearning [ru]

➡️

Что такое технология TTS, как устроена и каких сферах используется синтез речи

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4🐳1

3.17K views18:07

Data Science | Machinelearning [ru]

📨

Пример использования программы для парсинга e-mail адресов с сайтов, созданный ИИ

Сегодня делимся программой для парсинга e-mail с сайтов, созданной за 30 минут с помощью ИИ от Rokitok. Это показывает, как ИИ ускоряет задачи, на которые раньше уходили дни или большие бюджеты.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1

3.02K views10:07

Data Science | Machinelearning [ru]

👩‍💻

Задачка по Python

Создайте Python-приложение, которое принимает путь к CSV-файлу с историческими данными о ценах акций (дата, цена закрытия) и предсказывает, будет ли цена акций расти или падать на следующий день, используя простую линейную регрессию. Программа должна выводить прогноз в консоль и сохранять модель в файл model.pkl.

➡️ Пример:

• python app.py predict_stock prices.csv — предсказывает изменение цены акций на следующий день.

Решение задачи ⬇️

import sys
import pandas as pd
from sklearn.linear_model import LinearRegression
import pickle

def predict_stock(file):
data = pd.read_csv(file)
X = data.index.values.reshape(-1, 1)
y = data['Close'].values

model = LinearRegression()
model.fit(X, y)

next_day = [[len(X)]]
prediction = model.predict(next_day)

with open('model.pkl', 'wb') as f:
pickle.dump(model, f)

print(f'Прогноз на следующий день: {"Рост" if prediction > y[-1] else "Падение"}')

if __name__ == "__main__":
if len(sys.argv) != 3 or sys.argv[1] != 'predict_stock':
print('Использование: python app.py predict_stock <файл.csv>')
else:
predict_stock(sys.argv[2])

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍2

2.99K views14:07

Data Science | Machinelearning [ru]

🔝

Самые интересные статьи за последние дни:

• Как я с помощью нейросетей обогнала инфляцию [4 кейса, скрины, никакой рекламы]

• Сравнение роста заработных плат ректората МГТУ им. Н.Э. Баумана и остальных сотрудников

• Pydantic 2: Полное руководство для Python-разработчиков — от основ до продвинутых техник

• SOLID на котиках

• Как переподписка по CPU в облаке снижает производительность Arenadata DB: результаты, которых не ждёшь

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

2.87K views18:07

Data Science | Machinelearning [ru]

☁️

Как обучить ИИ в облаке

Сегодня мы хотим поделиться с вами нашим успешным кейсом, который наглядно демонстрирует, как облачные технологии могут значительно улучшить и ускорить процессы разработки и обучения ИИ.

Читать...

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3❤1

2.96K views10:07

Data Science | Machinelearning [ru]

👩‍💻 Задачка по Python

Создайте Python-приложение, которое принимает набор данных с несколькими признаками и определяет наиболее важные признаки для предсказания целевой переменной с помощью модели RandomForest. Программа должна выводить результаты в виде списка признаков, отсортированных по важности.

➡️ Пример:

• python app.py data.csv — выводит важные признаки.

Решение задачи ⬇️

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

def feature_importance(file):
data = pd.read_csv(file)
X = data.drop(columns=['target'])
y = data['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

model = RandomForestClassifier()
model.fit(X_train, y_train)

importance = pd.Series(model.feature_importances_, index=X.columns).sort_values(ascending=False)
print("Важные признаки:\n", importance)

if __name__ == "__main__":
import sys
if len(sys.argv) != 2:
print("Использование: python app.py <файл.csv>")
else:
feature_importance(sys.argv[1])

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

3.24K views14:07

Data Science | Machinelearning [ru]

🔎

Подборка вакансий для джунов

Системный аналитик junior
🟢UML, BPMN, API, MongoDB
🟢от 60 000 ₽ | 1–3 года

Junior Data Scientist \ Аналитик
🟢SQL, PostgreSQL, MariaDB, ClickHouse, Python, Pandas, Git
🟢от 50 000 до 60 000 ₽ | 1–3 года

Data-аналитик в области временных рядов (Junior)
🟢Python, Pandas, NumPy, SciPy, Matplotlib, Seaborn, SQL
🟢от 247 000 ₽ | 1–3 года

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍1🔥1

3.04K views18:07