Разбираем Next Basket Recommendation (NBR) — метод предсказания товаров, которые пользователь добавит в корзину. Рассмотрим метрики оценки, частотные и нейросетевые подходы в онлайн-ритейле.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
functools.partial
в Python и зачем он нужен?functools.partial
позволяет создавать новые функции на основе существующих, фиксируя некоторые аргументы. Это полезно для упрощения кода, повышения читаемости и работы с колбэками.from functools import partial
def power(base, exponent):
return base ** exponent
square = partial(power, exponent=2) # Фиксируем степень = 2
cube = partial(power, exponent=3) # Фиксируем степень = 3
print(square(5)) # 25
print(cube(2)) # 8
🗣️ partial() фиксирует аргумент exponent, создавая новые функции square и cube. Теперь square(5) эквивалентно power(5, 2), но код чище.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2👎1
Data Scientist
•
Python, BI•
Уровень дохода не указан | 1–3 годаData Engineer
•
PostgreSQL, Apache Airflow, Greenplum, DWH, ETL•
Уровень дохода не указан | 3–6 летAI Data Analysis Specialist
•
Python, NLP, Power BI, Анализ данных, BI, Визуализация, Tableau, Английский язык•
Уровень дохода не указан | 1–3 годаPlease open Telegram to view this post
VIEW IN TELEGRAM
❤1🔥1
Детальный разбор 10 самых перспективных инструментов для работы с ИИ в 2025 году. От создания умных ассистентов до построения мощных RAG-систем — разбираем возможности, сравниваем производительность, безопасность и простоту интеграции каждого решения.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
Напишите функцию на Python, которая принимает путь к текстовому файлу и возвращает словарь с подсчётом количества уникальных слов. Слова должны сравниваться без учёта регистра, а знаки препинания должны быть удалены.
Пример:
# Содержимое файла example.txt:
# "Hello, world! This is a test. Hello again."
result = count_words_in_file("example.txt")
print(result)
# Ожидаемый результат:
# {'hello': 2, 'world': 1, 'this': 1, 'is': 1, 'a': 1, 'test': 1, 'again': 1}
Решение задачи
import string
from collections import Counter
def count_words_in_file(file_path):
with open(file_path, 'r', encoding='utf-8') as f:
text =f.read ().lower()
text = text.translate(str.maketrans('', '', string.punctuation))
words = text.split()
return dict(Counter(words))
# Пример использования
result = count_words_in_file("example.txt")
print(result)
Please open Telegram to view this post
VIEW IN TELEGRAM
👎3❤2👍1🔥1🐳1
Как машинное обучение помогает управлять ускорителями частиц? В статье раскрываются примеры применения нейронных сетей, обучения с подкреплением и байесовской оптимизации для стабилизации и настройки пучков частиц.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Data Engineer
•
Python, CI/CD, Apache Spark, Apache Hadoop•
от 250 000 до 320 000 ₽ | от 2 лет опытаData Scientist (E-com)
•
Python, SQL•
Уровень дохода не указан | от 1 года опытаData Scientist (middle)
•
Python, SQL, A/B тестирование, Математическая статистика•
Уровень дохода не указан | от 1 года опытаPlease open Telegram to view this post
VIEW IN TELEGRAM
❤2
• «Снова упала?» Как поднять самооценку и зачем мы сравниваем себя с другими, даже если от этого больно
• Из учителя в QA: мой путь в IT
• Рынок дата-инженеров и прогноз на 2025
• Как сделать резюме, которое дойдёт до работодателя. Фильтры ATS в 2025 году
• Ошибайся смело: жизненные уроки из мира machine learning
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
logging
в Python?logging
— это встроенный модуль Python для создания логов, которые помогают отлаживать и мониторить работу приложений.import logging
# Настройка базового уровня логирования
logging.basicConfig(level=logging.INFO)
# Создание лога
logging.info("Приложение запущено")
logging.warning("Это предупреждение!")
logging.error("Произошла ошибка")
🗣️ В этом примере модуль logging создаёт сообщения разного уровня важности. Логирование позволяет отслеживать работу приложений и находить проблемы в коде.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥1
Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥1🐳1
Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3🔥1🐳1
Тебя уже дважды спрашивали, как работает твой код, а ты сам еле вспоминаешь?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2🐳1
Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🐳1
Сегодня делимся программой для парсинга e-mail с сайтов, созданной за 30 минут с помощью ИИ от Rokitok. Это показывает, как ИИ ускоряет задачи, на которые раньше уходили дни или большие бюджеты.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1
Создайте Python-приложение, которое принимает путь к CSV-файлу с историческими данными о ценах акций (дата, цена закрытия) и предсказывает, будет ли цена акций расти или падать на следующий день, используя простую линейную регрессию. Программа должна выводить прогноз в консоль и сохранять модель в файл
model.pkl
.•
python app.py predict_stock prices.csv
— предсказывает изменение цены акций на следующий день.Решение задачи
import sys
import pandas as pd
from sklearn.linear_model import LinearRegression
import pickle
def predict_stock(file):
data = pd.read_csv(file)
X = data.index.values.reshape(-1, 1)
y = data['Close'].values
model = LinearRegression()
model.fit (X, y)
next_day = [[len(X)]]
prediction = model.predict(next_day)
with open('model.pkl', 'wb') as f:
pickle.dump(model, f)
print(f'Прогноз на следующий день: {"Рост" if prediction > y[-1] else "Падение"}')
if __name__ == "__main__":
if len(sys.argv) != 3 or sys.argv[1] != 'predict_stock':
print('Использование: pythonapp.py predict_stock <файл.csv>')
else:
predict_stock(sys.argv[2])
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2
• Как я с помощью нейросетей обогнала инфляцию [4 кейса, скрины, никакой рекламы]
• Сравнение роста заработных плат ректората МГТУ им. Н.Э. Баумана и остальных сотрудников
• Pydantic 2: Полное руководство для Python-разработчиков — от основ до продвинутых техник
• SOLID на котиках
• Как переподписка по CPU в облаке снижает производительность Arenadata DB: результаты, которых не ждёшь
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Сегодня мы хотим поделиться с вами нашим успешным кейсом, который наглядно демонстрирует, как облачные технологии могут значительно улучшить и ускорить процессы разработки и обучения ИИ.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤1
Создайте Python-приложение, которое принимает набор данных с несколькими признаками и определяет наиболее важные признаки для предсказания целевой переменной с помощью модели
RandomForest
. Программа должна выводить результаты в виде списка признаков, отсортированных по важности.•
python app.py data.csv
— выводит важные признаки.Решение задачи
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
def feature_importance(file):
data = pd.read_csv(file)
X = data.drop(columns=['target'])
y = data['target']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
model = RandomForestClassifier()
model.fit (X_train, y_train)
importance = pd.Series(model.feature_importances_, index=X.columns).sort_values(ascending=False)
print("Важные признаки:\n", importance)
if __name__ == "__main__":
import sys
if len(sys.argv) != 2:
print("Использование: pythonapp.py <файл.csv>")
else:
feature_importance(sys.argv[1])
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Системный аналитик junior
Junior Data Scientist \ Аналитик
Data-аналитик в области временных рядов (Junior)
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1🔥1