Junior/Middle Data Engineer
Junior Data Engineer
Специалист по сбору данных/ Junior data analyst
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1
В этой статье я привел базовые сведения о логистической регрессии и показал как сделать модель с нуля на чистом Python. Логистическая функция, обучение, метрики качества для модели классификации, реализация и небольшой разбор обучения весов.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍1
shutil
в Python и зачем он используется?Модуль
shutil
предоставляет функции для работы с файлами и директориями, такие как копирование, перемещение и удаление. Он полезен для автоматизации задач управления файлами.import shutil
# Копирование файла
shutil.copy('source.txt', 'destination.txt')
# Перемещение файла
shutil.move('destination.txt', 'folder/destination.txt')
🗣️ В этом примере shutil.copy копирует файл, а shutil.move перемещает его в другую директорию. Это облегчает выполнение операций с файлами и папками.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🐳2❤1
Data Scientist
•
Python, SQL, MS SQL Server, PostgreSQL, A/B тестирование, ML-модели, Ad-Hoc аналитика•
Уровень дохода не указан | Средний (Middle)Data Scientist (Моделирование РБ)
•
Python, Spark, SQL, ML, DL, NLP, Apache Spark•
Уровень дохода не указан | Средний (Middle)ML Engineer / Инженер машинного обучения
•
Python, PyTorch, PostgreSQL, FastAPI, LLM, MLOps, Git, Docker, AirFlow•
Уровень дохода не указан | Средний (Middle)Python разработчик
•
Python, FastAPI, PostgreSQL, React•
от 150 000 ₽ | Средний (Middle)Python разработчик
•
Python, Flask, FastAPI, PostgreSQL, MySQL•
Уровень дохода не указан | Средний (Middle)Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
Компания OpenAI представила свою ИИ-модель для генерации видео — Sora. В статье обсуждаются ожидания, доступность и сравнительный анализ с конкурентами, такими как Kling AI и Runway Gen-3.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2
Напишите функцию, которая принимает текстовую строку и возвращает наиболее часто встречающееся слово и количество его вхождений. Игнорируйте регистр и знаки препинания.
Пример:
text = "Python is great, and Python is fun! Learning Python is rewarding."
result = most_common_word(text)
print(result)
# Ожидаемый результат: ('python', 3)
Решение задачи
import re
from collections import Counter
def most_common_word(text):
words = re.findall(r'\b\w+\b', text.lower())
counter = Counter(words)
return counter.most_common(1)[0]
# Пример использования:
text = "Python is great, and Python is fun! Learning Python is rewarding."
result = most_common_word(text)
print(result)
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2👎1
Статья расскажет, как машинное обучение помогает улучшить процесс производства железорудных окатышей, снизив зависимость от человеческого фактора, и о примерах, когда технологии сталкиваются с реальными проблемами.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳5❤1
Статья рассказывает, как Pydantic помогает бизнесу гибко управлять наградами для пользователей. Описаны преимущества Pydantic в валидации и преобразовании данных по сравнению с dataclass.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥1
💾 Онлайн-доски теперь в on-premise!
Яндекс 360 для бизнеса выкатил корпоративный сервис для совместной работы. Можно строить схемы, вести проекты, разбирать user flow и визуализировать данные.
🛠 Что под капотом?
• On-premise-развертывание — все данные остаются внутри компании.
• Гибкое управление доступами — настройка через админку.
• Безопасность — данные зашифрованы, работают в закрытом контуре.
📡 В будущем добавят облачную версию, но пока онли self-hosted. Лицензия уже доступна.
Яндекс 360 для бизнеса выкатил корпоративный сервис для совместной работы. Можно строить схемы, вести проекты, разбирать user flow и визуализировать данные.
🛠 Что под капотом?
• On-premise-развертывание — все данные остаются внутри компании.
• Гибкое управление доступами — настройка через админку.
• Безопасность — данные зашифрованы, работают в закрытом контуре.
📡 В будущем добавят облачную версию, но пока онли self-hosted. Лицензия уже доступна.
❤3🔥3🐳3👎2👍1
• Эволюция архитектур нейросетей в компьютерном зрении: сегментация изображений
• Заяц не вырастет в акулу. Или секреты гибкой инженерной культуры от Александра Бындю
• Все, пора увольняться: что я поняла после работы в токсичных командах
• Базовое программирование, или Почему джуны не могут пройти к нам собеседование
• Я стал аналитиком, потому что не смог быть программистом
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🐳2
Статья исследует возможность аутентификации пользователей GPT-чата во внешних приложениях. Рассматривается голосовое взаимодействие и альтернативный способ аутентификации через пароли вместо OAuth 2.0.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🐳1
Статья объясняет, как управлять зависимостями и изолировать проекты в Python. Рассматриваются виртуальные окружения, работа с разными версиями Python, примеры из практики и лучшие подходы для разработки.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Ты можешь быть крутым специалистом, но если на рутинные действия уходит куча времени, ты теряешь продуктивность.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3
Data Engineer
Marketing analyst
Data Engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Это коллекция из 7 моих любимых промптов для ChatGPT (и моих самых используемых промптов), которые вы можете добавить в любой промпт и мгновенно сделать его в 10 раз лучше.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤1
Напишите функцию на Python, которая принимает обучающий набор данных, тестовый набор данных и значение 𝑘, а затем использует алгоритм k-ближайших соседей (kNN) для классификации тестовых данных. Функция должна возвращать предсказанные метки для тестового набора данных.
Пример:
import numpy as np
X_train = np.array([[1, 2], [2, 3], [3, 4], [5, 5]])
y_train = np.array([0, 0, 1, 1])
X_test = np.array([[2, 2], [4, 4]])
predictions = knn_classification(X_train, y_train, X_test, k=3)
print(predictions) # Ожидаемый результат: [0, 1]
Решение задачи
from sklearn.neighbors import KNeighborsClassifier
def knn_classification(X_train, y_train, X_test, k=3):
model = KNeighborsClassifier(n_neighbors=k)
model.fit (X_train, y_train)
return model.predict(X_test)
# Пример использования:
import numpy as np
X_train = np.array([[1, 2], [2, 3], [3, 4], [5, 5]])
y_train = np.array([0, 0, 1, 1])
X_test = np.array([[2, 2], [4, 4]])
predictions = knn_classification(X_train, y_train, X_test, k=3)
print(predictions) # Ожидаемый результат: [0, 1]
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1👎1
• Смарт-функции в Алисе: как LLM помогает понять, чего хочет пользователь
• Сбер выкладывает GigaChat Lite в открытый доступ
• История YOLO – самой известной архитектуры компьютерного зрения
• Магия простоты: как мы улучшили отображение общественного транспорта на карте
• Обучение и fine-tuning моделей простым языком: зачем, как, где
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1
Масштабирование ИИ-систем долго считалось ключом к их развитию. Однако последние отчёты ставят это под сомнение: ROI от увеличения мощности снижается, а гипотеза «чем больше, тем лучше» теряет актуальность.
Читать...
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳2❤1👍1
Продуктовый аналитик / Data Analyst (junior)
Разработчик Back-End Java / BigData (Junior to Senior)
Junior Data Analyst
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1