Библиотека собеса по Data Science | вопросы с собеседований

1.3K views07:26

Что выведет код сверху?

Anonymous Quiz

😁13🤯4❤1

470 voters1.38K views07:26

Библиотека собеса по Data Science | вопросы с собеседований

Чем файл .pyc отличается от файла .py?

Хотя оба файла содержат байт-код, .pyc — это скомпилированная версия файла Python. Он имеет независимый от платформы байт-код.

Следовательно, мы можем выполнить его на любой платформе, поддерживающей формат .pyc.

Python автоматически генерирует его для повышения производительности (с точки зрения времени загрузки, а не скорости).

👍1

1.49K views07:31

Библиотека собеса по Data Science | вопросы с собеседований

Что такое N-граммы? Как мы можем их использовать?

Функция разбиения на последовательные последовательности слов называется n-граммами. Его можно использовать для определения N наиболее часто встречающихся слов (как часто за словом X следует слово Y) в данном предложении.

1.51K views07:50

Библиотека собеса по Data Science | вопросы с собеседований

Что, если мы установим все веса нейронной сети равными 0?

Если все веса нейронной сети установлены равными нулю, выходные данные каждого соединения будут одинаковыми (W*x = 0). Это означает, что градиенты, которые возвращаются к каждому соединению в слое, одинаковы. То есть все связи/веса изучают одно и то же, и модель никогда не сойдется.

👍3🤔1

1.52K views07:15

Библиотека собеса по Data Science | вопросы с собеседований

Каковы основные параметры модели дерева решений?

✍️ максимальная глубина дерева
✍️ минимальные выборки на листовой узел
✍️ критерий примеси

👍9

1.46K views07:45

Библиотека собеса по Data Science | вопросы с собеседований

Что такое регуляризация? Зачем нам это нужно?

Регуляризация используется для уменьшения переобучения в моделях машинного обучения. Это помогает моделям хорошо обобщать и делать их устойчивыми к выбросам и шуму в данных.

👍3

1.41K views07:18

Библиотека собеса по Data Science | вопросы с собеседований

Как узнать, сколько деревьев нам нужно в случайном лесу?

Количество деревьев в случайном лесу обрабатывается n_estimators, а случайный лес уменьшает переобучение за счет увеличения количества деревьев. Не существует фиксированного эмпирического правила для определения количества деревьев в случайном лесу, оно довольно точно настраивается с учетом данных, обычно начиная с возведения в квадрат количества признаков (n), присутствующих в данных, с последующей настройкой, пока мы не получим получить оптимальные результаты.

👍8😁2🤔1

1.53K views07:28

Библиотека собеса по Data Science | вопросы с собеседований

Когда бы вы использовали Adam, а когда SGD?

Adam имеет тенденцию сходиться быстрее, тогда как SGD часто сходится к более оптимальным решениям.

🤯5❤2👍1

1.46K views07:16

Библиотека собеса по Data Science | вопросы с собеседований

Что такое ROC-кривая? Когда её использовать?

ROC означает «Receiver Operating Characteristics». Схематическое изображение, показывающее контраст между истинно положительными показателями и ложноположительными. Она используется, когда нам нужно предсказать вероятность двоичного результата.

❤2👍2

1.42K views07:22

Библиотека собеса по Data Science | вопросы с собеседований

Что такое bag of words? Как мы можем использовать его для классификации текста? ‍

Это представление текста, описывающее появление слов в документе. Порядок или структура слов не учитываются. Для классификации текста мы смотрим на гистограмму слов в тексте и рассматриваем каждое количество слов как признак.

👍5

1.38K views18:15

Библиотека собеса по Data Science | вопросы с собеседований

Как выглядит регуляризация L2 в линейной модели?

Регуляризация L2 добавляет к нашей функции стоимости штраф, который равен сумме квадратов коэффициентов модели, умноженных на лямбда-гиперпараметр. Этот метод гарантирует, что коэффициенты близки к нулю, и широко используется в случаях, когда у нас есть много функций, которые могут коррелировать друг с другом.

👍2

1.25K views07:15

Библиотека собеса по Data Science | вопросы с собеседований

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

👍1

1.31K views20:00

Библиотека собеса по Data Science | вопросы с собеседований

В чем разница между случайным лесом и повышением градиента?

Функция «Случайные леса» строит каждое дерево независимо, а функция «Усиление градиента» строит по одному дереву за раз.
Случайные леса объединяют результаты в конце процесса (путем усреднения или «правил большинства»), тогда как повышение градиента объединяет результаты по ходу процесса.

👍1

1.21K views12:02

Библиотека собеса по Data Science | вопросы с собеседований

Что такое dropout? Почему это полезно? Как это работает?

Dropout — это метод, который на каждом этапе обучения отключает каждый нейрон с определенной вероятностью p. Таким образом, на каждой итерации мы обучаем только 1-p нейронов, что заставляет сеть не полагаться только на подмножество нейронов для представления признаков. Это приводит к регуляризирующим эффектам, которые контролируются гиперпараметром p.

👍5

1.1K views07:14

Библиотека собеса по Data Science | вопросы с собеседований

Самые полезные каналы для программистов в одной подборке!

Сохраняйте себе, чтобы не потерять 💾

🔥Для всех

Библиотека программиста — новости, статьи, досуг, фундаментальные темы
Книги для программистов
IT-мемы
Proglib Academy — тут мы рассказываем про обучение и курсы

🐘PHP

Библиотека пхпшника
Вакансии по PHP, Symfony, Laravel
Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по PHP — код, квизы и тесты

🐍Python

Библиотека питониста
Вакансии по питону, Django, Flask
Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Python — код, квизы и тесты

☕Java

Библиотека джависта — полезные статьи по Java, новости и обучающие материалы
Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Java — код, квизы и тесты
Вакансии для java-разработчиков

👾Data Science

Библиотека Data Science — полезные статьи, новости и обучающие материалы
Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Data Science — код, квизы и тесты
Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту

🦫Go

Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go
Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Go — код, квизы и тесты
Вакансии по Go

🧠C++

Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++
Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по C++ — код, квизы и тесты
Вакансии по C++

💻Другие профильные каналы

Библиотека фронтендера
Библиотека шарписта
Библиотека мобильного разработчика
Библиотека хакера
Библиотека devops’a
Библиотека тестировщика

💼Каналы с вакансиями

Вакансии по фронтенду, джаваскрипт, React, Angular, Vue
Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel
Вакансии по DevOps & SRE
Вакансии для мобильных разработчиков
Вакансии по QA тестированию
InfoSec Jobs — вакансии по информационной безопасности

📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈

🤖Также у нас есть боты:
Бот с IT-вакансиями
Бот с мероприятиями в сфере IT

Мы в других соцсетях:
🔸VK
🔸YouTube
🔸Дзен
🔸Facebook
🔸Instagram

1.19K views06:00

Библиотека собеса по Data Science | вопросы с собеседований

Что такое обмен значениями при помощи кортежей?

Один из популярных трюков в Python – обмен значениями без создания временной переменной. Способ применим для любого числа переменных.

В правой части инструкции присваивания последовательностей допускается указывать любые итерируемые объекты. Главное, чтобы число элементов слева равнялось числу элементов справа. Такое присваивание применяется и для сложных вложенных конструкций.

1.26K views18:31

Библиотека собеса по Data Science | вопросы с собеседований

Как мы можем узнать, какие функции более важны для модели дерева решений?

Часто мы хотим найти такое разделение, которое минимизирует сумму примесей узлов. Критерий примеси является параметром деревьев решений. Популярными методами измерения примеси являются примесь Джини и энтропия, описывающая прирост информации.

👍3😱1😢1

1.28K views07:14

Библиотека собеса по Data Science | вопросы с собеседований

Знаете ли вы какие-либо способы получения вложений слов?

TF-IDF
GloVe
BERT

👍1

1.21K views07:26

Библиотека собеса по Data Science | вопросы с собеседований

Что такое объединение в CNN? Зачем нам это нужно?

Объединение — это метод понижения разрешения карты объектов. Это позволяет слоям, которые получают относительно неискаженные версии входных данных, изучать низкоуровневые функции, такие как линии, в то время как более глубокие слои модели могут изучать более абстрактные функции, такие как текстура.

🤔3👍1

1.09K views07:21

About

Blog

Apps

Platform