DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_29

🔠Вопрос_29: Можно ли проверить вероятность повышения точности модели без использования методов перекрестной проверки? Если да, пожалуйста, объясните ?

✔️Ответ:

Да, можно протестировать вероятность повышения точности модели без использования методов перекрестной проверки. Мы можем сделать это, запустив ML-модель, скажем, для n-го числа итераций, записав точность. Нанесите на график все значения точности и удалите 5% значений с низкой вероятностью. Измерьте левый [низкий] срез и правый [высокий] срез. С оставшейся 95%-ной уверенностью мы можем сказать, что модель может опуститься как низко, так и высоко [как указано в пунктах отсечения].

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_30

🔠Вопрос_30: Назовите популярный алгоритм уменьшения размерности.

✔️Ответ:

Метод главных компонент (Principal Component Analysis, PCA). PCA позволяет сократить размерность данных, сохраняя при этом наибольшую возможную дисперсию в данных. Этот алгоритм применяется в различных задачах, включая снижение размерности данных, сжатие изображений, определение главных компонент для анализа данных и т.д.

При этом самыми популярными алгоритмами уменьшения размерности являются анализ главных компонент и факторный анализ. Анализ основных компонентов создает одну или несколько индексных переменных из большего набора измеряемых переменных. Факторный анализ - это модель измерения скрытой переменной. Эта скрытая переменная не может быть измерена с помощью одной переменной и видна через взаимосвязь, которую она вызывает в наборе y переменных.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_23

🔠Q23: Какие сертификаты у вас есть для проведения тестирования на проникновение?

✔️Ответ:

Для тестировщиков на проникновение полезны сертификаты
- EC-Council Certified Ethical Hacker (CEH),
- Offensive Security Certified Professional (OSCP) и
- GIAC Exploit Researcher & Advanced Penetration Tester (GXPN).

Однако это не является обязательным, все зависит от навыка человека.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_24

🔠Q24: Мои данные хранятся в облаке. Зачем мне нужен тест на проникновение?

✔️Ответ:

Даже если данные хранятся в облаке, тестирование на проникновение по-прежнему необходимо, чтобы определить, защищены ли ваши данные или нет. Кроме того, для проверки эффективности средств контроля требуется тест на проникновение.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_31

🔠Вопрос_31: Как мы можем использовать набор данных без целевой переменной в алгоритмах контролируемого обучения?

✔️Ответ:

Введите набор данных в алгоритм кластеризации, сгенерируйте оптимальные кластеры, пометьте номера кластеров как новую целевую переменную. Теперь в наборе данных присутствуют независимые и целевые переменные. Это гарантирует, что набор данных готов к использованию в алгоритмах контролируемого обучения.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_32

🔠Вопрос_32: Назовите и определите методы, используемые для поиска сходств в системе рекомендаций ?

✔️Ответ:

Корреляция Пирсона и косинусная корреляция - это методы, используемые для поиска сходств в рекомендательных системах.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_33

🔠Вопрос_33: Укажите ограничения фиксированной базовой функции ?

✔️Ответ:

Линейная разделимость в пространстве объектов не подразумевает линейной разделимости во входном пространстве. Ограничениями функций с фиксированной базой являются:

- Нелинейные преобразования не могут устранить перекрытие между двумя классами, но они могут увеличить перекрытие.
- Часто неясно, какие базовые функции наилучшим образом подходят для данной задачи. Таким образом, изучение базовых функций может быть полезным по сравнению с использованием фиксированных базовых функций.
- Если мы хотим использовать только фиксированные значения, мы можем использовать их много и позволить модели определить наилучшее соответствие, но это привело бы к переобучению модели, тем самым сделав ее нестабильной.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score

https://dzen.ru/denoiselab
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_25

🔠Q25: На каких типах систем вы проводили тестирование на проникновение?

✔️Ответ:

Тестирование на проникновение проводится на серверах, конечных точках, веб-приложениях, мобильных устройствах, беспроводных сетях, сетевых устройствах, облачных сервисах и других потенциальных объектах воздействия.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_26

🔠Q26: Как часто организация должна проводить тестирование на проникновение третьей стороной ?

✔️Ответ:

Это зависит от критичности данных организации, размещенных в системе. Если данные более чувствительны, частота тестирования на проникновение должна быть выше, и наоборот.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_34

🔠Вопрос_34: Определите и объясните концепцию индуктивного смещения на нескольких примерах ?

✔️Ответ:

Индуктивное смещение - это набор допущений, которые люди используют для прогнозирования выходных данных с учетом входных данных, с которыми алгоритм обучения еще не сталкивался. Когда мы пытаемся узнать Y из X, а пространство гипотез для Y бесконечно, нам нужно уменьшить объем за счет наших убеждений / предположений о пространстве гипотез, которое также называется индуктивным смещением. Благодаря этим предположениям мы ограничиваем пространство наших гипотез, а также получаем возможность постепенно тестировать и улучшать данные, используя гиперпараметры.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score

https://dzen.ru/denoiselab
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_27

🔠Q27: Вызывают ли тесты на проникновение какие-либо сбои в работе сети организации ?

✔️Ответ:

Это может нарушить работу служб, если тестер на проникновение успешно использует уязвимости. Чтобы свести к минимуму сбои, информируйте своего клиента, а также при необходимости прекращайте тестирование.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account

https://dzen.ru/denoiselab
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_28

🔠Q28: У нас установлен брандмауэр. Нужно ли нам по-прежнему проводить тестирование на проникновение в сеть, если у нас есть брандмауэр ?

✔️Ответ:

Брандмауэр используется для анализа трафика и блокирует его на основе заранее заданной конфигурации. В то время как тестирование на проникновение проверяет возможность использования ИТ-ресурсов, включая брандмауэр. Тестирование на проникновение является необходимым мероприятием даже при наличии всех сетевых компонентов.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_35

🔠Вопрос_35: Объясните термин "обучение на основе примеров" ?

✔️Ответ:

Обучение на основе экземпляров - это набор процедур регрессии и классификации, которые позволяют предсказать метку класса на основе сходства с его ближайшими соседями в наборе обучающих данных. Эти алгоритмы просто собирают все данные и получают ответ, когда это требуется или запрашивается. Простыми словами, они представляют собой набор процедур для решения новых задач, основанных на решениях уже решенных проблем в прошлом, которые аналогичны текущей проблеме.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_36

🔠Вопрос_36: Что такое теорема Байеса? Укажите хотя бы 1 вариант использования в отношении контекста машинного обучения ?

✔️Ответ:

Теорема Байеса - это статистическая теорема, которая позволяет обновлять вероятности событий на основе новой информации. Формально она выглядит так:

P(A|B) = (P(B|A) * P(A)) / P(B)

Где:
P(A|B) - вероятность события A при условии B,
P(B|A) - вероятность события B при условии A,
P(A) и P(B) - вероятность событий A и B соответственно.

Пример использования теоремы Байеса в контексте машинного обучения - это классификация текстов. Предположим, у нас есть набор текстов, разделенных на категории, и мы хотим классифицировать новый текст. Мы можем использовать теорему Байеса, чтобы обновить вероятности принадлежности текста к определенным категориям на основе уже имеющихся данных.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_29

🔠Q29: Что такое STRIDE?

✔️Ответ: STRIDE - это аббревиатура от системы моделирования угроз. Это помогает классифицировать все кибератаки по приведенным ниже методам:

- Spoofing;
- Tampering;
- Repudiation;
- Information disclosure;
- Denial of service (DoS);
- Elevation of privilege;

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_30

🔠Q30: Можете ли вы настроить таргетинг на любой IP-адрес для тестирования на проникновение?

✔️Ответ: Тестирование на проникновение начинвается только после детального обсуждения целевых показателей с руководством и технической командой компании. Юридическое соглашение подписывается между агентством по тестированию и компанией заказчиком, в котором упоминаются все IP-адреса, подпадающие под действие теста.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_37

🔠Вопрос_37: Каково значение гаммы и регуляризации в SVM?

✔️Ответ:

Гамма в SVM отвечает за ширину радиальной базисной функции (RBF), которая используется для преобразования признакового пространства. Более высокое значение гаммы приводит к более сложной модели, которая может более точно разделить данные в исходном пространстве, но может страдать от переобучения. Снижение значения гаммы позволяет модели быть более гибкой и генерализировать лучше, но может ухудшить точность классификации.

Регуляризация в SVM контролирует баланс между уменьшением ошибки обучения и сложностью модели. Чем больше значение регуляризации, тем более простая модель, что может помочь в избежании переобучения. Уменьшение значения регуляризации позволяет модели быть более сложной и точной на обучающих данных, но также может привести к переобучению.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_38

🔠Вопрос_38: В чем разница между порождающей и дискриминативной моделями?

✔️Ответ:

Генеративная модель моделирует совместное распределение вероятностей входных данных и меток классов. Она пытается понять, каким образом данные были сгенерированы, и генерирует новые примеры данных, а также метки классов для этих данных. Генеративная модель может использоваться для генерации новых данных, классификации данных и оценки плотности распределения данных.

Дискриминативная модель, на другой стороне, моделирует прямое отображение между входными данными и метками классов. Она фокусируется на том, какие признаки в данных отличают один класс от других. Дискриминативная модель используется для классификации данных и оценки вероятности принадлежности к определенному классу.

#work #coding #testing #optimization #ml #learning #deep #data_science #model #score
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_31

🔠Q31: Что такое XSS и SSRF ?

✔️Ответ:

XSS - это атака, при которой злоумышленник внедряет вредоносный скрипт на веб-страницу, которая потом выполняется в браузере пользователей. Это позволяет злоумышленнику перехватывать данные пользователя, модифицировать содержимое страницы, или выполнять действия от имени пользователя.

SSRF - это атака, при которой злоумышленник заставляет уязвимое приложение отправлять запросы на внутренние сетевые адреса или внешние ресурсы, включая конфиденциальную информацию. Это может привести к компрометации системы, обходу ее защиты или раскрытию конфиденциальных данных.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_31

🔠Q31: Что такое OWASP ZAP ?

✔️Ответ:

OWASP ZAP (Zed Attack Proxy) - это инструмент для тестирования безопасности веб-приложений с открытым исходным кодом. ZAP предоставляет возможности сканирования и анализа уязвимостей веб-приложений, включая нахождение уязвимостей XSS (межсайтового скриптинга), SQL-инъекций, уязвимостей безопасности авторизации и многое другое. ZAP позволяет обнаружить и исследовать потенциальные проблемы безопасности, помогая девелоперам и тестировщикам улучшить безопасность своих веб-приложений.

🔥🔥🔥Отказ от ответственности: Материалы публикуем в канале несут лишь информационный характер, редакция канала не несет ответственности за ваши возможные действия и последующие за ними последствия. Мы также не призываем вас нарушать закон.

#cyber #secutity #coding #malware #vulnerabilities #coding #qa #analysis #penetration #testing #account