Интересное что-то
517 subscribers
2.72K photos
253 videos
139 files
4.52K links
Материалы и мысли, понадерганные отовсюду
Блог: https://t.me/asisakov_channel
Чат: https://t.me/youknowds_chat
Download Telegram
Обзор типов баз данных: какие типы БД существуют, в каких задачах используются ?

Сегодня поговорим про базы данных и рассмотрим типы БД, преимущества и недостатки каждого типа. Знание специфики применения различных типов баз данных позволяет аналитику лучше ориентироваться в архитектуре системы, а также принимать участие в проработке архитектуры решения.

Поэтому собрал в карточках краткую теорию по основным типам БД. Изучайте, делитесь с друзьями и сохраняйте в избранное, чтобы не потерять полезную информацию 😉

#study_analysis
Я принес. Черная книга менеджера

Впервые я прочитал эту книгу лет 10-11 назад, когда только начинал получать тимлидские и прочие ответственные роли. Возможно поэтому у меня от них не было возвышенных иллюзий 🙂

Не пугайтесь, что эта книга называется книгой и якобы долго её придется читать. По сути это большой лонгрид на 25 страниц контента. Но контент очень емкий, сжатый, сконцентрированный. После каждой главы надо хорошо подумать.

А еще сразу уточню, что книга написана в жестком стиле. С обсценной лексикой и без какого-то заигрывания с «мы – семья», «позволь максимально уважить твои личные границы» и «доброго времени суток, многоуважаемые коллеги».
При этом, на мой взгляд, книга снимает розовые очки, к которым мы иной раз в айтишечке привыкли и показывает неприкрытую правду жизни и настоящих требований бизнеса от менеджеров. Жестко, но по-деловому справедливо.

Книгу я бы посоветовал почитать тимлидам, проджектам, продактам и прочим менеджерам точно. А еще неплохо бы тем, кто только подумывает пойти в разный менеджмент.

Ссылка на сайте Стратоплана потому, что её написал Слава Панкратов https://stratoplan-school.com/Storage/books/pdf/stratoplan_black_book.pdf

Кстати это тоже отдельный прикол был для меня, что одно время я воспринимал Стратоплан и Черную книгу менеджера как совсем разные сущности и был удивлен, когда узнал кто же автор 🙂

Пишите в комментариях свои отзывы, если читали. Обычно я встречаю отзывы противоположного спектра: или «супер-жиза», или «ну это че-то перебор». Равнодушных после прочтения обычно мало на моей практике.
Forwarded from K R
вот ещё полезный тред в тему обсуждения кач-ва сигналов ( то, что описано в треде имхо валидно онли для дирекшонал мидфрика, для кроссекшонала это будет невалидно по очевидным причинам, для хфт это будет невалидно из-за нерегулярного сэмплинга ) https://x.com/systematicls/status/1840317347783221613
Материалы с курса ML System Design

Два моих хороших товарища Mikhail Rozhkov и Alexander Guschin выложили в открытый доступ материалы по ML System Design курсу в HARBOUR.SPACE в git

C Мишей мне довелось поработать над курсом MLOps для Data Science и разработки ML моделей, а с Сашей часто общаемся по самым разным вопросам =)

Так же советую ознакомиться с постом на medium

И подписаться на канал Саши в телеграме
#llm #blog

Трендовые статьи по Large Language Model

Пост в блоге

Краткое содержания блогпоста:
- самокоррекция в LLM через обучение с подкреплением: Google Deepmind предложили инновационный подход для повышения способности больших языковых моделей (LLM) к самокоррекции.
- квантование LLM для выполнения инструкций: Было установлено, что методы квантования существенно влияют на производительность LLM. Ключевое наблюдение – квантование моделей с большими параметрами (405B) часто дает лучшие результаты.
- память в LLM: Было доказано, что LLM обладают памятью, а архитектура Transformer выполняет функцию аппроксимации входных данных, демонстрируя «память Шрёдингера», которая активируется входными данными.
- Logic-of-Thought для улучшения рассуждений LLM: Новый подход Logic-of-Thought (LoT) показал значительное улучшение производительности LLM на задачах логического рассуждения, в частности, на наборах данных ReClor, LogiQA и ProofWriter.

Пост в блоге
Forwarded from Katser
Open-source наработки в промышленности

Одна из мер поддержки опен-сорса в РФ, упомянутая отчете из этого поста, это гранты Код-ИИ. Я и сам участвовал в проекте, получившем такой грант. В этом посте поделюсь парой проектов, получивших грант и относящихся к промышленности.

1️⃣ CVFlow (13 звезд, последний коммит 4 месяца назад) — открытая библиотека CV для промышленности
Github | Youtube

Решает следующие задачи:
🔘Определение положения объектов в пространстве и расстояния между ними
🔘Поиск дефектов и прочих образований на материале
🔘Распознавание номера автомобилей
🔘Распознавание номера вагона поезда
🔘Распознавание QR и штрихкодов
🔘Классификация транспортных средств
🔘Гранулометрия, распознавание размеров однородных объектов
🔘Определения скорости объектов по видеопотоку

Из реально интересных задач: гранулометрия и поиск дефектов на материале.

Из преимуществ: доступны веса предобученных моделей, хотя нет доступных данных.

2️⃣ TSAD — Time Series Analysis for Simulation of Technological Processes (39 звезд, последний коммит 5 месяцев назад) — python библиотека для решения ML задач в промышленности
Github | Youtube

Решает следующие задачи:
🔘Прогнозирование временных рядов
🔘Поиск аномалий
🔘Автоматизированный разведочный анализ данных
🔘Предварительная обработка данных
🔘Визуализация результатов
🔘Оценки качества решения задач, включая специфичные задачи типа changepoint detection

Из преимуществ: неплохая документация, доступны данные, упор на работу с промышленными данными и решение задач PHM (Prognostics and Health Management)

Общий недостаток обеих библиотек: недостаточность функционала и недоработанность кода/подходов. Зато у каждого есть шанс поучаствовать и улучшить библиотеки
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 🗞 Виз Ньюз (Nikita Rokotyan)
Делюсь с вами большущей доской, на которой собраны различные инструменты для OSINT — разведки по открытым данным. А вот тут еще можно посмотреть вебинар с обзором этих инструментов.

Автор — Клаудия Титце (Claudia Titze), известный в узких кругах OSINT специалист. Еще на ее сайте можно найти интересные видео, в которых она рассказывает про некоторые свои расследования.

@dataviznews
Forwarded from Young&&Yandex
🤟 Тренировки по ML 2.0

Первая лекция стартует 25 октября в 19:00. Для подготовки собрали ещё немного тренировок и разборов домашних заданий — освежите знания перед стартом нового сезона:

⚫️ Лекции
1. Вводная по ML + knn
2.
Линейная регрессия и регуляризация
3.
Линейная классификация, метод максимального правдоподобия
4.
Решающие деревья, композиции деревьев, Random Forest
5.
Градиентный бустинг, тонкости обучения
6.
Обзорная лекция по DL
7.
Оценка значимости признаков, обучение без учителя
8.
Бонусная встреча. Как перейти от теории к практике

⚫️ Разборы заданий
Разбор домашнего задания 1
Разбор домашнего задания 2
Разбор домашнего задания 3
Разбор домашнего задания 4

Одновременно запускаем набор на трек Алгоритм, регистрируйтесь по ссылке 🫰
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Авторы Chatbot Arena выпустили расширение для VS Code для оценки моделей для кодинга. По сути, это бесплатный копайлот, где предлагают выбирать из нескольких вариантов, сгенеренных разными моделями. Это должно позитивно повлиять на оценку моделей для кода, ведь именно автодополнение никто больше не бенчит. Отдельная арена тут может помочь до какой-то степени, пока разработчики на неё не оверфитнулись. А дальше придётся придумывать новые бенчи.

Если хотите попользоваться, учтите, что ваш код будут отправлять хостерам моделек на арене, что допустимо для опенсорс разработок и каких-то личных проектов. А вот для коммерческой разработки, конечно же, такое использовать не стоит.

Скачать

@ai_newz