Интересное что-то
517 subscribers
2.72K photos
253 videos
139 files
4.52K links
Материалы и мысли, понадерганные отовсюду
Блог: https://t.me/asisakov_channel
Чат: https://t.me/youknowds_chat
Download Telegram
Forwarded from Dealer.AI
This media is not supported in your browser
VIEW IN TELEGRAM
Перекрёсток семи фичей вот и я – DeepCrossNetwok.

Вспомним, как деды воевали с кодированием категориальных признаков (это те, что представляют собой спец.теги, категории транзакций и пр. не всегда мнимоническое текстовое):
1. OneHot - когда мы разворачиваем категории в плоский табличный вид, где столбцы название категорий, а строки принимают значения 0/1 есть ли у наблюдения такая категория. Просто, интерпретируем и даже комбинации для моделей в виде регрессии, дерева или бустинга понятные. Сюда же я отнесу binary/dummy и прочие сродственные подходы.

2. Можно делать one-hot на интеракциях фичей аля склеивание их в комбинации, например, цвет "серый" и категория "рыбалка" превращаются в "серый-рыбалка". Далее также 0/1 и т.п.

3. Label encoding. Тут все "просто" категории дается число (ее уникальный номер). Далее эта хака может превращаться в ранг, если можно прям позиционность закодировать. Например низкий-средний-высокий, как 0,1,2. У нас и лейблы и мы понимаем, что 0<1<2 как и позиция высоты. Но еще id категорий можно превращать в их частоты...

4. Кодирование частотами. Тут конечно повеселее, нужно хитро и без ликов прокинуть на train/test частотки той или иной категории по выборке. Обычно не раздувает число столбцов, как в п.п. 1,2, но требует осторожности – частоты считаем всегда по train. В целом тут можно и в лоб пройтись каунтером, но мое любимое переиспользовать tfidf :) Тут будет у вас term = лейбл категории, далее каждой такой фиче для всех принимаемых категорий можно построить tfidf меру. А как вы помните tfidf почти всегда (99%) считается по train сету, если иного не требует какая-нибудь хитрость.

5. Target encoding. Как п. 2 был развитием п.1  этот пункт развитие предыдущего. Но тут пилотаж повыше нужен. Т.к. кодировать фичи нужно мат. ожиданием совместного появления категории с таргетом. Т.е. концептуально (т. к. есть разные методы кодирования таргетом) для регрессии – это среднее значение переменной по категории, для классификации совместная вероятность класса и категории. Тут важно также не напортачить с ликом в данных, т.к. вы прокидываете переменную в фичи, там и схемы хитрой валидации и в т.ч. хитрый расчёт этих энкодингов, загуглите, не поленитесь.

Ладно, к чему эта вся телега. Да к тому, что дяди (уже не деды), придумали для того, чтобы работать с категориями и интеракциям фичей прям на слое нейросети. И назвали это deep crows network - DCN. В центре внимания находится механизм кодирования и интеракций признаков, напоминающий МГУА (деды придумали метод группового учета аргументов), но с большей нелинейностью, эмбами, skip-connections и т.п.

В общем, стала модна эта штука в рекомендациях, CTR prediction и конечно же в табформерах. Вспомним даже LIMIX выше.

Если тебе интересно познакомиться с этим поближе, советую прочитать статью и глянуть pytorch код, не все же тебя на keras отсылать.
🤔 Почему думать за пользователя опасно

Сейчас у нас в стартап треке AI Talent Hub проходит пре-акселератор. Мы встречаемся раз в неделю, слушаем полезную инфу и получаем задания на неделю – подготовить питч, провести CustDev, сформировать ценностные предложения своего продукта

Нам рекомендовали прочитать 2 книжки. Сейчас я много времени провожу в самолетах, поэтому у меня есть куча возможностей для чтения

Вот какие книги советовали:

1) "Спроси маму: Как общаться с клиентами и подтвердить правоту своей бизнес-идеи, если все кругом врут?", Фитцпатрик Роб

2) "От нуля к единице. Как создать стартап, который изменит будущее", Питер Тиль, Блейк Мастерс


Я довольно быстро прочитал первую книгу. Там подробно и на примерах рассказывают, как получать честную и полезную обратную связь о своей идее. Суть в том, что люди склонны говорить то, что собеседник хочет услышать, чтобы не огорчить его

С помощью конкретных шагов можно возвращать разговор в нужное русло, задавать правильные вопросы и с максимальной пользой использовать полученную информацию

Еще там рассказывают, почему важно как можно чаще общаться со своими клиентами и почему нельзя додумывать за него

Звучит, что даже крупные знакомые мне продукты грешат этим и сами пытаются придумать проблемы, которые пользователь хочет решить с помощью их продукта, хотя эта информация не только может оказаться бесполезной, но и может сильно навредить

С другой стороны, в больших продуктах аналитик обычно не общается с пользователями

Но ведь продакт и есть пользователь аналитики. Если ты не понимаешь, какую задачу решаешь для продакта, аналитика может быть бесполезной

В Яндексе один из самых популярных вопросов – «какую задачу ты решаешь?»

Это очень крутая часть продуктовой культуры. Сначала ты приходишь в компанию и бесишься от частоты этого вопроса, а потом сам не приступаешь к задаче, пока досконально не разберешься в проблематике 🤬

А как часто вы задаете подобные вопросы?

@tagir_analyzes
Please open Telegram to view this post
VIEW IN TELEGRAM
Считаем денежки 💸

Устала от того, что деньги постоянно куда-то деваются. Причем я не транжира, каждую трату стараюсь делать осознанно, но блин каждый раз не вписываюсь в план. Решила обратиться за помощью к ИИ и сделала промпт «финансовый консультант» 😘

Работает так: выкачиваете выписку с тратами из банка, копируете промпт и все вместе закидываете в чат. ИИ все разбирет, найдет «слепые зоны» и даст план экономии без жёстких ограничений. Плюс добавит пару неожиданных инсайтов на основе ваших привычек.

Лучше кидать в Excel, но CSV, PDF и скриншоты тоже подойдут. Обычно в таких отчетах нет чувствительных данных, так что с безопасностью все ок.

Промпт большой, положила сюда.


Рекомендациями довольна, все детально и с примерами. По моим ощущениям Gemini 2.5 Pro справился лучше GPT-5 — больше паттернов считал и советы получились глубже. Буду их применять 🤩

@creativethecreator
Please open Telegram to view this post
VIEW IN TELEGRAM
📎 Примеры финансовой отчетности

Уже второй раз в чатике курса обсуждали, а есть ли какие-нибудь хорошие примеры финансовых дэшей. Делюсь сохраненками по теме:

❤️ Tableau:
- Consolidated Financial Report
- Scenario Analysis - IBCS
- Income Statement
- Financial Dashboard | #RWFD
- CORPORATE FINANCE - Balance Sheet (не вау дизайн, но есть что подсмотреть)


❤️ Power BI:
- P&L в PowerBI
- Consolidated Financials Power BI Dashboard
- Alternative Approach to Visualize Surplus and Deficit

- Финансовая отчетность в DataLens от Юры Красильникова
- Подборка управленческих отчетов в Excel от Станислава Салостей

И IBCS стандарт и его обзор от Ромы Бунина
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Раз 5 передавал между GPT 5 Pro ︎ Gemini 2.5 Pro Deep Think довольно сложный вопрос:

Если бы за всю жизнь, человек мог бы прочитать строго 10 книг, не больше; какие книги это были бы и почему? 


Получился такой список, я не все читал так что побежал качать:

Научная и системная оптика

📔 1. Карл Саган - «Космос»
Формирует картину мира от атомов до галактик и показывает научный метод «в деле»: скептицизм, проверяемость, красота сомнения. Даёт масштаб и смирение - противоядие от догматизма и узости перспективы.

📔 2. Донелла Медоуз - «Азбука системного мышления» (Thinking in Systems)
Базовый набор инструментов: запасы/потоки, петли обратной связи, задержки, точки рычага. Помогает понимать экосистемы, рынки, политику и ИТ-платформы как сложные системы с непреднамеренными последствиями.

📔 3. Даниэль Канеман - «Думай медленно… решай быстро»
Грамматика когнитивных искажений: вероятности, причинность, риск. Инструкция по выживанию в мире манипуляций и инфошума.

📔 4. Элизабет Колберт - «Шестое вымирание»
Трезвая оптика антропогенных изменений: биоразнообразие, климат, пороги необратимости. Сшивает экологию с экономикой и политикой.

Практическая философия и жизнестойкость

📔 5. Марк Аврелий - «Размышления»
Стоический «тулкит» для высокой турбулентности: различение контролируемого/неконтролируемого, тренировка внимания, дисциплина и мягкая доброта.

Технологии, власть и общество

📔 6. Мэри Шелли - «Франкенштейн, или Современный Прометей»
Пророческая этика создателя: «способность» ≠ «право», ответственность за побочные эффекты. Рифмуется с ИИ, синбиотехом и «быстрыми» R&D-циклами.

📔 7. Вирджиния Вулф - «Своя комната»
Про невидимую инфраструктуру неравенства: деньги, время, тишина, двери. Учебник по распознаванию структурных барьеров и дизайну условий для таланта.

📔 8. Джордж Оруэлл - «1984»
Язык как инструмент власти, контроль памяти и восприятия. Мини-словарь для распознавания новояза и архитектур наблюдения в цифровой среде.

📔 9. Чинуа Ачебе - «Распад» (Things Fall Apart)
Деконструирует колониальный взгляд; показывает цену «прогресса» и хрупкость культурных систем. Расширяет моральный круг.

Художественные «симуляторы» глубокой этики

📔 10. Фёдор Достоевский - «Братья Карамазовы»
Лаборатория свободы и ответственности. «Великий инквизитор» как модель алгоритмического патернализма: комфорт и предсказуемость в обмен на свободу и данные.

***

А вот мотивация, почему список такой:

Когнитивистика вместо «истории науки»: в мире информационного шума важнее понимать собственные ошибки мышления, чем историографию их опровержения.

Экология и системность: кризисы теперь связаны - климат, биоразнообразие, энергетика, эпидемии. Нужен взгляд на взаимосвязи, а не только на «величие идей».

Технологическая этика: ИИ/генетика ставят вопросы ответственности творца и границ контроля.

Практическая философия и устойчивость: инструменты самообладания, когда неопределённость - норма.

Баланс перспектив: добавляем женские голоса и неевропейские оптики, чтобы «карта мира» не была однобокой.


P.S. Для кино сделаю такой же попозже
Please open Telegram to view this post
VIEW IN TELEGRAM
Добавлю ещё вот эти две подборки от моих GPTs (Под капотом GPT-5 thinking + system prompt)

Кстати первый раз в жизни захотелось эти книги из подборки в печатном виде и чтобы стояли на полке в спальне или зале(гостинной).
Приглашение на Хабр

Недавно на Хабре вышла моя статья "Математика на складе. Как оптимизировать хаос". После получения 50 плюсов Хабр дал мне возможность кому-то подарить приглашение. Хабру уже 19 лет, и там есть сформированная хорошо продуманная система привилегий - кто может писать статьи, комментарии, ставить реакции

Пригласила на Хабр Ваню, автора Кроссворда Тьюринга, и его статья сразу вошла в топ. Крайне рекомендую к прочтению, особенно тем, кто хочет разобраться в деталях постановки задач в теории вероятностей
Forwarded from Философия AI
Всем привет! Вышел наш вебинар о применении искусственного интеллекта в информационной безопасности и безопасности искусственного интеллекта. Самое интересное по тайм-кодам:
06:00 - Встроенная в LLM защита от злонамеренных действий
10:50 - Локальная LLM VS облачные LLM (ChatGPT и т.д.), что безопаснее?
18:50 - ML, AI, LLM - как они соотносятся друг с другом и что такое ИИ?
50:40 - Что умеет ИИ-агент?
01:13:10 - ИИ как объект атаки злоумышленников
01:32:40 - подходы к защите ИИ от атак
Forwarded from Борис_ь с ml
Росконгресс - состояние AI-агентов для бизнеса в мире
#ai #иб_для_ml

Я неожиданно встретил и прочитал крайне содержательный отчет Росконгресса по состоянию рынка AI-агентов в мире на август 2025 года. Он изобилует цифрами и графиками, свидетельствующими о взрывном росте популярности этой технологии в бизнесе, содержит разбор основных паттернов создания, сценариев использования и рисков применения. Более того, есть даже разбор одного вектора кибератаки.

Ключевые выводы отчета
Успешные внедрения AI‑агентов связаны с решением узких задач с четкими границами автономности и обязательным человеческим контролем важных решений
Агентные системы создают дополнительные векторы кибератак, включая отравление памяти и захват агентов через манипулирование контекстом
Статистические данные не подтверждают массового замещения рабочих мест — лишь 14% работников в США непосредственно столкнулись с сокращениями из‑за автоматизации

Главное по кибербезопасности
➡️23% компаний (из 1036 опрошенных IBM) сказали что новые атаки на агентов - главный мешающий фактор для масштабирования технологии
➡️новым критическим классом атак является отравление памяти
➡️80% опрошенных организаций сообщают что у них уже были инциденты, в которых их AI-агенты передавали нарушителям конфиденциальные данные

О чем вообще пишут в отчете
➡️Концепция агентного ИИ
➡️Сценарии использования AI-агентов - клиентский сервис, персональные ассистенты, создание контента, HR, транспорт, здравоохранение
➡️Вопросы масштабирования AI-агентов - надежность, кибератаки, регуляторика, чрезмерная автономность
➡️Венчурные инвестиции в ИИ - структура фондов в США, количество и объем сделок
➡️Перспективы внедрения агентного ИИ - снижение операционных расходов, экономия в секторе клиентского облуживания
➡️Прогнозы рынка агентного ИИ - экспоненциальный рост вплоть до 2034, при этом падение рынка SaaS
➡️Технические ограничения AI-агентов - накопление ошибок в многошаговых рассуждениях, высокая накапливающаяся стоимость длинных диалогов, сложности с выполнением сложных непрерывных задач
➡️Риски агентного ИИ - дают ссылку на OWASP и AgentDojo, дается пример "атаки через AI-браузер", утечки конфиденциальных данных в том или ином виде, каскадные эффекты распространения ошибок в многоагентных системах. Перечислены принципы безопасности AI-агентов от OWASP:
▪️авторизация агентов в нижестоящих системах
▪️ограничение функциональности "расширений" до минимума
▪️множество агентов с раздельными ролями вместо универсальных агентов
▪️непрерывный мониторинг аномалий поведения и механизмы отключения агентов при срабатывании защиты
➡️AI-агенты на рынке труда - более половины бизнес-лидеров признали, что увольнять людей при появлении ИИ было ошибкой, при этом статистика показывает падение количества вакансий по всем направлениям в США до 50%
➡️Сценарии будущего рынка AI-агентов
▪️пессимистичный (инциденты повлекут жесткое регулирование и это задушит рынок)
▪️базовый (агенты как узкоспециализированные инструменты для повышения эффективности, ничего сверхъестественного, рост рынка замедлится)
▪️оптимистичный (агенты достигнут надежности свыше 99% и становятся стандартным компонентом любого корпоративного ПО, рынок растет)
Please open Telegram to view this post
VIEW IN TELEGRAM