AI и грабли
7.21K subscribers
149 photos
19 videos
4 files
189 links
Строил HR продукты для американского бигтеха. Внедряю AI в чужой бизнес, делаю свой, косячу и пишу про подноготную

@nikolay_sheyko
Download Telegram
Иногда так круто просто уехать в деревню и устроить себе рабочий «ретрит»
🔥12👍4
Что делать, когда ты ноунейм с большими амбициями. Считаешь, что ты крутой, но никто про это не знает.

Надо, чтобы узнали! А там и получишь обратную связь от жизни, насколько ты крутой.

Заскочил на прожарку идей от Кириллика. Говорю, хочу вот технические собесы в РФ автоматизировать. То ли так четко все рассказал, то ли у меня просто было минимум булщита на фоне крипто-проектов, но мне в итоге два классных чувака написали и сам Кирилл фидбэка позитивного навалил.

Один чувак из кроссовера, где они кандидатов пачками собесят (кстати, надо будет как-нибудь рассказать про их бизнес модель, это забавно).

А второй работал в крупнейшем СНГ hr-агентстве, у него много теплых контактов и понимание рынка.

Мне нравится вот так наводить какой-то суеты, но я пока все еще не научился отличать полезную от просто суеты
8🥰2
Я тут недавно офигел, до чего техника дошла. Прилетает задача по анализу созвонов с клиентами компании. Есть записи, есть список критериев для анализа, чего не хватает?

Ну, вообще то все эти наши GPT обычно работают с текстом, а у нас аудио. Как быть?

Уже давно существует Whisper – нейронка от OpenAI, открытая и ускоренная так, что я прям на ноуте могу почти в реалтайме звук в текст переводить.

То есть процесс должен выглядеть так

Звук => Whisper => Текст => GPT с чеклистом в промпте => Репорт с анализом созвона


Магия, но нет. GPT путает фразы сотрудников и клиентов. Репорт получается с галлюцинациями.

Вывод? АААААА, GPT галлюцинирует, ее нельзя использовать в продакшн решениях, аааааааа

Ладно-ладно, вывод, что нужно вставить еще один этап – диаризацию. То есть отделить фразы одного человека от другого. Когда запись изначально сохранена в разных аудиодорожках файла, это делается тривиально. В моем случае это не так, так что в ход идет специальная заточенная на это нейронка.

Звук => (whisper + диаризация) => Текст с метками говорящих => GPT с чеклистом в промпте => Репорт с анализом созвона


Что может пойти не так? Качество перегонки в текст (speech_to_text или STT) на русском оказывается далеко от идеала. И диаризация все равно часто путает говорящих. Репорты с косяками, самое время грустить.

———

Тут те, кто следят за AI, скажут: "так это, нейронки уже давно мультимодальные, в них не обязательно только текст грузить, вон, у GPT давно уже картинки понимает, и вообще войсмод уже появился". И будет прав. Только вот войсмод не дает грузить записи, а хочет, чтобы ты в микрофон говорил. И стоит как крыло от самолета.

Помощь пришла откуда не ждали. Помните шутки про гугл, которые не может угнаться за OpenAI?

Так вот, у них давно уже нейронки не только с контекстом в 2 млн токенов вместо 128к у OpenAI, но и с поддержкой фото, аудио и видео на входе. Дада, можно загрузить видос с лекцией и сразу спрашивать по нему что-то без костылей с переводом в текст.

Чисто чтобы сравнить, я попросил выдать мне транскрипт аудио по ролям и получил результат на голову лучше, чем то что у меня было.

А так я в итоге я вообще отказался от текста и сразу задаю вопросы по аудио

Звук => Google Gemini с чеклистом в промпте => Репорт с анализом созвона


———

Я ожидал, что с OpenAI в каких-то случаях придется переключаться на Anthropic (основанный бывшими сотрудниками OpenAI), но вот гугл я вообще не ожидал, если честно
👍76🔥3
Главная проблема внедрения AI

Больше всего пользы от нейронок – в классических бизнесах, где много рутины. Но эти бизнесы обычно не в курсе реальных возможностей ИИ, и не даже не задумываются, какие процессы можно ускорить/удешевить в 10-100 раз. А если задумываются, то часто сливают бюджет на сказки про ИИ-агентов нерабочие решения, потому что 99% внедрения AI – буллщит.

А ИИ энтузиасты из твиттера, наоборот, вообще ничего не знают про процессы и проблемы реального сектора.

Я пытаюсь не быть энтузиастом из твиттера и много времени уделяю на консультации – держу руку на пульсе и помогаю компаниям не тратить деньги на грабли.

Если актуально, пишите: @nikolay_sheyko
14👍1🔥1
Классный подход к брейншторму идей или гипотез.

Просишь своего партнера быстро назвать 10, которые первыми приходят в голову, из которых первые 5 должны быть очевидно бредовыми, странными или просто нелогичными/

Чувствуете, как стресс уменьшается, когда можно (и нужно) косячить. А стресс – главный враг креативности
7
Media is too big
VIEW IN TELEGRAM
Решил я подобавлять HR директоров в линкедине. Раньше я бы либо руками тыкал, либо полез бы читать код страницы и писал скрипт вручную.

Сейчас я просто скопировал весь код страницы в Gemini (моделька гугла с очень большим окном контекста) и спросил, что вставить в консоль браузера, чтобы было хорошо

Плюс еще одна итерация понадобилась на окно подтверждения. Следующий шаг – попросить переходить к следующей странице.

Если честно, вроде ничего необычного, но когда эти кнопочки сами нажимаются, то ощущение магии какое-то
6🔥5
Новое поколение моделей бесплатно

Несколько месяцев назад вышла первая принципиально новая модель o1 от OpenAI. Вот подробные спекуляции о механизмах работы.

Мне было интересно, кто первый из конкурентов сделает что-то похожее. Может гугл и тут удивит?

В итоге удивили вообще китайцы из DeepSeek. Они и так делали очень неплохие, при этом супер дешевые модели, одни из первых завезли нормальное кэширование промптов (колоссальное удешевление однотипных запросов), а теперь еще и первого конкурента o1, который по нескольким метрикам оказался сильнее оригинала.

А самый кайф для нас всех, что он, в отличие от o1, доступен бесплатно, показывает весь ход рассуждений и открывается без VPN

https://chat.deepseek.com/
👍15
Как сэкономить нервы, деньги и время на подписи

Рано или поздно человек попадает в ситуацию, где ему очень хочется иметь ЭЦП – это не название болезни, а электронная цифровая подпись.

Глобально – ЭЦП была проклята долгое время. Помню, я получал в Москве в 20м году, когда в очередной раз устраивался в 2гис. Мне нужно было приехать в специальный офис компании-поставщика, получить флешку, скачать какое-то специальное ПО но ноут, чтобы это хоть как-то работало. И все равно, при переезде на макбук все отлетело. Ну не должно это так работать.

С тех пор многое изменилось. Мы уже в киберпанке. Я сейчас получил полную версию ЭЦП с помощью смартфона с NFC, заграна с биометрией и аккаунта госуслуг.

Да, теперь не нужно ездить подтверждать свое лицо в специальное место. Достаточно скачать приложение госключ, войти через аккаунт госуслуг и приложить телефон к биометрическому чипу загранпаспорта. Смартфон и будет хранилищем ЭЦП, никаких флешек. Вау!

Бтв, офигенный лендос ↓
❤‍🔥10
Вчера моя хорошая подруга подкинула кейс с ее работы.

Нужно часто рассылать одинаковые сообщения нескольким людям в личку. Это классная идея для микро-продукта – решает одну конкретную маленькую, но обычно геморную задачу

1️⃣ Первая мысль сделать юзер-бота в тг. Это такой бот, который управляет аккаунтом пользователя. Проблема – давать доступ к своему аккаунту – не приятно. Можно и в бан телеги улететь, при нарушении каких-нибудь правил. Да и ни один пользователь не даст моему сервису свой аккаунт.

2️⃣ Придумал, как это сделать, с помощью браузерной версии телеги, когда мы не даем доступ к аккаунту, но даем доступ к открытому телеграму (это как открыть телегу на своем компе перед другом, но не давать ему пароль).

И JavaScript кодом просто выполняем нужные действия на веб странице (найти нужного пользователя, вставить текст, отправить текст, и т.д.). Примерно, как я в линкдине делал.

3️⃣ В итоге пришли к тому, что в телеге это на самом деле можно сделать. Пересылать сообщение можно сразу нескольким людям. Правда хочется то, чтобы это было не пересланное сообщение, а как будто от себя написанное. Так вот, оказывается, что если его пересылать из Избранного, то все работает именно так как нужно. Как будто каждому человеку написано лично.

То есть в телеге уже есть эта фича, вот только узнать о ней еще сложнее, чем о том, как прикреплять картинку под текстом.

Обожаю, когда для решении задачи не нужно писать ни строчки кода. Не обожаю, когда идеи так тупо обламываются
4👍2
Так как Илон Маск опять со всеми судится (в данном случае с OpenAI), то в рамках дела были опубликованы его переписки с Сэмом Альтманом и другими любопытными лицами, вроде Ильи Суцкевера, который недавно поднял миллиард долларов инвестиций на свой собственный суперинтелидженс с блэкджеком и безопасностью

У меня нет каких-то крутых выводов – переписки интересны и сами по себе – посмотреть, как общаются сильные мира сего.

Как они торгуются, решают вопросики, как мыслят про конкуренцию с гуглом.

Где-то там можно разглядеть и семена будущих интриг с увольнением и мгновенным возвращением CEO OpenAI Сэма Альтмана. Да и с последующими увольнениями всей остальной изначальной команды.

Забавно видеть, какими наивными добряками выглядят Илья Суцкевер и Грэг Брокман (ML и Dev столпы OpenAI) на фоне акул Маска и Альмана.

———
Хайлайты из комментов:

Грег:

Я надеюсь, что мы сможем зайти в эту область как нейтральная команда, которая стремится к широкому сотрудничеству и хочет изменить диалог так, чтобы он касался победы всего человечества, а не отдельной компании или группы.


Грег и Илья (к Илону):

Цель OpenAI — сделать будущее безопасным и избежать диктатуры ИИ. Вас беспокоит, что Демис (Google) может создать диктатуру ИИ. Нас это тоже беспокоит. Поэтому создавать такую структуру, где вы сами могли бы стать диктатором, если бы захотели, — плохая идея, тем более что мы можем придумать другой подход, который этого не допустит.


Грег и Илья (к Альтману):

Мы не смогли полностью доверять вашим решениям в этом процессе, потому что не понимаем ваших мотивов.

Мы не понимаем, почему для вас так важен статус генерального директора. Причины, которые вы называли, менялись, и сложно понять, что вами движет на самом деле.

Является ли создание ИИ вашей главной целью? Как это связано с вашими политическими планами? И как со временем изменились ваши взгляды?


Маск:

ИИ, вероятно, самая мощная из всех технологий
🔥4👍3
Обнаружил, что у меня очень много непонятно откуда взявшегося стыда, который мне дико мешает.

Даже этот пост я третий день откладываю, потому что мне стремно рассказывать про какие-то свои недостатки, не выебываясь ими при этом.

Обычно то я рассказываю про проблемы или ошибки постфактум, когда я их героически преодолел. Либо когда они какие-то уникальные и необычные, так что сам факт наличия таких проблем ощущается как повод выпендриться.

Кажется, я настолько прирос к концепции собственной охуенности, что неосознанно пытаюсь избегать любой риск выглядеть иначе для окружающих. И вместе с этим забираю у себя возможность жить жизнь так, как хочу я. Когда чужое разочарование оказывается больнее любой другой реакции, то как-то вообще сложно идти за своими желаниями

Например, уже три месяца ссусь запостить сториз в телеге хоть с одним постом отсюда.

Забавно и грустно, что всякие сознательные убеждения, что "ошибки – это круто", судя по всему, не работают.

Я хз, что с этим делать, у меня пока план просто "нормализировать" свою неохуенность через то, чтобы больше писать тут про свои проебы. Например, как там дела с CommuniCare или как я косячил, когда работал в CodeSignal
24💔4🥰1👀1
Большой брат по желанию

Я уже не раз писал про Rewind AI, который записывает экран компьютера и созвоны, давая удобный поиск aka "аугментация памяти". У Саши даже микро-холивар в комментах случился на смежную тему (и я в нем даже поучаствовал ).

А сейчас еще опенсорсный аналог появился, набрал уже 10к звезд на гитхабе. У Rewind меня не устраивало, что он плохо аггрегировал инфу и еще хуже делал выводы.

Условный вопрос «чем я занимался в этом месяце больше всего» он не вывозит.

Интересно, будет ли screenpipe в этом лучше.

Поставить себе тут
This media is not supported in your browser
VIEW IN TELEGRAM
👍5🔥4
Выбирать скуку

Очень легко начинать интересное дело. Пробовать новое хобби, кодить прототип новой идеи, заниматься новым спортом, начинать работать на новой работе, входить в новые отношения.

А потом появляется рутина. Среди интересных задач все больше такого, что просто надо сделать. Среди ярких свиданий все больше быта и обычных вечеров. Среди вдохновляющих успехов все больше упорной работы на одном месте.

Это что, получается, мы большую часть жизни проводим в скучной рутине. Кто сказал, что это вообще ок?

Кажется, это неизбежно, если только не хочется быть "вечным туристом", который перепрыгивая с одного на другое, не погружается вглубь.

А так, как будто просто важно выбирать такие хобби, работу, партнера и жизнь в целом – не столько по веселой и яркой части, сколько по скучной и рутинной, чтобы тебе в ней было хорошо.

Для меня эта мысль оказалась абсолютно контринтуитивной, но очень умиротворяющей
15👍6🤔2
Как быстро писать промпты?

Главная помеха использовать GPT во время работы – лень писать промпты и объяснять весь контекст, чтобы она нормально работала.

А его и не нужно писать. Мой процесс работы с кодом или текстом выглядит так:
1. Открываю Cursor или ChatGPT
2. Жму хоткей, у меня появляется плашка считывания голоса
3. Наговариваю в свободном режиме все что думаю со всеми эканьями и "ну типа"
4. Отпускаю хоткей, у меня есть готовый промпт

Поставил приложение superwhisper, но в целом и стандартный системный голосовой ввод должен неплохо справляться.

Зато стороннее приложение позволяет еще и сразу преобразовать распознанный текст. Например, автоматически переписать, убрав эканья, поправив ошибки распознавания или сразу структурировать по шаблону.

Заметил, что теперь гораздо чаще прошу нейронку что-то сделать – меньше усилий нужно прикладывать
4🔥4👍1
Косяки на работе. Часть 1

Есть одна штука, которая просто убивает репутацию. Я даже записал себе избавление от нее как намерение на 2024 год.

Давать обещания, которые не исполняешь.

Пример: один из топов компании делится документом в ответ на один из моих вопросов. Я пишу, что обязательно гляну и откомментирую. Глянуть – глянул, комменты не оставил, ему не отписался.

Какое мнение будет обо мне, если такое повторится хотя бы пару раз?

Тут можно сказать, что эти топы настолько заняты, что даже не заметят таких мелочей. Уверен, заметят. Не обязательно даже осознанно. Просто значимость моих слов снизится. А это одна из ключевых прокси метрик доверия, влияния и зп.

И уверен, я снижал ее много раз :(
16💔2
О, нашел супер очевидную ошибку, которую постоянно совершаю.

Вот тут Миша Табунов пишет про то, что очень важна форма продукта. Что-то можно сделать и как бот, и как приложение. Но ботом пользоваться никто не будет, а приложением будут. Просто потому что у нас есть конкретные ожидаемые паттерны использования разных категорий продуктов.

А я наоборот всегда думаю, что важно, как продукт решает проблему, а то, в какой оболочке – все равно. Это одна из самых больших ошибок с CommuniCare, потому что по сути это был онлайн-курс, но в оболочке веб-приложения. А нужно было сделать, чтобы все в нем выглядело как будто это онлайн курс.

Тогда и чек можно было бы поднимать (посмотрите на среднюю стоимость онлайн курса), и в принципе пользователям бы было сильно понятнее, что это такое.

И вообще, мы практически всегда выбираем понятность.
🔥103
GPT в гугл таблицах

На мое предложение помочь с рутиной откликнулись друзья из @esprezo. У них есть своя классная рассылка, в которой уже 180 выпусков. А вместе с ней есть проблема – для новых статей становится сложно ориентироваться в том, о чем раньше уже писали, а о чем нет, а главное – в каком контексте. Работа превращается в ручное хождение по всем предыдущим статьям.

Можно один раз пройтись по всем статьям и сделать какое-то саммари для каждой из них, назначить категории и темы. Но 180 статей – это дофига работы. Можно даже посчитать. Если на одну статью уйдет 10 минут, то это 30 человеко-часов чистой работы. Примерно полторы-две недели реальной, по моему опыту 😅

Тут мы можем такие важные сесть и напрограммировать какой-нибудь сервис с запросами к GPT и веб-мордой для отображения результатов. Но тут сразу ворох проблем:
* Время разработки
* Придумать удобный интерфейс
* Кто будет заниматься поддержкой? А если что-то изменить нужно?

Слишком много зависимости от меня, а хочется чтобы вообще без программирования можно было все крутить-вертеть.

Что-то типа гугл табличек, только вот с GPT, да?

В общем, на первых 30 секундах видео – итоговая система. Остальное – тонкости работы для особо любопытных.

А самое прекрасное, что можно это раскатать вообще на всех пользоватей гугл табличек, чтобы прям формулу в ячейке писать:
=ASK_GPT("Если этот текст содержит рекламу, верни TRUE. иначе FALSE", A1)


И потом растянуть ее на весь столбец, как мы это обычно делаем.

В результате получается самый близкий к народу способ обработать с GPT кучу однотипных данных и без единой строчки кода.
This media is not supported in your browser
VIEW IN TELEGRAM
🔥144🤩3
Запросы к GPT с российских серверов

Если вы не делаете свои сервисы – не читайте дальше, вам это ни к чему


У меня есть сервер в РФ, на котором у меня крутятся всякие боты и демки. Как только я хочу отправлять запросы к LLMкам, все ломается – ни openai, ни anthropic ни гугл не отвечают пользователем с российскими IPшниками

Варианты:
1. Перетащить все на мой американский VPS (будут больше задержки для всего, особенно для демок на streamlit'е)
2. Использовать OpenRouter (все мы знаем тенденцию штук с приставкой Open переставать такими быть. И не будет оригинальных личных кабинетов. Но в целом норм вариант)
3. Сделать из американского сервера прокси. (Самый бесшовный способ)

В первом комменте инструкция для тех, кому нужно

Если вам нужно, но нет своего сервака вне РФ, можно мне в личку написать, я в вайтлист своего могу добавить IPшник вашего сервера

(для обычных устройств это не нужно, просто используйте VPN)
👍5🔥5
FOMO от постов

Давно уже думаю, как решить проблему с переизбытком информации в телеге.

Если читать все интересные каналы, то это занимает кучу времени, а реально интересных постов только 10 процентов.

Если читать только каналы с высокой долей интересных постов, то пропущу много инфы.

В итоге сделал себе бота, который подписывается на все мои каналы и скидывает мне саммари на каждый пост, и я читаю только те, что заинтересовали.

В первой версии пишет немного по-инфоцыгански, но в целом работает
🔥6👍5
Секреты ведения блога от Эндрю Чена, которые он наработал за 2 десятилетия (тут).

Там в целом много крутого, но меня особенно зацепила вот эта часть:

Думать о себе как о журналисте, который освещает интересные идеи, тенденции, продукты и все, что происходит вокруг вас, приводит к гораздо лучшему/сильному контенту


Я сам часто не пишу про что-то потому что «ну про это же уже написали, кококо». Хотя именно мой взгляд на это сам по себе несет ценность.

С чем-то я могу согласиться и рассказать, почему, а с чем-то я могу поспорить и привести аргументы, которых не было в оригинале. До кого-то я просто донесу мысль, которая не приходила по другим каналам.

Буду чаще писать про все, что вижу
👍6🔥52