AI и грабли
7.28K subscribers
149 photos
19 videos
4 files
190 links
Строил HR продукты для американского бигтеха. Внедряю AI в чужой бизнес, делаю свой, косячу и пишу про подноготную

@nikolay_sheyko
Download Telegram
Тут по поводу предыдущего поста мои студенты скинули видео Артура Шарифова про выученную беспомощность, и я вспомнил, что где-то даже читал то ли саму статью с опровержением, то ли ее анализ. Даже вроде с кем-то из друзей разгонами делился.

В общем, выученной беспомощности нет, расходимся

Ладно, на самом деле просто мы учимся не беспомощности. Беспомощность в нас по-дефолту. Мы учимся антибеспомощности. Тому, что мы вообще-то можем влиять на жизнь. Удачи нам в этом.
3
Продолжаю тему костылей для выработки дисциплины.

Способ явно не для всех, но я всю весну с ним провел, работает отлично. Напоминаю: если я не делаю Х, которое пообещал себе письменно, то отправляю бабушке 1000 рублей (точнее скидываю на отдельный счет, а когда набирается 5к, отправляю). Начал я с трех таких штук в день, теперь у меня 6, часть в процессе перефразировал, часть убрал:

1. Зарядка с утра (в любой форме, но точно должны быть приседания, и отжимания либо подтягивания. Поднимаю число повторений на 1 раз в неделю
2. В рабочие дни никаких залипаний в соц. сетях до обеда. Можно только личные сообщения
3. Дневник. Что угодно, хоть события, хоть эмоции, хоть философские разгоны
4. Написать один пост. Пишу пока только сюда и сюда
5. Растяжка вечером
6. Лечь в 12 (тут я разрешаю себе отменить, если за день написал себе это в заметки)

Интуитивно больше всего пользы от 2 и 6, хотя разрыв с остальными не очень большой.
👍32🔥2🐳1
Короче, есть такие идиоты-саванты, у которых абсолютная память. Они реально могут вспомнить любую деталь разговора. Даже если он был 5 лет назад. Вот только они не могут рассказать смысл этого разговора.

А есть вот Rewind - штука, которая запоминает все, что я делаю на своем макбуке. Так что я могу найти по какой-то фразе момент несколько месяцев назад, когда она была на экране и "отмотать" к тому месту, и даже покрутить вперед-назад, как в видеопроигрывателе.

Правда, никаких выводов из моей жизни, используемых в будущем она делать не умеет. То есть, я могу спросить ее, чем я занимался последний час и она расскажет. Но эта информация нигде не сохранится, нигде не будет использоваться.

Создание верхнеуровневых выводов из набора "сырой" информации - принципиальная штука, по которой мы отличаемся от всех современных систем ИИ, к которым прикрутили семантический поиск (RAG). Они ведут себя как идиоты-саванты, которые могут хорошо искать информацию в памяти, но которые не выучат из нее урока, чтобы как-то повести себя иначе в следующий раз.
Давно хотел написать про GPT Store в качестве маркетингового инструмента. Сейчас стало особенно актуально, когда GPTs (специализированные GPT-based ассистенты) скоро станут доступным и бесплатным пользователям.

Как работают GPTs:
1. Кастомный промпт, настроенный на конкретное поведение. Например, построение натальной карты 🫨
2. (Опционально) Файлы, информация из которых может использоваться. Например, теория по расшифровкам натальных карт
3. (Опционально) Документация API, которую можно дергать. Например, внешний сервис, который генерит натальные карты, а мы ему передаем только ту информацию, которую успели узнать у пользователя

Как это можно использовать:
Если есть какой-то внешний продукт, можно вынести часть его функций в интерфейс чата, получать пользователей через фичеринг GPTStore или сторонних ребят-агрегаторов GPTs, потом направлять их в свой основной продукт. Например, прописать в промпте, чтобы скидывал ссылку, если пользователь активен.
👍1
Я тут пишу про общение людей и добавляю кейсы с опросами. Стало интересно, почему люди вообще в них участвуют. Поспрашивал друзей.

Пока понял, что ключевая мотивация - ощущение игры и тайны. Типа, интересно посмотреть правильный ответ и интересно посмотреть, что думают другие люди (мы тут все социальные существа все-таки, нам важно знать, насколько мы попадаем в мнение общества)

Вспомнил какую-то статью про разработку игр, где описывалось, что многие механики завязаны на удовольствии от предсказаний. Типа, наш мозг пытается предсказать поведение (сможет ли персонаж перепрыгнуть через эту яму) и дофаминовой награды от успешного предсказания.

Интересно, что когда предсказание слишком простое, то награды не происходит (не зачем закреплять успех если и так все ок). Аналогично, если предсказать слишком сложно (если это полный рандом, то незачем закреплять успех, все равно в будущем не пригодится).

Получается, есть какой-то определенный уровень сложности, когда нам интересно, когда мы чувствуем азарт. Это очень похоже на преподавание - задания должны быть не слишком сложными и не слишком простыми, чтобы у студента была мотивация их решать.
🔥2👍1
Тут недавно рассказывал друзьям, у которых на работе запрещено пользоваться ChatGPT, что можно запускать опенсорсные модели прям у себя на ноуте. Никакие данные не уходят в интернет. Самый простой способ - lmstudio.ai

Там выбираем llama3 Instruct 8B q4_k_m gguf

Чтобы быстро отвечало, мне нужно было еще в настройках включить GPU acceleration.

Жрет 4гб оперативки, на макбуке летает.

P.s. Llama3, как и многие опенсорсные модели, плохо работает с русским, зато на английском работает отлично, особенно на простых задачах.
3🔥2
Следующая же мысль, которая у меня появилась - что установка приложения - лишний этап. Ведь мы привыкли все использовать в браузере, и браузер ужа давно похож на полноценную операционную систему. Мысль такая: нужен веб интерфейс, который скачивает веса нейронки, сохраняет в кэше браузера и с помощью WebGPU или чего-то в этом стиле просто запускает все прямо в браузере. Вот, кстати, пример такой штуки.
1
Вчера было супер тупое настроение, такое, апатичное. Пошел погулять. А я когда хожу, часто слежу за своей походкой, осанкой, положением рук во время движения. И когда фокусирую внимение, походка меняется. Иногда становится более уверенной, иногда более мягкой или плавной.

Пока шел, поймал ощущение, что настроение меняется. Ну не могу же я с такой походкой тигррра быть такой апатичной тухлятиной!



Пока писал, вспомнил разгоны одного классного профессора в Сколтехе (того, который учил нас по стеклу ходить и рассказывал про лсд) - поинт был в том, что когда мы попадаем в какие-то мысленные замкнутые циклы, то с помощью мыслей из них практически бесполезно выходить. И советовал нам в таких кейсах использовать тело.

Восстанавливать ментальное состояние через физическое. Дыхание, там, медитация, спорт, по стеклу погулять, вот это вот все.
13🔥3
Вам часто обидно? Мне часто. Правда говорят, "на обиженных воду возят", бебебе, или что обида, это такие камни на душе, которые мы носим с собой, и вообще надо учиться отпускать и прочий дзен. Я, честно говоря, в рот ебал такой дзен, обиды - охуенная тема. Сейчас объясню.

Я заметил, что мне очень легко отпускать обиды, когда я просто абстрагируюсь от человека. Вот, обидно мне, что человек не проявляет инициативу в общении, ну а я не буду считать его своим другом и уже как-то и не обидно, а похуй, вот.

А это вообще ок? Ну, абстрагироваться от людей. Мы так-то норм друзьями были. А в итоге не общаемся. Зато не обидно, ага.

А если не абстрагироваться? Ходить и обижаться? И что хорошего вам от этого? Тоже хрень какая-то. А чего я тогда тут загоняю, что обиды - круто?

Да потому что обиды – это охуенный индикатор того, что тебя что-то не устраивает в том, что у вас в отношенях принято за норму. Это большая красная стрелка, которая очень точно указывает в область того, что именно мне важно с учетом именно моих ценностей, даже если я их не знаю и вообще никогда не задавался вопросом их существования.

И обычно, когда получается обсудить их так, что вы приходите к чему-то врод "Слушай, да, я бы на самом деле не хотела так делать, и чтобы ты так делал по отношению ко мне тоже. Давай и правда пытаться так не делать", обида исчезает
6💊2🙈1
Кто видел сервисы, где авторизация через телеграм? Насколько это удобно?
Недавно удивился. Значит, завтрак со знакомой в кофейне, болтаем про околорабочие штуки. Оказывается, у них в компанию на основные услуги люди практически не приходят. Они даже не знают, что это им нужно! А приходят на микро-услугу из серии "научите наших сотрудников делать презентации".

И уже потом раскапывается куча задач, которые гораздно важнее и глубже (и дороже, хаха).

И если бы не простое и понятное "сделать презентации", то этих клиентов вообще бы не было! Для меня это как-то вообще не очевидно было, что сложные и дорогие продукты можно продавать через привлечение простыми, понятными и дешевыми 🤷‍♂️
👍43
Бтв, я на какое-то время в Новосибирском академгородке, кто хочет вместе позавтракать, кидайте плюсик в личку @nikolay_sheyko
4
Какой же пиздец происходит в нейронках, которые работают с картинками 🫨

У меня друг занимается разработкой инди игр. Часто делает pixel art штуки. И я ему все уши прожужжал, что нужно просто нейросетками научиться пользоваться, чтобы генерить картинки, а не рисовать. Сегодня мы засели все это дело потестить и знатно обосрались.

Задача была научиться брать существующего персонажа и немного менять его, чтобы делать спрайтовую анимацию или создавать других в том же стиле

Часть 1. Давай просто ChatGPT попробуем, она же умеет распознавать картинки 🤡

Результат можно увидеть ниже.

Она меняет детали, которые не должна. Всему виной - потеря информации. Вся соль в том, как работает генерация картинок в ChatGPT: их генерирует не GPT, а отдельная нейросетка DALLE.

А GPT умеет нативно "видеть" объекты на картинках и описывать их текстом. Так что она готовит инструкцию, а DALLE просто по ней рисует с нуля.

То есть:

1. Я отправляю картинку и прошу поменять только цвет.
2. GPT описывает что на картинке текстом и формирует инструкцию для Dalle, мол, нарисуй рыцаря в стиле пиксель арт, с тяжелыми доспехами синего цвета
3. Dalle его рисует
4. 😢

Потому что Dalle даже не видела изображения, которое она должна изменить!
Такой себе глухой телефон у ИИ.

В следующей части будет про "специализированные сервисы" для редактирования изображений
👍3😁1😢1
Часть 2/4 Специализированные сервисы для редактирования картинок

Пробовал Canva/RunwayML, всякие обертки на StableDiffusion и еще что-то из браузерного. DiffusionBee из локального.

Тут магия в том, что можно выделить какую-то часть изображения и попросить перерисовать ее. Или попросить перерисовать все изображение.

Лучший результат был в DiffusionBee, но все равно полный отстой (фотка ниже).

Еще была мысль научить свою "модель" для style-transfer в RunwaiML, там говорят, можно 15 примеров всего подать. МБ попробую, расскажу, но пока RunwaiML показал самый ужасный результат
👍1
Часть 3/4 По-настоящему специализированный сервис под конкретную задачу.

Плагин для Aseprite (среда, в которой как раз и делают пиксельарт вручную)

На сайте выглядит как мечта – по нарисованной каляке-маляке генерирует спрайты персонажей, еще и анимирует их

Андрей затестил и говорит, что ограничения в размерах сильное – 80 на 80 в бесплатном тарифе и 140 на 140 в платном.

А по поводу анимаций:

Сами анимации - это такое. Нужно найти сначала нужную картинку-реф, и сгенерить скелет. Потом по скелету каждый кадр всё таки в ручную надо генерить. И он не сможет генерить слеш и частицы на ударах


———

Короче, я думаю, что нужно искать именно такие инструменты – что-то, что интегрируется с уже существующими, но автоматизирует какую-то часть, при этом бесшовно.

Но видимо, пока такого не много 🤷‍♂️
🤔1
анимация, как она на сайте
👍2
Часть 4/4. Опять ChatGPT

На самом деле, она плохо справляется только тогда, когда входная картинка не похожа на то, как генерит изображения сама DALLE. Это очевидно, она ведь просто генерит картинки с нуля на основе описания.

Но вот если сразу использовать ее для генерации объектов, то они все будут совпадать с фирменным стилем DALLE и проблем не будет.

Правда с анимациями все равно будет сложно – при просьбе поменять положение тела, все остальное может поехать.

P.s. я часто по несколько раз перезапускал генерацию, чтобы получить такой результат
👍2