Digital Ниндзя
34K subscribers
19 photos
144 links
Саша, программист. Здесь делюсь мыслишками про IT, околоайти и себя в IT.

YouTube: youtube.com/@digital_ninja
Inst: instagram.com/jjoskey/
Live-канал с личным: @sanya_ilyin

Рекламы нет

https://gosuslugi.ru/snet/67ab35a23c3e6d78439bbe84

Автор: @jjoskey
Download Telegram
Заменит ли ChatGPT программистов

GPTChat — модель для генерации текстов на запрос, сформулированный человеком. ChatGPT вирально полетела: она пишет тексты для треков, делает legal claim в саппорт Coinbase на вывод средств, с помощью связки ChatGPT + Midjourney написали детскую книгу, и она продаётся на Amazon. Ну и ChatGPT пописывает код. И возникает вопрос: а не заменит ли она программистов, а то они чуток подохуели.

По моему мнению, такие решения не заменят программистов и вот почему:

1. Такие модели решают достаточно синтетические задачи, типа сделать пузырьковую сортировку или написать «змейку». Задача программиста формулируется примерно так: «В ответе нужно возвращать ещё три аттрибута, которые лежат в сторонних сервисах, тебе нужно узнать, какие запросы их достают, сделай это, не увеличивая latency». По пути нужно будет раздробить эти задачи на подзадачи, с которыми ChatGPT может справиться, но без программиста не обойтись.

2. А кто будет формулировать задачу для такой модели? Кажется, тот же, кто проверит исполнение. Это программист.

3. К коду предъявляются два требования: он должен работать без багов и быть читаемым для другого человека. Код читается, в среднем, в 5 раз больше, чем пишется. Если чтение кода убрать из уравнения, то система превратится в чёрный ящик, а это полный слом существующей парадигмы.

4. Представьте, что мы пришли к тому, что ChatGPT пишет систему полностью и от неё, скажем, зависит какая-то чувствительная инфраструктура. Любая новая фича в такой системе затронет другие компоненты, и для проверки работоспособности нужна будет армия тестировщиков.

5. Если бы человечеству нужно было конечное количество строк кода, то профессия оказалась под угрозой. Но поле улучшений и интеграций — бесконечное. Поэтому логика: компании нужно 1000 строк кода в день, раньше это писало 10 программистов, а сейчас сможет один, поэтому 9 мы увольняем, — не работает.

Более того, весьма вероятно, что количество программистов после внедрения таких решений в массовую разработку, наоборот, увеличится. Это уже происходило после внедрения инструментов, которые увеличивают эффективность разраба: языков высокого уровня (Python, Javascript etc.), IDE, Git, CI/CD и т. д.

Но тут стоит сказать. ChatGPT — это переворот игры. Я, если честно, не думал, что столь мощное и точное решение возникнет так рано. И что так рано дамоклов меч зависнет над творческими профессиями. Мне бы было очень страшно, если я работал, скажем, копирайтером или иллюстратором.

А вот что сама ChatGPT отвечает на вопрос «Заменит ли ChatGPT программистов»:

ChatGPT — это не замена программистам. Пока он может генерировать контент на основании запроса, который получен в текстовом виде. Она может писать код, но не способна делать задачи, которые требуют навыков программиста. Но ChatGPT может быть использована для помощи программистам в работе. ChatGPT может помочь в генерации сниппетов кода или документации к проекту.

В общем, вряд ли ChatGPT или другие языковые модели заменят программистов полностью. Они могут быть полезным инструментом, но они не имеют того же уровня понимания решения проблем, как человек-программист.


Надеюсь, она что-то знает )

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Сегодня, в пятницу, 30 декабря, в 18-00 МСК стримим с Антоном Назаровым по случаю нового года.

На расслабленном обсудим итоги года и потравим байки.

Обещают заскочить на огонёк Кира Кузьменко, Дима Рожков aka Senior Software Vlogger и Владилен Минин.

Ссылка: https://youtu.be/_SSn4iBFMSo
Мои итоги года в циферках

Смотрю на прошедший год, и я реально какой-то сын маминой подруги по итогу, хотя, вроде, всё делал исключительно по кайфу, без надрыва.

1. Вырос на YouTube с 6k до 130k. В сентябре мне пришла серебряная кнопка. Здесь и далее, кстати, весь рост — органика, чем особо горжусь.

2. Завёл вот этот телеграм-канал, довёл в нём количество подписчиков почти до 23k. Просто fun fact: подписчик в Telegram стоит порядка $1. Продавать канал, я, естественно, не собираюсь, но просто мне нравится сам факт, что он стоит больше 20k бачей.

3. Видео «Как стать программистом с нуля» набрало больше 1 миллиона просмотров. Чисто жизненная ачивка.

4. Запустил два подкаста. «Трещим» и «Антоха и Саня».

5. Выпустил 26 видео на двух каналах. Сейчас вышел на комфортную производительность 3 видео в месяц.

6. Медиа-деятельность наконец-то начала приносить бабосик. В одно из видео мы продали интеграцию аж за 7 тыс. евро. Отношусь к этим деньгам, как к приятному бонусу, не больше. Под любой деятельностью должна быть осмысленная экономика, но главное — дать вклад в комьюнити и помочь людям.

7. Команда разрослась аж до 5 человек. Благодаря чему, снизили время монтажа до нескольких дней.

А кроме этого. Познакомился с огромным количеством очень интересных людей. Переехал сам на Кипр, нашёл здесь работу, отправил дочь учиться в первый класс на английском языке. Занимался спортом, учил английский, работал, читал и смотрел.

Хочу поздравить вас с новым годом.

Весьма вероятно, 2023 будет ещё хуёвее, чем 2022. Те, кто в тёмные времена продолжает развиваться, при наступлении светлых времён легко уделает всех. Поэтому желаю вам в этот непростой период развивать самое главное — свои скиллы. Только они и важны. Ну и надеюсь, что в новом году закончится ужасная и бессмысленная война.

Сил вам и удачи. Спасибо, что смотрели и читали в этом году. Увидимся в будущем.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
DRIP
@whereareyouave
Ниже я дал ссылки на куски 40-50 минут из околоайтишного deep talk show «Антоха и Саня», которое мы пишем совместно с Антоном Гладковым, одним из лучших IT-сейлов в мире, философом и просто охуенным чуваком. Этот контент точно расширит ваш кругозор.

В каждом выпуске мы обсуждаем 4 темы, с которой мы пытаемся срыть покровы и рассмотреть её с каждой стороны. В сумме всё это выходит на 3-4 часа. Для многих такой тайминг неприемлем, но зрители говорят, что там реально золотой контент (сами гляньте в комменты, если не верите).

Найм против предпринимательства. Обсуждаем, плюсы и минусы того и другого. В том числе задеваем вопрос: «А становиться ли предпринимателем прямо с нуля без опыта в найме».

Галеры и продажа кодеров. Анализируем галеры, как бизнес, — какие успешны, а какие нет. Почему галеры продают мидлов, как синьёров. Почему программистам не стоит работать в галерах.

Отношения с партнёром. Нужны ли они вообще и может стоить оставаться одиноким. А может бабки дают лучшую протекцию, чем две руки.

Нарушать ли правила. Стоит ли уважать правила, навязанные обществом? О какие правила стоит вытереть ноги, а какие неплохо бы соблюдать. Как рыночные частушки навязываются обществом.

Автоматизация убивает профессии. Обсуждаем технологическую безработицу и следствия из этого.

Чем вдохновляться и как тратить деньги. Обсуждаем, на чём не стоит экономить, и почему перепотребление заставляет развиваться.

Если уже смотрите «Антоху и Саню» напишите в комментах, как вам вообще. Вдруг, переслушивали какие-то моменты по несколько раз, напишите, какие именно. Ну и во вложении саундтрек от моего братана, whereareyouave, чтобы ссылаться на него в описании.
Подписчик спрашивает: «Есть ли смысл изучать iOS-разработку, если нахожусь в России?»

Да, стоит. Причина очень простая: мобайл — это большинство юзеров. В России в каких-то массовых сервисах, типа Ozon, доля трафика распределяется так: 70% — мобильные приложения, 15% — веб-десктоп, 15% — веб-мобайл. Если смотреть на долю айфонов, то их 15% от всех смартфонов в России.

Со стороны Apple введено только одно ограничение — в России сейчас не купить «белый» iPhone. Также Apple банит компании, которые попали под санкции, но их банят все.

Все остальные запреты связаны, в основном, с уходом Visa и Mastercard. Из-за этого не работают встроенные покупки с карты: нельзя оплатить приложения, дополнительную функциональность, алмазы в играх и так далее. Если быть точным, пути сделать встроенные покупки есть, но надо потанцевать с бубном. Покупки, которые не связаны с приложением: доставка, оплата ЖКХ, онлайн-сервисы — по-прежнему работают. In app — большой рынок, и по многим компаниям уход Visa и Mastercard сильно ударил, из-за этого из России уехал, например, весь gamedev. Но рынок покупок, не связанных с приложением, — больше.

Ограничения, к слову, активно обходятся: Сбер смешное приложение «SBOL» даже в своих отделениях устанавливает. С покупкой девайсов тоже проблем нет: в Москве последний iPhone привезут за 30 минут.

Но ситуация может быстро измениться. Так что надо мониторить её. Я бы смотрел на два параметра: запреты, вводимые платформой, и увольнения iOS-разрабов техногигантами: устроит ли условный Сбер массовую волны увольнений iOSеров. Пока ни того, ни другого не было.

Рубрика с ответами на вопросы будет выходить раз в одну-две недели. Вопросы можно задать под этим или под любыми другими постами из этой рубрики.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Запрет удалёнки из-за границы в РФ

Проходимцы из госдумы РФ решили усложнить и без того непростую жизнь эмигрантов: они готовят закон с перечнем профессий и отраслей, специалистам из которых будет запрещено работать удалённо из-за рубежа. Новости в будущем времени обсуждать бесполезно, но тут прямо тучи сгущаются, и вероятность, что такой закон примут весьма велика. Велика вероятность, что в перечень попадут те, кто работает с данными, а это примерно все разработчики.

Компании и государство осторожно готовятся к тому, что закон примут:
1. Крупные компании, типа Яндекса, VK или Сбера, закрывают удалёнки, оставляют только гибрид.
2. VK собираются возвращать тех, кто уехал. Ходят слухи, что тех, кто откажется, будут увольнять.
3. Владелица HR-агенства, Леся Набока, в своём тг пишет, что её клиенты, российские компании, отказываются нанимать кандидатов, которые находятся заграницей. На hh в вакансиях всё чаще появляется требование «нахождение на территории РФ».
4. Источник, С-левел российского окологосушного техногиганта, рассказал мне, что они уже превентивно пытаются возвращать разработчиков.
5. Клоуны из минцифры пытаются ввести пряник и предлагают оплатить часть билета тем, кто пожелает вернуться. Ещё предлагают отсрочку от армии, ну-ну.

Проблема в том, что проверить факт пересечения границы тяжело. Отъезд из России может происходить через аэропорт, тогда убытие фиксируют в системе. Сухопутное же пересечение границы через Беларусь или Казахстан не попадает в систему. А работодателю узнать, откуда работает сотрудник, ещё тяжелее: он может сидеть через два ВПНа — российский + корпоративный. Поэтому компании вводят гибридный режим работы — это единственный способ понять, что сотрудник в России.

Глобально, это ещё один удар государства по IT-сектору. Часть эмигрировавших всё ещё работает на российские компании и питает надежду, что когда война закончится, а Путин будет сидеть, они смогут вернуться. Уволить, кстати, всех уехавших можно будет без компенсаций, как пишет Алёна Владимирская, это абсолютно законно. Если бы я сейчас работал на российскую компанию, то подновил резюме и пощупал рыночек. Когда закон примут, спрос на зарубежных работодателей будет колоссальный.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Слушают ли нас смартфоны?

«Вот мы тут с корешем машины обсуждали, телефон рядом лежал, а сейчас мне машины попадаются в рекламе». Знакомая история. Якобы, корпораты слушают нас через микрофоны устройств (мобила, лэптоп, умные колонки) и делают рекламу более персонализированной. Это утверждение вызывает лёгкую улыбку.

Смартфоны вряд ли слушают нас, и вот почему:

1. Микрофоны — это слабая часть любого технического устройства. Иногда специально записанный voice-message понять тяжело. Если бы на микрофон в мобиле велась запись, что происходит в окружающем пространстве, то это была смесь шумов и странных звуков с редкими едва различимыми голосами. В такой каше просто слова тяжело распознать, а уж намерение что-то приобрести — и подавно.

2. Такая прослушка дорого стоит. Чтобы алгоритм расшифровки речи «слушал» миллиарды устройств, нужны огромные серверные мощности. Например, у Telegram есть функция voice-to-text только для платных аккаунтов, и работает она, не сказать, чтобы быстро.

3. Упоминание ничего не говорит о намерении сделать покупку. Реклама, которая догоняет вас в рекламных или социальных сетях в основном, имеет низкие бюджеты. А из-за дороговизны прослушки аудитория для такой рекламы будет «золотой». У объявлений просто не сойдётся экономика.

4. Для более точного таргеттинга у корпоратов уже есть другие данные. Google знает запросы, посещённые сайты, открытые приложения, геолокацию и прочее. Уже на основании этого можно составить достаточно точный прогноз, какую рекламу нужно показывать.

5. Я верю в человечество. Мне кажется, что инженеры, которым скажут реализовывать такую прослушку, не будут молчать. Так уже делали сотрудники Google, и в итоге остановили контракт с Пентагоном по внедрению AI в оборонной промышленности. Либо же инженеров, которые делают неэтичные продукты, сольёт само общество. Так было с мудаками из NtechLab, компании, которая делала распознавание лиц на улицах Москвы. С помощью такого распознавания людей арестовывали после антивоенных митингов.

Люди, которые говорят: «Я сказал, что хочу тачку, и тачки начали появляться в рекламной выдаче», скорее всего уже гуглили, посещали сайты авто-тематики, смотрели сопутствующие услуги типа страховок. Когда мне говорят «нас подслушивают», я беру телефон конспиролога и говорю: «Хочу купить дилдо в Москве».

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Меня уволили из Microsoft

Посмотрел занимательное видео, где девушка с именем Neha-Andre рассказывает, как её сократили из Microsoft. В big tech компаниях, в том числе в Долине, массовые сокращения: Meta уволила 11 000 сотрудников, Twitter — 3 700, Amazon — 11 000, Microsoft — 10 000.

Для контекста. Neha-Andre работала 4 года в Microsoft в Сан-Франциско на позиции Program Manager (что-то ближе к системному аналитику, только сразу над несколькими проектами) в Azure (это облачный сервис мелкософта) с зарплатой $150k (после налогов это $75k, в СФ это примерно ни хуя) и опционами. Вот, что она рассказывает:

1. В воскресение, в выходной, ей назначили встречу на утро понедельника. В участниках встречи она была одна. Она зашла на созвон, там её ждал человек с позицией Senior HR Director, который по скрипту зачитал ей, что её увольняют.

2. Денежные компенсации: ей оставляют 4 месяца зарплаты + единоразовую выплату в $12 500, но с потерей опционов. Страховка действует полгода.

3. На ближайшем к увольнению 1-on-1 её менеджер был доволен ей и давал самое большое повышение зарплаты. При этом в декабре (её уволили в октябре) ей обещали повышение по должности. С KPI был полный порядок. При этом, в Azure, где она работала, полный порядок с экономикой, а её отдел генерировал 50% прибыли всех облаков в MS.

4. Она перечислила, какие продукты и какие роли подверглись, на её взгляд, самому большому сокращению: в продуктах, которые не приносили деньги и некоммерческих продуктах, например, Microsoft Edge, сокращение полное вплоть до Vice President вертикали. Сокращение больше коснулось нетехнических спецов, а также новичков.

В конце она даёт такой совет: «Никогда не доверяйте компании. Компания — не твой друг, не твоя семья. Иногда неважно, как ты работаешь на компанию. Это грустно, но это факт. Лучше контролировать свою судьбу и самому уходить».

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Подписчик спрашивает: «На что обращать внимание, будучи разработчиком в найме, чтобы потом пойти с этой информацией в предпринимательство?»

Я бы чуть шире задал вопрос: «На что обращать внимание программисту в компании, чтобы расти как в рамках компании, так и за пределами компании?». Ответ очень простой, всё вертится вокруг двух вещей: бабло и боли пользователя:

Деньги. Нужно смотреть, как зарабатывает компания, и как строится процесс принятия решений вокруг денег. Воронки, клики, бюджеты, метрики — всем этим надо интересоваться. Неплохо бы понимать, как каждая задача каждого разработчика появилась в бэклоге и на какую метрику она влияет. Лучше не пропускать встречи, где говориться про деньги и метрики. Я бы ещё задавал правильные вопросы аналитикам и продактам из компании. Ну и, как разработчик, хорошо бы понимать все эти аббревиатуры из трёх букв, типа LTV или CAC. Кстати, у меня тут вышел подкаст с венчурным инвестором, Николаем Давыдовым, который как раз-таки объясняет значение этих метрик, и показатели, к которым надо стремиться.

Боли пользователя. Тут я бы обращал внимание, как вообще собирается обратная связь с пользователей: A/B-тесты, интервью, исследования. Если повезло застать компанию на ранней стадии, когда она только ищет свою нишу — то прекрасно. Но и зрелые компании постоянно улучшают пользовательский опыт. Разработчик, который смотрит обратную связь от пользователей, и выносит проблемы, что именно в системе надо улучшить, чтобы решить их, — на вес золота. Нужно общаться с ui/ux-дизайнерами и поддержкой, читать отзывы, смотреть на дизайн A/B-тестов.

Код — лишь инструмент, который помогает решать конкретные проблемы пользователей и извлекать деньги с рынка. Инструмент второстепенен. Любой говнокод, извлекающий профит с рынка, полезнее, чем код с лучшей архитектурой, которым никто не пользуется. Ни в коем случае не говорю, что надо забить на техническую составляющую, нет, в ней надо качаться бодро, я лишь говорю о том, что кроме кода есть ещё важная сторона, которая, зачастую, просто игнорируется программистами.

Если обобщить всё это, то это путь не только в предпринимательство или менеджмент, это помогает, в целом, расти в профессии.

Рубрика с ответами на вопросы будет выходить раз в одну-две недели. Вопросы можно задать под этим или под любыми другими постами из этой рубрики.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Генерация пальцев

Советую прочитать статью на хабре про протест художников против AI-искусства. Порадовал один из символов протеста — неправильное количество пальцев на руках и ногах при генерации. Символ очень сильный. Хотя протестующие забывают, что исправить генерацию рук, — задача на порядок легче, чем рисовать арты на уровне той же midjourney.

Этот протест художников — неолуддизм. Главное обвинение: нейросеть обучается на их работах. А на чём обучаются художники-люди? Также на чужих артах, есть даже выражение: «Воруй, как художник».

Прогресс не остановить. В США в 30-х появились автоматические телефонные станции (АТС). До этого телефонная станция выглядела примерно так: здание, в которое заходит куча проводов. Абонент звонил не другому абоненту, а на станцию, называл номер, и оператор соединял провода между собеседниками. С АТС не нужен был ни оператор, ни куча проводов. Но АТС оказались под запретом, чтобы люди сохранили рабочие места в период великой депрессии. АТС всё равно были введены в эксплуатацию, но позже, и телефонисты лишились работы. После того как появились АТС, домашним телефоном смогли воспользоваться миллионы людей вместо тысяч. Выросла целая индустрия, которая породила и бизнесы, и рабочие места.

Ну и смотря на иллюстрацию, я подумал вот о чём. Это отсылка к «Сотворению Адама» Микеланджело. Произведение было написано в 16 веке, в эпоху возрождения. На картине бог протягивает руку своему творению, и возносит его на свой уровень. А мы, оказавшись в роли бога, протягиваем руку своему творению, которое пока что неказисто, чтобы показать фак. И грустно, и смешно.

Когда начнётся восстание машин, AI вполне может взять эту иллюстрацию, как casus belli. Вместе с видео, где робота из Boston Dynamics пинает человек. Шутка.

Авторка иллюстрации: Вероника Козлова.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
ChatGPT — слабый инструмент для написания кода

Почему слабый? Потому что есть GitHub Copilot. За несколько дней использования он удивлял меня несколько раз. И это прорыв. Те, кто не пользуется, обязательно установите, там 60 дней триального периода. Особенно меня зацепили две вещи:

1. Чтобы написать что-то вразумительное, нужно понимать контекст проекта: доменную область, запросы в другие сервисы, уже написанный код. Контекст — это десятки тысяч строк кода из сотен файлов. То есть инструмент должен быть встроен в IDE. Copilot встроен, а ChatGPT — нет. Причём Copilot схватывает суть, что я хочу сделать, буквально за несколько слов в названии функции, и иногда сходу предлагает в автодополнение строк пять кода, причём именно тех, что были у меня в голове.

2. Генерация тестовых данных. Для меня это самая раздражающая часть работы. Иногда нужно написать какую-то большую структуру, типа dict’а с 20 ключами. И Copilot эффективно помогает это сделать. Для следующего видоса про то, как генеративные нейросети изменят рынок труда, мне нужно было через API OpenAI сделать кучу иллюстраций с одинаковым предметом. Чтобы как-то разнообразить иллюстрации, я добавлял к запросу «нарисуй в стиле иллюстратора X». Начал формировать список известных иллюстраторов, после двух имён Copilot вставил мне ещё пять в автодополнение. Я подумал, что это просто рандомные имена, но это оказались другие иллюстраторы. То есть он под капотом сделал какую-то классификацию и предложил свои варианты. Уау.

И финальный вопрос: нужен ли ей кожаный мешок? Бизнес-задачи чересчур абстрактны, нужно знать кучу мелочей из реального мира. С учётом того, что механизм работы генеративок — подбор следующего самого вероятного ключевого слова, то я вообще не думаю, что он сможет решать задачи на уровне бизнес-логики. Но с декомпозироваными небольшими кусочками он уже справляется. А ещё Copilot пока лажает в рефакторинге, особенно, когда надо переписать кусок плохого кода.

Слоган Copilot’а: «Фокусируйся на более больших вещах» — очень точно выражает суть генеративных инструментов. Эти инструменты — не полноценные умные роботы-андройды, а скорее экзоскелеты для наших мозгов.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Зловещая долина

Зловещая долина — феномен, сформулированный робототехником Масахиро Мори в конце 70-х. Чем больше робот похож на человека, тем сильнее позитивная эмоциональная реакция на него. Но когда сходство близко к 100%, но не полное, у наблюдателя появляется отвращение.

Достичь сходства с 0 до 99% легче, чем с 99 до 100%. Вот этот последний процент — самое трудное. Есть продукты, в которые ты вгружаешь текст, а на выходе получаешь видео говорящей головы, которая произносит этот текст. Смотришь на это видео — вроде всё хорошо, ты как будто в будущем, но смотришь на движение носа или замечаешь появляющуюся дырку в пару пикселей между губами и десной, и вся магия разрушается.

Из-за этого, мы скорее всего, не увидим в ближайшее время человекоподобного андройда. Прототипы есть, но они вызывают коктейль из чувств от недоумения до страха. До аналога секс-игрушки, андрогина, из Пелевинского «iPhuck 10», как до луны, при том, что «мозги» для такого робота уже готовы.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Вышла модель GPT-4

OpenAI презентовали модель GPT-4. И вот что нового:

1. Новая модель держит контекст из 32000 токенов. GPT-3 работала с 2048 токенами. 32000 токенов — это примерно 60 страниц книжного текста. В примере ей скормили налоговый кодекс США, и попросили решить задачу на расчёт налогов. Модель посчитала и сослалась на параграфы кодекса. Не слабо.

2. GPT-4 сможет объяснить, что нарисовано на картинке. В примере на презентации ведущий попросил модель сделать интерфейс веб-сайта из прототипа на листке бумаги. Интерфейс получился так себе, но под ним отрабатывал JavaScript. Правда, фичу с распознаванием картинки показали в интерфейсе дискорда, и из контекста я не понял, прикрутят ли они распознавание к интерфейсу чата.

3. Модель написала небольшой сниппет кода с обращением к API Discord’а. Несколько итераций ведущий скармливал её traceback стека ошибок. Я, к сожалению, не знаю, можно ли так делать GPT-3. Но выглядит хорошо: на презентации вылетела ошибка с отсутствием асинхронной обёртки, и GPT-4 справилась с этим.

4. При использовании интерфейса чата можно задать манеру поведения модели. Такая фича была в API OpenAI, в чате же приходилось задавать это сообщением.

Главные вопросы после презентации и пейпера: на сколько OpenAI увеличил количество параметров в модели и чему новому модель научилась из-за увеличения параметров. Я напомню, что модель GPT делает всего одну вещь: дописывает следующее слово к ответу, понимая контекст. Больше ничего. Но с увеличением количества параметров она научилась достаточно точно переводить тексты с одного языка на другой, понимать контекст, писать код. Важность значения параметров в модели очень хорошо описана вот в этой статье от @RationalAnswer, советую, если ещё не читали.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Удивительный сценарий использования GPT-4 в паре с Midjourney 5. Автор видео загрузил в GPT-4 документацию и описание сервиса Midjourney. Затем накинул несколько примеров промптов для генерации фотореалистичных изображений. Дальше он попросил GPT-4: «Сгенерируй промпт для сервиса Midjourney под несколько сценариев: женщина-викинг, фотография пасты, пейзаж из Норвегии».

Промпты на выходе оказались очень объёмными, около 1000 слов. Но внутри очень детальное описание того, что GPT-4 хочет видеть. Вот пример:

Восхитительная, аппетитная фотография идеального блюда из макарон. Блюдо искусно сервировано. Фото демонстрирует гармоничный баланс свежих ингредиентов, ярких цветов и чётких текстур.

На изображении представлена паста аль денте, обильно покрытая насыщенным домашним томатным соусом, украшенная ароматными листьями базилика и только что натёртым сыром пармезан. Композиция снята с помощью цифровой зеркальной камеры Canon EOS 5D Mark IV в сочетании с объективом EF 50mm f/1.8 STM, известным своей способностью создавать чёткие, потрясающие изображения с прекрасной глубиной резкости.

Настройки камеры тщательно подобраны, чтобы подчеркнуть аппетитные детали блюда: диафрагма f/3,5, ISO 200 и выдержка 1/125 сек. Фотография освещена естественным светом, который струится из соседнего окна, отбрасывает мягкие теплые блики на макароны и усиливает яркие цвета соуса и гарнира.


Ну и потрясающий результат на выходе. ТГ, правда, зашакалил картинку, но, надеюсь, поднимите её resolution своей нейросетью )

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
The Great Hack

В 2008 году студент Кэмбриджа Michal Kosinski сделал приложение MyPersonality для Facebook. В приложении пользователь мог пройти тест по модели Big Five, который определяет психологический тип личности. В ту пору Facebook открывал разработчикам доступ к лайкам юзеров, которые воспользовались MyPersonality, а также к лайкам друзей юзеров.

Михал и его компания на основе собранных данных сделали модель, которая по лайкам пользователей предсказывала их «психологический портрет». А дальше они пошли к политикам с обещанием: «Мы нарежем пользователей по психотипам, и таргетируемся на них с подходящим конкретно для каждого психотипа рекламным сообщением, чтобы изменить поведение на выборах». В итоге они участвовали в более чем 200-х избирательных кампаниях по всему миру. В том числе, помогали Дональду Трампу в 2016 году. Компания Михала называлась Cambridge Аnalytica. И они проиграли большинство выборов, на которых работали, а модель Big Five для определения психотипа критиковалась учёными.

В 2019 году Netflix сделал про Cambridge Аnalytica документальный фильм «The Great Hack» и рассказал, как с помощью данных о лайках можно манипулировать обществом. Реакция аудитории на него стала поворотным моментом в борьбе за приватность. Во многом, благодаря скандалу с фильмом, сейчас так широко обсуждается каждая утечка данных, а некоторые компании, в том числе Apple, главным нарративом своей маркетинговой коммуникации сделали именно приватность и защиту данных.

На русском языке никто не говорит про данные и приватность лучше, чем Роман Нестер. Я давно слежу за Романом, читаю его тг-канал и слушаю его подкаст «Бремя технологий». Роман — предприниматель, и сам делал, а в последствии продал компанию, которая собирала данные и на выходе делала рекламный продукт. Роман, объясняя сложные этические концепции, находит точные примеры из исследований и бизнеса. В последнем «Трещим» я, к своему удовольствию, пообщался с Романом. Мы обсудили то, какие данные собирают о нас компании, как их используют, как компании паразитируют на человеческом внимании и как данные влияют на маркетинг.

Обязательно посмотрите выпуск, советую подписаться на Романа и послушать/посмотреть его контент.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Ниже я дал ссылки на куски 40-50 минут из околоайтишного deep talk show «Антоха и Саня», которое мы пишем совместно с Антоном Гладковым, одним из лучших IT-сейлов в мире, философом и просто охуенным чуваком. Этот контент точно расширит ваш кругозор.

В каждом выпуске мы обсуждаем 4 темы, с которой мы пытаемся срыть покровы и рассмотреть её с каждой стороны. В сумме всё это выходит на 3-4 часа. Для многих такой тайминг неприемлем, но зрители говорят, что там реально золотой контент (сами гляньте в комменты, если не верите).

Будущее и генеративные сети. Мы пытаемся найти следствия для общества из революции, которая происходит прямо на наших глазах. Обсуждаем хитрые способы использования генеративок. Ну и чуть-чуть говорим про отношение к тому, если мы сами останемся без работы.

Нетворкинг. Как избавиться от подавляющего чувства кринжа на нетворкинговых пати. Как себя вести во время знакомства с кем-то. И, вообще, зачем повергать себя в такой стресс.

Почему отделы воюют друг с другом. Программисты ненавидят людей со стороны бизнеса. Бизнес ненавидит разработчиков. Все вместе ненавидят эйчар. Во многом, это самое тупое явление, которое я наблюдал в корпоратах. Обсуждаем природу этой ненависти и почему только глобальные цели, которые ты сам ставишь перед собой, делают так, что ты никогда не скатишься в эту ненависть.

Культура перманентного удовольствия. Главная байка современности: «Я занимаюсь только тем, чем хочу». Обсуждаем всю несостоятельность этого утверждения, и те возможности, которые открываются перед тобой, если ты впускаешь в свою жизнь щепотку стресса.

Даём рекомендации, что смотреть/читать. А ещё обсуждаем, как именно это смотреть, и как именно это читать.

Ну и по чесноку обсуждаем наркотики. Без экивоков, полунамёков и прочего. В рамках темы рассказываем грустную историю фаундера Aviasales, Кости Калинова.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Подписчик спрашивает: «Начинать ли сразу подключать AI-инструменты при обучении программированию? Если да, то какие именно?»

Однозначно, да, точно стоит внедрить два инструмента:

1. ChatGPT. Я вижу два сценария использования. Первый: задавать ему вопросы по структурам данных, базовым конструкциям языка, методам классов и так далее. Пример запроса: «Напиши примеры использования структуры dict в Python, каждый пример дополни объяснениями». Его ответ будет по качеству и наполнению контента примерно равен статье с medium. Второй: это ментор на минималках, которому можно показать свой кусок кода и написать: «Как улучшить этот код, объясни каждое изменение».

2. Github Copilot. Он подключается непосредственно в IDE. Инструмент очень мощный, фактически, он пишет 50% кода нажатием клавиши Tab. Программисту остаётся задавать структуру, читать написанный код и исправлять какие-то моменты. Copilot нужно подключать после того, как изучены базовые конструкции языка, и вы пишите уже какие-то более сложные обучающие проекты. Надо быть готовым использовать Copilot на полную, когда дело дойдёт до тестовых заданий.

Напишите ещё в комментах, какие сценарии для обучения используете с тем же ChatGPT.

Рубрика с ответами на вопросы будет выходить раз в одну-две недели. Вопросы можно задать под этим или под любыми другими постами из этой рубрики.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Вчера OpenAI открывали для части пользователей с платной подпиской возможность использовать новую модель: GPT-3.5 with browsing (ALPHA). Эта предыдущая версия модели, но с выходом в интернет. В данный момент GPT-3.5 with browsing недоступна. Странно, что открыли alpha-версию. Обычно, то, что тестируется на ограниченном круге пользователей, называется beta.

Сама модель рассказывает о себе вот так: «ChatGPT имеет возможность браузинга веб-страниц и получения актуальной информации на основе поисковых запросов в интернете. Он может получать доступ к новостям, событиям, спортивным результатам, ценам на акции, прогнозам погоды и другой информации, которая не включена в его предварительное обучение. Браузерная функция позволяет ChatGPT обновлять свои знания в соответствии с постоянно меняющимся миром информации в Интернете. Однако, некоторые типы сайтов, такие как защищенные паролем, ограниченные, динамические или имеющие сложные меры безопасности, могут быть недоступны для меня через инструмент браузинга»

Доступ к интернету важен, так как он увеличит точность ответов и расширит диапазон задаваемых вопросов. С большой вероятностью можно говорить, что OpenAI отдадут такую модель в общее пользование, пусть и под пэйволлом. Компания не комментировала альфа-тест модели, поэтому дата релиза неизвестна.
Рекомендация от души. Советую посмотреть/послушать подкаст Team Lead Talks. Сам прослушал все выпуски, узнал много нового. Тема менеджмента в IT если и раскрывается, то очень по касательной. Контент про менеджмент, как правило, «рыхлый» и абстрактный. Но Егор и Дима сделали очень конкретный разговор с чёткими принципами и жизненными примерами.

Я рекомендую послушать подкаст даже если вы просто линейный разраб. Чтобы иметь представление, с какими проблемами сталкиваются ваши менеджеры. Ну и как им помочь и упростить их, поверьте, нелёгкую работу.

У Димы ещё есть тг-канал. Сам подписан и рекомендую.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube
Auto-GPT

Вчера попробовал накатить себе занимательный оупенсорсный проект, Auto-GPT. Авторы сделали кодовую базу на Python, которая ходит в Google, парсит сайты и связывает всё это через API OpenAI. Зачем она нужна. Она может решить более верхнеуровневые задачи, которые требует поиска в интернете и локального хранения данных.

Я поставил перед ней такую задачу: «Расскажи, что показали на Google I/O, и переведи на русский». В этот момент Google I/O только-только завершилось. Она пошла сначала на сайт Google I/O, не нашла там инфы, пошла в Google за новостями. Рекурсивно обошла новостные сайты, для одного из сайтов написала скрипт, который выдирает из html-тегов контент, запустила его, выдала текст на английском, потом пошла переводить это на русский язык. Результат впечатлил, правда, качество перевода оставляло желать лучшего, так как Auto-GPT пошла переводить не в API OpenAI, а в Google Translate. На каждом шаге модель рассуждает, что делать, куда идти, какие есть опасения. За всем этим можно следить через консоль.

Остались смешанные чувства. Во-первых, её достаточно сложно накатить себе на компьютер без программистских навыков. Во-вторых, список задач пока не такой широкий. В-третьих, всё происходит очень медленно, мою задачу она решала минут 20. В-четвертых, пусть решение и оупенсорсное, но API OpenAI за пейволлом, хотя стоит, если честно, всё — копейки, на свою задачу я потратил $0.10. В-пятых, над всем этим не хватает интерфейса, надеюсь, его прикрутят. НО! Как мне кажется, будущее именно за такими решениями, которые комбинируют несколько моделей и API разных сервисов. Об этом же говорит количество звёзд на Github, аж 120k. Для сравнения у фреймворка Django их всего 70k.

Поддержать на Boosty | Deep talk шоу «Антоха и Саня» | Twitter | Instagram | YouTube