ИИволюция 👾
6.62K subscribers
352 photos
205 videos
303 links
Авторский канал Сергея Пахандрина про AI, нейросети, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
Download Telegram
На прошлой неделе мир узнал о модели LLaMA-3-70b, и она с ноги ворвалась в чарты, расталкивая локтями другие модели на арене чатботов. Пока GPT-4 Turbo держится на вершине, но похоже, его лидерство продержится не долго.

Смотреть на битву моделей так же интересно, как наблюдать за гладиаторскими боями, только теперь на арене выступают языковые модели. Звучит странно, правда?

Что действительно удивляет, так это скорость, с которой мы привыкаем к новинкам. Ещё год назад ChatGPT вызвал фурор, предложив нам общение с машиной, которая почти на все отвечает. Конечно, приходится подождать, пока она “напечатает” ответ, но это было волшебно.

Теперь же, когда привычка взяла своё, начинаешь хотеть большего: чтобы было качественнее и быстрее. И вот Groq добавил поддержку LLaMA-3-70b, и рядом с этим сочетанием скорость GPT-4 Turbo кажется как интернет через модем. Ты просто сидишь и ждешь ответ, и это таааааак медленно! 🐌

Невероятно, как быстро мы привыкаем к хорошему, но когда видишь что-то лучше, уже не хочется возвращаться назад. Groq + LLaMA-3-70B = 🚀

Попробовать можно тут https://groq.com, а я себе даже успел урвать инвайт в TestFlight на неофициальное приложение Groq от одного AI-энтузиаста.

Ждём, когда OpenAI снова будет удивлять, и так по кругу.

ИИволюция🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Что такое дипфейки, зачем их создают и как от них защититься

Начинаю цикл постов по дипфейкам. Дело в том, что популяризацией нейронок их станет больше, а значит — станет больше мошенников. От таких людей никак не избавится, поэтому лучший способ — заранее узнать о всех способах обмана и не попасться на удочку мошенников.

Что такое дипфейки. Это видео, аудио или фото, которые создаются нейронками. Для этого им скармливают много настоящих записей человека: голосовых сообщений, фотографий и видео. По ним нейронки учатся подделывать лицо, мимику и голос. В итоге получается очень реалистичная, но полностью поддельная запись.

Известные примеры дипфейков — помолодевшие Аль Пачино, Роберт Де Ниро в фильме «Ирландец» (крутой фильм, советую). Там 80-летних актеров омолодили лет до 50.

Как дипфейки используют мошенники. Думаю, все знают тот самый развод «я попал в аварию, скинь деньги на штраф». Сейчас в такое редко верят, поэтому мошенники придумали новую схему: они собирают данные о человеке, ищут его фотки, аудио и видеозаписи в интернете, а потом на основе этого контента создают дипфейк. И уже с созданного дипфейка общаются с жертвами.

Можно выделить 2 способа обмана.

1️⃣ Мошенники копируют голос жертвы, генерируют копию его голоса в нейронке с просьбой перевести деньги или что-то в этом роде. А потом звонят родственникам и друзьям жертвы, включают сгенерированный голос и ждут чуда.

2️⃣ Мошенники взламывают социальные сети жертвы и пишут от её имени кому попало из контактов с просьбой занять денег. А в подтверждение того, что это пишет сама жертва — присылают голосовые сообщения. А если пишут в Telegram или WhatsApp — могут даже круглые видео прислать. И сразу подделку не заметишь — кружок реально выглядит так, будто его записал тот самый человек.

И это не шутки, одну такую историю я читал у Сергея Бурого. А ему про этот обман рассказал подписчик.

На этом первый пост все. В следующих частях расскажу, как отличить дипфейк от оригинала и как постараться защититься себя, чтобы самому не стать дипфейком.
ИИ готовится разводить мошенников

Мошенничество по телефону бьёт все рекорды, и люди продолжают терять огромные деньги, попадаясь на различные уловки злоумышленников.

⭐️И вот классная новость: Тинькофф банк предложил оригинальное решение — «Фрод-рулетку». Представьте, вам звонит мошенник с целью нагреть вас на деньги, но вместо вас Тинькофф соединяет мошенника с пранкером или другим участником программы, который не прочь поглумиться над мошенником. Мошенник тратит своё время, не сразу понимая, что не он разводит жертву, а его разводят. И почему этого не придумали ранее? Чтобы стать участником сервиса, видимо, либо вас должны каким-то образом выбрать, или нужно подать где-то заяву (вот этого я не знаю). Но выглядит супер полезно и даже немного весело!

😬Я сам иногда «играю» с мошенниками, когда у меня есть и время на эти игры, и настроение. Отвечаю всякую ерунду, просто ради забавы. Но это я, а ведь есть много людей, которые не в теме и легко попадаются на такие уловки, теряя свои деньги. Это, конечно, печально.

Сейчас всё на стадии теста, и кажется, что применение ИИ в ближайшем будущем значительно усилит барьеры защиты между мошенниками и их жертвами. Как минимум, Тинькофф будет иметь кучу разговоров с мошенниками, и на этих данных сможет качественно обучить нейросеть, чтобы условно ассистент Олег (каждый раз меняя свой голос) общался с разводилами и разводил уже их.

Я бы уже оформил подписку себе и членам семьи, чтобы максимально защититься от разводил. Но и мошенники, думаю, не дураки и как-то будут подстраиваться под новые способы защиты.

Будьте в безопасности!

P.S. Попросил DALL.E сгенерировать фотку телефонного мошенника и как же хорошо он уловил смысл. Я себе так и представляю этих людей.

ИИволюция😎
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Удивительно наблюдать (даже немного жутковато), как автопилот Tesla проезжает загруженный перекресток.

В удивительное время живем!

ИИволюция
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на интересный UX того, как генерация картинок в теории и должна работать в SciFi: вы просто сидите у компьютера, называете случайные фразы, whisper.cpp их переводит в текст, а SD генерирует бесконечно картинки, плавно подмешивая новые концепты в старые (не просто на уровне промпта, а на уровне внутреннего пространства сети), пока вам какая-то генерация не понравится

Ну или просто, сидишь, смотришь и фантазируешь вместе с нейронкой – хороший тул для вдохновления.

Кода пока нет, но автор обещал выложить.

P.S. Лица психонавтов и биохакеров представили 🌈
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Как «взламывают» эти ваши автопилоты.

Получается своего рода визуальная промпт инъекция 😅 Выпустить на улицы сотни людей в таких футболках и беспилотные такси встанут 😂

ИИволюция
Ах, и ты туда же? А я хотел еще поработать, а он вон что!

Я слышал, что ChatGPT ленится в разные периоды года, но не настолько же 😅

Всех с началом майских! 👽

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Дизраптор
Media is too big
VIEW IN TELEGRAM
Беспилотник в Индии - это вам не по Долине кататься

Пока западные беспилотные омежки от Waymo и Cruise впадают в ступор от дорожного конуса на капоте и шугаются от чувака в майке со знаком "Стоп", стартап Swaayatt Robots из индийского города Бхопал демонстрирует свою гигачад-систему беспилотного движения.

Дорожное движение в Индии - это вам не по прямым калифорнийским шоссе рассекать. Здесь дорогу беспорядочно перебегают люди (и коровы). Рои мопедов, тук-туков и каких-то неопознанных свистоперделок то и дело норовят вас подрезать. Дорожные знаки, светофоры и разметка выполняют исключительно рекомендательную функцию, а проехаться по встречке - вполне нормальный шорткат. Да и вообще, "дорога" - это весьма условное понятие.

На видео джип с системой автономного вождения от Swaayatt Robots вполне успешно справляется с задачами в индийских условиях. Стартап уже 7 лет занимается беспилотьем, уделяя особое внимание движению по хардкорному бездорожью и при крайне напряженном городском трафике. Как видно из видео, получается неплохо.

Не удивлюсь, если именно в Индии появится первая система в мире, полностью соответствующая пятому уровню автономности.

Как говорится, same same but different.

Дизраптор
Forwarded from Сиолошная
Вчера на LMSYS Arena (место, где живые люди вслепую сравнивают генерации разных LLM и выбирают лучшую) появилась странная модель: gpt2-chatbot. И несмотря на то, что по названию можно подумать о слабости модели, она, внезапно, очень хороша. Настолько, что люди гадают, кто же её сделал, является ли это GPT-4.5 / 5, или может это свежий релиз Gemini Ultra 2.0.

Предлагаю вам самим поиграться тут: https://chat.lmsys.org/ (вкладка Direct Chat, там выбрать модель в выпадающем списке). Ограничение всего 8 сообщений в сутки, пользуйтесь с умом (или используйте VPN и режим инкогнито, кек).

На реддите люди тестируют свои задачки, которые якобы не решаются моделями предыдущих поколений, а эта либо щелкает, либо куда ближе к ответу, чем остальные. Треды почитать: 1, 2, 3.

Мой опыт:
— я дал ей простую задачку Show me an example of 3d ray tracing (with python). Set a simple scene, different light sources, etc. и получил полностью работающий код (в 2 или 3 ответа) с первого раза. Он учитывал материал объектов, включая цвет и уровень отражения. У меня получилось отрисовать сферу, на которой было два блика от двух источников света. После я попросил добавить поддержку не только сферы, но любой произвольной 3D-модели. Это заработало со второго раза — новонаписанный код был правильным, но оказалось, что нужно слегка изменить предыдущий. Скормив ошибку, получил работающее решение — и немного покрутив камеру увидел, что движок даже отражения от поверхностей учитывает!
— с таким же промптом (и даже с уточнениями) GPT-4-Turbo выдала лишь чб-рендер одного объекта, в куда менее удобном стиле написания кода. Тут не получилось быстро добавить на сцену объектов, в то время как у обсуждаемой модели всё было очень круто организовано.
— ещё по паре вопросов я заметил, что модель то ли делает паузы (особенно в начале), то ли просто зависает интернет-соединение. Возможно, под капотом есть Retrieval по интернету — и модель опирается на что-то со страниц из поисковика. Пока на Арене всего одна модель ходит в интернет (гугловский Бард), может, аугментировали GPT-4 🤷‍♂️

Что можно сказать про модель:
— Вот тут ребята сделали быстрое тестирование. Модель утверждает, что её сделали OpenAI, она ведётся на те же ловушки странных-редких токенов, на которые ведутся их модели (а другие модели — нет, потому что у них другой набор токенов). Скорее всего, это не просто дообученная LLAMA-3 или какая-то другая модель.
— На Arena для неё используют тот же системный промпт, что и для последней GPT-4-Turbo
— пользователи сравнивали ASCII-арт, просили нарисовать единорога, и модель давала такой же ответ, как и ChatGPT. Причём именно такой же единорог есть в интернете — либо модель его нашла и срисовала, либо выучила наизусть во время тренировки, и теперь воспроизводит. А какие-то рисует лучше 🤷‍♂️
— формат ответа очень напоминает формат ответа Gemini, расписывает всё по пунктам и подпунктам. Мне код, например, писала в 5 или 6 этапов.
— некоторые пользователи говорят, что им ответы модели нравятся теперь меньше( 🔫

Короче, очень интересно, чем окажется модель, и когда это вскроется. И тем более какое у неё будет место на лидерборде. Поживём — увидим!

Но просто напомню, что GPT-4 была запущена как часть Bing Chat за 5 недель до официального анонса 🤡 а потом все такие «вау!»

Пишите в комменты про ваш опыт использования 👇 только не выбирайте слишком сложные задачи, модель прям не настолько лучше, чтобы претендовать на звание AGI.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
AI не сократит количество рабочих мест, а наоборот?!

Jonathan Ross, CEO компании Groq, утверждает, что с активным внедрением AI в различные сферы, количество рабочих мест не уменьшится, а увеличится.

Это отражение "парадокса Джевонса", который говорит о том, что внедрение новых технологий может не только повысить производительность, но и увеличить количество рабочих мест.

Вот пример, появление печатных машинок сделало процесс копирования документов быстрее и дешевле (до этого офисные клерки переписывали документы в ручную), что позволило компаниям чаще пользоваться этими услугами. В результате, вместо сокращения, потребность в клерках возросла, так как бизнес стал эффективнее и масштабировался.

Современные технологии, включая искусственный интеллект, аналогично могут создавать новые рабочие места, даже в секторах, кажущихся на первый взгляд под угрозой автоматизации.

ИИволюция🔤
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
О, Google добавил вызов Gemini прям из адресной строки Chrome браузера.

Просто укажите в начале запроса @ и введите сам запрос.

Выглядит очень правильным шагом и очень удобно! Правда пока только в США, но мы же живём в открытом мире без границ, кто ж нас остановит потестить 😎

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
И как то очень синхронно с новостью выше, на сайте openai.com обновился дизайн и центральным элементом стала строка для ввода запроса, которая перекидывает в чат джи-пи-ти 😀

Кто у кого подсмотрел? 🤔

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Ну всё, кажется точно ждём в ближайшее время новую GPT модель.

Сэм Альтман врать не будет: «GPT-4 is the dumbest model any of you will ever ever have to use again, by a lot.»

Сначала неожиданное появление неизвестной миру модели gpt2-chatbot на чатбот арене, теперь слова «GPT-4 тупейшая модель, которую вам когда-либо придется использовать», подчеркивая тем самым, что впереди нас жду гораздо более продвинутые модели и на их фоне, GPT-4 будет казаться детским лепетом. Прогрев в стиле инста блоггеров перед анонсом курса «Как стать миллионером».

Сэм просто ждёт окончания майских, чтобы снова удивить нас 🫶🏻

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI планирует запустить AI поисковик

1. Первые слухи о том, что OpenAI собирается запустить собственный поисковик были еще в начале февраля.
2. Сэм Альтман затрагивал тема поиска + LLM в подкасте у Лекса Фридмана.
3. А в последнее время информация о SearchGPT всё чаще и чаще появляется в разных источниках от разного рода инсайдеров (один, два, три).
4. Даже домен search.openai.com готов и на него есть SSL сертификат.
5. Новая главная (в шапке) openai.com после редизайна уже выглядит как поисковая строка (но пока перекидывает в chat). Тонкий намёк?
6. Один из инсайдеров пишет, что OpenAI представит свой поисковик 9 мая.
7. Кодовое название SearchGPT: судя по всему это аналог Perplexity AI, который за вас сёрфит, находит ответы, суммарзирует содержимое страниц.
8. В коде сайта openai даже поддержку виджетов нашли: погода, калькулятор (что? зачем?), финансы, спорт и прочее.
9. В общем, в мае точно стоит ожидать больших анонсов от openai, в том числе новой модели GPT.
10. Кажется, что Perplexity точно сейчас в напряжении, и кажется не только они одни.

Ух, жду не дождусь 🍿🤔

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Как работает LLM

Наглядно и по шагам показана вся магия. Смотреть по ссылке - http://ig.ft.com/generative-ai/

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Вау, первый музыкальный клип "The Hardest Part" созданный с помощью Sora от OpenAI🤩

Авто видео Paul Trillo сгенерировал 55 отдельных коротких роликов и склеил их в одно видео с помощью Adobe Premier.

Пол пишет: «I leaned into the hallucinations, the strange details, the dream-like logic of movement, the distorted mirror of memories, the surreal qualities unique to Sora / AI that differentiate it from reality. Embrace the strange.»

Синтетический мир уже здесь👁

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
📱Apple все же смогли договориться с OpenAI, чтобы использовать gpt модели в новой версии iOS. Конференция Apple для разработчиков WWDC все ближе и в этот раз очень её жду, как никогда раньше.

Ранее я уже писал множество слухов о том, что нас ждет нового-ИИшного в iOS 18. Почитать можно тут 👈

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Завтра ждём GPT-4.5?

Описание для GPT-4 изменили с “Our most avanced model” на “Advanced model”. Т.е. уже не такая и мощная! По тихому изменили и думали прокатит и никто не заметит? 😄

Это может говорить о том, что завтра нас ждет обновление GPT-4 до более сильной модели и очень надеюсь с сильно большим контекстным окном.

Кстати, Сэм Альтман тизерил умного ассистента под кодовым названием Magic. Случится ли магия? Узнаем завтра!

А еще ходят слухи о новой модели gpt-4l (видимо от слова lite). А вдруг gpt-3.5 заменят на неё? Было бы супер круто!

Уже завтра состоится долгожданная презентация OpenAI, где по словам Сэма, точно не будет презентована GPT-5 и поисковый движок, о котором все писали (увидим, но видимо позже).

🔤ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM