{AI} love you | Нейросет
276 subscribers
89 photos
16 videos
88 links
Авторский канал о prompt-gramming.
Гайды, разборы, ревью, рекомендации и личные инсайты о нейросетях.

Автор — @troclap
____________
Курс "ChatGPT в работе"
на Stepik: https://stepik.org/a/200358
на GetCourse: https://ailoveyou.getcourse.ru/gpt-assistant
Download Telegram
Тема, которую уже активно обсуждают в ядре, среди нердов, но еще совсем не упоминают за пределами — AI рабочая сила (AI workforce). Простыми словами, речь о том, как построить небольшой отдел компании или мини-организацию из нескольких ролей, состоящую исключительно из AI-работников.

Приведу пример: сейчас участвую в проекте по созданию Telegram-бота, который бы помогал в подготовке к сдаче IELTS. В простейшей версии мы закладываем в него три роли: экзаменатор, лектор (по теории) и генератор заданий. Хороший учитель выполняет эти роли в одном лице, переключаясь между ними согласно методике. Однако понятие разделения труда напоминает нам, что выполняя одну роль, можно повысить эффективность. Учитель не может себе это позволить, потому что придется вечно пересказывать контекст, важный для следующей роли. Если же контекст постоянно записывается и автоматически прочитывается на следующем шаге, то барьер к разделению труда может быть преодолен.

Именно эта идеология заложена в концепцию мульти-агентского фреймворка (в видео раскрывают два таких: MetaGPT и chatDev). В моем случае три AI-агента могут быть до-обучены выполнять свою узкую задачу (тестировать / объяснять / выдумывать задания) и далее взаимодействовать в разных сценах (например, writing / listening / reading в IELTS).

Всё это первый серьезный заход на то, чтобы GenAI мог выполнять не только задачу (task), но и работу (job). Пока что люди критически важны, чтобы связывать разные таски воедино и контролировать input / output.

#aiagent #aiworkforce #case
Более менее сложился консенсус, какой вклад GenAI оказывает на производительность в разрезе разной квалификации работников. Выигрывают от GenAI прежде всего новички и junior-специалисты, я об этом рассказывал на своем примере. Одно из лучших исследований про консультантов из большой тройки показывает разрыв в приросте эффективности в 2-2,5 раза между junior- и senior-специалистами. Это называют "великим уравнением" (я бы назвал лучше "великой конвергенцией"). Это неплохо объясняет скепсис некоторых специалистов по поводу GenAI: им самим он не так нужен, зато менее квалифицированным дает инструмент, который способен их нагнать и лишить преимущества опыта.

Но я бы не экстраполировал эту тенденцию далеко и надолго. В моменте новички выигрывают, потому что ИИ не способен их заменить, это уже все осознали. Зато AI-агенты и AI-workforce, о которых бурно дискутируют среди нердов, придут именно на замену новичкам, а не в помощь им (увы!). Хотя все будет зависеть от экономики замены. На днях видел ролик про разработку простейшей компьютерной игры (типа сапера) с помощью AI agent workforce фреймворка, и в деньгах это стоило 20-30 рублей (за OpenAI API).

#review #aiagent
Экспериментирую с Custom Instructions для учебных целей. Инструкция со скриншота создает предметного учителя, который на основе готового текста (типа главы учебника), поясняет сложные моменты простым языком, а затем вызывает экзаменатора, который спрашивает с ученика / студента по всему материалу и в разной форме (по таксономии Блума). На выходе оба дают фидбек по всему диалогу.

Результат не блестящий, но уверенно хороший, особенно на длинной дистанции в 7-10 сообщений, чего обычным custom instruction достичь сложнее. Если нужен промпт текстом - пишите в лс.

#text #chatgpt #edu #aiagent
#ОбзорГены

Что не могло пройти мимо радаров на минувшей неделе, а также неожиданно нашло отклик? Возникла потребность еженедельно бросать якорь в области GenAI — оставлять на память ключевые события: релизы, новости, материалы и темы.

{ Свежак }

🔠 Adobe анонсировал ControlNet для Firefly под названием Structure reference. Можно сгенерировать изображение на основе структуры (depth и др.) input-изображения. Давно есть в Stable Diffusion, однако нет ни у DALL-E, ни у Midjourney.
🔠 Hume.ai выпустили голосового чатбота со способностью распознавать эмоции. Самобытная компания, названная по имени великого шотландского философа-эмпириста, обучает именно эмоциональные модели в разных модальностях (текст / изображение / речь / видео). Давно слежу за ними, использую их технологию в одном проекте.

{ Пульс }

⚡️ Claude 3 Opus опередил GPT-4 (последней версии) на Chatbot Arena Leaderboard, где пользователи вслепую голосуют за лучший ответ одной из двух моделей. А еще бесплатный Claude "на голову" лучше бесплатного ChatGPT, правда с более жесткими ограничениями на пользование.
⚡️ Модель YandexGPT 3 Pro можно дообучить под свои нужды в сервисе DataSphere. Яндекс стабильно отстает примерно на 1 год от OpenAI, зато они остаются лидерами для российских разработчиков, которые по тем или иным причинам не могут использовать зарубежные модели.

{ Текстуры }

Знаменитый Andrew Ng рассказал об AI Agentic workflows — по его мнению, результатов GPT-5 в zero-shot версии можно добиться уже сейчас за счет правильного Agentic workflow (итеративная генерация + добавление внешних инструментов). Авто-планирование шагов и мульти-агентные фреймворки, по его мнению, пока недостаточно надежны.
Ресерч по AI-детекторам — отличный разбор того, можно ли достоверно определить является ли текст ИИ-сгенерированным? Короткий ответ — нет.
ChatGPT справляется с задачами на программирование с leetcode — пользовательский разбор.

{ Перекресток мнений }

GPTs c кастомными функциями. Есть мнение, что GPT-store еще не успев полноценно заработать, уже превратился в помойку с тысячами не отличимых друг от друга GPT-ассистентами. Я соглашусь с этим мнением в том, что пока затраты на поиск и тестирование сторонних GPTs превышает выгоду. Однако всё меняет одна черта — наличие внешних (кастомных) функций, нереализованных внутри ChatGPT. В качестве примера Photo Realistic GPT, который под капотом использует Stable Diffusion вместо DALL-E.

#image #hume #text #claude #llm #finetuning #gpts #aiagent #coding
Please open Telegram to view this post
VIEW IN TELEGRAM
Скриншоты из лекции Andrew Ng
{1} типы элементов AI Agentic workflows
{2} эффективность Reflection
{3} типы внешних инструментов

#aiagent
Please open Telegram to view this post
VIEW IN TELEGRAM
Action Engine Optimization (AEO)

Youtube-канал Marketing Against the Grain продолжает поставлять инсайты на стыке GenAI и маркетинга. В предыдущих сериях были важные мысли про AI-подрыв поиска (и соответственно органического трафика), возрастающую роль Youtube и маркетинговые LLM-опросы (в итоге я сделал кейс про это).

В новом выпуске ключевая мысль, что на смену Search Engine может прийти Action Engine. Поисковой движок распределяет интернет-трафик между отранжированными веб-сайтами, а движок действий может распределять "трафик" (лучше сказать ИИ-запросы) между отранжированными AI-агентами или API, которые будут совершать действия от имени пользователя. То есть после запроса ИИ-ассистенту: "Запиши меня в парикмахерскую сегодня вечером" — начинается конкуренция между AI-агентами и API за то, что именно будет выбрано для осуществления одной конкретной записи в парикмахерскую.

Очень вовремя случилась масштабная утечка Google о том, что лежит в основе ранжирования веб-сайтов в поисковике. Много полезных деталей из текущей (уходящей) эпохи. Интересно, что именно у Google все шансы построить первый полномасштабный Action Engine благодаря лидерству в поиске.

#aiagent #marketing #search #action
#ОбзорГены №8

Две добротные недели. Всё крутится, всё движется.

{ Свежак }

🔠 Apple наконец внедрил AI в iPhone, пожалуй, самая сильная фича — голосовое управление приложениями.
🔠 Случилось аж два мощных релиза среди видеогенераторов: Kling и Luma. Последние очевидно используют свое лидерство в 3D.
🔠 Выложили веса Stable Diffusion 3 Medium — культовой визуальной нейросетки для сообщества. Полный open-source уходит в прошлое.
🔠 Anthropic запустил AI-агентов на базе чат-бота Claude.
🔠 Eleven Labs теперь генерирует любые звуки, не только речь.

{ Пульс }

⚡️ У Udio появился Audio2Audio режим. Режим редактирования — это первый шаг к полной адаптации новой технологии.
⚡️ В мире анимации фурор вызвала межкадровая интерполяция от ToonCrafter. Посмотрите сами.
⚡️ Окончательное решение вопроса с джейлбрейкерами: близко к тому, чтобы мошенничество с LLM пресекалось на уровне нейронов.
⚡️ В мире животных: учёные принялись за распознание лая собак.

{ Текстуры }

Грядет Action Engineцентр интернета действий
Анализ емкости данных для обучения ИИ — данные закончились или ещё есть?
Гайд, как использовать GPT-Vision для настоящего OCR
Как достать любой кастомный промпт из GPT?
Обзор российских агрегаторов ботов (без vpn)
AI-инструменты для маркетинга
"Панельск" — прекрасный художественный проект, берущий сок из множества нейросетей
Актуальная цитата из Стругацких

{ Находки }

😯 Два сервиса по дешёвой аренде GPU: GPUDeploy и Vast.

{ Перекресток мнений }

С чего начать? Apple на этой неделе выступил не как технологический лидер, а как отраслевой гигант, которого конкуренция вынудила внедрить AI. Другие крупные компании ощущают себя схоже: AI не угрожает их положению на рынке, а вот конкуренты с глубоко внедренным AI угрожают. Если присмотреться к тому, что именно внедряют корпорации, то можно увидеть "консервативный" AI: суммаризация, перевод, генерация картинок, общение с документом. Топ-4 для старта.

#gadget #image #video #aiagent #audio #speech #llm #science #animation #marketing #data #gpu #vision #prompts
Please open Telegram to view this post
VIEW IN TELEGRAM