Векторные базы данных
Обычные базы данных (реляционные БД) хранят информацию вот так:
Если мы знаем, о ком или чем нам нужна информация, то мы закинем эту удочку (рыбалковая метафора 😁), например, спросим у базы данных, какую книгу купил Василий Петрович С., и нам очень быстро вернется ответ - “Книга о рыбалке”. В этой задаче есть определенность, на которую мы опираемся.
Искусственный интеллект может отвечать на вопросы, где есть много неопределенности, например, какие еще книги предложить Василию Петровичу или у каких клиентов похожие вкусы. Но ИИ принимает решение на основе векторов, которые выглядят примерно вот так:
Причем у каждого объекта может быть очень длинный вектор. А если у объекта какие-то свойства меняются, то меняется и весь вектор.
✅ Векторная база данных - это хранилище векторов для ИИ, оптимизированное под особенности ИИ-задач, например:
➖ превращать запрос к базе в вектор
➖ ранжировать все объекты в базе на соответствие запросу
➖ отсекать объекты, не отвечающие запросу
➖ переписывать вектора при возникновении изменений, дополнительных сведений и т.д.
А также она очень полезна при скрещивании поисковиков с ИИ, именуемом RAG.
Вот так человечество и пришло к созданию векторных БД. Сейчас их много есть разных, в том числе бесплатных с открытым кодом. В вакансиях на ИИ-разрабов и дата-саентистов скилл владения векторными БД тоже упоминается. Так что, если хотите стать сениором в ИИ-разработке и датасаенсе или шатать RAG, то векторная база - это база 😎
#база
Обычные базы данных (реляционные БД) хранят информацию вот так:
Клиент | Василий Петрович С.
Товар | “Книга о рыбалке”
Стоимость | 800 р.
Оплатил | ДаЕсли мы знаем, о ком или чем нам нужна информация, то мы закинем эту удочку (рыбалковая метафора 😁), например, спросим у базы данных, какую книгу купил Василий Петрович С., и нам очень быстро вернется ответ - “Книга о рыбалке”. В этой задаче есть определенность, на которую мы опираемся.
Искусственный интеллект может отвечать на вопросы, где есть много неопределенности, например, какие еще книги предложить Василию Петровичу или у каких клиентов похожие вкусы. Но ИИ принимает решение на основе векторов, которые выглядят примерно вот так:
Василий Петрович С. | 0.53694 0.32644 0.32492 0.32149 0.99846..
Мария Ивановна И. | 0.23982 0.79123 0.21365 0.75313 0.97373..Причем у каждого объекта может быть очень длинный вектор. А если у объекта какие-то свойства меняются, то меняется и весь вектор.
✅ Векторная база данных - это хранилище векторов для ИИ, оптимизированное под особенности ИИ-задач, например:
➖ превращать запрос к базе в вектор
➖ ранжировать все объекты в базе на соответствие запросу
➖ отсекать объекты, не отвечающие запросу
➖ переписывать вектора при возникновении изменений, дополнительных сведений и т.д.
А также она очень полезна при скрещивании поисковиков с ИИ, именуемом RAG.
Вот так человечество и пришло к созданию векторных БД. Сейчас их много есть разных, в том числе бесплатных с открытым кодом. В вакансиях на ИИ-разрабов и дата-саентистов скилл владения векторными БД тоже упоминается. Так что, если хотите стать сениором в ИИ-разработке и датасаенсе или шатать RAG, то векторная база - это база 😎
#база
Хабр
Архитектура RAG: полный гайд
Первая часть. Часть вторая про Advanced RAG тут . Если, открывая холодильник, вы еще не слышали из него про RAG - то наверняка скоро услышите. Однако, в сети на удивление мало полных гайдов,...
👍3🔥3❤1
Как компании неправильно внедряют ИИ
Все счастливые компании, внедряющие ИИ, счастливы одинаково, и каждая несчастная компания несчастлива по-своему. За время работы в университетах я наблюдала множество неудач с внедрением ИИ, а читала про них еще больше. Вот мой шорт-лист самых ярких блуперов.
Кейс 1: для галочки / дань моде / дали деньги на модернизацию
Одна крупная сырьевая компания сделала на базе государственного университета магистратуру про ИИ, чтобы взрастить себе кадры, которые произведут ИИ-внедрение. Многие студенты, поступившие в нее, честно старались делать классные проекты. Но на защитах проектов перед представителями компании они получали только комментарии вроде “Это вообще что?” и “Зачем это нам? У нас и так все хорошо”. Этой маги больше нет с нами.
А бывает и наоборот: сотрудникам очень упорно внедряют идею, что нужно использовать ИИ, устраивают обучения, контролируют, пока всех не начнет тошнить. Однажды я организовала мастер-класс по ИИ в одном коллективе, которому вот так прокапали мозг - хотела объяснить, как реально можно использовать ИИ с пользой. Вход был чисто по желанию. Пришло полтора землекопа.
Вот такие эмоциональные качели.
Кейс 2: управление поссорилось с персоналом и хочет заменить его роботами
Как я люблю говаривать на всяких своих воркшопах и тьюториалах: стоимость одного запроса к ИИ может быть и не велика, но если у вас будет много таких запросов, то дешевле держать кожаного человека. Он и на запрос ответит, и бумажку перенесет из одного кабинета в другой, и цветочки польет, и с доски вытрет..
Как я понимаю, компании, где нет или почти нет людей, создаются таковыми изначально, а компании, в которых изначально велик фактор человека, на ИИ-рельсы не перевести. Вот, например, в онлайн-школах, которые растут как грибы, очень много автоматизации, а в реальных школах она даже мешает (загружает людей бюрократией). История, конечно, знает и контр-примеры: переводчики, копирайтеры, джуны - целые профессии, замененные ИИ-шкой. Но вместо предсказаний, мне кажется, лучше просто подружиться со своим персоналом. Или придется дружить с персоналом ИТ-компании, которая будет поставлять ИТ-услуги взамен сокращенных сотрудников.
Кейс 3: коллектив уже использует ИИ, но управление не замечает или не хочет, чтобы они это делали
Однажды в далеких 2010-х гг. группа моих инициативных коллег, которые занимались компьютерной лингвистикой, пошла к руководству просить, чтобы им согласовали создание лаборатории по ИИ. Руководство отказало, т.к. не поняло, что это вообще такое. Прошли года и на горизонте появилась ChatGPT. В ту же организацию пригласили кадры, которые должны заниматься внедрением ИИ - лица в этом коллективе все абсолютно новые. А мои инициативные коллеги все так и занимаются ИИ-шкой, хоть и не называются лабораторией.
В то же время я знаю многих коллег, которые сами используют нейросети для рабочих задач, сами себе оплачивают подписки, сами обучаются с ними работать. Иногда это даже вроде как “запрещеночка”, например, генерация рабочих программ дисциплин, тестов и других методических материалов - не сказать, чтобы это приветствуется, а кое-где даже официально запрещено. Студентам, конечно, тоже нельзя генерить эссе, а ученым - статьи. И? Представляете - генерят. Не потому что их мало контролируют (чтобы полностью контролировать процесс, нужно приставить к каждому человеку по одному контролеру). А потому что использовать ИИ в некоторых задачах - выгодно: это повышает производительность труда и качество работы.
А как повышается качество учебы и науки от того, что все всё генерят? Это тема для отдельного поста 😉
Выводы
✅ Внедрять ИИ нужно снизу, глядя на то, как эффективные сотрудники используют ИИ, и разговаривая с ними.
✅ Там, где силен фактор человека изначально, выкорчевывать его и заменять ИИ-шкой не приведет к успеху.
✅ Правила игры с ИИ должны держаться не на контроле, а на выгодном предложении для тех, кто будет его использовать.
А вам знакомы другие кейсы неправильного внедрения ИИ? Делитесь в комментариях.
#эссеИИстика
Все счастливые компании, внедряющие ИИ, счастливы одинаково, и каждая несчастная компания несчастлива по-своему. За время работы в университетах я наблюдала множество неудач с внедрением ИИ, а читала про них еще больше. Вот мой шорт-лист самых ярких блуперов.
Кейс 1: для галочки / дань моде / дали деньги на модернизацию
Одна крупная сырьевая компания сделала на базе государственного университета магистратуру про ИИ, чтобы взрастить себе кадры, которые произведут ИИ-внедрение. Многие студенты, поступившие в нее, честно старались делать классные проекты. Но на защитах проектов перед представителями компании они получали только комментарии вроде “Это вообще что?” и “Зачем это нам? У нас и так все хорошо”. Этой маги больше нет с нами.
А бывает и наоборот: сотрудникам очень упорно внедряют идею, что нужно использовать ИИ, устраивают обучения, контролируют, пока всех не начнет тошнить. Однажды я организовала мастер-класс по ИИ в одном коллективе, которому вот так прокапали мозг - хотела объяснить, как реально можно использовать ИИ с пользой. Вход был чисто по желанию. Пришло полтора землекопа.
Вот такие эмоциональные качели.
Кейс 2: управление поссорилось с персоналом и хочет заменить его роботами
Как я люблю говаривать на всяких своих воркшопах и тьюториалах: стоимость одного запроса к ИИ может быть и не велика, но если у вас будет много таких запросов, то дешевле держать кожаного человека. Он и на запрос ответит, и бумажку перенесет из одного кабинета в другой, и цветочки польет, и с доски вытрет..
Как я понимаю, компании, где нет или почти нет людей, создаются таковыми изначально, а компании, в которых изначально велик фактор человека, на ИИ-рельсы не перевести. Вот, например, в онлайн-школах, которые растут как грибы, очень много автоматизации, а в реальных школах она даже мешает (загружает людей бюрократией). История, конечно, знает и контр-примеры: переводчики, копирайтеры, джуны - целые профессии, замененные ИИ-шкой. Но вместо предсказаний, мне кажется, лучше просто подружиться со своим персоналом. Или придется дружить с персоналом ИТ-компании, которая будет поставлять ИТ-услуги взамен сокращенных сотрудников.
Кейс 3: коллектив уже использует ИИ, но управление не замечает или не хочет, чтобы они это делали
Однажды в далеких 2010-х гг. группа моих инициативных коллег, которые занимались компьютерной лингвистикой, пошла к руководству просить, чтобы им согласовали создание лаборатории по ИИ. Руководство отказало, т.к. не поняло, что это вообще такое. Прошли года и на горизонте появилась ChatGPT. В ту же организацию пригласили кадры, которые должны заниматься внедрением ИИ - лица в этом коллективе все абсолютно новые. А мои инициативные коллеги все так и занимаются ИИ-шкой, хоть и не называются лабораторией.
В то же время я знаю многих коллег, которые сами используют нейросети для рабочих задач, сами себе оплачивают подписки, сами обучаются с ними работать. Иногда это даже вроде как “запрещеночка”, например, генерация рабочих программ дисциплин, тестов и других методических материалов - не сказать, чтобы это приветствуется, а кое-где даже официально запрещено. Студентам, конечно, тоже нельзя генерить эссе, а ученым - статьи. И? Представляете - генерят. Не потому что их мало контролируют (чтобы полностью контролировать процесс, нужно приставить к каждому человеку по одному контролеру). А потому что использовать ИИ в некоторых задачах - выгодно: это повышает производительность труда и качество работы.
А как повышается качество учебы и науки от того, что все всё генерят? Это тема для отдельного поста 😉
Выводы
✅ Внедрять ИИ нужно снизу, глядя на то, как эффективные сотрудники используют ИИ, и разговаривая с ними.
✅ Там, где силен фактор человека изначально, выкорчевывать его и заменять ИИ-шкой не приведет к успеху.
✅ Правила игры с ИИ должны держаться не на контроле, а на выгодном предложении для тех, кто будет его использовать.
А вам знакомы другие кейсы неправильного внедрения ИИ? Делитесь в комментариях.
#эссеИИстика
👍4
Альтернативные промпты
Промпт-инжиниринг - это искусство создания запросов (промптов) к большим языковым моделям (LLM) типа ChatGPT. Почему искусство? Потому что здесь много неопределенности:
📌 что вам нужно от модели (включая, что вам на самом деле нужно от модели)
📌 что знает и что умеет модель
📌 как модель настроили ее производители
Существуют разные техники (лайфхаки) для написания промптов, которые чаще всего дают хороший результат, например шаблоны
В этом посте хочу поделиться несколькими техниками, о которых я узнала недавно и которые меня удивили:
Многие модели настроены так, чтобы экономить токены (длину своего ответа), т.к. именно за них мы и платим, общаясь с моделями. В итоге модель возвращает максимально краткий ответ. Эта фраза может сломать данную настройку, и модель выдаст длинный и подробный ответ.
🐉
Этот промпт задает метрику успеха. Помогает при решении аналитических задач, на логику, математику, эрудицию. Часто языковые модели дают один ответ, на котором настаивают. Этот промпт заставит модель сомневаться. Вместо 0.5 можно поставить любое другое число между 0 и 1, а также попросить много вариантов и ранжировать их от самого вероятного к наименее вероятному. Можно придумать и другую метрику (не обязательно вероятность).
🐉
Мне уже лень самой писать промпты. Вот как я в последнее время делаю картинки для анонсов своих постов: скидываю GPT 5 на чатбот-арене темы и краткое описание канала, говорю, что нужен промпт для постера, и она пишет. Потом кидаю этот промпт в Gemini, которая генерит изображение.
🐉
Например:
🐉
Даешь модели кусочек своего текста и она тебе пишет посты в тг-канал 😀 Да ну видно же, что я сама пишу, вы че!.. А вот всякие скучные вещи вроде промежуточных выводов по параграфу в статье можно и нагенерить. Но лучше при этом, чтобы модель писала как вы, в вашем стиле.
А какие необычные лайфхаки для промптов используете вы? Делитесь в комментариях.
Всем удивительного промптинга! 💫
#спискИИ #лайфхакИИ
Промпт-инжиниринг - это искусство создания запросов (промптов) к большим языковым моделям (LLM) типа ChatGPT. Почему искусство? Потому что здесь много неопределенности:
📌 что вам нужно от модели (включая, что вам на самом деле нужно от модели)
📌 что знает и что умеет модель
📌 как модель настроили ее производители
Существуют разные техники (лайфхаки) для написания промптов, которые чаще всего дают хороший результат, например шаблоны
“цель - формат - контекст (материал)” или указание роли “Ты - эксперт в области..”. (Одно из самых популярных собраний промптов здесь; оно на английском - можно перевести на русский при помощи ChatGPT.)В этом посте хочу поделиться несколькими техниками, о которых я узнала недавно и которые меня удивили:
🐉 Улучши свой ответМногие модели настроены так, чтобы экономить токены (длину своего ответа), т.к. именно за них мы и платим, общаясь с моделями. В итоге модель возвращает максимально краткий ответ. Эта фраза может сломать данную настройку, и модель выдаст длинный и подробный ответ.
🐉
Оцени вероятность, что твой ответ - правильный, и, если она ниже 0.5, дай другой ответЭтот промпт задает метрику успеха. Помогает при решении аналитических задач, на логику, математику, эрудицию. Часто языковые модели дают один ответ, на котором настаивают. Этот промпт заставит модель сомневаться. Вместо 0.5 можно поставить любое другое число между 0 и 1, а также попросить много вариантов и ранжировать их от самого вероятного к наименее вероятному. Можно придумать и другую метрику (не обязательно вероятность).
🐉
Напиши промпт для [ваша задача]Мне уже лень самой писать промпты. Вот как я в последнее время делаю картинки для анонсов своих постов: скидываю GPT 5 на чатбот-арене темы и краткое описание канала, говорю, что нужен промпт для постера, и она пишет. Потом кидаю этот промпт в Gemini, которая генерит изображение.
🐉
Думай вот так: [логика рассуждения, что допустимо, альтернативы]Например:
“выдвини несколько гипотез / найди факты, которые подтверждают или опровергают твои утверждения / проверь, есть ли в твоем рассуждении метафоры”. Недавно я наткнулась на вот такой пост и поняла, что многое из него делаю в своих промптах. При этом у меня отпадает нужда в других лайфхаках вроде задавания роли. Пост, на мой взгляд, довольно туманный, мало примеров, но в целом концепцию объясняет хорошо. Возможно, со временем эта тема сформируется в более четкую инструкцию.🐉
Сохрани мой авторский стиль [ваш текст как пример]Даешь модели кусочек своего текста и она тебе пишет посты в тг-канал 😀 Да ну видно же, что я сама пишу, вы че!.. А вот всякие скучные вещи вроде промежуточных выводов по параграфу в статье можно и нагенерить. Но лучше при этом, чтобы модель писала как вы, в вашем стиле.
А какие необычные лайфхаки для промптов используете вы? Делитесь в комментариях.
Всем удивительного промптинга! 💫
#спискИИ #лайфхакИИ
Kaggle
Prompt Engineering
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
🙏2❤1🔥1
Как визуализировать данные при помощи ChatGPT
Не секрет, что ChatGPT и иже с ними очень сильны в аналитике данных - могут не просто посчитать среднее, но и найти тенденции, аномалии и выбросы. И даже подсказать, что искать. Но если просто попросить модель, которая умеет рисовать изображения, "построй мне диаграмму", то она нарисует "креативный визуал на тему".
Вот варианты, как всё-таки получить от них диаграмму. Скидываем модели данные, объясняем задачу, просим подобрать тип диаграммы и далее пишем:
✅ Н
Дальше следуем инструкции. В Excel могут понадобиться функции, дополнительные столбцы с расчетами и т.п.
✅
Затем этот код запускаем, например, в Google Colaboratory. Можно вместо Python использовать любой другой язык программирования.
✅
Полученный код сохраняем сначала в обычном текстовом документе .txt, затем меняем ему расширение на .html и открываем в любом браузере.
Всем живописных визуализаций! 🧑🎨
#база #лайфхакИИ
Не секрет, что ChatGPT и иже с ними очень сильны в аналитике данных - могут не просто посчитать среднее, но и найти тенденции, аномалии и выбросы. И даже подсказать, что искать. Но если просто попросить модель, которая умеет рисовать изображения, "построй мне диаграмму", то она нарисует "креативный визуал на тему".
Вот варианты, как всё-таки получить от них диаграмму. Скидываем модели данные, объясняем задачу, просим подобрать тип диаграммы и далее пишем:
✅ Н
апиши инструкцию, как сделать диаграмму в Excel [или Google Spreadsheet - смотря в чем вы работаете]Дальше следуем инструкции. В Excel могут понадобиться функции, дополнительные столбцы с расчетами и т.п.
✅
Напиши код на Python, который генерирует диаграмму из моих данных. Данные хранятся в файле csv [Excel, Google Spreadsheet... Можно сразу указать путь к файлу]Затем этот код запускаем, например, в Google Colaboratory. Можно вместо Python использовать любой другой язык программирования.
✅
Напиши код HTML страницы с использованием JavaScript, который отображает диаграмму. Данные, которые надо использовать, включи в кодПолученный код сохраняем сначала в обычном текстовом документе .txt, затем меняем ему расширение на .html и открываем в любом браузере.
Всем живописных визуализаций! 🧑🎨
#база #лайфхакИИ
🔥5👍1
Объяснимый ИИ: машинное обучение - это не совсем черный ящик
Нейросети стали популярными за то, что очень быстро решали типовые задачи, для которых нужен был человек. Например, распознать номер автомобиля на фото с камеры (и выписать штраф). Как нейросеть принимает решение, что на фото цифра 2⃣, а не, например, 5⃣? Мы точно не знаем; это черный ящик. Она взвешивает много-много признаков (в случае с фото это будут цвета пикселей) и делает вывод, что вероятнее всего цифра вот такая. Но пытаться выяснить, какие пиксели влияют больше всего на разницу между цифрами 2⃣ и 5⃣, не очень интересно - мы ее и так видим невооружённым глазом. Зато есть задачи, где взаимосвязи между признаками не так очевидны, а решения, которые мы (частично) делегируем машинам, очень важны. Например:
📎 прочитать ли резюме
📎 выдать ли кредит
📎 снять ли товар с продажи или заказать ещё партию
📎 обрызгать ли поле пестицидами
Для таких задач хотелось бы, чтобы ИИ объяснил, почему даёт нам тот или иной совет.
Explainable AI, или объяснимый ИИ - это способы вытащить из черного ящика тонкие взаимосвязи, которые приводят ИИ к выдаче определенного решения.
Примеры способов:
📈 Посмотреть на линейную зависимость между признаками - у каких признаков она наиболее высока. Например, чем ближе осень, тем чаще люди покупают шарфы.
Есть и специальные методы для выявления более сложной, нелинейной статистической зависимости. Нейросеть даёт нам ответ, а мы подбираем методы, чтобы вытащить из данных эти зависимости.
📈 Найти подпространства признаков, в которых есть что-то общее. Например, найти, что вот такие признаки отвечают за профессионализм кандидата, а вот такие - за софт скиллз.
В языковых моделях ищут, например, в каких подпространствах оказываются факты - чтобы модель меньше выдумывала.
📈 Наконец, у ChatGPT можно просто спросить напрямую, на чем основано ее решение.
Объяснимый ИИ - это отдельный перспективный сегмент научных исследований. Но в коммерческом секторе его задачи чаще решает аналитика данных.
#база
Нейросети стали популярными за то, что очень быстро решали типовые задачи, для которых нужен был человек. Например, распознать номер автомобиля на фото с камеры (и выписать штраф). Как нейросеть принимает решение, что на фото цифра 2⃣, а не, например, 5⃣? Мы точно не знаем; это черный ящик. Она взвешивает много-много признаков (в случае с фото это будут цвета пикселей) и делает вывод, что вероятнее всего цифра вот такая. Но пытаться выяснить, какие пиксели влияют больше всего на разницу между цифрами 2⃣ и 5⃣, не очень интересно - мы ее и так видим невооружённым глазом. Зато есть задачи, где взаимосвязи между признаками не так очевидны, а решения, которые мы (частично) делегируем машинам, очень важны. Например:
📎 прочитать ли резюме
📎 выдать ли кредит
📎 снять ли товар с продажи или заказать ещё партию
📎 обрызгать ли поле пестицидами
Для таких задач хотелось бы, чтобы ИИ объяснил, почему даёт нам тот или иной совет.
Explainable AI, или объяснимый ИИ - это способы вытащить из черного ящика тонкие взаимосвязи, которые приводят ИИ к выдаче определенного решения.
Примеры способов:
📈 Посмотреть на линейную зависимость между признаками - у каких признаков она наиболее высока. Например, чем ближе осень, тем чаще люди покупают шарфы.
Есть и специальные методы для выявления более сложной, нелинейной статистической зависимости. Нейросеть даёт нам ответ, а мы подбираем методы, чтобы вытащить из данных эти зависимости.
📈 Найти подпространства признаков, в которых есть что-то общее. Например, найти, что вот такие признаки отвечают за профессионализм кандидата, а вот такие - за софт скиллз.
В языковых моделях ищут, например, в каких подпространствах оказываются факты - чтобы модель меньше выдумывала.
📈 Наконец, у ChatGPT можно просто спросить напрямую, на чем основано ее решение.
Объяснимый ИИ - это отдельный перспективный сегмент научных исследований. Но в коммерческом секторе его задачи чаще решает аналитика данных.
#база
🔥3👍2
ИИ-агенты в тренде
Когда люди используют ИИ, у них возникают желания: вот бы оно ещё бы вот так бы могло..
Например, разговариваете вы с ChatGPT и понимаете, что лимит на длину диалога исчерпан. Придется начинать новый диалог, и модель не будет ничего знать о предыдущей беседе. А бывает, хочется ещё больше: чтобы у ChatGPT создалась как бы версия, которая с вами много общалась и очень хорошо вас понимает. Или вот бы сделать для офисной работы такого бота, который бы и в документах разобрался, и клиентскую базу вел, и пиццу заказывал.. А что, если сделать много ботов и выбрать потом лучшего кандидата?
Одна из областей ИИ, которая хочет воплотить эти желания в реальность, называется агентное моделирование (agent modelling). Раньше агенты были очень простые - алгоритм генерировал множество немного разных параметров для переменных. Затем запускалась симуляция, в которой переменные становились агентами: их параметры менялись, когда они сталкивались друг с другом или с какими-то внешними условиями. Как NPC в симуляции игры в футбол. Такие методы все ещё используются, но вот каких успехов агентное моделирование добилось к 2025 г:
Project SID. Деревня в Майнкрафте из тысячи ИИ-агентов построила демократическое общество с культурой и моралью.
TheAgentCompany. Офис искусственно созданной компании управлялся полностью ИИ-агентами - в основном неудачно, но какую-то часть задач агенты выполнили.
Character AI. На этой платформе пользователи сами создают своего рода ИИ-агентов - персонажей с определенными свойствами. На платформу подано множество исков от родителей подростков, которые слишком увлекаются общением со своими персонажами.
Чтобы модель приобрела черты агента, после обучения ее настраивают - создают стартовую версию. Но затем модель все равно будет получать новую информацию: в диалоге, при чтении документов, писем, обращении к сайтам. Одной из сложностей здесь является хранение новой информации и поиск по ней в зависимости от контекста. Решается это, например, через RAG - retrieval-augmented generation, или генерация, улучшенная поиском по базе данных, которая наполняется получаемой информацией.
Если нас, офисных работников, когда-нибудь заменит ИИ, то это будут именно агенты 🤖
#база
Когда люди используют ИИ, у них возникают желания: вот бы оно ещё бы вот так бы могло..
Например, разговариваете вы с ChatGPT и понимаете, что лимит на длину диалога исчерпан. Придется начинать новый диалог, и модель не будет ничего знать о предыдущей беседе. А бывает, хочется ещё больше: чтобы у ChatGPT создалась как бы версия, которая с вами много общалась и очень хорошо вас понимает. Или вот бы сделать для офисной работы такого бота, который бы и в документах разобрался, и клиентскую базу вел, и пиццу заказывал.. А что, если сделать много ботов и выбрать потом лучшего кандидата?
Одна из областей ИИ, которая хочет воплотить эти желания в реальность, называется агентное моделирование (agent modelling). Раньше агенты были очень простые - алгоритм генерировал множество немного разных параметров для переменных. Затем запускалась симуляция, в которой переменные становились агентами: их параметры менялись, когда они сталкивались друг с другом или с какими-то внешними условиями. Как NPC в симуляции игры в футбол. Такие методы все ещё используются, но вот каких успехов агентное моделирование добилось к 2025 г:
Project SID. Деревня в Майнкрафте из тысячи ИИ-агентов построила демократическое общество с культурой и моралью.
TheAgentCompany. Офис искусственно созданной компании управлялся полностью ИИ-агентами - в основном неудачно, но какую-то часть задач агенты выполнили.
Character AI. На этой платформе пользователи сами создают своего рода ИИ-агентов - персонажей с определенными свойствами. На платформу подано множество исков от родителей подростков, которые слишком увлекаются общением со своими персонажами.
Чтобы модель приобрела черты агента, после обучения ее настраивают - создают стартовую версию. Но затем модель все равно будет получать новую информацию: в диалоге, при чтении документов, писем, обращении к сайтам. Одной из сложностей здесь является хранение новой информации и поиск по ней в зависимости от контекста. Решается это, например, через RAG - retrieval-augmented generation, или генерация, улучшенная поиском по базе данных, которая наполняется получаемой информацией.
Если нас, офисных работников, когда-нибудь заменит ИИ, то это будут именно агенты 🤖
#база
🔥4❤1
ИИ-агенты в тренде: мини-агент в Google Colab
На конец месяца я обычно оставляю всякую аналитику, но, когда писала прошлый пост про ИИ-агентов, подумала, что хранить новые данные для агента можно и в простой Google-таблице - не обязательно целую базу данных заводить. Поэтому сегодня расскажу, как сделать своего мини-ИИ-агента в Google, а аналитика немного сдвинется по графику вперед. Как всегда, ноутбучек с кодом прилагается.
Итак, что нам понадобится:
✅ Аккаунт Google
✅ Подключенный к нему Google Colaboratory (среда программирования Python, которая запускается в облаке Google Drive)
✅ Аккаунт большой языковой модели Mistral AI (понадобится ключ доступа к модели: API key)
✅ Гуглотаблица - файл формата Google Spreadsheets
Будем создавать ИИ-агента, который парсит вакансии на hh.ru - можно без регистрации на hh.ru.
Алгоритм действий нашего агента:
1⃣ Отправить запрос к hh.ru по интересной нам вакансии, например, аналитик.
2⃣ Распарсить ответ - заполнить гуглотаблицу данными, полученными от hh.ru.
3⃣ Передать данные модели Mistral и попросить у нее инсайты по этим данным.
4⃣ Записать ответ Mistral в гуглотаблицу.
Ну и я же не горшечник, чтоб горшки обжигать, поэтому.. вместе с GPT 5 high на чатбот-арене мы написали вот такой код (не с первой попытки, но все же): ноутбучек.
❗Обратите внимание: я в нем почистила свои токены и адреса файлов- чтобы он заработал, нужно вставить свои.
И вот такой результат получился у меня в гуглотаблице по вакансии "аналитик" - по-моему, все красиво.
🧐 Важно продумать, какую задачу будет выполнять агент, какие данные и в каком формате для этого понадобятся и как будет храниться результат.
🧐 Также интересное с агентами начинается, когда несколько агентов получают доступ к данным и вступают во взаимодействие друг с другом. Гуглотаблица в моем примере служит хранилищем, которое хранит память об этом взаимодействии - типа долгосрочной памяти у человека, которая вместе с генетическими предрасположенностями и делает нас уникальными личностями.
🍀 Всем счастливой автоматизации! И да не заменят нас ИИ-агенты 👾
#notebook
На конец месяца я обычно оставляю всякую аналитику, но, когда писала прошлый пост про ИИ-агентов, подумала, что хранить новые данные для агента можно и в простой Google-таблице - не обязательно целую базу данных заводить. Поэтому сегодня расскажу, как сделать своего мини-ИИ-агента в Google, а аналитика немного сдвинется по графику вперед. Как всегда, ноутбучек с кодом прилагается.
Итак, что нам понадобится:
✅ Аккаунт Google
✅ Подключенный к нему Google Colaboratory (среда программирования Python, которая запускается в облаке Google Drive)
✅ Аккаунт большой языковой модели Mistral AI (понадобится ключ доступа к модели: API key)
✅ Гуглотаблица - файл формата Google Spreadsheets
Будем создавать ИИ-агента, который парсит вакансии на hh.ru - можно без регистрации на hh.ru.
Алгоритм действий нашего агента:
1⃣ Отправить запрос к hh.ru по интересной нам вакансии, например, аналитик.
2⃣ Распарсить ответ - заполнить гуглотаблицу данными, полученными от hh.ru.
3⃣ Передать данные модели Mistral и попросить у нее инсайты по этим данным.
4⃣ Записать ответ Mistral в гуглотаблицу.
Ну и я же не горшечник, чтоб горшки обжигать, поэтому.. вместе с GPT 5 high на чатбот-арене мы написали вот такой код (не с первой попытки, но все же): ноутбучек.
❗Обратите внимание: я в нем почистила свои токены и адреса файлов- чтобы он заработал, нужно вставить свои.
И вот такой результат получился у меня в гуглотаблице по вакансии "аналитик" - по-моему, все красиво.
🧐 Важно продумать, какую задачу будет выполнять агент, какие данные и в каком формате для этого понадобятся и как будет храниться результат.
🧐 Также интересное с агентами начинается, когда несколько агентов получают доступ к данным и вступают во взаимодействие друг с другом. Гуглотаблица в моем примере служит хранилищем, которое хранит память об этом взаимодействии - типа долгосрочной памяти у человека, которая вместе с генетическими предрасположенностями и делает нас уникальными личностями.
🍀 Всем счастливой автоматизации! И да не заменят нас ИИ-агенты 👾
#notebook
❤5🔥1
Миссионеры против мерсенариев. Вечный спор: что важнее - идея или деньги?
Благодаря буму в области ИТ, капитализация и зарплаты в некоторых ИТ-компаниях бьют рекорды.
Капитализация компании Apple (т.е. рыночная стоимость всех выпущенных ею акций) в 2025 г. составляет 3.7 триллиона $ (3 791 000 000 000). В рублях это примерно 315 триллионов. Для сравнения расходы федерального бюджета РФ в 2026 году запланированы на уровне 44,1 трлн рублей.
Из 36 000 работников компании Nvidia более 70% являются долларовыми миллионерами. Это произошло благодаря росту акций компании. Судя по вакансиям компании в 2022 г. при трудоустройстве инженер получал 55 000 акций - сейчас это порядка 9 млн. долларов.
А одна компания, которую нельзя называть, переманивая сотрудников у Open AI, предложила им бонусы в 100 млн. долларов. В итоге из open AI ушло порядка 8 человек: “The list of new hires also included a number of people from OpenAI, including Shengjia Zhao, Shuchao Bi, Jiahui Yu, and Hongyu Ren”.
CEO Open AI Сэм Альтман отреагировал на это, породив фразу, которая разошлась по всему Интернету:
Я надеюсь, обойдется без насилия. И все же.. - что главнее в ИТ: деньги или идея?
Понятно, что тут нет однозначного ответа. Во второй половине 20 в. ИТ-индустрия сильно поменяла экономику в принципе, а ИИ-бум продолжает ее менять в начале 21 в. И кажется, что это влияние занимает собой прям все вокруг. Сейчас время, когда пока еще можно заработать хороший куш в айтишечке, но уже далеко не всем. Например, вкатываться в ИТ с нуля ради больших денег уже поздно (там высокая конкуренция), а вот ради идеи (..потому что вы придумали идею приложения или вам просто нравится кодить) - можно хоть когда. На кусочек хлеба с маслом можно заработать, даже делая сайты или кодя в 1С.
И когда ИИ-бум устаканится и денег в айтишечке будет как везде, то больше не придется “бить наемников” и вопрос отпадет сам собой.
#эссеИИстика
Благодаря буму в области ИТ, капитализация и зарплаты в некоторых ИТ-компаниях бьют рекорды.
Капитализация компании Apple (т.е. рыночная стоимость всех выпущенных ею акций) в 2025 г. составляет 3.7 триллиона $ (3 791 000 000 000). В рублях это примерно 315 триллионов. Для сравнения расходы федерального бюджета РФ в 2026 году запланированы на уровне 44,1 трлн рублей.
Из 36 000 работников компании Nvidia более 70% являются долларовыми миллионерами. Это произошло благодаря росту акций компании. Судя по вакансиям компании в 2022 г. при трудоустройстве инженер получал 55 000 акций - сейчас это порядка 9 млн. долларов.
А одна компания, которую нельзя называть, переманивая сотрудников у Open AI, предложила им бонусы в 100 млн. долларов. В итоге из open AI ушло порядка 8 человек: “The list of new hires also included a number of people from OpenAI, including Shengjia Zhao, Shuchao Bi, Jiahui Yu, and Hongyu Ren”.
CEO Open AI Сэм Альтман отреагировал на это, породив фразу, которая разошлась по всему Интернету:
Деньги - не главное
Миссионеры побьют мерсенариев (наемников).
Missionaries will beat mercenaries.
Я надеюсь, обойдется без насилия. И все же.. - что главнее в ИТ: деньги или идея?
Понятно, что тут нет однозначного ответа. Во второй половине 20 в. ИТ-индустрия сильно поменяла экономику в принципе, а ИИ-бум продолжает ее менять в начале 21 в. И кажется, что это влияние занимает собой прям все вокруг. Сейчас время, когда пока еще можно заработать хороший куш в айтишечке, но уже далеко не всем. Например, вкатываться в ИТ с нуля ради больших денег уже поздно (там высокая конкуренция), а вот ради идеи (..потому что вы придумали идею приложения или вам просто нравится кодить) - можно хоть когда. На кусочек хлеба с маслом можно заработать, даже делая сайты или кодя в 1С.
И когда ИИ-бум устаканится и денег в айтишечке будет как везде, то больше не придется “бить наемников” и вопрос отпадет сам собой.
#эссеИИстика
Companiesmarketcap
Apple (AAPL) - Market capitalization
As of March 2026 Apple has a market cap of $3.736 Trillion USD. This makes Apple the world's 3rd most valuable company according to our data.
👍2😁2
Конкурс ИИ-агентов
Давно не было конкурсов в этом канале, поэтому.. барабанная дробь..
🗣 Объявляю конкурс кастомных ИИ-агентов. 🗣
Собрать своего агента сегодня можно дажена коленке в Colab-ноутбуке и гуглотаблице. Главное, чтобы он делал что-то интересное и/или полезное.
Ваша миссия, если вы возьметесь за ее выполнение: создать собственного ИИ-агента, который автоматизирует одну или несколько рутинных задач в какой-то профессии. (Это может быть и бот для развлечения - профессия тут будет “контент-мейкер”.)
Присылайте ссылку на ваш код и краткое описание ИИ-агента на оценку уважаемому жюри. Жюри выберет трех лучших агентов, а от меня - памятные призы. Кто в жюри и по каким критериям они будут судить, напишу отдельно.
Важно‼ Код будет опубликован в этом канале и его Github-репозитории, так что участвуйте, только если готовы сделать свой труд публичным достоянием.
Что нужно подготовить
1⃣ описание задачи, которую автоматизирует ИИ-агент
2⃣ сценарий взаимодействия с агентом (краткосрочная память), например:
✔ просто запуск программы с фразой-триггером (сообщением, которое мы бы ввели в чате, начав его с ботом)
✔ input / окно ввода данных
✔ кнопка или диалог в чате, например, в телеграмме
3⃣ хранилище для данных, полученных ИИ-агентом и его решений (долгосрочная память), например:
✔ кэшированные данные и/или логи программы
✔ гуглотаблица или любой другой документ
✔ база данных
4⃣ алгоритм принятия решений на основе искусственного интеллекта:
✔ линейная, логистическая регрессия
✔ классический машобуч (SVM, Naive Bayes, деревья решений и т.д.)
✔ небольшая большая языковая модель (например, Qwen-8B)
✔ API с большой языковой моделью
📛 В коде не должно быть платных инструментов (например, моделей с API только по платной подписке), но можно использовать инструменты, которые требуют логин.
🫂 Пользоваться ИИ, чтобы написать код - приветствуется.
🏆 Призы (помимо фидбэка уважаемого жюри и лавров в моем канале): электронные подарочные сертификаты в магазин «Читай-город». Потому что книжка - лучший подарок.
Дедлайны
31 декабря включительно - заполняйте Google-форму (понадобится залить код ИИ-агента на облако и прикрепить ссылку на него)
31 января - итоги голосования и объявление победителей
🍀 Всем удачи! И да заменят нас в рутинных задачах ИИ-агенты! 👾
#конкурс
Давно не было конкурсов в этом канале, поэтому.. барабанная дробь..
🗣 Объявляю конкурс кастомных ИИ-агентов. 🗣
Собрать своего агента сегодня можно даже
Ваша миссия, если вы возьметесь за ее выполнение: создать собственного ИИ-агента, который автоматизирует одну или несколько рутинных задач в какой-то профессии. (Это может быть и бот для развлечения - профессия тут будет “контент-мейкер”.)
Присылайте ссылку на ваш код и краткое описание ИИ-агента на оценку уважаемому жюри. Жюри выберет трех лучших агентов, а от меня - памятные призы. Кто в жюри и по каким критериям они будут судить, напишу отдельно.
Важно‼ Код будет опубликован в этом канале и его Github-репозитории, так что участвуйте, только если готовы сделать свой труд публичным достоянием.
Что нужно подготовить
1⃣ описание задачи, которую автоматизирует ИИ-агент
2⃣ сценарий взаимодействия с агентом (краткосрочная память), например:
✔ просто запуск программы с фразой-триггером (сообщением, которое мы бы ввели в чате, начав его с ботом)
✔ input / окно ввода данных
✔ кнопка или диалог в чате, например, в телеграмме
3⃣ хранилище для данных, полученных ИИ-агентом и его решений (долгосрочная память), например:
✔ кэшированные данные и/или логи программы
✔ гуглотаблица или любой другой документ
✔ база данных
4⃣ алгоритм принятия решений на основе искусственного интеллекта:
✔ линейная, логистическая регрессия
✔ классический машобуч (SVM, Naive Bayes, деревья решений и т.д.)
✔ небольшая большая языковая модель (например, Qwen-8B)
✔ API с большой языковой моделью
📛 В коде не должно быть платных инструментов (например, моделей с API только по платной подписке), но можно использовать инструменты, которые требуют логин.
🫂 Пользоваться ИИ, чтобы написать код - приветствуется.
🏆 Призы (помимо фидбэка уважаемого жюри и лавров в моем канале): электронные подарочные сертификаты в магазин «Читай-город». Потому что книжка - лучший подарок.
Дедлайны
31 декабря включительно - заполняйте Google-форму (понадобится залить код ИИ-агента на облако и прикрепить ссылку на него)
31 января - итоги голосования и объявление победителей
🍀 Всем удачи! И да заменят нас в рутинных задачах ИИ-агенты! 👾
#конкурс
Telegram
Введение в искусственный интеллект
ИИ-агенты в тренде: мини-агент в Google Colab
На конец месяца я обычно оставляю всякую аналитику, но, когда писала прошлый пост про ИИ-агентов, подумала, что хранить новые данные для агента можно и в простой Google-таблице - не обязательно целую базу данных…
На конец месяца я обычно оставляю всякую аналитику, но, когда писала прошлый пост про ИИ-агентов, подумала, что хранить новые данные для агента можно и в простой Google-таблице - не обязательно целую базу данных…
🔥2👾1
Введение в искусственный интеллект pinned «Конкурс ИИ-агентов Давно не было конкурсов в этом канале, поэтому.. барабанная дробь.. 🗣 Объявляю конкурс кастомных ИИ-агентов. 🗣 Собрать своего агента сегодня можно даже на коленке в Colab-ноутбуке и гуглотаблице. Главное, чтобы он делал что-то интересное…»
Кому принадлежит ИИ-контент
Авторское право регулирует права авторов на их произведения; произведения должны быть оригинальными и творческими. Если речь не идёт об изобретении чего-то кардинально нового, все произведения имеют "something old and something new" - что-то, взятое от традиции и других мастеров, и что-то новое, привнесенное автором. Это касается любой сферы искусства, науки, инженерии.
В случае с ИИ-генераторами:
🧓 что-то старое привносит обучающая выборка
👶 что-то новое - наш промпт, контекст всего диалога и наши правки после генерации
Результат генерации, если это обговорено пользовательским соглашением, которое вы подписываете в приложении, остаётся вам, и вы становитесь правообладателем.
Кажется, все честно - как в любом творческом процессе. Но.. регулярно в новостях появляются осуждающие речи именитых авторов, обращения профсоюзов креативных индустрий, иски от правообладателей к производителям генеративного ИИ.
Какие тут подводные:
🙅 Авторы контента, который используется ИТ-компаниями для обучения моделей, не дают на это своего согласия. А законодательство (пока?) не требует от компаний получать такое согласие. Эта ситуация вызвана тем, что машинное обучение не так давно повсеместно заполонило нашу жизнь, и, что в нем регулировать, пока непонятно.
🧑🎤 Маловероятно, что продукт ИИ-генерации может быть настолько похож на чужое произведение, что речь уже будет идти не о самостоятельном произведении, а о так называемом производном. (Если вы в чужой картинке три пикселя поменяете, то это будет именно производное, а не ваша творческая работа.) Но генерация копирует узнаваемый стиль. Например, недавно завирусился генератор изображений в стиле Хаяо Миядзаки. Получается, привлекательность работе придает не то, что внёс новый автор, а что-то, что создано другим автором, например стиль.
👾 Авторы демотивируются создавать что-то новое из головы и все чаще прибегают к ИИ. В итоге Интернет заполняется частично или полностью сгенерированной ИИ-слизью. Потом она попадает в обучающие выборки, и качество сгенерирвоанного контента снижается.
Но пока никакой крупной катастрофы не произошло. Следовательно, можно ожидать, что авторское право в области ИИ-генерации будет оставаться довольно либеральным. А небольшие бизнесы будут иметь возможность быстро генерить маркетинговый контент, не нанимая команду креаторов и не тратясь на отчисления правообладателю (роялти).
#эссеИИстика
Авторское право регулирует права авторов на их произведения; произведения должны быть оригинальными и творческими. Если речь не идёт об изобретении чего-то кардинально нового, все произведения имеют "something old and something new" - что-то, взятое от традиции и других мастеров, и что-то новое, привнесенное автором. Это касается любой сферы искусства, науки, инженерии.
В случае с ИИ-генераторами:
🧓 что-то старое привносит обучающая выборка
👶 что-то новое - наш промпт, контекст всего диалога и наши правки после генерации
Результат генерации, если это обговорено пользовательским соглашением, которое вы подписываете в приложении, остаётся вам, и вы становитесь правообладателем.
Кажется, все честно - как в любом творческом процессе. Но.. регулярно в новостях появляются осуждающие речи именитых авторов, обращения профсоюзов креативных индустрий, иски от правообладателей к производителям генеративного ИИ.
Какие тут подводные:
🙅 Авторы контента, который используется ИТ-компаниями для обучения моделей, не дают на это своего согласия. А законодательство (пока?) не требует от компаний получать такое согласие. Эта ситуация вызвана тем, что машинное обучение не так давно повсеместно заполонило нашу жизнь, и, что в нем регулировать, пока непонятно.
🧑🎤 Маловероятно, что продукт ИИ-генерации может быть настолько похож на чужое произведение, что речь уже будет идти не о самостоятельном произведении, а о так называемом производном. (Если вы в чужой картинке три пикселя поменяете, то это будет именно производное, а не ваша творческая работа.) Но генерация копирует узнаваемый стиль. Например, недавно завирусился генератор изображений в стиле Хаяо Миядзаки. Получается, привлекательность работе придает не то, что внёс новый автор, а что-то, что создано другим автором, например стиль.
👾 Авторы демотивируются создавать что-то новое из головы и все чаще прибегают к ИИ. В итоге Интернет заполняется частично или полностью сгенерированной ИИ-слизью. Потом она попадает в обучающие выборки, и качество сгенерирвоанного контента снижается.
Но пока никакой крупной катастрофы не произошло. Следовательно, можно ожидать, что авторское право в области ИИ-генерации будет оставаться довольно либеральным. А небольшие бизнесы будут иметь возможность быстро генерить маркетинговый контент, не нанимая команду креаторов и не тратясь на отчисления правообладателю (роялти).
#эссеИИстика
👍3💘2❤1
Этика ИИ: ответственность - это новая нефть
Заканчиваю заявленные в сентябре посты редакторской колонкой.
А завтра будет.. барабанная дробь.. анонс на октябрь.
И да не устану я напоминать, что весь октябрь жду ваших ИИ-агентов - на конкурс с ценными призами 😍 См. пост в закрепе.
Этика ИИ - это скучная тема, которая прозвучала уже примерно из каждого утюга. При этом она, конечно, важная, т.к. затрагивает такие вопросы, как, например, ответственность разработчиков..
А что тут особо про ответственность разработчиков обсуждать? По-моему, обычно споры доходят до двух крайностей:
☝ если мы не разработаем, то кто-то другой это сделает вперед нас, и мы просто окажемся позади прогресса - "даешь laissez-faire (свободный рынок)"
☝ если разработчиков не обложить бюрократией, они своими разработками убьют экологию и человечество - "даешь вмешательство государства в экономику"
Недавно мне почему-то захотелось пересмотреть фильм 2014 года “Игра в имитацию” с БенедиктомКьюкумбером Камбербетчем.
⚠Внимание ⚠ Дальше будет спойлер.
Алан Тьюринг в команде с инженерами и учеными изобретает первый компьютер, который хакает Энигму - шифровальную машинку нацистов. В фильме это событие - переломный момент всей Второй мировой. При этом, как только команда расшифровывает первое сообщение, они обнаруживают, что на британский корабль планируется атака. И в команде есть человек, чей брат служит на этом корабле. Алан Тьюринг, конечно, делает очень многозначительное лицо и говорит, что нельзя передавать эту информацию военным, чтобы они отразили атаку - иначе немцы поймут, что Энигму хакнули, и сменят алгоритм шифрования.
..И вот тут я неожиданно для себя обнаруживаю, что этот фильм устарел (по крайней мере в моих глазах).
В 2025 г. в США запустили DOGE - департамент государственной эффективности по оптимизации расходов и сокращению бюрократии. Департамент возглавил Илон Маск - он же автор концепции. ИИ был активно задействован в работе. Маск интегрировал чатбот Grok и другие системы для анализа данных, выявления неэффективных расходов, автоматизации отчетности и даже мониторинга переписки сотрудников. Первоначальная цель сэкономить $2 трлн провалилась. Экономия составила $160–175 млрд, а затраты на реализацию достигли $135 млрд, что поставило под сомнение выгоду от проекта. Эксперимент завершился досрочно.
Когда кто-то берет на себя ответственность за большую и важную разработку, главное - это сделать многозначительное лицо. Чтобы все поверили, что именно он это сможет. И дали на это большой правительственный грант. А дальше хоть трава не расти.
Я не отказываю ученому Алану Тьюрингу в гениальности и масштабе его изобретения. Но кинематографический Алан Тьюринг, который еще и в военном деле разбирается, и судьбы людей может вершить, и чуть ли не Вторую мировую выиграл - это too much. В реальности, я думаю, военные сами разобрались, что им делать с расшифрованной Энигмой. Не-кинематографический Илон Маск берет ответственность за DOGE и.. ничего, все ок. Ну не получилось, бывает. Теперь мы знаем, у кого и что не получилось.
Так что сегодня новая нефть - это ответственность, а вовсе не Лабубу 😎
#эссеИИстика
Заканчиваю заявленные в сентябре посты редакторской колонкой.
А завтра будет.. барабанная дробь.. анонс на октябрь.
И да не устану я напоминать, что весь октябрь жду ваших ИИ-агентов - на конкурс с ценными призами 😍 См. пост в закрепе.
Этика ИИ - это скучная тема, которая прозвучала уже примерно из каждого утюга. При этом она, конечно, важная, т.к. затрагивает такие вопросы, как, например, ответственность разработчиков..
А что тут особо про ответственность разработчиков обсуждать? По-моему, обычно споры доходят до двух крайностей:
☝ если мы не разработаем, то кто-то другой это сделает вперед нас, и мы просто окажемся позади прогресса - "даешь laissez-faire (свободный рынок)"
☝ если разработчиков не обложить бюрократией, они своими разработками убьют экологию и человечество - "даешь вмешательство государства в экономику"
Недавно мне почему-то захотелось пересмотреть фильм 2014 года “Игра в имитацию” с Бенедиктом
⚠Внимание ⚠ Дальше будет спойлер.
Алан Тьюринг в команде с инженерами и учеными изобретает первый компьютер, который хакает Энигму - шифровальную машинку нацистов. В фильме это событие - переломный момент всей Второй мировой. При этом, как только команда расшифровывает первое сообщение, они обнаруживают, что на британский корабль планируется атака. И в команде есть человек, чей брат служит на этом корабле. Алан Тьюринг, конечно, делает очень многозначительное лицо и говорит, что нельзя передавать эту информацию военным, чтобы они отразили атаку - иначе немцы поймут, что Энигму хакнули, и сменят алгоритм шифрования.
..И вот тут я неожиданно для себя обнаруживаю, что этот фильм устарел (по крайней мере в моих глазах).
В 2025 г. в США запустили DOGE - департамент государственной эффективности по оптимизации расходов и сокращению бюрократии. Департамент возглавил Илон Маск - он же автор концепции. ИИ был активно задействован в работе. Маск интегрировал чатбот Grok и другие системы для анализа данных, выявления неэффективных расходов, автоматизации отчетности и даже мониторинга переписки сотрудников. Первоначальная цель сэкономить $2 трлн провалилась. Экономия составила $160–175 млрд, а затраты на реализацию достигли $135 млрд, что поставило под сомнение выгоду от проекта. Эксперимент завершился досрочно.
Когда кто-то берет на себя ответственность за большую и важную разработку, главное - это сделать многозначительное лицо. Чтобы все поверили, что именно он это сможет. И дали на это большой правительственный грант. А дальше хоть трава не расти.
Я не отказываю ученому Алану Тьюрингу в гениальности и масштабе его изобретения. Но кинематографический Алан Тьюринг, который еще и в военном деле разбирается, и судьбы людей может вершить, и чуть ли не Вторую мировую выиграл - это too much. В реальности, я думаю, военные сами разобрались, что им делать с расшифрованной Энигмой. Не-кинематографический Илон Маск берет ответственность за DOGE и.. ничего, все ок. Ну не получилось, бывает. Теперь мы знаем, у кого и что не получилось.
Так что сегодня новая нефть - это ответственность, а вовсе не Лабубу 😎
#эссеИИстика
🔥5
..Давно пора себе признаться, что я не хочу монтировать подкаст - это долго и муторно.
..С другой стороны, вроде и тема все еще актуальная, и содержание - многообещающее.
В общем, пора мне повзрослеть (((;◔ᴗ◔;))) истать поваром сварить уже этот подкаст: "А смысл?" - в котором я с зумерами и уважаемыми гостями ааа-смысляю пришествие искусственного интеллекта.
Поэтому в октябре-ноябре 2025 я буду постить две вещи:
((ඏ.̫ඏ*))
выпуски подкаста - 20-минутки аудио-рассуждений, примерно один выпуск в неделю
((ඏ.̫ඏ*))
новости конкурса ИИ-агентов - см. закрепленное сообщение
#анонс
..С другой стороны, вроде и тема все еще актуальная, и содержание - многообещающее.
В общем, пора мне повзрослеть (((;◔ᴗ◔;))) и
Поэтому в октябре-ноябре 2025 я буду постить две вещи:
((ඏ.̫ඏ*))
выпуски подкаста - 20-минутки аудио-рассуждений, примерно один выпуск в неделю
((ඏ.̫ඏ*))
новости конкурса ИИ-агентов - см. закрепленное сообщение
#анонс
🔥4❤2🍓1🦄1
И сразу объявляю.. барабанная дробь.. первого эксперта многоуважаемого жюри, которое выберет лучших ИИ-агентов:
Руслан Сибгатуллин
Ведущий разработчик на Go в cloud.ru.
Go - это язык программирования, изобретенный в компании Google (поэтому и называется Go). Его отличают простота и эффективность (благодаря удобному набору готовых функций). Go - один из самых популярных языков для микросервисных архитектур и фронтенда.
Микросервисы - это такие маленькие программы, которые выполняют одну четко поставленную задачу. Удобно для веб-разработки и приложений для бизнеса.
Cloud.ru - платформа, которая предоставляет облачные услуги: хранилища данных, сервисы, включая развертывание моделей машинного обучения.
#конкурс
Руслан Сибгатуллин
Ведущий разработчик на Go в cloud.ru.
Go - это язык программирования, изобретенный в компании Google (поэтому и называется Go). Его отличают простота и эффективность (благодаря удобному набору готовых функций). Go - один из самых популярных языков для микросервисных архитектур и фронтенда.
Микросервисы - это такие маленькие программы, которые выполняют одну четко поставленную задачу. Удобно для веб-разработки и приложений для бизнеса.
Cloud.ru - платформа, которая предоставляет облачные услуги: хранилища данных, сервисы, включая развертывание моделей машинного обучения.
#конкурс
🔥6👍3🙏2
Представляю следующего эксперта в жюри моего конкурса кастомных ИИ-агентов:
Анна Глазкова
Кандидат технических наук, доцент Тюменского госуниверситета, специалист группы нейроразметки в НКРЯ
Нейроразметка - это автоматическая разметка данных при помощи нейронных сетей. Что-то супер-сложное пока нейросетям доверять рано - за ними приходится много править. Но вот разбиение на отдельные слова и предложения, например, вполне себе делегируемая задача.
НКРЯ - Национальный корпус русского языка - это самая большая частично размеченная коллекция текстов на русском языке. Посмотреть можно тут.
А еще хочу немного сказать о критериях оценки. Каждый эксперт будет оценивать ваш проект по одному параметру по шкале от 1 до 5:
Руслан из Cloud.ru оценит масштабируемость решения - насколько современные платформы позволяют сделать вашего агента доступным для широких масс.
Анна из НКРЯ оценит адекватность ИИ-моделей, которые вы используете - хороши ли они для той задачи, которую вы им ставите.
#конкурс
Анна Глазкова
Кандидат технических наук, доцент Тюменского госуниверситета, специалист группы нейроразметки в НКРЯ
Нейроразметка - это автоматическая разметка данных при помощи нейронных сетей. Что-то супер-сложное пока нейросетям доверять рано - за ними приходится много править. Но вот разбиение на отдельные слова и предложения, например, вполне себе делегируемая задача.
НКРЯ - Национальный корпус русского языка - это самая большая частично размеченная коллекция текстов на русском языке. Посмотреть можно тут.
А еще хочу немного сказать о критериях оценки. Каждый эксперт будет оценивать ваш проект по одному параметру по шкале от 1 до 5:
Руслан из Cloud.ru оценит масштабируемость решения - насколько современные платформы позволяют сделать вашего агента доступным для широких масс.
Анна из НКРЯ оценит адекватность ИИ-моделей, которые вы используете - хороши ли они для той задачи, которую вы им ставите.
#конкурс
❤5👍2
Напоминаю, что жду ваших ИИ-агентов до 27 октября включительно - все подробности в закрепленном сообщении.
И следующий эксперт в жюри:
Александр Хлюпин
Вот так он себя представил:
Александр оценит безопасность вашего решения. Он реально работает в конторе, которая занимается кибербезопасностью - я точно знаю, т.к. это мой двоюродный братишка
ヾ(・ω・)メ(・ω・)ノ
#конкурс
И следующий эксперт в жюри:
Александр Хлюпин
Вот так он себя представил:
Безопасник. С ИИшками взаимодействую, когда припрет. Ранее пытался в них разбираться.
Александр оценит безопасность вашего решения. Он реально работает в конторе, которая занимается кибербезопасностью - я точно знаю, т.к. это мой двоюродный братишка
ヾ(・ω・)メ(・ω・)ノ
#конкурс
❤2🔥1🙏1
RAG в хату в Google Colab
ИИ-агентам нужны не только навыки хорошей коммуникации на любые темы, но и умение хранить и быстро искать специфическую информацию - например, о предыдущем диалоге с пользователем или о конкретных фактах или сущностях, которые не входят в круг общих тем. Это могут быть документы конкретной фирмы, или ваша дипломная работа, или архивные записи, которые не попали в Интернет. В общем какая-то коллекция информации в виде текстов.
Ранеена Discovery в этом канале я разбирала, как хранить эту информацию в Google таблице, а сегодня предлагаю вот такой легкий вариант RAG - retrieval-augmented generation (поиска, улучшенного генерацией): ноутбучек с кодом.
Этот пример я взяла из тьюториала с Хабра, в котором автор использует семейство моделей Ollama, чтобы генерить финальный ответ модели. Я, конечно, Ollama в Google Colab запустила - потому что ну как же я-то и не запущу, но если честно вайбы от этого запуска остались самые неприятные - ред флаг, господа, очень не рекомендую пользоваться Ollama в Колабе:
👉 в Колабе запускается через доп. библиотеку asyncio, а с ней у Колаба свои непонятки
👉 работает через раз
👉 непонятно, почему иногда срабатывает, а иногда нет
👉 регулярно выкидывает ошибку подключения
Думаю, что в Колабе лучше использовать другие проверенные модельки, а с Ollama работать локально (на своем компе) или на сервере - я пока сама не пробовала. Если вы пробовали, делитесь пж в комментариях.
А к чему я именно эту тему решила сегодня запостить? К тому, что вдруг она поможет вам в создании ИИ-агента для моего конкурса 😉 См. закрепленный пост.
#база #notebook #конкурс
ИИ-агентам нужны не только навыки хорошей коммуникации на любые темы, но и умение хранить и быстро искать специфическую информацию - например, о предыдущем диалоге с пользователем или о конкретных фактах или сущностях, которые не входят в круг общих тем. Это могут быть документы конкретной фирмы, или ваша дипломная работа, или архивные записи, которые не попали в Интернет. В общем какая-то коллекция информации в виде текстов.
Ранее
Этот пример я взяла из тьюториала с Хабра, в котором автор использует семейство моделей Ollama, чтобы генерить финальный ответ модели. Я, конечно, Ollama в Google Colab запустила - потому что ну как же я-то и не запущу, но если честно вайбы от этого запуска остались самые неприятные - ред флаг, господа, очень не рекомендую пользоваться Ollama в Колабе:
👉 в Колабе запускается через доп. библиотеку asyncio, а с ней у Колаба свои непонятки
👉 работает через раз
👉 непонятно, почему иногда срабатывает, а иногда нет
👉 регулярно выкидывает ошибку подключения
Думаю, что в Колабе лучше использовать другие проверенные модельки, а с Ollama работать локально (на своем компе) или на сервере - я пока сама не пробовала. Если вы пробовали, делитесь пж в комментариях.
А к чему я именно эту тему решила сегодня запостить? К тому, что вдруг она поможет вам в создании ИИ-агента для моего конкурса 😉 См. закрепленный пост.
#база #notebook #конкурс
Telegram
Введение в искусственный интеллект
ИИ-агенты в тренде: мини-агент в Google Colab
На конец месяца я обычно оставляю всякую аналитику, но, когда писала прошлый пост про ИИ-агентов, подумала, что хранить новые данные для агента можно и в простой Google-таблице - не обязательно целую базу данных…
На конец месяца я обычно оставляю всякую аналитику, но, когда писала прошлый пост про ИИ-агентов, подумала, что хранить новые данные для агента можно и в простой Google-таблице - не обязательно целую базу данных…
❤3
И финальный эксперт в жюри конкурса ИИ-агентов (см. закрепленное сообщение):
Кира Коваленко
Я попросила Киру оценить адекватность лингвистических технологий в вашем решении:
👉 как оформлены промпты
👉 как подобраны большие языковые модели
👉 как обрабатываются текстовые данные
#конкурс
Кира Коваленко
Научный сотрудник ИЛИ РАН, научный сотрудник и доцент Школы вычислительных социальных наук ЕУСПб. Занимаюсь историей лексикологии и лексикографии, веду проектный менеджмент, пишу в ТГ канал про названия растений @phytolex
Я попросила Киру оценить адекватность лингвистических технологий в вашем решении:
👉 как оформлены промпты
👉 как подобраны большие языковые модели
👉 как обрабатываются текстовые данные
#конкурс
🎉3❤2
Тизер
А-смысл
Ааа-смысл: тизер
А также.. 🥁🥁🥁 готов тизер подкаста "А смысл?", в котором я 🧐, пара зумеров (Саша 🤦♂️, Лиля 👩🏫 и Артем 👨💻) вместе с коллегами из социальных наук 👪 и айти-сферы 💻, а также вымышленный персонаж-робот-рептилоид по имени Ктуц 👾 ааа-смысляем искусственный интеллект 🤖
Не переключайтесь! 📺 Скоро запощу весь сезон 🙀
и пойду отпраздную в караоке 💃
#анонс
А также.. 🥁🥁🥁 готов тизер подкаста "А смысл?", в котором я 🧐, пара зумеров (Саша 🤦♂️, Лиля 👩🏫 и Артем 👨💻) вместе с коллегами из социальных наук 👪 и айти-сферы 💻, а также вымышленный персонаж-робот-рептилоид по имени Ктуц 👾 ааа-смысляем искусственный интеллект 🤖
Не переключайтесь! 📺 Скоро запощу весь сезон 🙀
и пойду отпраздную в караоке 💃
#анонс
👍3❤2🔥1
Ollama в Google Colaboratory
☕ Я начала утро не с Нескафе, а с какого-то другого экспериментального кофе, который купила на пробу в Магните, и... совместного написания кода вместе с Gemini-2.5-pro на чатбот-арене по перезапуску Ollama в Google Colaboratory. И.. нормальный код получился. Все работает! Вот бы с первого раза так.
Ноутбучек с нормальным кодом для Ollama в Colaboratory.
Важно☝ В параметрах ноутбука нужно выбрать T4 - запуск на графическом процессоре. Иначе будет долго грузить.
В чем плюсы Ollama - много моделей (ламы, квены, геммы, дипсики, фаи), довольно легковесных, без смс и регистрации, прямо тут, в вашем браузере.
И, конечно, напоминаю, что сегодня - дэдлайн для подачи ИИ-агентов на конкурс.
#notebook #конкурс
☕ Я начала утро не с Нескафе, а с какого-то другого экспериментального кофе, который купила на пробу в Магните, и... совместного написания кода вместе с Gemini-2.5-pro на чатбот-арене по перезапуску Ollama в Google Colaboratory. И.. нормальный код получился. Все работает! Вот бы с первого раза так.
Ноутбучек с нормальным кодом для Ollama в Colaboratory.
Важно☝ В параметрах ноутбука нужно выбрать T4 - запуск на графическом процессоре. Иначе будет долго грузить.
В чем плюсы Ollama - много моделей (ламы, квены, геммы, дипсики, фаи), довольно легковесных, без смс и регистрации, прямо тут, в вашем браузере.
И, конечно, напоминаю, что сегодня - дэдлайн для подачи ИИ-агентов на конкурс.
#notebook #конкурс
Google
llama_in_colab.ipynb
Colab notebook
🔥4
Промпт-инжиниринг эволюционирует в контекст-инжиниринг
Спасибо Интернету и анализу данных, мы теперь очень хорошо видим, что эволюция примерно любой технологии идет скачками. Вот и большие языковые модели достигли ограничений по длине контекста. Производители моделей больше не пытаются увеличить длину нашего диалога с моделью, чтобы мы поместили в него описание задачи и все данные, опираясь на которые эту задачу нужно решить. Теперь технология осваивает, как можно по-разному подавать данные и делать версию модели (ИИ-агента) под конкретную задачу.
Если ваш промпт состоит из задачи на 5% и из данных на 95%, то задача в нем как бы затирается, зашумляется данными. Следовательно, можно давать модели не все данные, а выжимку из них. Это можно сделать, отобрав данные вручную или создав отдельного ИИ-агента, который отберет их за вас. Тогда у вас будет уже мультиагентная архитектура. Отдельно надо продумать, какие данные релевантны, необходимы для вашей задачи, и организовать их в хранилище (пусть это будет даже обычная гуглотаблица).
Разрабы из компании Anthropic предлагают называть этот этап эволюции БЯМ контекст-инжинирингом. Уже не так важно, как вы задаете промпт - важнее, на какие специфические данные или выжимку из них должна опираться модель.
Перевод статьи от Антропика тут.
Цимес статьи и практические советы тут.
🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉
А пока новости по конкурсу: прислано всего два ИИ-агента. Это не очень интересно с точки зрения выбора победителей. И возможно, задача создания своего ИИ-агента пока что кажется слишком сложной и долгой.
❗Поэтому я решила продлить сроки конкурса до Нового года ❗
(Ребята, кто прислал свои работы, надеюсь вы не против подождать результатов.)
Буду писать больше об ИИ-агентах - надеюсь, их создание станет для вас как семечки щелкать.
Ну и если вы вдруг знаете кого-то, кому может быть интересен мой конкурс - перешлите им пж вот это сообщение.
#база #конкурс
Спасибо Интернету и анализу данных, мы теперь очень хорошо видим, что эволюция примерно любой технологии идет скачками. Вот и большие языковые модели достигли ограничений по длине контекста. Производители моделей больше не пытаются увеличить длину нашего диалога с моделью, чтобы мы поместили в него описание задачи и все данные, опираясь на которые эту задачу нужно решить. Теперь технология осваивает, как можно по-разному подавать данные и делать версию модели (ИИ-агента) под конкретную задачу.
Если ваш промпт состоит из задачи на 5% и из данных на 95%, то задача в нем как бы затирается, зашумляется данными. Следовательно, можно давать модели не все данные, а выжимку из них. Это можно сделать, отобрав данные вручную или создав отдельного ИИ-агента, который отберет их за вас. Тогда у вас будет уже мультиагентная архитектура. Отдельно надо продумать, какие данные релевантны, необходимы для вашей задачи, и организовать их в хранилище (пусть это будет даже обычная гуглотаблица).
Разрабы из компании Anthropic предлагают называть этот этап эволюции БЯМ контекст-инжинирингом. Уже не так важно, как вы задаете промпт - важнее, на какие специфические данные или выжимку из них должна опираться модель.
Перевод статьи от Антропика тут.
Цимес статьи и практические советы тут.
🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉🐉
А пока новости по конкурсу: прислано всего два ИИ-агента. Это не очень интересно с точки зрения выбора победителей. И возможно, задача создания своего ИИ-агента пока что кажется слишком сложной и долгой.
❗Поэтому я решила продлить сроки конкурса до Нового года ❗
(Ребята, кто прислал свои работы, надеюсь вы не против подождать результатов.)
Буду писать больше об ИИ-агентах - надеюсь, их создание станет для вас как семечки щелкать.
Ну и если вы вдруг знаете кого-то, кому может быть интересен мой конкурс - перешлите им пж вот это сообщение.
#база #конкурс
🔥3❤2🙏1👌1🤝1