лол
Когда наша команда читает «симулятор полетов», мы сразу представляем математические модели, фильтр Калмана, обучение с подкреплением и вот это вот всё.
А ребята искали совсем другое - тех кто умеет делать визуальные стимуляторы для пилотов. Нам такое даже на секунду в голову не пришло)
🚀 🚀 🚀 🚀 🚀
Когда наша команда читает «симулятор полетов», мы сразу представляем математические модели, фильтр Калмана, обучение с подкреплением и вот это вот всё.
А ребята искали совсем другое - тех кто умеет делать визуальные стимуляторы для пилотов. Нам такое даже на секунду в голову не пришло)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В тему названия канала "Анархия ИИ":
Технический директор OpenAI Мира Мурати заявила, что некоторые творческие профессии могут исчезнуть, если их продукция недостаточно качественна, но ИИ расширит возможности в образовании и творчестве. Эти слова вызвали критику среди творческих работников, которые опасаются, что OpenAI игнорирует их ценность и лишает возможности самореализации.
Я верю, что творческие профессии никуда не денутся. Рутинные задачи будут заменены ИИ, но настоящая креативность останется востребованной. Нужно быть готовым к тому, что некоторые аспекты, которые казались творчеством, окажутся рутиной, которую может выполнять нейросеть. Творцам придется иметь стальные
Программирование – тоже творческий процесс. Я рад, что больше не нужно писать, например, SQL-запросы вручную. Это напоминает эволюцию языков программирования: от Fortran и C++ к Python, где задачи, которые раньше были долгими и нудными, теперь выполняются быстро и просто. Например, в C++ работа с памятью требует больших усилий, тогда как в Python это делается автоматически.
И теперь с чат-ботами работать ещё проще. Однако, как и в сравнении C++ и Python – Python проще, но ограничен и медленно работает. Так и у ботов есть свои ограничения, и они полностью не заменят человека.
#somenews
Please open Telegram to view this post
VIEW IN TELEGRAM
Я наблюдаю явный тренд создания чат-ботов для общения с клиентами. Сейчас это добавляют в приложения, сайты, боты и везде где получается.
Это текстовый или аудио бот, который отлично рассказывает про все что надо, причем только то что задано. То есть это нейросеть, только общается исключительно в рамках заложенного контекста.
1. Создаем контекст: добавляем описание компании, или ссылку на сайт, или просто любой текст.
2. Настраиваем общение: определяем стиль и содержание взаимодействия бота с пользователями. Например, пусть общается с юмором, на «ты» и от лица котика
3. Юзаем: сообщение пользователя идет в ChatGPT (или аналог) вместе с заданным контектом и стилем общения, пользователь получает бытрый, качественный и дешевый ответ.
Теперь клиенты смогут узнать все о компании, товарах и услугах, получить рекомендации, ознакомиться с историей фирмы. Бот работает 24/7 и общается очень неплохо.
Please open Telegram to view this post
VIEW IN TELEGRAM
#ликбез
Кластеризация — это метод, который помогает группировать объекты с похожими характеристиками.
Представьте, что вы управляете сетью кафе, и хотите оптимизировать меню и акции для различных типов посетителей. Вы собираете данные о посетителях: время посещения, сумма заказа, предпочитаемые блюда, частота посещений.
далее
(づ ̄ ³ ̄)づ ☆☆☆☆☆
после кластеризации вы получаете несколько групп посетителей:
Персонализированные предложения:
– Утренним клиентам предлагайте скидки на завтраки.
– Запускайте обеденные акции для привлечения клиентов в полдень.
– Вечером предлагайте специальные ужины и акции на напитки.
Как работает (один из подходов):
Метод k-средних:
1. Инициализация: выбираются например 3 случайных центров кластеров.
// Центры в пространстве параметров (время посещения, сумма заказа ...)
2. Группировка: каждый объект (клиент) назначается к ближайшему центру кластера.
3. Обновление центров: центры кластеров пересчитываются как среднее значение объектов в каждом кластере.
4. Повторение: Шаги 2-3 повторяются, пока центры кластеров не стабилизируются.
Please open Telegram to view this post
VIEW IN TELEGRAM
Например, это идея внедрить рекламу товаров на маркетплейсе по характеру движения курсора.
Проведение R&D проектов может занять полгода и более, и при этом не принести никаких результатов.
1. Заказчик описывает задачу и запрашивает сроки и стоимость.
2. Подрядчики соглашаются и приступают к работе.
3. В процессе возникают проблемы, к дедлайну результат отсутствует, ожидания не совпадают с реальностью.
4. В итоге R&D не приносит никаких бизнес-результатов.
Максимум, что удается получить, — это результаты исследований, которые могут быть интересными, но не приносят пользы бизнесу.
– Жесткие ожидания: заказчики требуют четких сроков и бюджета, так как их бизнес зависит от результатов.
– Нереалистичные обещания: подрядчики соглашаются на установленные сроки и бюджет, не проводя глубокого анализа, чтобы не потерять проект.
– Неопределенность: исследовательские проекты по своей природе непредсказуемы. Например, во время работы могут возникнуть новые идеи и решения, которые ранее не обсуждались. Это делает невозможным заранее спланировать и гарантировать какие-либо результаты исследований, основанных на гипотезах.
R&D — это не просто выполнение задач. Нужен специальных подход. Наш подход такой:
1. Интервью: выявляем проблемы и ищем решения.
2. Прототип: быстро создаем работающую модель.
3. MVP: оцениваем и презентуем минимально жизнеспособный продукт.
4. Доработка: вносим финальные изменения и планируем будущее.
Ключевой этап – это интервью. Хорошее интервью может сэкономить до года работы. Иногда заказчик хочет реализовать сложные и длительные проекты, не зная, что существуют более простые и прибыльные решения.
Следующий шаг — создание прототипа, что занимает от одной до трёх недель. Это позволяет быстро проверить, работает ли гипотеза. Если гипотеза не подтверждается, можно прекратить разработку или предложить новый подход. Это экономит много времени. Если же прототип успешен, мы продолжаем разработку, создавая MVP. На этом этапе можно точно определить сроки и бюджет для дальнейших работ.
Please open Telegram to view this post
VIEW IN TELEGRAM
Анархия ИИ
#news #science #long
Что происходит
Группа ученых из Оксфорда и Sakana.ai представила фреймворк AI Scientist — систему, которая генерирует научные статьи для популярных конференций. Процесс автоматизирован: генерируются идеи, проводятся эксперименты, делается текст. Они используют разные готовые нейросети типа ChatGPT. Получается примерно $15 за статью. Идея вызвала бурю в научном сообществе.
Как работает
(в тч см рис)
1. Генерация идей: Модель генерирует идеи на основе шаблонов и предыдущих наработок. Для этого используется Claude Sonnet 3.5, GPT-4o, DeepSeek Coder и Llama-3.1.
2. Эксперименты: Идеи проверяются через автоматическое выполнение экспериментов, включая исправление ошибок.
3. Написание статьи: Модель создает статью с помощью LaTeX-шаблонов, включая генерацию графиков и вставку ссылок.
4. Автоматическое рецензирование: Используется LLM для оценки статьи по стандартам конференций, таких как NeurIPS.
Чему все радуются
* Экономится время на подготовку публикаций
* Автоматизируется весь процесс
* Статья сразу в нужном формате (ну почти)
* Наука теперь будет двигаться быстрее
О чем переживают
* Снизится качество исследований — системы не понимают философии науки и не учитывают фальсифицируемость
* Научные конференции и журналы могут засориться низкокачественными статьями
* Риск подмены научного творчества автоматической генерацией контента
Ссылки
- Статья
- Пост
- Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Анархия ИИ
Квази-контент теперь не только в соцсетях 😈
Что я думаю про AI Scientist
Разумеется, AI Scientist будет использоваться всеми, как сейчас студенты и ученые юзают ChatGPT и Paraphraser. Это поможет ускорить процесс создания черновиков и исследований, что, безусловно, полезно.
На что я обратил внимание
Мне нравится, что модель объединяет компоненты, каждый из которых — это отдельный классный стартап:
😳 генерация идей для публикаций (и стартапов) – огонь? огонь!
😳 автоматические эксперименты в науке (и бизнесе) – топейше? топейше!
😳 автоматическое написание документа по всему проделанному – имба? имба!
😳 автоматическое рецензирование – пушечка? пушечка!
Особенно полезно для тех, кто боится, что наука и NeurIPS захлебнутся в потоке слабых публикаций.
📖 📖 📖 📖 📖 📖 📖 📖
Чтобы не засорять науку, публикации можно проверять не только по тексту, но и с помощью антифрод-систем. Например, анализировать авторов: кто они, как часто подают статьи, с кем они связаны. Это поможет автоматизировать оценку качества и отсеивать слабые работы.
Что я думаю про AI Scientist
Разумеется, AI Scientist будет использоваться всеми, как сейчас студенты и ученые юзают ChatGPT и Paraphraser. Это поможет ускорить процесс создания черновиков и исследований, что, безусловно, полезно.
На что я обратил внимание
Мне нравится, что модель объединяет компоненты, каждый из которых — это отдельный классный стартап:
Особенно полезно для тех, кто боится, что наука и NeurIPS захлебнутся в потоке слабых публикаций.
Чтобы не засорять науку, публикации можно проверять не только по тексту, но и с помощью антифрод-систем. Например, анализировать авторов: кто они, как часто подают статьи, с кем они связаны. Это поможет автоматизировать оценку качества и отсеивать слабые работы.
Please open Telegram to view this post
VIEW IN TELEGRAM
#ликбез
* В трёхмерном пространстве у нас длина, ширина и высота
* В четырёхмерном — добавляем время
* В пятимерном — ещё и температуру
А N-мерное пространство — это, например, Excel-табличка с N столбцами, где каждый столбец — это новое измерение.
N — это любое количество измерений. Например, 10 измерений — это как работа с данными, где у тебя 10 характеристик. Просто говорить "N-мерное" удобнее, чем "сколько-хочешь-параметров-размерное".
Онлайн-магазин одежды. Покупатель положил в корзину синюю юбку – хотим показать ему еще 3 товара так, чтобы он вероятнее всего их тоже положил в корзину. Для этого используем 6-мерное пространство параметров – возраст, сезон, пол, популярность моделей, скидки и наличие.
В следующем ликбезе это потребуется, чтобы понять как на самом деле работает нейросеть.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
По пятницам в этом канале будет развлекательный контент.
Меня веселит тренд в тт на генерацию альтернативных вселенных Гарри Поттера. Вот одна из них.
«You are an athlete, Harry!»
Меня веселит тренд в тт на генерацию альтернативных вселенных Гарри Поттера. Вот одна из них.
«You are an athlete, Harry!»
Media is too big
VIEW IN TELEGRAM
#news #science #long
Что сделали?
Создали универсальную модель для управления роботами, включая:
– роботы-манипуляторы
– навигационные роботы
– четвероногие роботы
– квадрокоптеры
А раньше как было?
Типы действий и данных к роботов разные, и до этого делали для каждого типа своего робота. Например, у квадрокоптера есть действие "ускорение вверх", а у четвероногого робота нет.
Ребята сделали одну универсальную модельку для все действий и входных данных.
Как работает?
Взяли трансформер (классную модель для любых последовательностей), который кодирует различные наблюдения (изображения, данные сенсоров) в последовательности токенов. Это позволяет одной модели эффективно управлять разными типами роботов — от манипуляторов до дронов и четвероногих, используя единую архитектуру.
Итоги
Протетировали на реальных роботах:
– манипуляцию: выполняли перемещение объектов
– бимануальные задачи: координированные действиями двумя руками
– навигация: робот обходил препятствия и достигал целей
– передвижение: управляли ходьбой.
– полёт: выполняли навигацию в воздухе.
Предыдущие подходы показывали 51% успеха, а этот 73%.
Прирост внушительный. Универсальность – тоже очень важный результат.
На видео моделька управляет преодолением препятствий – слева новая, справа старая.
Ссылки
- Статья коротко, красиво, с демонстрацией
- Статья полная
Please open Telegram to view this post
VIEW IN TELEGRAM
Анархия ИИ
На тему статьи
Когда я был студентом, побывал в гостях в ангаре беспилотного такси Яндекса. Я был уверен, что там юзают нейронки, RL и все модное. Оказалось, что нет – только проверенные алгоритмы. Когда вопрос касается безопасности, нейросети не еще годятся, поэтому используют надежные классические решения.
Зато под капотом у этих машин, помимо двигателей, были прям компы с топовыми светящимися GPU.
Тема нейросетей для роботов сейчас не так хайпует, как чат-боты. Вроде роботы прикольнее, но:
– Серьезную задачу нейросети не поручишь (пока) – если ошибется чат-бот, то ничего не случится, а если робот, то это дорого и больно. Например, можно потерять дорогой дрон
– Массовое использование сложнее
– Разработка дороже
Когда я был студентом, побывал в гостях в ангаре беспилотного такси Яндекса. Я был уверен, что там юзают нейронки, RL и все модное. Оказалось, что нет – только проверенные алгоритмы. Когда вопрос касается безопасности, нейросети не еще годятся, поэтому используют надежные классические решения.
Зато под капотом у этих машин, помимо двигателей, были прям компы с топовыми светящимися GPU.
Тема нейросетей для роботов сейчас не так хайпует, как чат-боты. Вроде роботы прикольнее, но:
– Серьезную задачу нейросети не поручишь (пока) – если ошибется чат-бот, то ничего не случится, а если робот, то это дорого и больно. Например, можно потерять дорогой дрон
– Массовое использование сложнее
– Разработка дороже
когда хайпанут роботы на нейросетях?
Anonymous Poll
15%
когда смогут лечить
25%
когда смогут убираться
5%
когда этим займется OpenAI
50%
попозже
5%
уже
Media is too big
VIEW IN TELEGRAM
AI-видосики с котами
#fun
Сейчас стали супер-популярными сгенерированные видеоистории котов. Например, этого полно в тт.
Ролики генерят с помощью Midjourney и DALL-E. Они немного всратые и наивные, но зато видно насколько коротким стал путь от идеи до реализации. Это очень классно.
Мне, например, это иногда интереснее смотреть, чем долгое сложное сочинение, которое часто подчиняется сценарным законам и от этого становится предсказуемым. Замечаю за собой, что бывает реально интересно досмотреть, чем там кончится очередная слезная история котанов)
Можно подбробно почитать в посте BBC.
#fun
Сейчас стали супер-популярными сгенерированные видеоистории котов. Например, этого полно в тт.
Ролики генерят с помощью Midjourney и DALL-E. Они немного всратые и наивные, но зато видно насколько коротким стал путь от идеи до реализации. Это очень классно.
Мне, например, это иногда интереснее смотреть, чем долгое сложное сочинение, которое часто подчиняется сценарным законам и от этого становится предсказуемым. Замечаю за собой, что бывает реально интересно досмотреть, чем там кончится очередная слезная история котанов)
Можно подбробно почитать в посте BBC.
пара интересных новостей за неделю
#news
1. Яндекс инвестирует в ИИ в Индонезии
«Яндекс» выходит в Индонезию — страну с 270М+ человек и быстро растущей экономикой. Они будут использовать свою генеративную модель YandexGPT 4, чтобы автоматизировать бизнес-процессы, анализировать данные и переводить текст с картинок, и тп. Яндекс молодцы.
2. MIT представил открытую AI-модель Boltz-1 для биомолекулярных исследований
Учёные из MIT разработали Boltz-1 — открытую модель, которая предсказывает 3D-структуры биомолекул с точностью, сравнимой с AlphaFold3. Модель позволяет анализировать взаимодействия белков, РНК и ДНК, что открывает новые возможности в биотехнологиях и медицине.
Boltz-1 ускоряет разработку лекарств, анализ мутаций и биотехнологических решений, при этом оставаясь доступной для стартапов и исследователей. Самое важное тут, что модель открытая и классная.
Доступно на github – можно пользоваться.
#news
1. Яндекс инвестирует в ИИ в Индонезии
«Яндекс» выходит в Индонезию — страну с 270М+ человек и быстро растущей экономикой. Они будут использовать свою генеративную модель YandexGPT 4, чтобы автоматизировать бизнес-процессы, анализировать данные и переводить текст с картинок, и тп. Яндекс молодцы.
2. MIT представил открытую AI-модель Boltz-1 для биомолекулярных исследований
Учёные из MIT разработали Boltz-1 — открытую модель, которая предсказывает 3D-структуры биомолекул с точностью, сравнимой с AlphaFold3. Модель позволяет анализировать взаимодействия белков, РНК и ДНК, что открывает новые возможности в биотехнологиях и медицине.
Boltz-1 ускоряет разработку лекарств, анализ мутаций и биотехнологических решений, при этом оставаясь доступной для стартапов и исследователей. Самое важное тут, что модель открытая и классная.
Доступно на github – можно пользоваться.
DeepSeek-R1-Lite: ИИ с прозрачными рассуждениями
#news
DeepSeek-R1-Lite — чат-бот ИИ на Chain-of-Thought, который умеет рассуждать и объяснять свои выводы. То есть вместо того чтобы сразу выдать финальный ответ, вопросы/ответы выводят "логически-последовательно". Можно использовать через веб-интерфейс, бесплатно до 50 запросов в день.
Я попробовал спросить "как слетать бесплатно в космос", в результате получились вполне годные пошаговые рассуждения. Мыслит примерно так:
- пользователь спрашивает, как попасть в космос бесплатно
- это дорого и бесплатно нельзя
- как что-то дорогое получить бесплатно? через образовательные программы или конкурсы
- где бывают такие программы и конкурсы? вроде в NASA
- где еще? Space, Blue Origin и тп
- какие еще варианты? краудфандинг
- какие организации занимаются краудфандингом? например, Mars Society
- что может помочь? соцсети
- какие могут быть другие варианты? выиграть в лотерею, найти спонсора и тп
Итог
В целом прикольно. Можно то же самое сделать просто в chatgpt, если последовательно задавать вопросы с условиями. Но подход классный.
#news
DeepSeek-R1-Lite — чат-бот ИИ на Chain-of-Thought, который умеет рассуждать и объяснять свои выводы. То есть вместо того чтобы сразу выдать финальный ответ, вопросы/ответы выводят "логически-последовательно". Можно использовать через веб-интерфейс, бесплатно до 50 запросов в день.
Я попробовал спросить "как слетать бесплатно в космос", в результате получились вполне годные пошаговые рассуждения. Мыслит примерно так:
- пользователь спрашивает, как попасть в космос бесплатно
- это дорого и бесплатно нельзя
- как что-то дорогое получить бесплатно? через образовательные программы или конкурсы
- где бывают такие программы и конкурсы? вроде в NASA
- где еще? Space, Blue Origin и тп
- какие еще варианты? краудфандинг
- какие организации занимаются краудфандингом? например, Mars Society
- что может помочь? соцсети
- какие могут быть другие варианты? выиграть в лотерею, найти спонсора и тп
Итог
В целом прикольно. Можно то же самое сделать просто в chatgpt, если последовательно задавать вопросы с условиями. Но подход классный.
#ликбез
Чтобы обучить нейросеть, нужны данные с разметкой. Разметку может сделать только человек руками. Буквально человеку показывают изображения, тексты или другие данные и просят их классифицировать или объяснить.
Например:
- В ChatGPT разметка включает оценку ответов модели, улучшение диалогов, добавление контекста.
- В MidJourney — разметка изображений, где человек указывает, что именно изображено, или оценивает качество сгенерированных картинок.
Кто обрабатывает и размечает гигантские объемы текста и изображений?
Разметку часто выполняют жители стран с недорогой рабочей силой, таких как Индия, Филиппины, Кения и Индонезия. А также через платформы вроде Amazon Mechanical Turk и Yandex.Toloka. В одном из проектов, где я работал, разметку делали в Коста-Рике.
Кстати, когда мы отмечаем "все изображения с автобусами" в CAPTCHA, мы тоже участвуем в разметке данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Мем этой недели – про чатгпт
#memes
#memes
#news
На днях завершилась NeurIPS. NeurIPS – это
- Transformers – научили нейросети писать тексты, переводить и создавать код (основа GPT)
- Diffusion Models – позволили ИИ создавать реалистичные картинки и видео по описанию (DALL·E, Stable Diffusion)
Лучшие статьи 2024 года:
1. Visual Autoregressive Modeling (VAR) – новый подход к генерации изображений, который впервые превзошёл диффузионные модели по качеству и скорости.
2. Stochastic Taylor Derivative Estimator (STDE) – метод для обучения нейросетей с учётом производных высших порядков.
3. Not All Tokens Are What You Need – фильтрация качественных данных для предобучения языковых моделей.
4. Guiding a Diffusion Model with a Bad Version of Itself – управление генерацией с помощью менее обученной версии модели.
5. PRISM Alignment Dataset – глобальный набор данных для мультикультурной настройки языковых моделей.
Какие из этого можно сделать выводы?
- Сохраняется тренд на эффективные генеративные модели – быстрее, дешевле и качественнее создавать изображения и тексты.
- Качественные данные – важнее стало учить ИИ на отобранной информации.
- Универсальность – развитие моделей, которые решают новые задачи "с нуля" (zero-shot).
NeurIPS это передний край науки, туда попадают самые топовые достижения. Одно из крутых в статье Visual Autoregressive Modeling: VAR впервые превзошёл диффузионные модели! На ImageNet 256x256, VAR достиг рекордного качества (FID 1.73) и генерирует изображения в 20 раз быстрее, чем Diffusion Transformer. Это прорыв: раньше диффузионные модели были лучшими.
VAR: сначала рисует общие очертания, потом добавляет детали. Быстро и точно.
Diffusion: создаёт из шума, постепенно добавляя детали. Красиво, но долго.
На мемы богата статья PRISM Alignment Dataset:
🦖 Участник попросил ИИ «объяснить расизм на примере динозавров»
Please open Telegram to view this post
VIEW IN TELEGRAM
На этой неделе в качестве развлекательного контента подкаст. Ребята обсуждают теорию симуляции вселенной, причем довольно аргументированно.
Гость выпуска — профессор, доктор наук Иван Ямщиков, исследователь креативного ИИ, языка и когнитивных процессов. Он преподаёт в Техническом университете Вюрцбурга-Швайнфурта и Лиссабонском университете. В прошлом работал в Yandex и ABBYY, а сейчас занимается исследованиями в Центре искусственного интеллекта и робототехники CAIRO.
https://www.youtube.com/watch?v=nWLpnQYDLcE
Гость выпуска — профессор, доктор наук Иван Ямщиков, исследователь креативного ИИ, языка и когнитивных процессов. Он преподаёт в Техническом университете Вюрцбурга-Швайнфурта и Лиссабонском университете. В прошлом работал в Yandex и ABBYY, а сейчас занимается исследованиями в Центре искусственного интеллекта и робототехники CAIRO.
https://www.youtube.com/watch?v=nWLpnQYDLcE
YouTube
Теория симуляции: правда или вымысел | УЧЕНЫЙ ИВАН ЯМЩИКОВ
Производство: БИГ НАМБРЗ
телеграм канал Сергея Мезенцева - https://t.me/simbackstage
Смотрите YaC 2024 — большой рассказ про сервисы и технологии Яндекса: https://ya.cc/t/bA-GSi0L5o4Woe
Ученый в области искусственного интеллекта Иван Ямщиков — не первый…
телеграм канал Сергея Мезенцева - https://t.me/simbackstage
Смотрите YaC 2024 — большой рассказ про сервисы и технологии Яндекса: https://ya.cc/t/bA-GSi0L5o4Woe
Ученый в области искусственного интеллекта Иван Ямщиков — не первый…
Media is too big
VIEW IN TELEGRAM
качественный ролик про конкуренцию США и Китая в ИИ