AI & Robotics Lab
18 subscribers
71 photos
26 videos
9 files
100 links
Explore AI code generation, robotics, and ROS with original projects and hands-on guides. Follow along as I share my experience, code samples, and tips for building intelligent systems.
Download Telegram
🔫 Когда они окружили дом, и в каждой руке был ствол...

Как себя вести, если вы подверглись нападению робособак? Они уже окружили ваш дом и пытаются проникнуть в него? Или вы подверглись нападению на улице? Никогда не задумывались о подобных вопросах? Тогда ролик Нow to disable a robot dog if it attacks you обязателен к просмотру - предупрежден, значит вооружен 😏

#fun
😁1
🤖 Теория мертвого интернета

Согласно ей, в интернете почти не осталось живых людей, а весь контент генерируют боты.

Давно подозревал, что в этом канале статьи пишут машины, теперь мои сомнения развеялись полностью 😕

Мда, пока не очень понял как к подобным вещам относиться, ведь я сам активно пользуюсь ИИ для поиска материала и обсуждения своих заметок, но когда видишь, что работа просто поставлена на конвейер, то не могу сказать, что мне это нравится. 🤨

#thoughts
🤔2
Forwarded from Дата-сторителлинг (Андрей Дорожный)
📈Как понять, что тексты блоггеру пишет нейросеть
Недавно в запрещенной социальной сети xxx Тамара Эйдельман (иноагент) выпустила пост с явными артефактами использования нейросетей. Все резко возмутились, а один чувак решил спарсить все посты из её тг канала и проверить, когда началось использование нейронок.

🎱 Использование тире вместо дефиса – один из косвенных признаков использования нейроредакторов. С начала 2023 наблюдается такой рост

🌮 Выросла доля использования буквы ё, но, возможно, просто сменился редактор

🍟 уменьшилась частота ошибки с использованием двойного пробела, что тоже косвенно говорит об использовании нейросети

Не имею ничего против нейросетей, тексты в этом канале пишет человек, если что.

Автор исследования @timuret
🤷‍♂1
👾 Jules - исполнительный, но безынициативный джун

Добрался, наконец, до того, чтобы потестить полноценного ИИ агента для кодинга Jules от Google - писал о нем ранее. Он пока бесплатный, дают 60 задач на день (правда, у меня почему-то на след. день счетчик не сбросился 😕).

Для работы ему нужно предоставить доступ к GitHub (похоже, что использует MCP), и, вуаля, в проекте появляется новый разработчик.

Решил поработать с ним над своим новым проектом pdf2mp3 по созданию аудиокниг: с меня jupyter notebook с рабочим прототипом + полноценный README с описанием итогового решения, с Jules - все остальное - т.е. полный код проекта, включая тесты.

#CodeGeneration #agents
👾1
С задачей, агент, в целом, справился, но есть нюансы.

📃 Работа идет по плану. В отличие от простого обсуждения проекта / кода в чат-боте или даже от взаимодействия с ИИ-помощниками типа Copilot, в данном случае, первым шагом является генерация плана, его агент будет стараться придерживаться и уточнять у пользователя вопросы по ходу, если что-то пойдет не так. Поэтому нужно максимально четко и полно формулировать задание и проверять план - в режиме чата есть возможность подправить / дополнить план до того, как агент возьмет его в работу. Почуствуй себя тимлидом 😎.

🐘 Слона надо есть по кусочкам. Если план согласован, то агент будет просто пытаться сделать то, как сказано. Ответственность за архитектуру проекта, решения по нюансам реализации и прочие сложные вопросы пока остаются за пользователем. Чтобы не терять контроль, нужно делать декомпозицию и выстраивать план пошагового решения небольших задач, с чем уже Jules неплохо справляется.

💾 Ограничение окружения. Для работы агента в облаке разворачивается виртуальная среда. Google, конечно, контора мощная и демонстрирует аттракцион невиданной щедрости, дав всем бесплатный доступ. Но все имеет предел и мой проект, который требует скачивания torch (зависимость kokoro размером ~850 Mb) в выделенное окружение не влез 😢 Поэтому полноценно сделать его без тестовых прогонов на своей машине я пока не смог.

Итого. Полноценные ИИ агенты-кодеры - вещь однозначно годная: поставил задачу, пошел пить кофе, машина работает. Дело сделано - присылает уведомление, двигаемся дальше. Джунам сейчас не позавидуешь... Уверен, что с развитием технологии, дойдет и до лидов: агент, который будет следить за проектом в целом и раскидывать задачи своим "подчиненным".

#CodeGeneration #agents
1
Forwarded from Machinelearning
📌 ICONIQ: Плейбук архитектора ИИ-систем 2025.
 
Iconiq Capital опросила 300 руководителей ИИ-стартапов с доходом от $10 млн. до $1 млрд. о том, как эти стартапы используют ИИ и собрала результаты в отчет "ICONIQ AI Builder’s Playbook 2025"

Iconiq Capital - американская компания по управлению инвестициями, основанная в 2011 году. Функционирует как гибридный семейный офис и имеет тесные связи с компанией Марка Цукерберга. Компания предоставляет услуги по инвестиционному менеджменту, частному капиталу, венчурным инвестициям, управлению недвижимостью и филантропии для состоятельных семей и организаций.


▶️Очень кратко:

Эра экспериментальных ИИ-демо закончилась. Сейчас компании массово переходят к боевому использованию генеративных моделей - и тут уже не про «вау», а про ROI, стоимость инференса и объяснимость.


🟡AI-native vs AI-enabled

Компании, с нативными ИИ-продуктами, сильно опережают тех, кто "добавил ИИ". Почти половина стартапов нативных ИИ-продуктов уже достигла масштабирования (47% против 13% у ретрофитеров).

В продуктовом портфеле такой типовой компании в среднем 2,8 модели и они активно идут по пути агентных сценариев, причем многие строят архитектуру с возможностью быстрого свапа моделей.


🟡Ценообразование и монетизация.

ИИ ломает старые цены и бизнес-модели. 38% компаний используют гибридное ценообразование (подписка + плата за использование), ещё 19% — только за использование а 6% уже экспериментируют с outcome-based моделями.

Пока 40% включают ИИ в премиум-пакет, но 37% планируют пересмотреть подход, учитывая реальные метрики использования и отдачу.

🟡Команда и расходы. 

ИИ перестал быть задачей «R&D-уголка». В быстрорастущих компаниях до 37% инженеров работают над ИИ, а AI/ML-инженеров нанимают в среднем за 70+ дней. И это большая проблема.

ИИ забирает до 20% R&D-бюджета, причем по мере роста проекта расходы смещаются с найма в сторону инференса и инфраструктуры.

 
🟡Инструменты и инфраструктура. 

68% компаний используют только облако, ещё 64% сидят на внешних API. OpenAI/GPT - лидер (81%), но растет доля мульти-модельных подходов (Claude, Gemini, Mistral и др.).

NVIDIA по-прежнему доминирует в инференсе: TensorRT и Triton используют 60% команд, но и ONNX Runtime (18%) с TorchServe (15%) укрепляют позиции.

Из инструментов для оркестрации лидируют LangChain и Hugging Face, а для мониторинга — Datadog и LangSmith (~17%). MLOps по-прежнему на MLflow (36%) и Weights & Biases (20%).


🟡Что тормозит развитие. 

Самое сложное в развертывании продуктов оказалось не в коде, а в доверии и эффективности:

42% компаний говорят о проблемах доверия и объяснимости, 39% — не могут показать ROI, 38% — борются с галлюцинациями, а 32% — с высокой стоимостью инференса, а доступ к GPU — проблема лишь для 5%.

Главный вывод: чтобы внедрить ИИ, одной модели не достаточно, еще нужно обосновать ее бизнес-ценность и держать под контролем поведение.
 
🟡ИИ внутри стартапов.

77% команд используют ИИ для помощи в разработке (GitHub Copilot почти у всех), 65% — для генерации контента, 57% — для поиска знаний.
Те, у кого ИИ активно используется получают 15–30% прироста эффективности. Самые распространенные юзкейсы: кодинг, аналитика, поиск по внутренней документации.


Самое неожиданное
Несмотря на популярность OpenAI, стоимость API и непредсказуемость инференса — головная боль даже у тех, кто платит миллионы в месяц.


🔜 Ознакомиться с полным отчетом

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒1
🪄 Приручить магию ИИ

То, как корпорации внедряют ИИ, мне почему-то сильно напомнило Hextech из сериала Аркейн - не совсем понятно как работающая технология (в сериале это именно магия), но ее можно использовать ради общего блага (загнать в удобные рамки). Правда, есть некоторые побочные эффекты... Кто не видел сериал - рекомендую: очень красивая графика и есть над чем подумать в плане сюжета.

#thoughts
🔥1
🌅 Каждый должен быть счастливым

Иногда чувствую себя 🦕 (Рожденный в СССР - ДДТ - как раз про +/- мое поколение). Смена экономической и идеологической систем в 90-е происходила со скоростью торнадо ("ты вчера был хозяин империи, а теперь сирота") - не было времени обдумывать и размышлять над устройством нового миропорядка. Требовалось быстро адаптрироваться к новой реальности. К чему это я? Трава, конечно, была зеленее 🥬, но сейчас не об этом.

Чтобы лучше анализировать события и тренды, нужно разбираться в той социокультурной системе, частью которой они являются. Возьмем сферу развлечений: индустрия видеоигр приносит столько же доходов, сколько фильмы и музыка вместе взятые. Я не играл в игры уже лет 20 (зато кино очень люблю 😁), поэтому для меня новости из этого мира, как например инвестиции в скины (внешний вид оружия) - как вести с другой планеты.

Сильно прокачать понимание устройства современного общества мне помогла книга Жана Бодрийяра Общество потребления, вышедшая еще в далеком 1970-м. Отрывок из главы "Принуждение к наслаждению" :

"...Одно из лучших доказательств того, что принципом и целью потребления не является наслаждение, состоит в том, что последнее сегодня принудительно и утверждается не как право или удовольствие, а как долг гражданина.

Пуританин рассматривал самого себя, свою собственную личность как предприятие, обязанное приносить плоды для наибольшей славы Бога. Его «личные» качества, его «характер», в формировании которого он проводил свою жизнь, были для него капиталом для своевременного инвестирования, для управления ими без спекуляции и расточительства. В противоположность этому, но таким же образом потребителю вменяется обязанность наслаждаться, он становится предприятием по наслаждению и удовлетворению. Он как бы обязан быть счастливым, влюбленным, расхваливающим (расхваленным), соблазняющим (соблазненным), участвующим, эйфорическим и динамичным. Это принцип максимизации существования через умножение контактов, отношений, через интенсивное употребление знаков, объектов, через систематическое использование всех возможностей наслаждения. ...

... Отсюда оживление универсальной любознательности (это понятие нужно исследовать) в области кухни, культуры, науки, религии, сексуальности и т. д. «Try Jesus!» – гласит американский лозунг. («Попробуйте (с) Иисусом!») Нужно все попробовать, ибо человек потребления одержим страхом «упустить» что-либо, упустить наслаждение, каким бы оно ни было. Никогда не известно, извлечет ли из вас тот или иной контакт, тот или иной опыт (Новый год на Канарах, угорь в виски, Prado, L.S.D., любовь по-японски) «ощущение». ..."

Мой канал, конечно, больше про технологии, но если посмотреть несколько со стороны, то они выступают лишь инструментом для достижения "счастья" в том виде, в котором оно понимается в обществе. Из этого корня, насколько я вижу, берут начало такие вещи как экономика внимания, попытки использовать ИИ для построения утопических сообществ, построение метавселенных, даже поклонение ИИ. Развитие ИТ и появление ИИ открывают совершенно новые горизонты для создания и потребления виртуальных продуктов, заключающих в себе образы, символы и знаки - такие, как скины оружия. Уверен, много дивных и чудных открытий мы еще увидим на этом пути 😁

#futurism
🆒1
🛏 Сказки на ночь

Уже не помню, когда читал что-нибудь из худ-лит в обычном бумажном варианте. Давно и прочно подсел на аудиокниги - скоротать время в поездке или перед сном побывать в каком-нибудь из фантастических миров: Властелин Колец, Гарри Поттер, Пространство (The Expanse)...

Сейчас слушаю книги на английском и недавно добрался до серии Песни Гипериона Дена Симмонса. Обычно, в сети много сайтов, где можно послушать онлайн, но в этом случае, из 4-х книг почему-то возникли проблемы с третьей - Эндимион - удалось найти ее только на YouTube (что не очень удобно для такого формата). Книгу читает приятный женский голос, и я поначалу даже не понял, что это синтезированная речь. Какое-то время я с удовольствием ее слушал, удивляясь качеству генерации, пока ролик не заблокировали (еще один минус YT).

Что делать - надо дочитывать, поэтому я полез на HuggingFace искать самые популярные модели TTS (text to speech).
1
Forwarded from AI & Robotics Lab
На первом месте по загрузкам - coqui/XTTS-v2 - поработав с ней понял, что не мое. А вот следующая hexgrad/Kokoro-TTS оказалась именно то, что нужно.

Для английского языка в модели почти 30 голосов - как мужских, так и женских - что-нибудь сгенерировать и послушать как они звучат можно здесь.

Модель с открытыми весами, ее использование максимально просто и удобно - все разворачивается в виртуальном окружении. Места, правда, занимает 5.6 Гб. Зато для работы не нужна видеокарта: на моем ноуте с Ryzen 5 4500U двухчасовой ролик генерируется где-то минут за 50.

Чтобы было удобно пользоваться - сделал небольшой проект pdf2mp3, обернув модель в CLI утилиту: работает как в Linux, так и в Win. Можно выбирать языки (русского, к сожалению, пока нет), голоса, скорость (важно для иностранного языка) и прочие параметры. Генерирует из pdf файла сразу в mp3 - подробное описание как установить и пользоваться.

#projects #kokoro #tts
🔥1🆒1
🎮 Play the game

Еще одна интересная цитата из книги Общество потребления Жана Борийяра:
"... Гаджет фактически определяется связанной с ним практикой, которая не принадлежит ни к утилитарному, ни к символическому типу, а представляет собой игровую деятельность. Именно игровая деятельность все более управляет нашими отношениями к вещам, к людям, к культуре, досугу, иногда к труду, а кроме того, к политике. Именно игровая деятельность придает господствующую тональность нашему повседневному поведению в той мере, в какой все предметы, блага, отношения, услуги становятся гаджетом. ... Здесь наши домашние гаджеты вновь соединяются с игральными автоматами, ... с компьютером дрогсторов, со щитком приборов автомобиля и всем «серьезным» техническим оборудованием от телефона до вычислительной машины, которое составляет современную «обстановку» труда, все то, с чем мы играем более или менее сознательно, захваченные действием, ребяческим открытием и манипуляцией, смутным или страстным любопытством к «игре» механизмов, игре цветов, игре вариантов. ... Посмотрите на электрический бильярд: игрок погружается в шум, сотрясения и мигание машины. Он играет с электричеством. Нажимая на кнопки, он сознает, что вызывает флюиды и потоки сквозь мир разноцветных нитей, такой же сложный, как нервная система.

Есть в его игре эффект магического участия в науке. Чтобы в этом убедиться, нужно понаблюдать в кафе собравшуюся толпу, окружающую мастера по ремонту, как только он открывает машину. Никто не понимает этих соединений и схем, но все принимают этот странный мир как первое и бесспорное данное. Ничего общего с отношением всадника к лошади, или рабочего к своему инструменту, или ценителя к произведению искусства: здесь отношение человека к объекту является магическим, то есть зачарованным и манипулятивным. ..."

Так что геймификация всего и вся появилась далеко не сегодня (книга вышла уже более полувека назад) и тогда уже технологии воспринимались как часть магического мира - просто до наших закоулков эта волна докатилсь с заметным отставанием от передовых кап. стран. Думаю, можно с уверенность сказать, что тренд на увеличение рынка видеоигр еще только набирает обороты - маленькая верхняя зона VR|AR еще только ждет тех технологий, которые смогут раскрыть ее потенциал, чтобы полноценно погрузить пользователей в виртульную реальность. А затем подойдут прямые интерфейсы мозг-компьютер типа Neuralink (забавно, что именно способность играть в видеоигры стала ее первым "достижением") - и это создаст еще один слой на этом пироге 🍰

#Thoughts
👾1