AI Для Всех
12.8K subscribers
1.17K photos
152 videos
10 files
1.37K links
Канал, в котором мы говорим про искусственный интеллект простыми словами

Главный редактор и по рекламе: @crimeacs

Иногда пишут в канал: @GingerSpacetail, @innovationitsme
Download Telegram
За последние 7 лет я довольно много переезжал, видимо для того что бы добраться до Калифорнии.

Пробыв тут чуть меньше недели могу сказать, что тут очень очень круто. С одной стороны это такая большая деревня, с другой, это очень лухари деревня и в ней есть все те услуги и сервисы к которым мы привыкли в больших городах.

Еще немножко адаптируюсь и буду писать в канал чаще. А пока, о чем вам было бы инетерсно прочитать про мой опыт в Долине?

(промпт !dream [description], Clean Cel shaded vector art. Shutterstock. behance hd by lois van baarle, artgerm, Helen huang, by makoto shinkai and ilya kuvshinov, rossdraws, illustration)
Forwarded from DLStories
Ну и раз уж мы про диффузионные модели: все же знают, что они используются не только для генерации картинок?

Вот, например, свежая статья о диффузии для speech enhancement. Подобные задачи, где нужно избавиться от шума, вообще просто идеально подходят для решения диффузией: идея работы диффузионных моделей как раз состоит в том, чтобы взять объект, последовательно добавлять к объекту шум, а затем обучить нейросеть восстанавливать изначальный объект из этого шума. Ну ребята из IEEE и применили диффузию к speech enhancement, причем архитектура их нейросети заимствована прямо из работ по генерации картинок =) Работает это хорошо, сравнимо с SOTA моделями. Более того, авторы утверждают, что их метод достигает лучшей генерализации, чем предыдущие подходы.

Ссылки:
Статья
Код на Github

Ну и пара ссылок для тех, кто хочет лучше вникнуть в то, как работают диффузионные модели и кто как зачем их сейчас применяет:
✔️ Статья-введение в diffusion models
✔️ Гитхаб-репо со ссылками на статьи/видео/лекции о diffusion models и score-matching models (это нашла в эйай ньюз)
Андрей Карпати (ex Tesla AI) выложил новую лекцию

«!!!! Итак, я записал (новую!) 2h25m лекцию "The spelled-out intro to neural networks and backpropagation: building micrograd".
Это кульминация примерно 8 лет навязчивых мыслей о том, как лучше объяснить нейронные сети и обратное распространение.

Если вы знаете Python, смутно помните, как проходили производные в средней школе, посмотрите это видео и к концу не поймете обратное распространение и суть нейронных сетей, тогда я съем ботинок :D»

Смотреть
Считается за ИИ контент? 😂
Deep-learning seismology

Сейсмология - наука о сейсмических волнах, которая ставит перед собой цель понять их происхождение. Наиболее очевидными источниками сейсмических волн являются землетрясения, но такие волны возникают также в следствие взрывов, извержения вулканов и тп.

Сейсмические волны регистрируются непрерывно, с типичной частотой дискретизации 100 точек в секунду.

Развитие технологии сейсмических датчиков, таких как оптоволоконный кабель и акселерометры в интеллектуальных устройствах, предвещает дальнейшее увеличение объемов сейсмологических данных.

Способность глубокого обучения к последовательному моделированию данных и снижению размерности - все это выгодно для обработки сейсмических данных. Глубокое обучение для научных открытий и прямого извлечения информации о сейсмологических процессах, очевидно, только начинается.

Мой профессор Greg Beroza написал большую обзорную статью в Science про будущее DL в Сейсмологии, которую я очень рекомендую к прочтению.
Сижу тут на PhD защите автора канала @earth_climate_tech, хоть канал и называется climate, защита на удивление про нефтяночку (причём норвежскую, которой я занимался в Лукойле в Осло).

Толик (вы его кстати видели в фильме у Дудя) молодец! Удачи будущий Dr. Aseev.
Forwarded from TechSparks
Генерация фотореалистичных картинок — это прекрасно. Но мне иногда по старинке хочется запечатлеть на память те места физического мира, где я побывал телесно. Потому и люблю фото, и не только на телефон. И страдаю от проблем в условиях малой освещенности; сегодняшние ухищрения цифровой фотографии типа очень длинной экспозиции при цифровой стабилизации спасают далеко не всегда: шумы на изображении оказываются неустранимы и портят картинку безобразно.
И вот выясняется, что гугловая технология NeRF, применяемая для рендеринга 3D сцен по набору плоских фоток, замечательно подходит для восстановления зашумленных картинок, полученных в условиях очень слабого освещения. Ждём следующего прорыва в фоторедакторах и в мобильной вычислительной фотографии
https://petapixel.com/2022/08/23/google-researchers-add-powerful-denoise-tool-to-nerf-ai-program/
Accurate prediction of transition metal ion location via deep learning

Около половины структурно охарактеризованных белков содержат ион металла. Ионы металлов играют решающую роль для многих приложений, таких как дизайн ферментов или дизайн белок-белковых взаимодействий. Однако вычислительный дизайн металлопротеинов - это очень ресурсоемкая задача.

В статье авторы показывают два инструмента - Metal3D (основанный на трехмерных сверточных нейронных сетях) и Metal1D (основанный исключительно на геометрических критериях) для улучшения идентификации и локализации цинка и других ионов металлов в экспериментальных и вычислительно предсказанных структурах белков.

Metal3D выдает метрику доверия для каждого предсказанного сайта и работает на белках с небольшим количеством гомологов в банке белковых данных.

Metal3D доступен в виде простого в использовании веб-приложения, блокнота или интерфейса командной строки.

📖 статья 📇 код 🤩 демо
Forwarded from DLStories
Анонс!

В понедельник (29.08) я буду записывать новый выпуск подкаста Deep Learning Stories, и мне нужны ваши вопросы гостю =)

Гость выпуска — Артемий Новоселов, постдок рисерчер в Stanford University и автор канала NN for Science. В Стенфорде Артемий занимается ML в сейсмологии.

В выпуске обсудим:
- путь Артемия в рисерче: как добраться до Стенфорда;
- что такое землетрясения и какими методами их пытаются предсказывать;
- AI в сейсмологии: как применяется сейчас, какие есть проблемы и какое видится будущее.

Выпуск будет не живой, выложу я уже запись. Сейчас под этим постом у вас есть возможность задать вопросы Артемию. В понедельник при записи выпуска мы добавим эти вопросы в программу.

Вопросы Артемию ⬇️
Forwarded from Борис опять
В инженерном блоге Толоки вышла (с немалой моей помощью) такая статья, что даже здесь хочется поделиться. Ребята из мобильной команды в деталях рассказывают детективную историю, как реализовали блюр лиц на эдж девайсах.

https://medium.com/toloka/privacy-and-speed-the-story-behind-our-face-blurring-solution-46ffa3514ed5
Посоветуйте художественную литературу, что бы прям на одном дыхании хотелось читать.

Последнее от чего я не мог оторваться - это Project Hail Mery. А до этого, наверное, зачитывался серией Стража-Стража Пратчетта.
Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
Пошло в массы. Теперь уже появился плагин для Фотошопа со Stable Diffusion. Дизайнеры, вы там держитесь! И покупайте видеокарты побольше!

Getalpaca.io

@ai_newz
Tesla продолжает судиться за право называть свои автомобили беспилотными. В этом месяце завершился суд против Теслы, инициированный немецкой антимонопольной службой. Изначально против компании было выдвинуто обвинение, что использование терминов “autopilot” и “self-driving” в отношении их системы помощи водителю является вводящим в заблуждение. Разбирательство продолжалось больше двух лет, передавалось в более высокие инстанции и закончилось в итоге победой автопроизводителя.

Интересно, повлияет ли этот прецедент на предстоящее разбирательство по аналогичному вопросу в США. В начале августа Калифорнийский DMV отправил две жалобы на тему “ложных и вводящих в заблуждение названий” в Управление административных слушаний. Если они выиграют суд, то дело может дойти вплоть до отзыва лицензии на “беспилотные” фичи или хотя бы на более строгую маркировку и более убедительное объяснение пользователям реальных возможностей системы.

От себя добавлю, что я желаю DMV успехов в этой борьбе. Мне порой хочется сделать себе футболку с надписью “Тесла — это не беспилотник” и носить ее, не снимая. Каждый раз, когда в разговоре про беспилотники всплывает вопрос про Теслу, мое давелние подскакивает и кровь начинает стучать в висках. Тогда я делаю глубокий вдох и объясняю, что это принципиально разные вещи, и принципиально разные подходы к разработке, когда у тебя есть контур безопасности в лице человека за рулем, и когда его нет. И так до следующего собеседника. Хотя вот перестали же люди спрашивать про дилемму вагонетки в контексте беспилотников, глядишь, и с этим разберутся.

https://www.theverge.com/2022/8/6/23294658/california-dmv-accuses-tesla-false-claims-autopilot-full-self-driving-autonomous-vehicles
Forwarded from Earth&Climate Tech
Этого шлифа не существует

Не знаю зачем им это было нужно, но на IMAGE22 ребята из Саудовской Аравии и Колумбии показали нейронку, которая генерирует изображения петрографических шлифов такого качества, что ни один из экспертов не смог отличить их от настоящих. Aрхитектура довольно известная, зовется StyleGAN, широким массам известна в качестве генераторов фейковых, но супер реалистичных изображений (например лиц селебритиз).

Красиво! Вдруг вы петрографов знаете. Вот для них подгон по ссылке:
This thin section doesn’t exist: on the generation of synthetic petrographic datasets
This media is not supported in your browser
VIEW IN TELEGRAM
Использование искусственного интеллекта для декодирования речи из активности мозга

В Meta разработали модель ИИ, которая может декодировать речь на основе неинвазивных записей активности мозга.

На основе трех секунд мозговой активности модель может декодировать соответствующие сегменты речи с точностью до 73% от верхнего предела из словарного запаса в 793 слова, т.е. большую часть слов, которые люди обычно используют в повседневной жизни.

В качестве модели используют wav2vec2, в качестве данных ЭЭГ и МЭГ (более 150 часов записей 169 здоровых добровольцев, слушавших аудиокниги и изолированные предложения на английском и голландском языках).

Результаты исследования показывают, что self-supervised learning (#SSL) может успешно декодировать воспринимаемую речь на основе неинвазивных записей активности мозга, несмотря на шум и изменчивость, присущие этим данным.

📇 блог-пост
📖 статья
Forwarded from Earth&Climate Tech
Приезжайте в Стэнфорд на пост-док!

Ребята, я уже рассказывал, что в Стэнфорде открывается новая огромная школа Устойчивого развития (School of Sustainability) на базе инженерной школы и школы Земли.

В связи с этим Стэнфорд будет набирать 30 пост-доков на программы, связанные с устойчивым развитием и новыми прорывами в источниках зелёной энергии.

Все это называется Stanford Energy Postdoctoral Fellowship. Зарплата $85К в год + $8К на конференции и прочие научные расходы + местные бенефиты типа страховки. По местным меркам немного, но деньги здесь не самое главное.

Подать заявку тут, описание тут

Условия уникальные. Нам тут очень не хватает родных лиц из стран бывшего СССР.

P.S. PhD only
Как и обещали, выкладываем нашу внутреннюю полуторачасовую лекцию про AI Safety!

Первая часть посвящена базовой информации и истории развития ML как области, чтобы лекция была понятной даже тем, кто пока мало про это знает.

Вторая часть будет интересна в том числе людям из индустрии:
⚡️ Что такое AI Safety и AI Alignment?
⚡️ Почему эти проблемы важны и какие есть загвоздки с простыми ответами?
⚡️ Какие направления решений сейчас исследуются?

В самом конце мы немного говорим про классные компании, связанные с AI Safety, для которых мы нанимаем.

Лекцию читает наш замечательный @paletskikh. Если вам интересно подискутировать про это или обсудить варианты работы в области — смело пишите Лёше в личку!
Forwarded from DLStories
А мы наконец открываем набор на осенний семестр школы глубокого обучения Deep Learning School!
#learning

DLschool — это школа при ФПМИ МФТИ, где мы учим нейронным сетям с самых азов до продвинутого уровня. Полный курс состоит из двух частей, каждая из которых длится полгода.
- Первая часть посвящена введению в нейросети и компьютерному зрению. Начинаем мы с языка Python и необходимой математики для понимания нейросетей, переходим к основам машинного обучения и обработки картинок, заканчиваем переносом стиля изображений и ГАНами.
- Вторая часть полностью посвящена темам NLP и обработки звука.

Две части курса можно проходить независимо. Можно пройти только первую часть или только вторую. Но обратите внимание, что для прохождения второй части нужно знать Python, понимать математику и основы нейросетей, о которых мы рассказываем в первой части курса.

Особенность нашей школы в том, что мы даем много практики (теория при этом тоже есть, разумеется, и немало). Вам предстоит много практических домашних заданий и самостоятельный итоговый проект в конце семестра. По окончании обучения вы точно получите нужные практические навыки работы с нейросетями.

Сейчас идет набор на первую часть курса. На вторую часть набор откроется чуть позже, об этом сообщу отдельно.

Преподаватели школы — ведущие специалисты российских и зарубежных IT-компаний и научные сотрудники исследовательских лабораторий МФТИ. Среди них — я (Таня), буду вести у вас несколько лекций про CV, сегментацию и архитектуры сетей =)

Школа бесплатная. Полностью онлайн: учиться можно из любой точки мира, где есть интернет. Занятия проходят раз в неделю — лекция, семинар и домашнее задание. Обучение проходит на платформе Stepik. Берем всех, отбора нет.

Начинаем 19 сентября. Регистрация продлится до 18 сентября. Чтобы зарегистрироваться на курс, отсавьте заявку на этой странице. После этого вам на почту придет письмо со ссылками на курс на Степике, на канал и чат в Телеграме.

При регистрации вам нужно выбрать поток — базовый или продвинутый. Как выбрать свой поток, читайте на сайте в разделе FAQ. Также у нас есть группа школы ВКонтакте — там очень удобно следить за новостями.

Ответы на самые часто задаваемые вопросы по курсу вы также можете найти на сайте в разделе FAQ. Если остались вопросы, спрашивайте в комментариях к этому посту ⬇️ Постараюсь ответить на все. Также если в канале есть выпускники наших прошлых потоков, буду благодарна, если вы поделитесь своим опытом прохождения курса и поможете отвечать на вопросы =)

Ну и ждем вас в чатиках наших курсов в новом семестре!🥰

P.S. Обратите внимание, что у школы сменился адрес сайта. Новый адрес: dls.samcs.ru
MEG-MASC: a high-quality magneto-encephalography dataset for evaluating natural speech processing

Набор данных "MEG-MASC" представляет собой набор необработанных записей магнитоэнцефалографии (МЭГ) 27 носителей английского языка, которые слушали два часа различных историй.

Каждый участник выполнил две одинаковые сессии, включающие прослушивание четырех вымышленных историй из аннотированного вручную подкорпуса (MASC), перемежающихся со случайными списками слов и вопросами на понимание. В метаданных записи авторы датасета даже отметили время начала и смещения каждого слова и фонемы и организовали набор данных в соответствии со "Структурой данных визуализации мозга" (BIDS).

Этот набор данных проводить крупномасштабный анализ кодирования и декодирования темпорально-пространственных реакций мозга на речь.

Код и данные
Статья
Media is too big
VIEW IN TELEGRAM
Last Week Tonight with John Oliver сделали целый выпуск с генерациями в Midjourney

И в этом видео открывается самая интересная часть text2image моделей, они позволяют быстро визуализировать креатив, создавая новый юмор.

Нейростендапы на подходе, когда смешной текст буквально за секунды превращается в визуализацию.

Возвращаясь к шоу, здесь показаны не только лучшие работы, которые отобрались с John Oliver, но и самая дикая идея превратилась в готовую юмористическую сцену.

Полный выпуск