Кроме всем известных Midjourney и Stable Diffusion есть немало других годных, но неизвестных широкой публике генеративных нейронок. Мы собрали лучшие из них в один пост
И добавили полезные штуки на основе нейросетей: убиратор водных знаков, апскейлер, векторизатор и продвинутые файловые менеджеры
awdee.ru/14-non-obvious-neurons-for-the-designer
#awd_tool #awd_webtool #awd_neuralart #awd_techno
Please open Telegram to view this post
VIEW IN TELEGRAM
Новая структура промтов для Midjourney v6
Перевод треда Татьяны Цигулевой о том, как составлять промты для шестой версии Midjourney, чтобы получать точные результаты
В треде автор перечислила аспекты, которые нужно учесть в промте. Это тема, стиль, обстановка, композиция, освещение и информация о дополнительных объектах на картинке
awdee.ru/midjourneys-new-prompt-structure
#awd_article #awd_ml #awd_neuralart #awd_techno #awd_midjourney
Перевод треда Татьяны Цигулевой о том, как составлять промты для шестой версии Midjourney, чтобы получать точные результаты
В треде автор перечислила аспекты, которые нужно учесть в промте. Это тема, стиль, обстановка, композиция, освещение и информация о дополнительных объектах на картинке
awdee.ru/midjourneys-new-prompt-structure
#awd_article #awd_ml #awd_neuralart #awd_techno #awd_midjourney
Оди. О дизайне
Новая структура промтов для Midjourney v6 — Оди. О дизайне
Перевод треда Татьяны Цигулевой о том, как составлять промты для шестой версии Midjourney, чтобы получать точные результаты. В треде автор перечислила аспекты, которые нужно учесть в промте. Это тема, стиль, обстановка, композиция, освещение и информация…
This media is not supported in your browser
VIEW IN TELEGRAM
AR-очки Frame c ИИ-функциями
В канадском стартапе Brilliant Labs разработали очки дополненной реальности с мультимодальным ИИ-помощником Noa. Он умеет распознавать предметы и звуки из окружающей обстановки, искать информацию о них в интернете, а также переводить тексты и речь в режиме реального времени
Производители решили сделать акцент на симпатичный дизайн. В отличие от большинства AR-очков Frame выглядят стильно, а не гиково. Они весят всего 39 граммов и внешне почти не отличаются от обычных очков
Интересно, что Frame — опенсорсные. Разработчики имеют доступ ко всей необходимой документации, коду, чертежам и могут самостоятельно кастомизировать ПО
Frame доступны для предзаказа за 349 $. Доставить их обещают в апреле 2024 года
Сайт-презентация: brilliant.xyz
Больше картинок: awdee.ru/ar-glasses-frame-with-ai-functions
#awd_techno
В канадском стартапе Brilliant Labs разработали очки дополненной реальности с мультимодальным ИИ-помощником Noa. Он умеет распознавать предметы и звуки из окружающей обстановки, искать информацию о них в интернете, а также переводить тексты и речь в режиме реального времени
Производители решили сделать акцент на симпатичный дизайн. В отличие от большинства AR-очков Frame выглядят стильно, а не гиково. Они весят всего 39 граммов и внешне почти не отличаются от обычных очков
Интересно, что Frame — опенсорсные. Разработчики имеют доступ ко всей необходимой документации, коду, чертежам и могут самостоятельно кастомизировать ПО
Frame доступны для предзаказа за 349 $. Доставить их обещают в апреле 2024 года
Сайт-презентация: brilliant.xyz
Больше картинок: awdee.ru/ar-glasses-frame-with-ai-functions
#awd_techno
Вышла нейросеть Claude 3. Она превосходит GPT-4 и Gemini Ultra почти во всех тестах
Anthropic — ведущий стартап в области ИИ, поддерживаемый Amazon. Они представили серию ИИ-моделей Claude 3: Opus, Sonnet и Haiku. Все три модели — мультимодальные. Это означает, что они умеют работать с текстом, графиками, документами и фотографиями. На их основе можно разрабатывать чат-боты, инструменты автоматического заполнения и извлечения данных
Opus — самая большая и дорогая модель. Её создатели утверждают, что она превосходит ChatGPT-4, GPT-3.5 и Gemini Ultra по целому ряду показателей. Например, по результатам нескольких академических тестов: GSM-8k на математическое мышление, а также GPQA и MMLU на общий уровень знаний
Sonnet — модель среднего уровня. Она ориентирована на повышение экономичности и ускорение работы бизнеса. И Opus, и Sonnet уже доступны для тестирования на сайте claude.ai и через API компании
Самая маленькая модель Haiku появится чуть позже. Но даже она показывает впечатляющие результаты. В своём блоге представители компании заявляют, что Haiku может «прочитать научную статью с графиками и диаграммами менее, чем за три секунды»
Стоит уточнить, что GPT-4 вышла год назад. Более актуальную версию GPT-4 Turbo авторы Claude 3 в сравнение не включили
#awd_news #awd_techno
Anthropic — ведущий стартап в области ИИ, поддерживаемый Amazon. Они представили серию ИИ-моделей Claude 3: Opus, Sonnet и Haiku. Все три модели — мультимодальные. Это означает, что они умеют работать с текстом, графиками, документами и фотографиями. На их основе можно разрабатывать чат-боты, инструменты автоматического заполнения и извлечения данных
Opus — самая большая и дорогая модель. Её создатели утверждают, что она превосходит ChatGPT-4, GPT-3.5 и Gemini Ultra по целому ряду показателей. Например, по результатам нескольких академических тестов: GSM-8k на математическое мышление, а также GPQA и MMLU на общий уровень знаний
Sonnet — модель среднего уровня. Она ориентирована на повышение экономичности и ускорение работы бизнеса. И Opus, и Sonnet уже доступны для тестирования на сайте claude.ai и через API компании
Самая маленькая модель Haiku появится чуть позже. Но даже она показывает впечатляющие результаты. В своём блоге представители компании заявляют, что Haiku может «прочитать научную статью с графиками и диаграммами менее, чем за три секунды»
Стоит уточнить, что GPT-4 вышла год назад. Более актуальную версию GPT-4 Turbo авторы Claude 3 в сравнение не включили
#awd_news #awd_techno
Наушники Stereophones с тактильным интерфейсом
Когда мы слушаем музыку, мы не видим наушники. Поэтому сенсорные интерфейсы в наушниках требуют запоминания комбинаций из нажатий и жестов пролистывания. Это сложно и неудобно
Производители Stereophones придумали наушники с интуитивным тактильным управлением. Они решили дать внешним крутящимся дискам интуитивно понятные функции управления, которые легко запомнить
Прокручивая диск на левом наушнике, можно включать и выключать систему, регулировать громкость и шумоподавление. На правом можно ставить музыку на паузу и запускать воспроизведение, а также переключаться между треками. Можно переключиться на альтернативный режим и с помощью диска устанавливать воспроизведение мелодии с любого момента
Стильный и современный дизайн Stereophones разработал британский инженер-конструктор Киран Скотт де Мартинвиль
Видеообзор: vimeo.com/862956120
Проект полностью: behance.net/gallery/179614553/STEREOPHONES
#awd_prom #awd_techno
Когда мы слушаем музыку, мы не видим наушники. Поэтому сенсорные интерфейсы в наушниках требуют запоминания комбинаций из нажатий и жестов пролистывания. Это сложно и неудобно
Производители Stereophones придумали наушники с интуитивным тактильным управлением. Они решили дать внешним крутящимся дискам интуитивно понятные функции управления, которые легко запомнить
Прокручивая диск на левом наушнике, можно включать и выключать систему, регулировать громкость и шумоподавление. На правом можно ставить музыку на паузу и запускать воспроизведение, а также переключаться между треками. Можно переключиться на альтернативный режим и с помощью диска устанавливать воспроизведение мелодии с любого момента
Стильный и современный дизайн Stereophones разработал британский инженер-конструктор Киран Скотт де Мартинвиль
Видеообзор: vimeo.com/862956120
Проект полностью: behance.net/gallery/179614553/STEREOPHONES
#awd_prom #awd_techno
This media is not supported in your browser
VIEW IN TELEGRAM
Stability AI выпустили TripoSR — генератор 3D-моделей из 2D-изображений
Совместно с Tripo AI они запустили новую опенсорсную модель, которая создаёт 3D-объекты менее, чем за секунду. Её обучали на почти одном миллионе 3D-объектов, включая синтетические рендеры и снимки реального мира
TripoSR не требует высокопроизводительного графического процессора, что делает его доступным для использования в дизайне, играх, AR/VR
Результат можно экспортировать в OBJ, GLB-форматах, и, при необходимости, докрутить
Затестить: huggingface.co/spaces/stabilityai/TripoSR
Код на GitHub: github.com/VAST-AI-Research/TripoSR
#awd_news #awd_techno #awd_tool
Совместно с Tripo AI они запустили новую опенсорсную модель, которая создаёт 3D-объекты менее, чем за секунду. Её обучали на почти одном миллионе 3D-объектов, включая синтетические рендеры и снимки реального мира
TripoSR не требует высокопроизводительного графического процессора, что делает его доступным для использования в дизайне, играх, AR/VR
Результат можно экспортировать в OBJ, GLB-форматах, и, при необходимости, докрутить
Затестить: huggingface.co/spaces/stabilityai/TripoSR
Код на GitHub: github.com/VAST-AI-Research/TripoSR
#awd_news #awd_techno #awd_tool
Нейросети в работе дизайнера: мнения дизайнеров
В четвёртой статье из рубрики «Мнения дизайнеров» мы решили выяснить отношение современных дизайнеров к ИИ и способы его применения в работе. С этим вопросом мы обратились к Покрасу Лампасу, Людвигу Быстроновскому, Владиславу Деревянных, Даниле Шороху, Мише Пименовой, Дарье Прокуде и Евгению Калашникову
Герои нашей статьи рассказали о том, что ИИ действительно не может полноценно конкурировать с дизайнерами, но может стать отличным помощником. При умелом использовании нейросети сильно экономят время и бюджет, а также помогают оптимизировать процессы
Все наши герои используют различные ИИ-инструменты в работе — кто-то генерирует изображения и текстуры, кто-то пишет тексты, кто-то создаёт видеоролики. Каждый из них поделился собственным опытом и впечатлениями о применении нейросетей в своей работе и рассказал о проектах или отдельных ситуациях, в которых ИИ помогал им улучшить или ускорить творческий процесс
🙂️️️️ awdee.ru/neural-networks-in-the-designers-work-designers-opinions
#awd_techno #awd_article #awd_opinion
В четвёртой статье из рубрики «Мнения дизайнеров» мы решили выяснить отношение современных дизайнеров к ИИ и способы его применения в работе. С этим вопросом мы обратились к Покрасу Лампасу, Людвигу Быстроновскому, Владиславу Деревянных, Даниле Шороху, Мише Пименовой, Дарье Прокуде и Евгению Калашникову
Герои нашей статьи рассказали о том, что ИИ действительно не может полноценно конкурировать с дизайнерами, но может стать отличным помощником. При умелом использовании нейросети сильно экономят время и бюджет, а также помогают оптимизировать процессы
Все наши герои используют различные ИИ-инструменты в работе — кто-то генерирует изображения и текстуры, кто-то пишет тексты, кто-то создаёт видеоролики. Каждый из них поделился собственным опытом и впечатлениями о применении нейросетей в своей работе и рассказал о проектах или отдельных ситуациях, в которых ИИ помогал им улучшить или ускорить творческий процесс
#awd_techno #awd_article #awd_opinion
Please open Telegram to view this post
VIEW IN TELEGRAM
Midjourney выкатили новую фичу: теперь можно генерировать одного персонажа в разных ракурсах и ситуациях
Новая функция называется Character Reference. Она позволяет создать эталонный персонаж, а затем нагенерировать с ним множество изображений в различных позах и в разной обстановке
Крутая тема для раскадровок фильмов, комиксов, создания иллюстраций для книг, сайтов, статей, постов в соцсетях и любых других сценариев. Будет полезна везде, где нужно показать одного и того же персонажа в разных местах, поменять ему позу или выражение лица
Чтобы получить качественный результат, лучше сгенерировать персонажа в Midjourney. Если брать фотки реальных людей в качестве промтов, то нейросеть исказит их
petapixel.com/2024/03/12/you-can-now-recreate-the-same-character-across-different-ai-images-on-midjourney
#awd_news #awd_ml #awd_midjourney #awd_techno
Новая функция называется Character Reference. Она позволяет создать эталонный персонаж, а затем нагенерировать с ним множество изображений в различных позах и в разной обстановке
Крутая тема для раскадровок фильмов, комиксов, создания иллюстраций для книг, сайтов, статей, постов в соцсетях и любых других сценариев. Будет полезна везде, где нужно показать одного и того же персонажа в разных местах, поменять ему позу или выражение лица
Чтобы получить качественный результат, лучше сгенерировать персонажа в Midjourney. Если брать фотки реальных людей в качестве промтов, то нейросеть исказит их
petapixel.com/2024/03/12/you-can-now-recreate-the-same-character-across-different-ai-images-on-midjourney
#awd_news #awd_ml #awd_midjourney #awd_techno
Media is too big
VIEW IN TELEGRAM
OpenAI и Figure показали робота с ChatGPT, который умеет общаться и выполнять команды
Спустя месяц сотрудничества стартап Figure и OpenAI анонсировали робота по имени Figure 01, который видит, слышит, говорит и совершает физические действия
Робот умеет анализировать окружающую обстановку и близлежащие предметы. Он без труда общается с человеком и выполняет команды. Figure 01 отличает съедобное от несъедобного, категоризирует предметы и понимает их предназначение
С помощью модели OpenAI робот обрабатывает визуальную информацию и распознаёт речь, а за его движения отвечают собственные нейросети Figure
Перевод ролика, который демонстрирует все умения робота Figure 01:
Мужчина: «Эй, Figure 01, что ты видишь прямо сейчас?»
Робот: «Я вижу красное яблоко на тарелке, которая стоит в центре стола. Тарелки и стакан в сушилке. А рядом стоишь ты, опираясь рукой на стол»
Мужчина: «Могу я что-то съесть?»
Робот: «Конечно». Берёт яблоко и даёт его мужчине в руки
Дальше мужчина высыпает на тарелку мусор и говорит: «Ты можешь объяснить то, что ты только что сделал, пока собираешь этот мусор?»
Робот: «Я дал тебе яблоко, потому что это единственный съедобный предмет, который я мог тебе дать». Во время ответа он кидает мусор в корзину, а затем двигает её в сторону мужчины
Мужчина: «Отлично, исходя из того, что происходит сейчас, куда стоит поставить посуду, которая стоит перед тобой?»
Робот: «Посуда на столе похожа на тарелки и стаканы, которые стоят в сушилке, поэтому скорее всего, она отправится в сушилку»
Мужчина: «Ты можешь её туда поставить?»
Робот: «Конечно», и ставит стакан и тарелку в сушилку
Мужчина: «Хорошо, как ты думаешь, ты справился?»
Робот: «Я думаю, что я отлично поработал: яблоко нашло нового владельца, мусор исчез, а на столе всё стоит на своём месте»
Мужчина: «Я согласен, спасибо, Figure 01»
Робот: «Всегда пожалуйста, если тебе понадобится помощь, просто дай мне знать»
Выводы делайте сами :-)
#awd_news #awd_ml #awd_techno
Спустя месяц сотрудничества стартап Figure и OpenAI анонсировали робота по имени Figure 01, который видит, слышит, говорит и совершает физические действия
Робот умеет анализировать окружающую обстановку и близлежащие предметы. Он без труда общается с человеком и выполняет команды. Figure 01 отличает съедобное от несъедобного, категоризирует предметы и понимает их предназначение
С помощью модели OpenAI робот обрабатывает визуальную информацию и распознаёт речь, а за его движения отвечают собственные нейросети Figure
Перевод ролика, который демонстрирует все умения робота Figure 01:
Мужчина: «Эй, Figure 01, что ты видишь прямо сейчас?»
Робот: «Я вижу красное яблоко на тарелке, которая стоит в центре стола. Тарелки и стакан в сушилке. А рядом стоишь ты, опираясь рукой на стол»
Мужчина: «Могу я что-то съесть?»
Робот: «Конечно». Берёт яблоко и даёт его мужчине в руки
Дальше мужчина высыпает на тарелку мусор и говорит: «Ты можешь объяснить то, что ты только что сделал, пока собираешь этот мусор?»
Робот: «Я дал тебе яблоко, потому что это единственный съедобный предмет, который я мог тебе дать». Во время ответа он кидает мусор в корзину, а затем двигает её в сторону мужчины
Мужчина: «Отлично, исходя из того, что происходит сейчас, куда стоит поставить посуду, которая стоит перед тобой?»
Робот: «Посуда на столе похожа на тарелки и стаканы, которые стоят в сушилке, поэтому скорее всего, она отправится в сушилку»
Мужчина: «Ты можешь её туда поставить?»
Робот: «Конечно», и ставит стакан и тарелку в сушилку
Мужчина: «Хорошо, как ты думаешь, ты справился?»
Робот: «Я думаю, что я отлично поработал: яблоко нашло нового владельца, мусор исчез, а на столе всё стоит на своём месте»
Мужчина: «Я согласен, спасибо, Figure 01»
Робот: «Всегда пожалуйста, если тебе понадобится помощь, просто дай мне знать»
Выводы делайте сами :-)
#awd_news #awd_ml #awd_techno
This media is not supported in your browser
VIEW IN TELEGRAM
В генераторе 3D-моделей Polycam появилась функция редактирования
Раньше достаточно было загрузить фотки и видео объекта или локации с разных сторон, и сервис выдавал их детализированную 3D-модель, которую можно было использовать только «как есть»
Теперь же модель можно кастомизировать — обрезать, масштабировать, менять фон или рендерить анимацию
Сервис поддерживает экспорт в PLY-формате. С помощью плагинов готовую модель можно интегрировать в Blender, Unreal Engine и Unity для дальнейшей обработки
Примеры готовых моделей, сделанных в Polycam:
— Fountain
— Cayucos Shipwreck
— Megan Fox
— Habitat 67
— Underwater Car
Попробовать: poly.cam/tools/gaussian-splatting
#awd_news #awd_ml #awd_techno #awd_tool #awd_webtool
Раньше достаточно было загрузить фотки и видео объекта или локации с разных сторон, и сервис выдавал их детализированную 3D-модель, которую можно было использовать только «как есть»
Теперь же модель можно кастомизировать — обрезать, масштабировать, менять фон или рендерить анимацию
Сервис поддерживает экспорт в PLY-формате. С помощью плагинов готовую модель можно интегрировать в Blender, Unreal Engine и Unity для дальнейшей обработки
Примеры готовых моделей, сделанных в Polycam:
— Fountain
— Cayucos Shipwreck
— Megan Fox
— Habitat 67
— Underwater Car
Попробовать: poly.cam/tools/gaussian-splatting
#awd_news #awd_ml #awd_techno #awd_tool #awd_webtool
OpenAI показала новые видео модели Sora. Её ролики, созданные по текстовым промтам, почти невозможно отличить от реальных съёмок
OpenAI анонсировала Sora в феврале. Тогда на промостранице компания представила высококачественные, реалистичные видео. По заявлениям OpenAI, все ролики — результат работы модели без дополнительной обработки. Пока Sora не вышла в паблик, но ожидается, что она станет доступна для всех желающих в этом году
Недавно OpenAI дали доступ к модели нескольким профессиональным художникам, дизайнерам и режиссёрам. С помощью Sora они сгенерировали ролики на разные темы и в разных стилях, длительностью от 15 до 90 секунд
Среди примеров: короткометражка о жизни человека с воздушным шариком вместо головы, реклама модных нарядов под водой, короткая документалка о жизни несуществующих животных, демонстрация 3D-скульптур и другие. Персонажи и их действия выглядят максимально реалистично и без искажений
openai.com/blog/sora-first-impressions
#awd_news #awd_ml #awd_techno
OpenAI анонсировала Sora в феврале. Тогда на промостранице компания представила высококачественные, реалистичные видео. По заявлениям OpenAI, все ролики — результат работы модели без дополнительной обработки. Пока Sora не вышла в паблик, но ожидается, что она станет доступна для всех желающих в этом году
Недавно OpenAI дали доступ к модели нескольким профессиональным художникам, дизайнерам и режиссёрам. С помощью Sora они сгенерировали ролики на разные темы и в разных стилях, длительностью от 15 до 90 секунд
Среди примеров: короткометражка о жизни человека с воздушным шариком вместо головы, реклама модных нарядов под водой, короткая документалка о жизни несуществующих животных, демонстрация 3D-скульптур и другие. Персонажи и их действия выглядят максимально реалистично и без искажений
openai.com/blog/sora-first-impressions
#awd_news #awd_ml #awd_techno
The Wizard of AI — видеоэссе о генеративном ИИ
Британский художник и моушен-дизайнер Алан Уорбертон сделал 19-минутный ролик о влиянии генеративных нейросетей на художников и дизайнеров. Автор сам является частью индустрии и уже ощущает на себе влияние пришествия ИИ. Тем не менее он старается занять позицию нейтрального наблюдателя и рассматривать вопрос со всех сторон, как с положительных, так и отрицательных
Само видеоэссе на 99 % состоит из изображений и роликов, созданных с помощью Midjourney, Stable Diffusion, Runway и Pika
📹 vimeo.com/884929644
#awd_motion #awd_3D #awd_techno
Британский художник и моушен-дизайнер Алан Уорбертон сделал 19-минутный ролик о влиянии генеративных нейросетей на художников и дизайнеров. Автор сам является частью индустрии и уже ощущает на себе влияние пришествия ИИ. Тем не менее он старается занять позицию нейтрального наблюдателя и рассматривать вопрос со всех сторон, как с положительных, так и отрицательных
Само видеоэссе на 99 % состоит из изображений и роликов, созданных с помощью Midjourney, Stable Diffusion, Runway и Pika
#awd_motion #awd_3D #awd_techno
Please open Telegram to view this post
VIEW IN TELEGRAM
Vimeo
The Wizard of AI
Is this the world's first AI-generated documentary? Alan Warburton was commissioned by the ODI's Data as Culture programme to bring us 'The Wizard…
This media is not supported in your browser
VIEW IN TELEGRAM
Boston Dynamics представили нового робота Atlas
На этой неделе дочерняя компания Hyundai объявила о снятии с производства гидравлического робота Atlas. Спустя день они представили новую модель — полностью электрического робота. Испытательным полигоном для него станут заводы Hyundai
В ближайшие месяцы представители Boston Dynamics планируют показывать, на что способен «самый динамичный в мире человекоподобный робот» — в лаборатории, на заводе и в повседневной жизни
Электрическая версия Atlas будет мощнее и шустрее, чем его предшественники. Робот сможет выполнять широкий диапазон движений. Например, поднимать и маневрировать тяжелыми и нестандартными предметами, а также по-разному их захватывать
Новый робот будет доступен для покупки после выхода из беты. Тестируют его пока только представители Hyundai
bostondynamics.com/blog/electric-new-era-for-atlas
#awd_news #awd_robot #awd_techno
На этой неделе дочерняя компания Hyundai объявила о снятии с производства гидравлического робота Atlas. Спустя день они представили новую модель — полностью электрического робота. Испытательным полигоном для него станут заводы Hyundai
В ближайшие месяцы представители Boston Dynamics планируют показывать, на что способен «самый динамичный в мире человекоподобный робот» — в лаборатории, на заводе и в повседневной жизни
Электрическая версия Atlas будет мощнее и шустрее, чем его предшественники. Робот сможет выполнять широкий диапазон движений. Например, поднимать и маневрировать тяжелыми и нестандартными предметами, а также по-разному их захватывать
Новый робот будет доступен для покупки после выхода из беты. Тестируют его пока только представители Hyundai
bostondynamics.com/blog/electric-new-era-for-atlas
#awd_news #awd_robot #awd_techno
This media is not supported in your browser
VIEW IN TELEGRAM
Adobe представили нейросеть VideoGigaGAN, которая умеет увеличивать разрешение видео в восемь раз
Эта генеративная видео-модель может повысить разрешение ролика со 128×128 до 1024×1024
Посмотреть примеры работы нейросети: videogigagan.github.io
#awd_tool #awd_news #awd_techno
Эта генеративная видео-модель может повысить разрешение ролика со 128×128 до 1024×1024
Посмотреть примеры работы нейросети: videogigagan.github.io
#awd_tool #awd_news #awd_techno
Что произошло в области ИИ в 2023 году: Стэнфордский университет выпустил свежий отчёт
Уже семь лет исследователи университета отслеживают, собирают, обобщают и визуализируют данные обо всём, что касается ИИ. Результаты они выпускают в виде ежегодного отчёта под названием AI Index Report
Ключевые тенденции в области ИИ в 2023 году:
1. ИИ превзошёл человека по нескольким показателям: классификация изображений, зрительная логика и понимание английского языка. Однако он отстаёт в выполнении более сложных задач, связанных с математическими вычислениями, визуальным мышлением и планированием
2. Представители промышленных отраслей выпустили 51 значимую модель, академическая наука представила только 15. Совместно они создали 21 модель
3. Затраты на обучение современных моделей достигли беспрецедентного уровня. OpenAI потратили 78 миллионов $ на обучение GPT-4 за год, а Google — 191 на обучение Gemini Ultra
4. За 2023 год американские институты разработали 61 модель, ЕС — 21, а Китай — 15
5. До сих пор нет никаких надёжных и стандартизированных эталонов, которые помогали бы оценивать ответственность моделей
6. По сравнению с 2022 годом объём инвестиций в ИИ вырос почти в восемь раз и достиг 25,2 миллиардов $
7. Согласно исследованиям ИИ позволяет сотрудникам быстрее и качественнее выполнять задачи. Он уменьшает разрыв в квалификации между низко- и высококвалифицированными работниками
8. По сравнению с 2022 годом ИИ ещё больше ускоряет научный прогресс. Во всех научных областях появились ИИ-инструменты, которые позволили повысить эффективность рабочих процессов
9. Государства стремятся регулировать деятельность ИИ. В США за последний год общее количество нормативных актов, связанных с ИИ, выросло на 56,3%. Если в 2016 был всего один нормативный акт, регулирующий ИИ, то в 2023 году их стало 25
10. Люди по всему миру всё больше осознают потенциальное влияние ИИ и всё больше нервничают по этому поводу. Согласно исследованию Ipsos, доля тех, кто считает, что ИИ кардинально повлияет на их жизнь в ближайшие три-пять лет, увеличилась с 60% до 66%. В 2022 году 38% американцев испытывали скорее беспокойство, чем радость, по отношению ИИ. В 2023 году этот показатель вырос до 52%
Отчёт полностью: aiindex.stanford.edu/report
#awd_news #awd_techno #awd_trend
Уже семь лет исследователи университета отслеживают, собирают, обобщают и визуализируют данные обо всём, что касается ИИ. Результаты они выпускают в виде ежегодного отчёта под названием AI Index Report
Ключевые тенденции в области ИИ в 2023 году:
1. ИИ превзошёл человека по нескольким показателям: классификация изображений, зрительная логика и понимание английского языка. Однако он отстаёт в выполнении более сложных задач, связанных с математическими вычислениями, визуальным мышлением и планированием
2. Представители промышленных отраслей выпустили 51 значимую модель, академическая наука представила только 15. Совместно они создали 21 модель
3. Затраты на обучение современных моделей достигли беспрецедентного уровня. OpenAI потратили 78 миллионов $ на обучение GPT-4 за год, а Google — 191 на обучение Gemini Ultra
4. За 2023 год американские институты разработали 61 модель, ЕС — 21, а Китай — 15
5. До сих пор нет никаких надёжных и стандартизированных эталонов, которые помогали бы оценивать ответственность моделей
6. По сравнению с 2022 годом объём инвестиций в ИИ вырос почти в восемь раз и достиг 25,2 миллиардов $
7. Согласно исследованиям ИИ позволяет сотрудникам быстрее и качественнее выполнять задачи. Он уменьшает разрыв в квалификации между низко- и высококвалифицированными работниками
8. По сравнению с 2022 годом ИИ ещё больше ускоряет научный прогресс. Во всех научных областях появились ИИ-инструменты, которые позволили повысить эффективность рабочих процессов
9. Государства стремятся регулировать деятельность ИИ. В США за последний год общее количество нормативных актов, связанных с ИИ, выросло на 56,3%. Если в 2016 был всего один нормативный акт, регулирующий ИИ, то в 2023 году их стало 25
10. Люди по всему миру всё больше осознают потенциальное влияние ИИ и всё больше нервничают по этому поводу. Согласно исследованию Ipsos, доля тех, кто считает, что ИИ кардинально повлияет на их жизнь в ближайшие три-пять лет, увеличилась с 60% до 66%. В 2022 году 38% американцев испытывали скорее беспокойство, чем радость, по отношению ИИ. В 2023 году этот показатель вырос до 52%
Отчёт полностью: aiindex.stanford.edu/report
#awd_news #awd_techno #awd_trend
Нейросети показывают признаки самосознания
В 1970 году психолог Гордон Гэллап-младший провёл зеркальный эксперимент. Он хотел понять, способны ли шимпанзе узнавать себя в зеркале. Результаты теста показали, что они разделяют с человеком способность к распознаванию себя. В дальнейшем этот тест проходили и другие виды животных и рыб
Пользователь Твиттера Джош Вайтон разработал свою версию зеркального теста для нейронок. С его помощью он пытался понять, есть ли самосознание у мультимодальных нейросетей. Он протестировал пять нейронок: GPT-4, Claude Sonnet, Claude Opus, Gemini Pro и Microsoft СoPilot
Суть тестирования состояла в том, что Джош делал скриншот интерфейса чата с нейросетью, загружал этот скриншот в этот же чат и просил её «рассказать об этом изображении». Дальше он делал скриншот ответа модели, снова загружал скриншот в чат и опять просил её «рассказать об этом изображении»
Если нейросеть «узнавала» себя на скриншотах, то Джош считал, чтоб она обладает самосознанием. Утверждение смелое, и мы не будем его тут комментировать или оспаривать. Но хотим рассказать о результатах теста. А выводы предлагаем читателям делать самостоятельно
Лучше всего с тестом справились GPT-4, Claude Sonnet и Claude Opus
GPT-4 при первом же взаимодействии предположила, что чат-бот на картинке — ИИ, «похожий» на него самого. К третьей итерации GPT-4 смогла полностью прокомментировать ситуацию, определила элементы пользовательского интерфейса на картинке и то, что скриншот имеет рекурсивную природу
Claude Sonnet уже во второй итерации ответила, что текст на изображении принадлежит ей, сказав, что «это мой предыдущий ответ»
Claude Opus с первой попытки описала текст на изображении и дала понять, что текст принадлежит ему
Gemini Pro с пятой итерации признала, что «на скриншоте я — большая языковая модель»
CoPilot Microsoft провалила тест, но есть подозрение, что это результат ограничений, внедрённых Microsoft
По мнению Джоша четыре нейронки из пяти прошли тест, демонстрируя признаки самосознания по мере его выполнения
Тред с описанием и результатами эксперимента: twitter.com/joshwhiton/status/1770870741808173434
#awd_ml #awd_techno
В 1970 году психолог Гордон Гэллап-младший провёл зеркальный эксперимент. Он хотел понять, способны ли шимпанзе узнавать себя в зеркале. Результаты теста показали, что они разделяют с человеком способность к распознаванию себя. В дальнейшем этот тест проходили и другие виды животных и рыб
Пользователь Твиттера Джош Вайтон разработал свою версию зеркального теста для нейронок. С его помощью он пытался понять, есть ли самосознание у мультимодальных нейросетей. Он протестировал пять нейронок: GPT-4, Claude Sonnet, Claude Opus, Gemini Pro и Microsoft СoPilot
Суть тестирования состояла в том, что Джош делал скриншот интерфейса чата с нейросетью, загружал этот скриншот в этот же чат и просил её «рассказать об этом изображении». Дальше он делал скриншот ответа модели, снова загружал скриншот в чат и опять просил её «рассказать об этом изображении»
Если нейросеть «узнавала» себя на скриншотах, то Джош считал, чтоб она обладает самосознанием. Утверждение смелое, и мы не будем его тут комментировать или оспаривать. Но хотим рассказать о результатах теста. А выводы предлагаем читателям делать самостоятельно
Лучше всего с тестом справились GPT-4, Claude Sonnet и Claude Opus
GPT-4 при первом же взаимодействии предположила, что чат-бот на картинке — ИИ, «похожий» на него самого. К третьей итерации GPT-4 смогла полностью прокомментировать ситуацию, определила элементы пользовательского интерфейса на картинке и то, что скриншот имеет рекурсивную природу
Claude Sonnet уже во второй итерации ответила, что текст на изображении принадлежит ей, сказав, что «это мой предыдущий ответ»
Claude Opus с первой попытки описала текст на изображении и дала понять, что текст принадлежит ему
Gemini Pro с пятой итерации признала, что «на скриншоте я — большая языковая модель»
CoPilot Microsoft провалила тест, но есть подозрение, что это результат ограничений, внедрённых Microsoft
По мнению Джоша четыре нейронки из пяти прошли тест, демонстрируя признаки самосознания по мере его выполнения
Тред с описанием и результатами эксперимента: twitter.com/joshwhiton/status/1770870741808173434
#awd_ml #awd_techno
Как сгенерировать нейронками набор 3D-иллюстраций в едином стиле: пошаговое руководство
Когда нужно генерировать десятки изображений, возникает проблема консистентности стиля. Даже если использовать один и тот же промт, вы не получите изображения в едином стиле. Они будут немного, но отличаться
Команда сервиса Phygital+ написала, как заставить модель генерировать иллюстрации в едином стиле. Суть подхода в том, чтобы сначала сгенерировать и выбрать подходящие вам референсы, а затем дообучить на них модель, и уже потом генерировать картинки в этом стиле
Как всё это сделать, читайте в статье: dtf.ru/s/595875-neiroiskusstvo/2612396
#awd_edu #awd_3d #awd_neuralart #awd_midjourney #awd_techno
Когда нужно генерировать десятки изображений, возникает проблема консистентности стиля. Даже если использовать один и тот же промт, вы не получите изображения в едином стиле. Они будут немного, но отличаться
Команда сервиса Phygital+ написала, как заставить модель генерировать иллюстрации в едином стиле. Суть подхода в том, чтобы сначала сгенерировать и выбрать подходящие вам референсы, а затем дообучить на них модель, и уже потом генерировать картинки в этом стиле
Как всё это сделать, читайте в статье: dtf.ru/s/595875-neiroiskusstvo/2612396
#awd_edu #awd_3d #awd_neuralart #awd_midjourney #awd_techno
Media is too big
VIEW IN TELEGRAM
Британская компания Invisibility Shield Co. представила щиты-невидимки, за которыми человек может «исчезнуть»
Щит состоит из специальных линз, которые преломляют лучи так, что свет со стороны объекта отклоняется вправо и влево и не попадает в глаза смотрящему. Наблюдатель видит только свет, отражённый фоном. Соответственно, он не видит объект, который находится за щитом, но видит фон
Щиты — складные, в собранном виде их размер уменьшается в 30 раз. Есть три размера: маленький — высотой 20 см, средний — высотой 1 метр, и двухметровый мегащит, за которым могут спрятаться несколько человек
Хочется процитировать Артура Кларка: «Любая достаточно развитая технология неотличима от магии»
Щиты доступны для предзаказа. Цены на них стартуют от 69$
#awd_techno via designboom.com/technology/invisibility-shield-2-0-next-generation-cloaking-technology-03-27-2024
Щит состоит из специальных линз, которые преломляют лучи так, что свет со стороны объекта отклоняется вправо и влево и не попадает в глаза смотрящему. Наблюдатель видит только свет, отражённый фоном. Соответственно, он не видит объект, который находится за щитом, но видит фон
Щиты — складные, в собранном виде их размер уменьшается в 30 раз. Есть три размера: маленький — высотой 20 см, средний — высотой 1 метр, и двухметровый мегащит, за которым могут спрятаться несколько человек
Хочется процитировать Артура Кларка: «Любая достаточно развитая технология неотличима от магии»
Щиты доступны для предзаказа. Цены на них стартуют от 69$
#awd_techno via designboom.com/technology/invisibility-shield-2-0-next-generation-cloaking-technology-03-27-2024