⚡️ AT-EDM: Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models
Компания Adobe нашла способ снизить вычислительные затраты на диффузионные модели данных без переобучения.
Они назвали метод AT-EDM, и это позволяет добиться сокращения FLOPs до 40% при сохранении почти такого же качества изображения, как и в исходной модели.
▪Почитать подробнее: https://atedm.github.io
▪Видео: https://www.youtube.com/watch?v=ZmOdN4F_8Ew
▪Статья: https://arxiv.org/abs/2405.05252
Код на подходе.
@ai_machinelearning_big_data
Компания Adobe нашла способ снизить вычислительные затраты на диффузионные модели данных без переобучения.
Они назвали метод AT-EDM, и это позволяет добиться сокращения FLOPs до 40% при сохранении почти такого же качества изображения, как и в исходной модели.
▪Почитать подробнее: https://atedm.github.io
▪Видео: https://www.youtube.com/watch?v=ZmOdN4F_8Ew
▪Статья: https://arxiv.org/abs/2405.05252
Код на подходе.
@ai_machinelearning_big_data
🔥17👍12❤3
Смотрит Google I/O ‘24 онлайн, ждем достойного ответа Open AI.
https://www.youtube.com/watch?v=XEzRZ35urlk
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Google Keynote (Google I/O ‘24)
It’s time to I/O! Tune in to learn the latest news, announcements, and AI updates from Google.
Update: As of September 2, if you’re 18 or over, your files are now used to improve Google AI but you can control this in Gemini Apps Activity. Learn more in the…
Update: As of September 2, if you’re 18 or over, your files are now used to improve Google AI but you can control this in Gemini Apps Activity. Learn more in the…
👍17🥱10❤4🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
💪 Разбираемся, у кого контекст длиннее!
У GEMINI обещают контекстное окно 2млн токенов. Это в 16 раз больше, чем у GPT-4o .
У GPT-4o 128k токенов, это две копии книги «Великого Гетсби», в Gemini 1.5 Pro можно загрузить всю «Войну и мир».
- Gemini теперь будет во ВСЕХ продуктах Google:
- Еще Google представили Gemini 1.5 Flash оптимизированную модель с низкой задержкой.
-Новый Project Astra - это прототип от GoogleDeepMind, ИИ-ассистенты, с которыми можно общаться в реальном времени. ИИ работает прямо с вашего телефона и даже с умных очков! Project Astra может быть по-настоящему полезен в повседневной жизни.
Агенты могут взаимодействовать с окружающим миром, воспринимая информацию, запоминая то, что видит, обрабатывая эту информацию и понимая окружение и детали.
- Представлен Veo - прямой конкурент Sora для генерации видео.
Модель принимает текст и может генерировать видео с разрешением до 1080p продолжительностью более минуты.
- Представлен Imagen 3 - самая соверщенная модель Google для генерации изображений.
- Песочница с искусственным интеллектом для преобразования текста в музыку.
- Google наконец-то прилагают серьезные усилия для интеграции искусственного интеллекта в свой поисковик
@ai_machinelearning_big_data
У GEMINI обещают контекстное окно 2млн токенов. Это в 16 раз больше, чем у GPT-4o .
У GPT-4o 128k токенов, это две копии книги «Великого Гетсби», в Gemini 1.5 Pro можно загрузить всю «Войну и мир».
- Gemini теперь будет во ВСЕХ продуктах Google:
Поисковике, gmail, photo, Workspace, NotebookGmail, Google Meet
, модель может писать письма, делать выжимки из них, вести диалог, искать нужные для вас части письма, читает вложения и может отвечать по любым длинным документам, видео, изображениям во вложениях, управляется голосом.- Еще Google представили Gemini 1.5 Flash оптимизированную модель с низкой задержкой.
-Новый Project Astra - это прототип от GoogleDeepMind, ИИ-ассистенты, с которыми можно общаться в реальном времени. ИИ работает прямо с вашего телефона и даже с умных очков! Project Astra может быть по-настоящему полезен в повседневной жизни.
Агенты могут взаимодействовать с окружающим миром, воспринимая информацию, запоминая то, что видит, обрабатывая эту информацию и понимая окружение и детали.
- Представлен Veo - прямой конкурент Sora для генерации видео.
Модель принимает текст и может генерировать видео с разрешением до 1080p продолжительностью более минуты.
- Представлен Imagen 3 - самая соверщенная модель Google для генерации изображений.
- Песочница с искусственным интеллектом для преобразования текста в музыку.
- Google наконец-то прилагают серьезные усилия для интеграции искусственного интеллекта в свой поисковик
@ai_machinelearning_big_data
👍62🔥9❤7😁6🤔5🗿4
🔥🔥🔥 Google объявила конкурс для всех разработчиков Gemini API с призовым фондом в $3 млн и Custom Electric 1981 DeLorean (Легендарная машина из фильма Назад в будущее)
В рекламе снялся легендарный Кристофер Ллойд, актер снимавшийся в трилогии Назад в будущее.
🛻 Главный приз: полностью электрическая версия DeLorean 1981, произведенная на заказ.
Общий призовой фонд: $3 млн.
Конкурс Google Gemini API открыт как для отдельных участников, так и для команд. Разработчикам предлагается создать и представить приложения с использованием API Gemini.
⚡️Критерии оценки
Google оценивает приложения по пяти основным критериям:
* Креативность
* Полезность
* Исполнение
* Новизна
* Влияние
Компания будет выбирать приложения, которые:
*Ииспользуют API Gemini
* Решают реальные проблемы
* Оригинальны и хорошо продуманы
* Дают потяьный пользовательский опыт
Призы
В рамках конкурса также будут вручаться денежные призы в различных категориях:
* Лучшее приложение для Android
* Лучшее веб-приложение
* Лучшая игра
Кроме того, будут присуждаться крупные денежные призы за:
* Самое полезное приложение
* Самое эффективное приложение
* Самое креативное приложение
Крайний срок подачи заявок
Крайний срок подачи заявок: 12 августа 2024 года.
Онлайн-голосование в категории «Выбор пользователей» ожидается 16 августа.
В остальных категориях победителей выберет внутренняя команда Google. Результаты конкурса Gemini API будут объявлены в октябре.
📌 Подать заявку: https://ai.google.dev/competition?hl=ru
📌 Видео: https://www.youtube.com/watch?v=_cZa_7KaQ3c&t=18s
@ai_machinelearning_big_data
В рекламе снялся легендарный Кристофер Ллойд, актер снимавшийся в трилогии Назад в будущее.
🛻 Главный приз: полностью электрическая версия DeLorean 1981, произведенная на заказ.
Общий призовой фонд: $3 млн.
Конкурс Google Gemini API открыт как для отдельных участников, так и для команд. Разработчикам предлагается создать и представить приложения с использованием API Gemini.
⚡️Критерии оценки
Google оценивает приложения по пяти основным критериям:
* Креативность
* Полезность
* Исполнение
* Новизна
* Влияние
Компания будет выбирать приложения, которые:
*Ииспользуют API Gemini
* Решают реальные проблемы
* Оригинальны и хорошо продуманы
* Дают потяьный пользовательский опыт
Призы
В рамках конкурса также будут вручаться денежные призы в различных категориях:
* Лучшее приложение для Android
* Лучшее веб-приложение
* Лучшая игра
Кроме того, будут присуждаться крупные денежные призы за:
* Самое полезное приложение
* Самое эффективное приложение
* Самое креативное приложение
Крайний срок подачи заявок
Крайний срок подачи заявок: 12 августа 2024 года.
Онлайн-голосование в категории «Выбор пользователей» ожидается 16 августа.
В остальных категориях победителей выберет внутренняя команда Google. Результаты конкурса Gemini API будут объявлены в октябре.
📌 Подать заявку: https://ai.google.dev/competition?hl=ru
📌 Видео: https://www.youtube.com/watch?v=_cZa_7KaQ3c&t=18s
@ai_machinelearning_big_data
👍30🔥15❤6🥰2🤣2❤🔥1
Tabby — это локальный AI-помощник для кодинга, open-source альтернатива GitHub Copilot.
Некоторые особенности Tabby:
— полная самодостаточность, отсутствие необходимости в СУБД или в облаке
— имеет интерфес OpenAPI, легко интегрируемый с существующей инфраструктурой (например, Cloud IDE)
— поддерживает GPU среднего класса
Быстрый старт с Docker:
docker run -it \
--gpus all -p 8080:8080 -v $HOME/.tabby:/data \
tabbyml/tabby \
serve --model TabbyML/StarCoder-1B --device cuda
Существует расширение для VS Code
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥9❤5😁1
Еще один ништячок от Google, - "PaliGemma"! 🚀
Семейство из 116 новых моделей, которые могут подписывать изображения, отвечать на вопросы, распознавать объекты, сегментировать изображения и многое другое!
PaliGemma (Github) - это семейство моделей визуализации с архитектурой, состоящей из SIGLIP-So 400m в качестве кодера изображений и Gemma-2B в качестве декодера текста.
SigLIP - это современная модель, которая может распознавать как изображения, так и текст. Как и CLIP, он состоит из кодера изображений и текста. Как и в случае с PALI-3, комбинированная модель Paligemma работает на основе графических и текстовых данных, а затем может быть легко адаптирована для последующих задач, таких как создание субтитров.
Gemma - это модель для генерации текста, предназначенная только для декодера. Сочетание графического кодера Siglip и линейного адаптера Gemma позволяет использовать Paligemma в качестве мощной модели визуализации.
▪Блог: https://hf.co/blog/paligemma
▪Модели: https://hf.co/collections/google/paligemma-release-6643a9ffbf57de2ae0448dda
▪Demo: https://hf.co/spaces/google/paligemma
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19❤6🔥3😴2
This media is not supported in your browser
VIEW IN TELEGRAM
🪄 И снова Google, они только что анонсировали Illuminate → https://illuminate.withgoogle.com
Illuminate использует ИИ для переосмысления процесса обучения, превращая сложные исследовательские работы в увлекательные беседы.
Обсуждения создаются с помощью искусственного интеллекта и основаны на загруженных научных статьях.
Illuminate - это экспериментальная технология, которая использует ИИ для адаптации контента к вашим предпочтениям в обучении.
📌 Бегом записываться в лист ожидания, тут же можно послушать примеры: https://illuminate.withgoogle.com/home
@ai_machinelearning_big_data
Illuminate использует ИИ для переосмысления процесса обучения, превращая сложные исследовательские работы в увлекательные беседы.
Обсуждения создаются с помощью искусственного интеллекта и основаны на загруженных научных статьях.
Illuminate - это экспериментальная технология, которая использует ИИ для адаптации контента к вашим предпочтениям в обучении.
📌 Бегом записываться в лист ожидания, тут же можно послушать примеры: https://illuminate.withgoogle.com/home
@ai_machinelearning_big_data
👍43🔥12❤5
Поддерживает синтез речи, разные режимы и расширяемую (вызов функций) систему плагинов.
Позволяет реализовать развертывание в один клик частного чат-приложения OpenAI ChatGPT/Claude/Gemini/Groq/Ollama.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥4❤3👏1