Machinelearning

😐

Toon3D: Seeing Cartoons from a New Perspective

Новый инструмент для реконструкции сцен из мультфильмов и аниме.

Toon 3D может восстанавливать ракурсы камеры и плотную геометрию помещений.

Такие методы, как COLMAP, не могут реконструировать негеометрические изображения, нарисованные от руки, но Toon 3D справляется с этой задачей. Вы только посмотрите на примеры выше!

▪Github: https://github.com/ethanweber/toon3d
▪Paper: https://arxiv.org/abs/2405.10320
Dem
▪Proj: https://toon3d.studio

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥20👍6❤4🤔2🥰1

10.1K views18:03

Machinelearning

🌟

ChatGPT теперь поддерживает Google Drive и OneDrive

OpenAI расширила возможности анализа данных в ChatGPT с использованием Google Drive и OneDrive.

Теперь файлы в чат-бот можно будет загружать напрямую из Google Drive и Microsoft OneDrive.
ChatGPT получит доступ к сервисам Google, таким как таблицы, документы, презентации и платформам Microsoft, таким как Excel, Word и PowerPoint.

Кроме того, в чат-бот внедрят расширяемое представление для таблиц и диаграмм. Когда пользователи добавляют набор данных, ChatGPT создаст интерактивную таблицу, которую можно развернуть в полноэкранном режиме. Наконец, можно будет кликать на определённые области таблицы, чтобы задать дополнительные вопросы или выбрать подсказки.

Например, пользователи смогут попросить ChatGPT объединить несколько электронных таблиц, содержащих ежемесячные расходы, и создать сводную с классификацией по типам расходов. Чат-бот также предлагает настраиваемые и интерактивные диаграммы, включая гистограммы, линии, круговые и точечные диаграммы. Все их можно будет загружать для использования в презентациях или документах.

Улучшения будут доступны пользователям ChatGPT Plus, Team и Enterprise в ближайшие недели.

📎

Подробнее

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍37❤10🔥9👏2

10.6K views07:47

🔥

Встречайте CAT3D от Google

CAT3D позволяет создавать что угодно в 3D с помощью диффузионных моделей.

Достижения в области 3D-реконструкции позволили осуществить высококачественную 3D-съемку, однако для создания 3D-сцены пользователю приходилось собирать от сотен до тысяч изображений.
Теперь процесс 3D-реконструкции сильно упрощается.
CAT3D использует под капотом воссоздание реального мира с помощью многоракурсной диффузионной модели.
CAT3D может создавать целые 3D-сцены всего за одну минуту и превосходит существующие методы создания 3D-сцен.

▶️

Страничка CAT3D

🟡

Arxiv

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍37❤7🔥5🥰3😎2👏1

10.6K views10:03

Machinelearning

🧠 Awesome AGI Survey

Как Далеко Мы Находимся От AGI?

AGI (artificial general intelligence) – это область теоретических исследований искусственного интеллекта, которая стремится создать программное обеспечение с интеллектом, подобным человеческому, и способностью к самообучению.

AGI, отличается способностью выполнять разнообразные задачи в реальном мире с эффективностью, сравнимой с человеческим интеллектом, отражает важнейшую веху в развитии искусственного интеллекта.

Здесь представлен большой структурированный список обязательных к прочтению статей по AGI, на которые стоит обратить внимание.

▪Github

@ai_machinelearning_big_data

👍33🔥6❤4🤨2🤣1

11.2K views13:50

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Moondream WebGPU — небольшая VLM, поддерживающая обработку изображений, работает локально в браузере

Moondream WebGPU — это VLM (Vision-Language Model) с 1.86 миллиардами параметров.
После загрузки модель (1.8 ГБ) будет кэширована и повторно использована при повторном посещении страницы.

Все выполняется непосредственно в браузере с помощью Transformers.js и ONNX Runtime Web, то есть ваши разговоры не отправляются на сервер.

🤗 Hugging Face

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍37🔥5❤1🗿1

10.1K views10:03

Machinelearning

🌟

Verba — open-source приложение для обеспечения сквозного, оптимизированного и удобного интерфейса для Retrieval-Augmented Generation

— pip install goldenverba

Verba — это полностью настраиваемый AI-помощник для запросов и взаимодействия с вашими данными, как локальными, так и развернутыми в облаке.
Отвечает на вопросы, связанные с вашими документами, получает информацию из существующих баз знаний. Verba сочетает в себе современные технологии RAG и контекстно-зависимую базу данных Weaviate. Выбирайте между различными фреймворками RAG, типами данных, методами разбивки и поиска и поставщиками LLM в зависимости от конкретного случая использования.

Позволяет использовать разные LLM: как от HuggingFace и Ollama, так и от OpenAI, Cohere и Google.

🖥

GitHub

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍45🥰6❤2🤔2🍾1

11.7K views14:03

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Farfalle — open-source поисковой AI-движок

Позволяет использовать локальные (llama3, gemma, mistral) или облачные (Groq/Llama3, OpenAI/gpt4-o) LLM.

🖥

GitHub

🟡

Запустить онлайн

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍31🔥8❤2😍2❤‍🔥1🥰1

11K views06:55

Machinelearning

⚡️

PHUDGE3: Phi-3 как масштабируемая система оценивания LLM

В этой свежей статье Arxiv представляется PHUDGE — тонко настроенная модель Phi3, которая достигла результатов SOTA в 4 задачах: Feedback Test, Feedback OOD, MT Human, Preference Test, превзойдя все существующие модели по задержке и пропускной способности.
PHUDGE демонстрирует очень сильную корреляцию не только с GPT4, но и с человеческими аннотаторами на непросмотренных данных, а также в задачах абсолютного и относительного оценивания.

В этой статье Arxiv не только рассмотривается вопрос использования небольших LM для экономичных систем производственного уровня, но и показывается, что причинно-следственное моделирование не только медленно по своей природе, но иногда может препятствовать обучаемости моделей и должно быть заменено на более простые задачи, когда это возможно, чтобы сделать систему в целом быстрее и лучше.

📎

Arxiv

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14😁9❤3🔥1

10.2K views10:03

Machinelearning

⚡️ Layer-Condensed KV Cache

Многослойный кэш-память KV для эффективного инференса больших языковых моделей.

Обеспечивает в 26 раз более высокую пропускную способность (throughput) по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.


pip install xformers --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt

▪repo: https://github.com/whyNLP/LCKV
▪abs: https://arxiv.org/abs/2405.10637

@ai_machinelearning_big_data

👍22❤4🔥2

9.75K viewsedited 13:28

Machinelearning

🦙 Llama3-from-scratch

Очень подробный гайд по созданию LLaMa-3 с нуля!

Крутой репозиторий, в котором реализована llama 3 с нуля - умножение матриц с помощью multiple heads, позиционное кодирование (способ кодирования позиции слова внутри эмбеддинга), реализация механизма внимания и все остальное, здесь тщательно описано и объяснено.

Отличный репо для обучения, 3 к звезд за сутки⭐️.

▪Github

@ai_machinelearning_big_data

🔥43👍12❤3

11.1K views14:02

Machinelearning

0:50

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting

Только что был выпущен код для генерации 3D объектов с помощью Гауссовских сплатов.

Новый фреймворк обеспечивает высокое качество генераций и рендеринга всего по четырем входными изображениями.


git clone https://github.com/GaussianObject/GaussianObject.git --recursive

▪Github: https://github.com/GaussianObject/GaussianObject
▪Colab: https://colab.research.google.com/drive/1WIZgM--tJ3aq25t9g238JAuAoXrQYVMs?usp=sharing#scrollTo=TlrxF62GNePB
▪Project: https://gaussianobject.github.io

@ai_machinelearning_big_data

🔥22👍13❤2

10.9K viewsedited 15:09

About

Blog

Apps

Platform