270K subscribers
3.94K photos
674 videos
17 files
4.53K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🔥 Burn — свежий open-source фреймворк для Deep Learning на Rust с упором на гибкость, эффективность вычислений и переносимость

cargo new my_burn_app && cd my_burn_app/
cargo add burn --features wgpu


С Burn весь рабочий процесс Deep Learning становится проще: вы можете следить за ходом обучения с помощью дашборда и выполнять вычисления на любых устройствах - от встраиваемых до больших кластеров GPU.

Burn был создан с нуля специально для Deep Learning и связанных с этим вычислений. Стоит также отметить, что Burn, по сравнению с такими фреймворками, как PyTorch, упрощает переход от экспериментов к развертыванию в прод, в процессе масштабирования не придётся менять код.

🖥 GitHub
🟡 Доки

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍419🔥2🥰1🙈1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 На выставке COMPUTEX 2024 генеральный директор Nvidia Дженсен Хуанг демонстрирует ускорение Pandas в 50 раз в GoogleColab после интеграции с RAPIDS cuDF.

Это работает без каких либо изменений кода, все, что нужно добавить %load-ext cudf.pandas поверх кода pandas.

cudf обеспечивает ускорение с помощью процессоров NVIDIA L4 Tensor Core.

Эти графические процессоры недавно стали доступны в Google Colab для пользователей с платной подпиской.

👉 Колаб-ноутбук с гайдом по запуску

Еще Дженсен Хуанг озвучил планы по выпуску новых продуктов Nvidia.

Nvidia планирует выпускать новые флагманские решения для дата-центров каждый год, постоянно наращивая их производительность и функциональность

Уже в следующем году ожидается выход графического процессора Blackwell Ultra, преемника нынешнего флагмана Blackwell

Blackwell Ultra
будет оснащен памятью HBM3e с 12 кристаллами в стеке, что позволит увеличить объем на 50 % по сравнению с Blackwell, у которого память с 8 кристаллами.

В 2026 году будет представлен новый графический чип Rubin с памятью HBM4. Еще, появится центральный процессор Vera, который придёт на смену нынешнему Grace. Rubin — это будет суперчип, связка GPU+CPU, аналогично актуальному Grace Hopper. Кроме того, пропускная способность запатентованной Nvidia технологии интерконнекта NVLink будет удвоена до 3,6 Тбит/с (NVLink 6 против NVLink 5).

На 2027 г планируется выход улучшенной версии Rubin Ultra с HBM4 с 12 кристаллами в стеке вместо 8.

Nvidia намерена выжимать максимум из доступных на данный момент производственных техпроцессов, чтобы каждый год выводить на рынок новые решения, работающие на пределе возможного.

По словам Дженсена Хуанга, именно эта стратегия непрерывного совершенствования позволит компании сохранять лидерство в сфере решений для дата-центров.

📌 Полное выступление: https://www.youtube.com/watch?v=pKXDVsWZmUU

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍527😁5😢3🥰1
🌟 Anthropic позволит создавать персональных помощников на базе ИИ-чат-бота Claude

Компания Anthropic расширяет возможности своего чат-бота Claude, построенного на основе генеративной нейросети. Теперь любой пользователь сможет создать для себя персонализированного помощника, например, для обработки электронной почты, совершения покупок в интернете или чего-то иного. Нововведение называется «использование инструментов» или «вызов функций» и его можно подключить к любому внешнему API по выбору пользователя.

Такой подход позволит создать персонализированного помощника, который будет, например, анализировать данные для создания персонализированных рекомендаций по продуктам, основываясь на истории покупок пользователя. Он также может быть полезен для генерации быстрых ответов на вопросы клиентов, например, при отслеживании статуса заказа или предоставления информации в качестве инструмента технической поддержки. Для создания такого помощника потребуется доступ к API и умение программировать. Новая функция может обрабатывать изображения, позволяя приложениям анализировать визуальные данные. К примеру, персональный помощник для дизайнера интерьеров может задействовать нейросеть для обработки снимков помещения и генерации индивидуальных предложений по его оформлению.

Взаимодействовать с новым инструментом можно будет через Messages API от Anthropic, а также на платформах Amazon Bedrock и Google Vertex AI. Стоимость использования основана на объёме текстовых запросов к нейросетям Claude, измеряемом в токенах. Обычно 1000 токенов соответствует примерно 750 словам. На этапе бета-тестирования самым быстрым и доступным вариантом стала модель Haiku: $0,25 за миллион введённых токенов и $1,25 за миллион токенов на выходе. Тестирование новой функции проходит с апреля и в нём принимают участие несколько тысяч клиентов Anthropic.

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🔥173👨‍💻1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 V-Express — метод анимирования статичной фотографии лица с учётом позы, звука и самого изображения

Метод V-Express был представлен совсем недавно Cong Wang, Kuan Tian, Jun Zhang и другими как один из самых эффективных методов генерации таких анимаций, код и модель опубликованы

🖥 GitHub
🟡 Страничка V-Express
🤗 Модель на Hugging Face

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍154😁2🗿1
🔥 unsloth — файнтюнинг Llama 3, Mistral, Phi и Gemma LLM, уменьшение потребления памяти на 80%, ускорение в 2-5 раз

conda create --name unsloth_env python=3.10
conda activate unsloth_env

conda install pytorch-cuda=<12.1/11.8> pytorch cudatoolkit xformers -c pytorch -c nvidia -c xformers

pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"

pip install --no-deps trl peft accelerate bitsandbytes


Некоторые бенчмарки unsloth приведены здесь

🖥 GitHub
🟡 Wiki

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39😁32🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 GPT Researcher — автономный агент на основе GPT, выполняющий комплексное онлайн-исследование по любой заданной теме

pip install gpt-researcher

Пример использования GPT Researcher:
from gpt_researcher import GPTResearcher

query = "why is Nvidia stock going up?"
researcher = GPTResearcher(query=query, report_type="research_report")
# Conduct research on the given query
research_result = await researcher.conduct_research()
# Write the report
report = await researcher.write_report()


🖥 GitHub
🟡 Страничка GPT Researcher

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥48👍175🙈2🤔1
Как девушке построить карьеру в инжиниринге данных?

Любить математику, смело говорить о своих ожиданиях от работы даже на позиции стажера и еще кое-что, о чем Мария Косарев рассказала здесь. Она прошла длинный путь от стажера до главы Департамента анализа данных и моделирования в Газпромбанке.

@ai_machinelearning_big_data
🤬33🥱20🔥14💅108👍7🤣7🤨2🍓1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 Dot — open-source приложение для локального разворачивания LLM, RAG и TTS для работы со своими документами

Dot предназначено для простого взаимодействия с документами и файлами (.pdf, .docx, .xlsx, .pptx, .md) с помощью локальных LLM и технологии Retrieval Augmented Generation.
Dot было вдохновлено такими решениями, как Chat with RTX от Nvidia
По умолчанию использует Phi-3

🖥 GitHub
🟡 Страничка Dot

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
26👍20🔥11
🌟 Omost — использование мощи LLM, пишущих код, для генерации изображений

Проект Omost предоставляет LLM, которые будут писать коды для компоновки фрагментов изображений с помощью виртуального агента Canvas. Таким образом можно сгенерировать даже сложные изображения с хорошим качеством.

В настоящее время Omost предоставляет 3 предобученные LLM, основанные на вариациях Llama3 и Phi3.

Все модели обучены на смешанных данных, состоящих из
(1) точных описаний изображений из нескольких датасетов, включая Open-Images,
(2) данных, полученных путем автоматического аннотирования изображений,
(3) данных от DPO,
(4) небольшого количества данных от мультимодальной GPT4o

На последних 2 изображениях приведён код, который необходим для генерации изображения таким образом

🖥 GitHub
🤗 Попробовать на Hugging Face

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍161
🌟 FaceFusion — замена лица / улучшение фотографии в 1 команду

FaceFusion — это open-source инструмент для замены лица на фотографии и для улучшения изображения

Для необходимого действия с фото нужно просто запустить файл run.py с нужными опциями (на последнем изображении):
python run.py ...

Ну или можно использовать удобный UI вместо прописывания команд

🖥 GitHub
🟡 Доки

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29👍103🤣3🥰1👌1🦄1