Устойчивость к кибератакам российских больших языковых моделей с открытым исходным кодом
Маленькая ремарка
С появлением больших языковых моделей обществу был брошен вызов. Первые проблемы, с которыми пришлось столкнуться в области LLM, были связаны с тем, что Читать дальше →
#open_source_llm #multimodal_llm #attacks_on_llm #alignment_llm #adversarial_attacks #backdoor_attacks #trusted_ai_research_center_isp_ras | @habr_ai
Маленькая ремарка
С появлением больших языковых моделей обществу был брошен вызов. Первые проблемы, с которыми пришлось столкнуться в области LLM, были связаны с тем, что Читать дальше →
#open_source_llm #multimodal_llm #attacks_on_llm #alignment_llm #adversarial_attacks #backdoor_attacks #trusted_ai_research_center_isp_ras | @habr_ai
Хабр
Уязвимость к атакам российских больших языковых моделей с открытым исходным кодом
Маленькая ремарка С появлением больших языковых моделей обществу был брошен вызов. Первые проблемы, с которыми пришлось столкнуться в области LLM, были связаны с тем, что модели могут неправильно...
Понимает ли Vision Llama импрессионистов?
Всем привет, меня зовут Арсений, я Data Scientist в компании Raft, и сегодня я расскажу вам про Visual Language Models (VLM).
Большие языковые модели уже стали частью нашей жизни и мы применяем их, чтобы упростить современную рутину, а так же используем для решения бизнес задач. Недавно вышло новое поколение vision transformer моделей, которые заметно упростили анализ изображений, из какой бы сферы эти изображения не были.
Особенно заметным был сентябрьский релиз Llama-3.2-11b, и не только потому что это первая vision модель от Llama, сколько потому, что с ней вместе вышло целое семейство моделей, включая маленькие на 1B и 3B параметров. А как вы знаете, меньше, значит юзабельнее.
Читать далее
#vision_transformers #vision_language_models #multimodal_llm #llama_3_2 #qwen2_vl #llava #art #art_history | @habr_ai
Всем привет, меня зовут Арсений, я Data Scientist в компании Raft, и сегодня я расскажу вам про Visual Language Models (VLM).
Большие языковые модели уже стали частью нашей жизни и мы применяем их, чтобы упростить современную рутину, а так же используем для решения бизнес задач. Недавно вышло новое поколение vision transformer моделей, которые заметно упростили анализ изображений, из какой бы сферы эти изображения не были.
Особенно заметным был сентябрьский релиз Llama-3.2-11b, и не только потому что это первая vision модель от Llama, сколько потому, что с ней вместе вышло целое семейство моделей, включая маленькие на 1B и 3B параметров. А как вы знаете, меньше, значит юзабельнее.
Читать далее
#vision_transformers #vision_language_models #multimodal_llm #llama_3_2 #qwen2_vl #llava #art #art_history | @habr_ai
Хабр
Понимает ли Vision Llama импрессионистов?
Всем привет, меня зовут Арсений, я Data Scientist в компании Raft, и сегодня я расскажу вам про Visual Language Models (VLM). Большие языковые модели уже стали частью нашей жизни и мы применяем их,...
[Перевод] Reasoning CV-модели OpenAI не смогли посчитать монеты
Новые мультимодальные модели OpenAI o3 и o4-mini позиционируются как "разумные". Однако качественное тестирование на практических задачах вроде подсчета объектов и распознавания текста выявило неожиданные пробелы в их производительности, в некоторых случаях уступающие даже не-reasoning моделям.
Узнайте, какие именно тесты провалили новинки и где показали уверенный результат. Читать далее
#ai #computervision #multimodal_llm #openai #llm #testing #evaluation #vqa #ocr | @habr_ai
Новые мультимодальные модели OpenAI o3 и o4-mini позиционируются как "разумные". Однако качественное тестирование на практических задачах вроде подсчета объектов и распознавания текста выявило неожиданные пробелы в их производительности, в некоторых случаях уступающие даже не-reasoning моделям.
Узнайте, какие именно тесты провалили новинки и где показали уверенный результат. Читать далее
#ai #computervision #multimodal_llm #openai #llm #testing #evaluation #vqa #ocr | @habr_ai
Хабр
Reasoning CV-модели OpenAI не смогли посчитать монеты
Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые...
Новый вид контента: ИИллюстрированная аудиокнига
Недавно мне пришла в голову идея написать приложение для автоматической генерации иллюстраций к аудиокнигам. Видео-модели пока не умеют создавать длинные видео, но ведь можно экранизировать аудиокниги с помощью серии иллюстраций! Эта идея меня захватила, и я написал небольшой проект... Читать далее
#llm #multimodal_llm #аудиокниги #медиа | @habr_ai
Недавно мне пришла в голову идея написать приложение для автоматической генерации иллюстраций к аудиокнигам. Видео-модели пока не умеют создавать длинные видео, но ведь можно экранизировать аудиокниги с помощью серии иллюстраций! Эта идея меня захватила, и я написал небольшой проект... Читать далее
#llm #multimodal_llm #аудиокниги #медиа | @habr_ai
Меньше — лучше: как Polaris-4B обошёл Qwen3-32B
Привет, Хабр!
В июне 2025 года команда из Гонконгского университета выложила открытые модели Polaris-4B‑Preview и Polaris-7B‑Preview, обученные с нуля на reasoning‑задачах с использованием Reinforcement Learning. Эти модели не просто догоняют топовые коммерческие аналоги вроде Claude‑Opus и Grok-3-Beta — они их обгоняют. Причём на архитектуре всего в 4 миллиарда параметров.
Все это результат продуманного инженерного подхода. В этой статье коротко рассмотрим, как авторам Polaris это удалось. Читать далее
#ml #искусственный_интеллект #machine_learning #нейросети #multimodal_llm | @habr_ai
Привет, Хабр!
В июне 2025 года команда из Гонконгского университета выложила открытые модели Polaris-4B‑Preview и Polaris-7B‑Preview, обученные с нуля на reasoning‑задачах с использованием Reinforcement Learning. Эти модели не просто догоняют топовые коммерческие аналоги вроде Claude‑Opus и Grok-3-Beta — они их обгоняют. Причём на архитектуре всего в 4 миллиарда параметров.
Все это результат продуманного инженерного подхода. В этой статье коротко рассмотрим, как авторам Polaris это удалось. Читать далее
#ml #искусственный_интеллект #machine_learning #нейросети #multimodal_llm | @habr_ai
Хабр
Меньше — лучше: как Polaris-4B обошёл Qwen3-32B
Привет, Хабр! В июне 2025 года команда из Гонконгского университета выложила открытые модели Polaris-4B-Preview и Polaris-7B-Preview , обученные с нуля на reasoning-задачах с использованием...