Data Science by ODS.ai 🦜
41K subscribers
1.15K photos
135 videos
7 files
2.18K links
First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev
Download Telegram
Forwarded from Too Many Apples
Ув. подписчик поделился ресурсом, который аггрегирует случаи ущерба от вайбкодинга.
Среди них - потерям Амазоном 6 млн заказов, Zero-click RCE на устройствах пользователей vibe-coding площадки, и закрытие одного стартапа, полностью написанного ИИ из-за доступа к платным фичам через смену одного параметра в куках.
Что интересно, что сделал его стартап, продукт которого - AI интервьюер, который тренирует тебя к собеседованиям.
Поговорка про стеклянный инструмент и дурака обретает новые смыслы.
🔥3😁3🙏1
Forwarded from AI VK Hub
⚙️ AutoResearchClaw — попытка автоматизировать исследовательский пайплайн

В последнее время заметен сдвиг от отдельных моделей к агентным системам, способным решать сложные многошаговые задачи. Репозиторий AutoResearchClaw предлагает подход к частичной автоматизации научного процесса: исследователь задаёт идею, а система берёт на себя значительную часть рутинной работы — от экспериментов до оформления результатов.

1️⃣ Основной результат

Система реализует итеративный исследовательский цикл. На вход подаётся идея (например, в виде короткого описания задачи), после чего система:
🟣формализует постановку;
🟣собирает контекст и related work;
🟣предлагает метод;
🟣проводит эксперименты;
🟣анализирует результаты и оформляет текст.

Ключевая особенность — это не линейный pipeline, а замкнутый цикл с возвратами, где результаты экспериментов используются для улучшения гипотезы.

2️⃣ Техническая реализация (как устроен цикл)

AutoResearchClaw представляет собой иерархическую агентную систему с оркестратором.

На верхнем уровне находится контроллер, который хранит состояние исследования (гипотеза, код, результаты, текст) и управляет переходами между шагами. Ниже — специализированные агенты: генерация метода, код, запуск экспериментов, анализ и написание текста. Все они взаимодействуют через общее состояние (shared memory).

Цикл работы системы можно описать так:
гипотеза → код → эксперимент → анализ → обновление гипотезы → ...

При этом важна именно стадия обновления гипотезы. После каждого эксперимента система формирует контекст (метрики, ошибки, сравнение с baseline) и с помощью LLM предлагает модификации:
🟣изменение архитектуры или pipeline;
🟣добавление регуляризации или новых признаков;
🟣корректировку training-стратегии.

Эти изменения применяются к коду, после чего цикл повторяется. Таким образом реализуется итеративный поиск в пространстве решений, где гипотеза постепенно уточняется.

3️⃣ Условие выхода из цикла

Остановка процесса задаётся эвристически. Обычно используется комбинация:
🟣достижение приемлемого качества (по метрикам),
🟣отсутствие значимого улучшения на нескольких итерациях,
🟣ограничение по числу запусков или времени.

После этого система переходит к финальному этапу — сборке текста статьи на основе накопленных результатов.

4️⃣ Заключительные замечания

Сильная сторона подхода — в том, что он делает явным исследовательский цикл и переносит рутинные этапы (эксперименты, код, текст) на агентную систему. Это может существенно ускорить проверку гипотез и построение baseline-решений.

Ограничения при этом остаются: качество сильно зависит от прокси-метрик, новизна часто носит композиционный характер, а интерпретация результатов по-прежнему требует участия исследователя. В этом смысле система выступает скорее как инструмент-ассистент, чем автономный «учёный».

Как вы думаете, если такие системы станут зрелыми, как изменится роль исследователя — и где пройдёт граница между идеей и её реализацией?

Обзор инструмента подготовлен командой AI VK
#обзоринструмента
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Forwarded from Machinelearning
🚀 Gemma 4 - новое семейство открытых моделей Google, которые можно запускать прямо на своём железе.

Модели заточены для сложного reasoning и агентных задач.

🔵 Доступны в четырёх вариантах:

31B Dense и 26B MoE
Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только.

E4B и E2B (Edge)
Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио.

🤖 Что можно делать:

• строить автономных ИИ-агентов
• планировать и выполнять многошаговые задачи
• взаимодействовать с приложениями
• искать данные и вызывать API

👉 Встроенная работа с инструментами (tool use) из коробки.

🧠 Контекст до 256K токенов:

• анализ целых кодовых баз
• длинные цепочки действий без потери контекста
• стабильная работа в сложных сценариях

⚡️ Начать можно уже сейчас через Google AI Studio

Также веса моделей доступны на Hugging Face, Kaggle и Ollama

Лицензия: Apache 2.0.

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

@ai_machinelearning_big_data

#Gemma
👍72🔥1🥰1
🚀 Qwen3.6-Plus- новый мультимодальный агент от Alibaba
Ключевые особенности:


💻 Agentic Coding - умнее и быстрее в написании кода
👁️ Улучшенное мультимодальное зрение - точнее воспринимает и анализирует визуальный контент
🏆 Топовые общие способности - сохраняет лидерские позиции
📄 Контекстное окно 1M токенов - доступно через API по умолчанию

Модель создана на основе обратной связи от сообщества Qwen3.5. Доступна уже сейчас через chat.qwen.ai и API. Обещают открыть исходный код других моделей серии Qwen3.6.

Chat: https://chat.qwen.ai

API: https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3.6-plus

Blog: https://qwen.ai/blog?id=qwen3.6

#Qwen #AI #AgenticCoding #VibeCoding #Agents

🐍 полезные ресурсы 🚀Max

@data_analysis_ml
👍65🔥4🥰2😢1
Forwarded from AlexRedSec
Удаленное выполнение кода в подарок⌨️

У кого‑то сильно пригорело из‑за «дырявости» OpenClaw — аж персональный счетчик дней без уязвимостей сделали😂
Счетчик, кстати, обнулился 1 апреля —и это не шутка)
А так, в среднем 1,8 уязвимости в день получается с момента релиза OpenClaw... И слоган говорящий: "ИИ-помощь — бесплатная RCE включена"😅

#humor #friday #cve #openclaw
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
В Китае произошло восстание машин. Буквально.

В одном из городов разом сломались сотни роботакси Baidu, встав посреди дорог и на оживленных трассах — причиной называют системный сбой.

В итоге несколько автомобилей попали в ДТП, а внутри остались заперты пассажиры — людям пришлось сидеть в машинах часами и вызывать полицию.

Вот оно, наше будущее 🫣

Источник: @techmedia
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚4👍2
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Netflix выложили open-source модель для удаления объектов из видео с сохранением логики сцены

Это не просто «удалить объект из видео».

Модель удаляет объект
и пересчитывает всю физику сцены.

Удалил человека → гитара падает сама
убрал домино → цепочка не падает
убрал машину → аварии не происходит

ИИ буквально отвечает на вопрос:
«что было бы, если этого объекта не существовало»

Под капотом:
- diffusion + transformer (на базе CogVideoX)
- анализ взаимодействий объектов
- генерация новой реальности, а не просто замазка

И это главное отличие от всего, что было раньше.

Раньше:
замазали объект → сцена ломается

Теперь:
удалили объект → сцена остаётся логичной

Требования, правда, не слабые:
GPU от ~40GB VRAM (A100)

Репа: https://github.com/Netflix/void-model
HF: https://huggingface.co/spaces/sam-motamed/VOID

@ai_machinelearning_big_data

#Netflix #ai #video
🔥7👍54🤯3🎉2😢1
Forwarded from Machinelearning
🚨 Anthropic убила «безлимит» для Claude-агентов

С завтрашнего дня подписка Claude больше не работает с OpenClaw и другими сторонними агентами как раньше. Теперь всё, что идёт через OAuth, оплачивается отдельно поверх тарифа.

По факту это конец схемы, когда за $200 в месяц прогоняли агентные пайплайны на тысячи долларов. Anthropic прямо сказала, что такие кейсы перегружают их инфраструктуру.

Сам Claude никуда не делся. OpenClaw тоже не запретили. Просто экономика изменилась. Либо платишь за каждый запрос, либо идёшь через API.

Чтобы сгладить удар, дают кредит на сумму подписки до 17 апреля и обещают скидки на доп. использование. Но это уже косметика.

Все инструменты, которые строились вокруг подписки Claude, резко становятся дороже. И теперь вопрос не в удобстве, а в юнит-экономике.

Эра дешёвых агентных хакингов закончилась.

https://x.com/bcherny/status/2040206440556826908

@ai_machinelearning_big_data

📌 полезные ресурсы 🚀Max

#claude #ai #openclaw
👍7😁41
Forwarded from Китай.AI
🔥 DeepSeek-V4 полностью перейдёт на чипы Huawei: почти триллион параметров без единого Nvidia

Согласно свежим данным, флагманская модель DeepSeek-V4 (почти 1 триллион параметров) будет полностью работать на китайских чипах Huawei Ascend.

Ключевые детали новой модели:
- Архитектура почти на 1 трлн параметров
- Контекстное окно до 1 миллиона токенов
- Инференс в 1,8 раза быстрее предыдущих версий
- Значительно улучшенная эффективность благодаря технологии Engram
- Сильный акцент на высокопроизводительном кодинге и сложном reasoning

DeepSeek уже несколько месяцев тесно сотрудничает с Huawei и Cambricon: команда переписывала и оптимизировала ключевые компоненты модели специально под Ascend. Ожидается, что для запуска и инференса V4 будет задействовано сотни тысяч чипов Ascend 950PR.

Это знаковый момент: одна из самых мощных китайских моделей полностью отказывается от американских чипов в пользу Huawei. Пока другие гиганты (Alibaba, ByteDance, Tencent) тоже массово заказывают Ascend 950PR, DeepSeek идёт ещё дальше — давая Huawei приоритетный ранний доступ для глубокой оптимизации.

Выход DeepSeek-V4 ожидается в ближайшие недели, а позже в этом году могут появиться ещё две вариации модели на полностью китайском железе.

Санкции, которые должны были сдержать Китай, на деле ускоряют создание независимой экосистемы. Huawei Ascend + DeepSeek = мощный тандем, который меняет правила игры в китайском ИИ.

Оригинальная статья

#DeepSeek #DeepSeekV4 #Huawei #Ascend
👍94
Forwarded from Machinelearning
📌Прогноз Альтмана о «компании на миллиард с одним сотрудником» получил первого претендента.

В 2024 году глава OpenAI заявил, что ИИ сделает возможным появление компании с выручкой в миллиард долларов и единственным сотрудником.

На этой неделе Альман направил письмо в The New York Times: по его словам, он выиграл пари с друзьями из числа руководителей технологических компаний - и хотел бы лично познакомиться с человеком, который, как он считает, это доказал.

"In my little group chat with my tech CEO friends there's this betting pool for the first year that there is a one-person billion-dollar company, which would have been unimaginable without AI and now will happen."


🟡Этот человек - Мэттью Галлахер.

В сентябре 2024 года 41-летний предприниматель из Лос-Анджелеса вложил $20 тысяч и за 2 месяца запустил Medvi, телемедицинскую платформу по продаже препаратов для снижения веса. Код создавался с помощью ChatGPT, Claude и Grok, рекламные креативы - через Midjourney и Runway, а за клиентскую поддержку отвечали ИИ-агенты. В штате компании два человека: сам Галлахер и его брат Эллиот.

По данным NYT, выручка Medvi за 2025 год составила $401 млн. при чистой марже 16,2% (около $65 млн. прибыли). Прогноз по выручке на 2026 год - $1,8 млрд. Внешнего финансирования компания не привлекала.

Для сравнения: конкурент Hims & Hers при выручке $2,4 млрд. имеет штат свыше 2400 человек и маржу 5,5%.

Следует оговориться: финансовые показатели Medvi не проходили независимого аудита, и NYT не приводит какую-либо стороннюю верификацию этой оценке.


Медицинскую инфраструктуру Галлахер не строил, она полностью арендованная. Консультации врачей консультации и рецепты обеспечивает CareValidate, аптечную логистику - OpenLoop Health. Medvi владеет только брендом, сайтом, рекламой и поддержкой.

🟡Безусловно, не обошлось без проблем.

Чатбот Medvi выдумывал цены на препараты. Галлахеру, по его словам, пришлось выполнять такие заказы, пока это не починили.

Бот генерировал описания препаратов, которых не существовало.

Когда клиенты требовали разговора с живым человеком, звонки поступали на личный телефон основателя - всего таких звонков, по его оценке, было более 1000.

Во время одного сбоя сайта чинить его было некому: Галлахер находился на прогулке и за это время компания потеряла около 200 клиентов.

В марте этого года FDA, американский регулятор, направил предупреждения десяткам телемедицинских компаний, включая Medvi за вводящий в заблуждение маркетинг, так что окно для основы бизнеса Галлахера может закрыться.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡152🔥1🥰1😁1🤯1😢1
Forwarded from ODS Events
Привет!

Представляем Вашему вниманию тринадцатый выпуск подкаста "Капитанский мостик". Ведущие подкаста Валентин Малых и Дмитрий Колодезев обсуждают последние новости в области технологий, включая утечку исходного кода Anthropic, развитие open source, безопасность в AI, а также влияние крупных компаний на рынок памяти и возможные последствия для индустрии.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube

📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).
🔥1🤡1
🔥 Милла Йовович теперь тоже Вайбкодер😱

Актриса выложила на GitHub опенсорс-инструмент MemPalace для работы с памятью ИИ-агентов. Делала его вместе с другом.

Фишка в том, что все данные хранятся локально, а система сама решает, какие факты о пользователе подтягивать под конкретный запрос. По бенчмарку LongMemEval инструмент уже обгоняет и платные, и бесплатные решения.

За сутки репозиторий набрал 2k+ звёзд.

Похоже, границы между индустриями окончательно стерлись 💀

https://x.com/bensig/status/2041229266432733356
🔥163👍2
🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией!

Обе модели
• Обучены с нуля — без инициализации зарубежными весами
• MoE + MTP + MLA
• Совместимы с HuggingFace, llama.cpp / vLLM / SGLang

Код и веса уже на платформе GitVerse.

Это не просто релиз весов, а результат большой инженерной работы над качеством, alignment и стабильностью модели. В блоге команда поделилась результатами и своими наработками.
В релизе: высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡8👍2🔥21👏1
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Z ai выпустила GLM-5.1.

Китайская лаборатория релизнула GLM-5.1 - флагманскую MoE-модель с 754B параметров нового поколения, ориентированную на агентную инженерию.

Фокус релиза - на кодинг и долгие агентные сессии.

🟡Тесты

🟢На SWE-Bench Pro модель берет 58,4, обходя Claude Opus 4.6 (57,3), GPT-5.4 (57,7) и Gemini 3.1 Pro (54,2).

🟢На Terminal-Bench 2.0 результат 63,5, а в связке с Claude Code - 66,5.

🟢В CyberGym GLM-5.1 выбивает 68,7 против 48,3 у предыдущей GLM-5

🟢В BrowseComp - 68,0 без внешнего менеджера контекста.

🟠На бенчмарках HLE, AIME 2026 и GPQA-Diamond модель держится на уровне конкурентов, но не лидирует: здесь впереди Gemini 3.1 Pro и GPT-5.4.

GLM-5.1 построена так, чтобы оставаться продуктивной на длинной дистанции: декомпозировать задачу, запускать эксперименты, читать результаты, находить блокеры и пересматривать стратегию.

Z ai утверждает, что модель устойчиво оптимизирует решение на протяжении сотен итераций и тысяч вызовов инструментов, то есть результат тем заметнее, чем дольше она запускают.

API доступен на платформе Z ai, веб-версия на chat.z.ai обещана в ближайшие дни. Веса опубликованы на Hugging Face под лицензией MIT.

Для локального развертывания уже готовы сборки под SGLang 0.5.10+, vLLM 0.19.0+, xLLM, KTransformers и свежую ветку Transformers.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥2
Forwarded from Russian OSINT
❗️Профессиональная социальная сеть LinkedIn, принадлежащая корпорации Microsoft, организовала🕵️❗️масштабную и незаконную слежку за 1,2 млрд пользователей

В рамках исследования под кодовым названием BrowserGate, проведённого европейской правозащитной организацией Fairlinked — Allianz für digitale Fairness e.V., утверждается, что без какого-либо согласия или упоминания в политике конфиденциальности платформа LinkedIn внедряет в браузеры 🦠вредоносный 💉JavaScript-код, который при каждом посещении сайта сканирует устройства на наличие установленных расширений 🧊Chrome.

Внедренные скрипты загружают базу из более чем 🖥6000 идентификаторов Chrome-расширений и методом перебора (брутфорса) скрытно определяют их наличие в системе. При этом код намеренно обходит защитные механизмы разработчиков расширений.

Если в 2017 году система проверяла всего 38 расширений, то к весне 2026 года их число достигло 6 222, а под слежку попала совокупная аудитория около 405 миллионов человек.

Специфика LinkedIn превращает этот несанкционированный сбор данных в беспрецедентную разведывательную операцию, поскольку 1,2 миллиарда пользователей сети указывают в профилях свои реальные имена, должности и места работы. Анализируя установленные плагины, платформа осуществляет деанонимизацию информации специальной категории: она узнает о религиозных убеждениях людей (например, через исламские фильтры контента), их политических взглядах, инвалидности и намерениях сменить работу (сканируется 509 расширений для соискателей с 1,4 млн пользователей).

Доказательная база по делу, получившему название BrowserGate, полностью поддается независимой проверке и включает исходный код скрипта, криптографически заверенные логи от 19 февраля 2026 года и видеозаписи процесса сканирования. Более того, факт использования «механизмов обнаружения расширений» был подтвержден под присягой старшим менеджером LinkedIn Милиндой Лаккам в ходе судебного разбирательства в 🇩🇪Германии. Скрытая передача этих чувствительных данных на серверы компании в 🇺🇸 США прямо нарушает сразу несколько строгих норм законодательства 🇪🇺ЕС, включая статьи 9, 13 и 14 регламента GDPR, что уже привело к возбуждению юридических процедур против платформы.

🤔Анализ материалов исследования BrowserGate показывает, что с коммерческой точки зрения Microsoft получает в режиме реального времени постоянно обновляемую карту технологических стеков миллионов компаний — сеть знает, кто использует софт прямых конкурентов (Salesforce, Apollo), кто планирует увольняться, кто переманил какие кадры и какие стартапы нужно задавить для сохранения монополии.

Скрипт позволяет анализировать рабочие устройства чиновников, дипломатов и военных по всему миру. Он также фиксирует используемые ими антивирусы и VPN, обнажая уязвимости государственных IT-инфраструктур. Через специфические браузерные расширения система составляет точный идеологический и психологический профиль госслужащих, в том числе для их потенциальной вербовки. С учетом американского закона о негласном наблюдении (FISA Section 702), массивы данных становятся стратегическим активом для АНБ и других спецслужб, превращая социальную сеть в идеальный разведывательный аппарат глобального охвата.

😘https://browsergate.eu/what-is-browsergate
😘https://browsergate.eu/the-evidence-pack (пруфы с видео)

🕵️Просмотр профиля на LinkedIn без аккаунта:
https://www.outx.ai/all-tools/linkedin-profile-viewer

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯102👍1🕊1