DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_79

🔠Q79: Что такое Wireshark ?

✔️Ответ

Wireshark — это инструмент для захвата и анализа сетевых пакетов. Он используется для перехвата и анализа сетевого трафика, включая передачу данных по сети, обмен данными между компьютерами и передачу файлов. Wireshark позволяет захватывать пакеты данных, просматривать их содержимое, извлекать информацию из заголовков и тела пакетов, а также анализировать сетевой трафик для выявления аномалий или необычных событий. Wireshark является бесплатным инструментом с открытым исходным кодом и широко используется в индустрии связи, безопасности и научных исследованиях.

Ссылка: https://github.com/wireshark/wireshark

🔥🔥🔥Отказ от ответственности: см. в постах выше.

#wireshark #networkanalysis #packetcapture #datatransfer #networktrafficanalysis #dataextraction #networksecurity #anomalydetection #opensource #telecommunications #scientificresearch
⚠️100 CEH (Certificated Ethical Hacker) - Вопрос_81

🔠Q81: Что такое Nmap (Network Mapper)?

✔️Ответ

Nmap (Network Mapper) - это открытое программное обеспечение для сканирования сети и анализа безопасности. Он используется для обнаружения узлов на сети, определения открытых портов и оценки уязвимостей систем. Nmap может выполнять различные типы сканирования, включая TCP, UDP, SYN/ACK, FIN, XMAS, NULL и другие.

Он также может обнаруживать и определять операционные системы, работающие на удаленных узлах, и собирать информацию о сервисах, запущенных на определенных портах. Nmap широко используется системными администраторами и аналитиками безопасности для проверки безопасности сетей и выявления потенциальных уязвимостей.

Ссылка: https://github.com/nmap/nmap

🔥🔥🔥Отказ от ответственности: см. в постах выше.

#nmap #networkmapper #opensource #securityanalysis #networkscanning #hostdetection #portscanning #vulnerabilityassessment #tcp
🖥 MongoDB выпускает MCP Server — теперь любой может стать дата-инженером

MongoDB представили открытый MCP сервер, который позволяет AI-инструментам вроде Claude, Cursor и GitHub Copilot напрямую общаться с вашей MongoDB-базой.

Теперь даже без знаний запросов можно просто написать:
• «Покажи самых активных пользователей» 
• «Создай нового пользователя с правами только на чтение» 
• «Как устроена коллекция orders?»

⚙️ MCP Server поддерживает:
• MongoDB Atlas 
• Community Edition 
• Enterprise Advanced

📌 Главное — не нужен SQL, не нужно знать синтаксис. Достаточно обычного языка.

💡 Под капотом: AI превращает ваши фразы в рабочие Mongo-запросы. 
Открытый исходный код. Готово к продакшену.

📌 GitHub

#MongoDB #AItools #OpenSource #MCP
Please open Telegram to view this post
VIEW IN TELEGRAM
🇨🇳 Китайские ИИ-модели захватили мировой opensource-рейтинг! 🚀

Всего через несколько лет после начала «гонки больших моделей» китайские разработчики стали доминировать в мировых рейтингах открытых ИИ. Недавно инженер Rohan Paul обнаружил, что на платформе Design Arena все 15 первых мест занимают модели из КНР.

Почему это важно?
Design Arena — крупнейший бенчмарк для генеративного ИИ, где люди напрямую сравнивают ответы моделей и голосуют за лучший. Рейтинг строится по системе Elo (как в шахматах), что обеспечивает честную и объективную оценку пользовательского опыта.

🏆 ТОП-5 открытых моделей:
1. DeepSeek-R1-0528
2. GLM-4.5 (Zhipu AI)
3. Qwen 3 Coder 480B (Alibaba)
4. DeepSeek-V3-0324
5. DeepSeek-V3.1 (Thinking)

Далее в списке — ещё 10 китайских моделей. OpenAI GPT OSS 120B находится лишь на 16-й позиции.

📊 Распределение по компаниям:
• Alibaba: 6 моделей
• DeepSeek: 5 моделей
• Zhipu AI: 3 модели
• Moonshot AI (Kimi): 1 модель

Технические детали
В июле на Hugging Face китайские компании (Alibaba, Tencent, StepFun и др.) открыли 33 новые модели. Аналитики Interconnects выделяют 19 ключевых лабораторий Китая в области opensource-ИИ, включая DeepSeek, Qwen, MiniMax, Baidu ERNIE и Huawei Pangu.

Вывод
Китайский opensource-ИИ не просто догнал западные аналоги — он задаёт новые стандарты качества. Если раньше opensource-сообщество ассоциировалось с Llama, то сейчас лидерами стали Qwen и DeepSeek.

Подробнее в оригинальной статье.

#КитайскийИИ #КитайAI #OpenSource #DeepSeek #Qwen #DesignArena #HuggingFace
🚀 Новая китайская модель LongCat-Flash-Thinking 

🧠 Это модель для рассуждений, которая показала SOTA-результаты среди open-source решений. 

Основное: 
- Архитектура MoE, 560B параметров, из них 27B активируются. 
- Эффективность: требует на 64,5% меньше токенов( чем другим открытым моделям того же класса), чтобы достичь топ-результатов на AIME25 (с нативным использованием инструментов,). 
- Контекст: 128k, обучение с усилением на задачах рассуждений и кода, многоэтапное пост-тюнинг обучение с мультиагентным синтезом. 
- Инфраструктура: асинхронный RL даёт 3x ускорение по сравнению с синхронными фреймворками. 

⚙️ Оптимизации для продакшена: 
- Свои оптимизированные ядра для работы с MoE и специальные приёмы распределённого обучения, 
- KV-cache reduction, квантование, chunked prefill, 
- статическая/эластичная маршрутизация, peer-to-peer cache transfer, heavy-hitter replication и PD-disaggregation. 
- Поддержка SGLang и vLLM для эффективного деплоя. 

📊 Бенчмарки: 
- Лидирует в tool use (τ²-Bench, VitaBench
- Хорошие результаты по instruction following (IFEval, COLLIE, Meeseeks-zh). 

Китайцы стабильно удерживают лидерство в reasoning-моделях.

🟠 HF: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking

#AI #LLM #Reasoning #MoE #DeepLearning #OpenSource
Please open Telegram to view this post
VIEW IN TELEGRAM
🤗 Кто реально двигает open-source ИИ: анализ топ-50 самых скачиваемых моделей на Hugging Face

Исследование  показывает, какие организации и типы моделей определяют экосистему открытых моделей


🔥 Главное:
📦 Топ-50 - это всего 3.4% всех моделей на Hugging Face,  но именно они собирают более 80% из 45 миллиардов скачиваний

Подавляющее большинство активности сосредоточено вокруг небольшой группы лидеров - 
именно эти модели формируют лицо всего open-source ИИ.

📉 Размер имеет значение (и чем меньше — тем лучше):
- 92.5% загрузок — модели < 1B параметров 
- 86.3% — < 500M 
- 70% — < 200M 
- 40% — < 100M 

Очевидны выводы: в open-source побеждают малые и лёгкие модели, пригодные для локального развёртывания и edge-инференса.

🧠 Популярные направления:
- NLP — 58.1% 
- Computer Vision — 21.2% 
- Audio — 15.1% 
- Multimodal — 3.3% 
- Time Series — 1.7%

Кто создаёт самые скачиваемые модели:
-  Компании - 63.2%  (Google лидер)
-  Университеты - 20.7% 
-  Индивидуальные авторы - 12.1% 
-  НКО - 3.8% 
-  Прочие лаборатории - 0.3%

Какие типы моделей побеждают:
Текстовые энкодеры - 45% всех загрузок 
Декодеры - всего 9.5% 
Энкодер-декодеры - 3%

📌 Несмотря на хайп вокруг LLM, массово скачиваются не гиганты, а утилитарные модельки  для интеграции в собственные продукты.

🇺🇸 Лидеры по странам: 
США доминируют по всем категориям: 
- встречаются 18 раз среди топ-50 скачиваний 
- на США приходится 56.4% всех загрузок

Open-source ИИ живёт не за счёт гигантских LLM, а благодаря компактным, быстрым и практичным моделям,  мкоторые реально работают в продуктах и проектах.

🟠 Почитать полностью: https://huggingface.co/blog/lbourdois/huggingface-models-stats

#AI #HuggingFace #OpenSource #ML #Research #LLM #AITrends
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯 Ring-1T: открыта первая в мире триллионная модель с размышлениями!

Всего за пару недель компания Ant Group выпустила три мощнейшие модели. Апофеозом стал Ring-1T — первая в мире открытая языковая модель с триллионом параметров, которая обладает продвинутыми способностями к рассуждению.

🚀 Результаты тестирования:
Математика: Решила 4 из 6 задач на уровне Международной математической олимпиады (IMO), что соответствует серебряной медали.
Программирование: На уровне ICPC World Finals 2025 решила 5 задач, обогнав Gemini 2.5 Pro.
Логика: Блестяще справляется с запутанными головоломками на определение правды и лжи.
Креатив: Пишет увлекательные исторические подкасты и генерирует рабочий код для игр.

📊 Технические детали для экспертов
Архитектура: MoE (Mixture of Experts) с увеличенным количеством активных параметров
Обучение: Полный цикл RLHF + RLVR (Reinforcement Learning from Verifiable Rewards)
Инновация: Алгоритм IcePop решает проблему расхождения обучения/инференса в MoE через "маскирование градиентов"
Инфраструктура: ASystem обеспечивает стабильное обучение через P2P синхронизацию GPU и Serverless Sandbox

Hugging Face | ModelScope

#КитайскийИИ #КитайAI #Ring1T #OpenSource