Data Portal | Data Science & Машиннное обучение
8.54K subscribers
116 photos
42 videos
4 files
156 links
Присоединяйтесь к нашему каналу и погрузитесь в мир для дата сайентиста

Связь: @devmangx
Download Telegram
Это один из самых впечатляющих технических блогпостов, которые я читал в последнее время: построение веб-поисковика с нуля за два месяца с 3 миллиардами нейронных эмбеддингов

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2🏆1👀1
📘 На Stepik вышел курс — «LangChain: с нуля до продакшн LLM-приложений»

Нужен не игрушечный бот, а воспроизводимый RAG-пайплайн с метриками и сервисом? Этот курс — про путь «ноутбук → FastAPI → прод».

🔍 Что вы получите
• RAG по PDF с цитированием источников и гибридным поиском (BM25 + вектор + rerank); контроль галлюцинаций через метрики (precision/recall@K, citation-rate)
• Инструменты и агенты для анализа данных: Pandas-задачи, структурированный JSON-вывод под отчёты/дашборды
• Продакшн-контур: FastAPI-сервис, логирование латентности/токенов, PromptOps (версии/A/B), базовый SLA-мониторинг

🎓 Сертификат по завершении — можно добавить в резюме или LinkedIn

🚀 Начните сегодня и получите скидку 25% в течение 72 часов

👉 Пройти курс на Stepik
3👍3🔥2😁2👎1
Создай свою собственную модель ИИ

Этот репозиторий содержит код для разработки, предобучения и fine-tuning’а LLM наподобие GPT с нуля: https://github.com/rasbt/LLMs-from-scratch

Недавно там появился новый раздел: Gemma 3 с нуля

Является официальным репозиторием к книге Build a Large Language Model (From Scratch).

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍3
Forwarded from IT Portal
Media is too big
VIEW IN TELEGRAM
Нашёл крутейшую платформу для подготовки к DS-собесам

Внутри: 1000+ реальных интервью-вопросов от Facebook, Google, Amazon, Microsoft и других топовых компаний. Практика по SQL, Python, R, статистике, алгоритмам, product sense и даже system design

Есть встроенный IDE с датасетами, где можно сразу писать и валидировать код. База регулярно обновляется

Бесплатно доступно 75 кодинг-задач, 600 вопросов и 50 тестовых заданий. Забираем здесь 🍯

@IT_Portal
🔥43
This media is not supported in your browser
VIEW IN TELEGRAM
Рецептивное поле в CNN, или как нейросети «видят»

В сверточных нейронных сетях (Convolutional Neural Networks, CNN) рецептивное поле — это область входного изображения, с которой работает конкретный нейрон. Оно соответствует максимальной области, которую сеть способна обработать.

Иными словами, рецептивное поле определяет ту часть изображения, которую нейрон «видит» при выполнении вычислений. По мере того как в CNN наслаиваются новые уровни, рецептивное поле увеличивается, и более глубокие слои могут захватывать более сложные паттерны на больших фрагментах изображения.

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Все недооценивают эту новую OCR-модель

dots-ocr — это новая vision-language модель с 1.7B параметров, которая показывает SOTA-результаты в мультиязычном парсинге документов

- Поддержка 100+ языков

- Работает как с изображениями, так и с PDF

- Без проблем обрабатывает текст, таблицы и формулы

Полностью опенсорс:
https://github.com/rednote-hilab/dots.ocr

👉 @DataSciencegx
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2