Data Science. SQL hub – Telegram

Data Science. SQL hub

35.8K subscribers

1.11K photos

92 videos

37 files

1.14K links

По всем вопросам- @workakkk

@itchannels_telegram - 🔥лучшие ит-каналы

@ai_machinelearning_big_data - Machine learning

@pythonl - Python

@pythonlbooks- python книги📚

@datascienceiot - ml книги📚

РКН: https://vk.cc/cIi9vo

#VRHSZ

Download Telegram

About

Blog

Apps

Platform

Data Science. SQL hub

35.8K subscribers

Data Science. SQL hub

Сотрудники Авито ведут свой telegram-канал ⭐️

И знаете, получается мегалампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом знакомые весёлые коллеги из постов, и вам точно есть что обсудить.

А вообще, хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и атмосферу в команде ещё до трудоустройства.

🔥 Однозначно подписка — @TeamAvito
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career

👍1👎1

2.99K viewsedited 14:05

Data Science. SQL hub

SQLModel использует аннотации типов Python, чтобы объединить Pydantic и SQLAlchemy и уменьшить дублирование кода при работе с SQL-базами.

* одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* хорошо совместим с FastAPI, Pydantic и SQLAlchemy
* внутри работает на базе Pydantic и SQLAlchemy
* разумные настройки по умолчанию уменьшают количество шаблонного кода

https://github.com/fastapi/sqlmodel

❤2👍1

3.3K views16:05

Data Science. SQL hub

Готов к космическому разгону AI‑продукта?
Приходи на One Day Offer для Product Analysts! 🚀

20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.

Ты будешь:

✔️ анализировать поведение пользователей;
✔️ проводить A/B‑тесты;
✔️ создавать дашборды;
✔️ работать с метриками.

А ещё ты станешь частью крупнейшего IT‑комьюнити.

Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас!

❤1👍1👏1

2.99K views10:43

Data Science. SQL hub

Media is too big

VIEW IN TELEGRAM

✔️

IPO OpenAI произойдет в 2027 году

Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.

Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.

Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.

В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com

✔️

Arcee AI переезжает из AWS на Hugging Face

Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.

Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.

На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co

✔️

NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5

Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.

Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.

В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.

Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.

Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google

✔️

Cohere выпустила свою первую открытую кодинг-модель

North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.

В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.

Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com

✔️

Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI

Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.

Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.

Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍2🔥2🤬1

3.44K views12:43

Data Science. SQL hub

OptimizerDuck - open-source утилита, после которой CCleaner уже не нужен

OptimizerDuck собирает в одном приложении 30+ твиков системы: от отключения телеметрии, Copilot, Cortana и рекламного ID до тонкой настройки автозагрузки, служб, питания и задержек ввода.

Укаждой настройки есть рейтинг риска. То есть вы заранее видите, что безопасно применить, а где лучше подумать, вместо классического сценария «нажал всё подряд и потом откатываешь систему».

Что умеет:

* отключать телеметрию Windows, Cortana, Copilot и рекламный ID
* управлять автозагрузкой приложений
* настраивать службы хоста под объём RAM
* включать кастомный план питания для высокой производительности
* снижать задержку клавиатуры для игр
* применять GPU-твики, которые обычно правят вручную через реестр

Все изменения обратимы. Не понравилось, можно откатить назад. можно откатить назад.

https://github.com/itsfatduck/optimizerDuck

👍8❤5🔥2🥰1

3.61K views20:22

Data Science. SQL hub

📚 Библиотека для работы с SQLite в C++26 с использованием рефлексии

Reflite — это библиотека на C++26, которая упрощает взаимодействие с SQLite, позволяя использовать обычные структуры как основу для выполнения запросов. Она поддерживает основные операции: вставка, удаление, выборка и обновление, избавляя от лишнего шаблона кода.

🚀 Основные моменты:
- Легковесная библиотека в одном файле
- Поддержка операций INSERT, DELETE, SELECT, UPDATE
- Использует рефлексию для работы с типами структур
- Не требует полной реализации SQL, фокус на простоте
- Совместима с современными компиляторами C++26

📌 GitHub: https://github.com/KaruroChori/reflite

#cpp

❤8👍3🔥3

2.83K views14:03

Data Science. SQL hub

Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.

Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.

На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.

BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.

https://x.com/GoogleResearch/status/2065475343205740911

❤8🔥3👍2

2.69K views14:02

Data Science. SQL hub

Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.

Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.

Разные научные объекты записываются одним общим языком токенов.

Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.

По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.

🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905

❤4👍2🔥1

2.31K views12:02

Data Science. SQL hub

This media is not supported in your browser

VIEW IN TELEGRAM

Разберем математику бесконечности Сатору Годжо, которая работает не как обычный щит.

Он не просто останавливает удар в последний момент. Идея в том, что пространство между атакой и Годжо как будто делится на всё более маленькие отрезки.

Сначала объект проходит половину расстояния. Потом половину оставшегося. Потом ещё половину. И так снова и снова.

Математически это похоже на бесконечную сумму: одна вторая, одна четвёртая, одна восьмая, одна шестнадцатая.

Объект всё ближе, но до контакта так и не доходит.

На практике атака как будто замедляется почти до нуля. Чем ближе она к Годжо, тем сильнее падает её эффективная скорость.

Поэтому Бесконечность — это не просто барьер. Это контроль пространства, где противник застревает в бесконечном приближении.

❤11👍2👎1

2.53K views14:02

Data Science. SQL hub

QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.

Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.

Что важно:

- Колоночное хранение данных

Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.

- Многоуровневое хранение

От WAL до нативного колоночного формата и Parquet в object storage.

- SQL-расширения для time-series

Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.

- Интеграции

Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.

https://github.com/questdb/questdb

❤2

2.34K views13:04

Data Science. SQL hub

This media is not supported in your browser

VIEW IN TELEGRAM

Вы можете выучить SQL по «Тетради смерти»

О времена, о нравы)

👍12❤5😁5🔥3👎2

2.62K viewsedited 13:32

Data Science. SQL hub

OpenAI выпустила полную версию GPT-5.5-Cyber - своей самой продвинутой модели для авторизованной защитной кибербезопасности.

Новая модель набрала 85,6% на CyberGym и обошла:

• Mythos 5 — 83,8%

• раннюю версию GPT-5.5-Cyber — 81,9%

• GPT-5.5 — 81,8%

• GPT-5.4 — 79,0%

• Claude Opus 4.7 — 73,1%

https://x.com/sama/status/2069121360744550796

❤3👍2🔥2🤔2🤯1

2.4K viewsedited 14:43

Data Science. SQL hub

Мы вообще понимаем, насколько Месси статистически ненормален?

Я наткнулся на цифру: по голам + ассистам за 90 минут он почти на 6 стандартных отклонений выше среднего нападающего из топ-лиг.

Для контекста: это уже не «очень сильный игрок».

Это уровень, который статистика почти не ожидает увидеть при жизни одного поколения.

Вот почему спор про Месси часто ломается: его сравнивают как футболиста, а он по цифрам ближе к аномалии.

Мы реально застали сбой системы.

Или всё ещё есть сомневающиеся?

🔥28👍5🥰2❤1

2.35K views12:03

Data Science. SQL hub

Как называется роль (пользователь) в PostgreSQL, которая обладает всеми правами доступа и может обходить любые проверки разрешений?

Anonymous Quiz

👍11🔥3😁3❤1

608 voters2.11K views15:31

Data Science. SQL hub

⚡️ SQL-трюк, который редко используют: `IS DISTINCT FROM`

Проблема обычного сравнения:


NULL <> 'new value'

не возвращает true. В SQL NULL ломает привычную логику сравнений.

Вместо этого можно писать так:


UPDATE users
SET email = :new_email
WHERE id = :id
  AND email IS DISTINCT FROM :new_email;

Зачем это нужно:

1. обновляешь строку только если значение реально изменилось
2. корректно работаешь с NULL
3. не плодишь лишние записи в WAL
4. не триггеришь лишние updated_at, triggers и replication events

Особенно полезно в API, где фронт постоянно присылает одни и те же данные.

Маленький оператор, который делает SQL сильно аккуратнее.

👍16❤5🤯1

1.79K views16:34

Data Science. SQL hub

Media is too big

VIEW IN TELEGRAM

SQL-инъекция за 40 секунд: Лайт против L

Разбираем SQL-инъекцию на пальцах в формате Лайт против L. Что это такое, как обычная строка ввода меняет логику запроса, к чему это приводит и какими способами реально закрыть дыру. Коротко, по делу и так, чтобы запомнилось.

Больше таких видео: https://www.youtube.com/shorts/c4gBi094jkU

@sqlhub

👍5❤3🔥3

1.47K viewsedited 15:03