Данные по-большому – Telegram

Данные по-большому

139 subscribers

327 photos

59 videos

204 links

И все остальное по-маленькому.

Успешный успех в сфере DE, DS, AI, ML и прочего бигтеха, а также лайфстайл, мемы и новости айтишки и не только

Download Telegram

About

Blog

Apps

Platform

Данные по-большому

139 subscribers

Данные по-большому

БИГДАТА-МУТАНТ ВТОРГНЕТСЯ В НАШУ ЖИЗНЬ ОЧЕНЬ СКОРО

Кажется, Google готовится объединить SQL, Python и Spark в рамках Colab Enterprise

По слухам, поисковый гигант намерен создать единую среду для специалистов по машинному обучению, объединив SQL, Python и Apache Spark в одном месте.

Ясмин Ахмад, управляющий директор Google Cloud по обработке данных, отметил, что главным препятствием для эффективности в ML является необходимость переключаться между средами: получать данные с помощью SQL в базах данных и хранилищах, затем экспортировать их, загружать в блокнот и настраивать отдельный кластер Spark.

Как вы понимаете, это крайне неудобно. Поэтому Google представляет ряд улучшений для своих блокнотов Colab Enterprise в BigQuery и на платформе Vertex AI.

Кроме того, компания анонсировала следующие преимущества для разработчиков в блокнотах Colab Enterprise:
➖ Предварительный просмотр собственных ячеек SQL.
➖ Интеграцию собственного Data Science Agent, призванного помогать в анализе и разработке моделей.

#новости

Please open Telegram to view this post

VIEW IN TELEGRAM

79 views18:28

Данные по-большому

Чем больше я начинаю погружаться в западный вендорский софт, тем больше понимаю, что дивергенция видов ПО (опенсорс и проприетарка), начавшаяся в 2022 году, будет только усиливаться.
И лет через 5-10 у нас будет такое же расхождение по начинке как у советских и американских ЭВМ, а может даже больше. По тому же пути идёт и Китай, создавая свои виды железа, ОС и дата/BI инструментов.

С каждым годом придется делать более осознанный выбор, вкатываться в "наш родной" опенсорс или пытаться перекатиться в их западные бездуховные решения. Потому что чем раньше вкатишься, тем легче будет преодолеть расхождения между софтом, языками и организационными подходами.

81 views18:41

Данные по-большому

ОТЛИЧИЯ В РАБОТЕ В БАНКЕ/КОНСАЛТИНГЕ И В IT

В банке, даже если ты студент-стажер аналитик из ВШЭ/Плешки/Финашки за 30к в месяц, ты носишь костюм и каждое утро идёшь в офис в Москва-Сити под Huey Lewis и группу News.

В айти ты за 200-300к одеваешься как чухан и не ходишь в офис (или ходишь иногда), но утро начинается с "Ёклмн, опять очередной микросервис сломался, бизнес бабки теряет, а меня стопудово вздрючат на очередном дейлике и уволят"

#лайфстайл

87 viewsedited 05:10

Данные по-большому

Топ сертификатов для дата-инженера, которые просто имба:

- AWS
- Databricks
- GCP
- DBT
- Astronomer Airflow
- CKAD (без Кубера никуда)
- Confluent Kafka

Всё яндекс.практикумы лучше засунуть в одно место - сплошная трата денег с посадкой на Yandex.Cloud, не котирующийся в мире. Исключение - сертификация по Clickhouse, но это тоже опционально и она только в 2025 году появилась

С собранным набором хотя бы 4 из 7 сертификатов на изи залететь в FAANG, заботав алгосы. Но так как рабочие визы всё, то надо ещё поднапрячься на визу талантов.

И лишь после всех этих мытарств #эмиграч оправдан.

136 views11:27

Данные по-большому

This media is not supported in your browser

VIEW IN TELEGRAM

Ездить в офис - это счастье и вообще правильно! Сразу становишься более счастливым и продуктивным!
Вот, например, сегодня в Москве целая ветка метро встала, и тысячи офисных работников стали ближе друг к другу. У дистанционных работников такого контакта нет, поэтому работа плохо идёт.

#режим_работы

#сарказм

🤩1

103 views06:55

Данные по-большому

Ездить в офис

Anonymous Poll

Счастье, радость, продуктивность

Правильно (я девелопер/риэлтор недвиги в крупном городе)

Не нужно, это чисто прихоть миллениалов и бумеров. А интровертам не нужно вдвойне.

Свой ответ (в комменты)

🤡1

18 voters92 views07:01

Данные по-большому

Работа мечты.
Офис в Москва-сити, престижно!

👍2

88 views07:12

Данные по-большому

#оффтоп #прогнозы

Прогнозы - дело неблагодарное, и их обычно делают в конце года, но я сделаю сегодня.

Профессиональные прогнозы:
- Через год агенты будут сами настраивать DE-пайплайны. Агенты будут везде и повсюду.
- Вендорские решения окончательно достроят уровень абстракции из фильма "Идиократия", сделав работу DE простой. Деды как всегда будут ныть что вот раньше машинными кодами писали, а сейчас...
- Зарплаты DE снизятся на фоне превращения пайплайнов в конструктор в песочнице.

Политические прогнозы:
- Админ алармист. На горизонте 5 лет, а скорее раньше большая война в Европе неизбежна. Даже если вдруг Путин умрет, то все остальные руководители России в Европе помечены как "военные преступники", и им почти нечего терять. В самой Европе цены на топливо скакнули до исторических максимумов и дефицит квалифицированной рабочей силы, поэтому если в России все станет плохо, то им выгодно чтобы квалифицированные кадры ехали к ним, а нефть поступала почти даром после большой войны. США выгодно продать новый план Маршала и Европе и России после большой войны и списать госдолг.
Большая война случается когда в ней заинтересованы все стороны, и поэтому я убежден что она неизбежна.
- Китаю выгодна своя большая война с Тайванем из-за отставания в гонке ИИ. Начнется она одновременно с войной в Европе.
- Хорошо будет только тем, кто панует или в США или в странах Океании и вовремя эвакуировался.

Такой прогноз.

91 views10:35

Данные по-большому

💻 Docker теперь запускает целые ОС

Обычно для тестов разных ОС нужны виртуалки, отдельные сервера или dual-boot. Но есть трюк: через Docker можно поднять полноценную систему буквально одной командой.

Контейнер запускается в --privileged режиме и внутри поднимает виртуалку. Подключение к системе идёт через VNC или прямо из браузера.

Пример для Windows:

docker run --privileged -d -p 5999:5999 --name my-win-vm dockur/windows

Через пару минут вы получаете рабочий десктоп.

95 views11:37

Данные по-большому

💸 BigTech удваивает ставки на ИИ

- В 2025 компании потратят $345 млрд на AI-инфраструктуру - рост в 2,5 раза за два года.
- Для сравнения: мировой телеком тратит ~$1,5 трлн.
- Проект OpenAI Stargate ($500 млрд к 2029) = ~25% от прогнозируемых $2 трлн при росте в 58% год за годом.

#новости

102 views16:06

Данные по-большому

Братишки-датаинженеры, я вам повайбкодить принес.

https://www.anthropic.com/news/claude-sonnet-4-5

102 views17:06

Данные по-большому

Forwarded from Криптонит. Разработка, наука, шифрование

Кто стоит за современными алгоритмами, защищающими данные по всему миру?

Это российские и советские математики!
Их фундаментальные труды определили не только настоящее, но и будущее криптографии.

Подробнее об этом рассказывает Иван Чижов, заместитель руководителя лаборатории криптографии по научной работе компании «Криптонит».

Из этой статьи вы узнаете:

🟦Как русский математик заложил основу HQC — главного кандидатам среди постквантовых алгоритмов.
🟦Почему коды Гоппы — это must-have для криптографии нового поколения.
🟦Как Гельфонд придумал алгоритм, без которого не было бы безопасных чатов и онлайн-банкинга.
🟦Как российские криптографические разработки становятся частью международных стандартов.
🟦Как работы Чебышёва и Маркова помогают в криптоанализе.

В журнале "Информационная безопасность" читайте

➡️

полную версию статьи.⬅️

Please open Telegram to view this post

VIEW IN TELEGRAM

Роль отечественной математической школы в развитии мировой криптографии

Криптография всегда была окружена завесой тайны, а точнее – секретности. Если ее приоткрыть, то окажется, что в основе современных криптографических алгоритмов лежат разработки российских (и даже советских) математиков. Давайте вспомним несколько примеров…

❤1👍1👏1

88 views08:23

Данные по-большому

Сертификаты Stepik на LinkedIn
(ваш опыт)

Anonymous Poll

Котируются

На них смотрят, но просто как бонус

Не котируются вообще

Не знаю, посмотрю ответы

30 voters85 views08:25

Данные по-большому

Forwarded from e/acc

Сегодня продолжаем про влияние ИИ на рынки. Статья "Коузианская сингулярность", опять-таки про все ту же идею, про которую я писал свою статью о пост-коузианстве.

Идея: ИИ кардинально снижает затраты на поиск информации, ведение переговоров и заключение контрактов. Это приводит к реогранизации процесса производства в экономике:

- спрос на агентов похож на рынок труда, а предложение на рынок софта. спрос будет зависеть от их качества и способности экономить время и улучшать решения пользователей. предложение будет формироваться в условиях конкуренции между разработчиками, которые создают как универсальных, так и специализированных агентов.
- эффективность рынков вырастет, но так же это приведет к перегрузке рынков (например, вал резюме и рекламы от ИИ) и новые формы манипуляции
- это потребует перестройки рыночной инфраструктуры (например, создания специальных API для агентов), решения проблемы цифровой идентификации ("человек или бот?"), новых AI-native правил и регуляции

ИИ-агенты заменят риелторов, турагентов и любых других посредников.

НО это так же ставят под вопрос саму причину существования крупных компаний. фирмы существуют потому, что координировать действия внутри организации дешевле, чем заключать тысячи контрактов на открытом рынке. если агенты снизят эти издержки почти до нуля, то сложная координация через рынок (агент-агент) может стать эффективнее, чем координация внутри иерархической фирмы.

агенты превращаются в Хайековские инструменты по выявлению скрытых предпочтений

люди часто плохо понимают свои собственные предпочтения. хороший ИИ агент сможет анализировать наше поведение и подмечать скрытые закономерности, помогая нам лучше понять самих себя. например, агент по поиску жилья может заметить, что вы, сами того не осознавая, всегда кликаете на квартиры с большими окнами и рядом с парком, хотя вслух этих критериев не называли. Таким образом, агент превращается из простого исполнителя в коуча или даже терапевта, помогающего в "обнаружении предпочтений".

при этом, мир разделится на агентов, которые за вас (персональный агент) и bowling shoe агентов (обувь для боулинга, которую вы берете в аренду). первый угрожает бизнес-моделям гигантов вроде Amazon или Google, так как он может сравнивать предложения между ними и не подвержен их манипуляциям. второй может быть более специализирован и умнее (ибо в облаке), но более изощрен в манипуляциях и преследует не ваши, а интересы платформы.

99 views10:32

Данные по-большому

Я абсолютно не согласен со статьей выше.
ИИ не заменит посредников, которые знают у кого и как можно достать что-либо, где все держится на неформальных связях, комбинациях, многоходовочках и договорняках.
В публичном доступе лишь вершина айсберга, а все истинные контракты решаются на уровне межличностного общения и договорняков.
Транзакционные издержки никуда не денется в силу человеческой природы.

#экономика

134 viewsedited 10:34

Данные по-большому

Попробовал новый Claude Sonnet 4.5.
Вердикт: говно. Просто вместо кода засирает проект доками, md-файлами и за это ещё деньги берет. Приходится прямо в промпте указывать что доки не нужны.
Ошибок тоже делает много, нормальный JSON-файл для графановского дэшборда так и не собрал.

А по поводу Sora 2 могу сказать только то, что блохеры всё. Теперь любой из нас может генерить контент со своей физиономией и быть блохером. Ну и эпоха дипфейков наконец-то наступила окончательно.

97 views19:16

Данные по-большому

Юридические аспекты Sora 2 в России:

- Будет ли относиться сгенерированный "порнографический" и "экстремистский" контент со сгенерированными (не реальными) лицами к порнографии и экстремизму? Ведь потерпевших лиц нет и нет "вовлечённых в изготовление" лиц.
- Как вообще будет регулироватья подобный контент?
- Если будет сгенерирован ролик, где Бонапарт взял Петербург и дошел до Урала, то влепят ли создателю ролика статью о "реабилитации боннапартизма"?
- Если одним автономным агентом будет создан другой автономный агент, который генерит подобные ролики на автопилоте, то кто будет ли нести ответственность за создание подобных роликов?

Непростые вопросы, очень непростые вопросы...

83 views19:41

Данные по-большому

Интересный инструмент, соединяющий командную строку и Jupyter notebook стиль хранения кода.

#devops #de

Atuin Desktop: Runbooks that Run — Now Open Source

Atuin Desktop looks like a doc, but runs like your terminal. Script blocks, embedded terminals, database clients and prometheus charts - all in one place.

100 views03:23

Данные по-большому

Forwarded from Solid State Humanity

Искусственный нейрон, работающий как настоящий мозг

Ученые наконец-то решили главную проблему нейроморфной электроники: как сделать искусственные нервные клетки такими же энергоэффективными и тихими, как наши биологические нейроны. До этого момента электронные аналоги были слишком "громкими" и "прожорливыми", требуя напряжения в разы больше, чем живая клетка.
Секрет в новой гибридной системе: исследователи создали искусственный нейрон, используя новый тип компонента - мемристор, который, в свою очередь, был изготовлен на основе белковых нанопроволок. Эта конструкция позволила максимально точно имитировать ключевые функции биологической мембраны и каналов.

Если нейрон в вашем мозге генерирует сигнал (потенциал действия) с ультранизкой амплитудой, то этот искусственный аналог смог в точности повторить это, работая с напряжением всего 120 милливольт (мВ). Но еще важнее его энергопотребление: на генерацию одного импульса (спайка) ему требуется всего от 0,2 до 37 пикоджоулей (пДж). Этот показатель идеально соответствует реальным биологическим клеткам, что делает его самым эффективным электронным нейроном на сегодня.
Система также показала способность к химической модуляции, что похоже на работу нейромедиаторов в мозге. Ее функциональность можно регулировать, изменяя концентрацию таких веществ, как натрий или дофамин.

Этот чип уже протестировали в качестве биоэлектронного интерфейса. Нейрон был успешно подключен к живым клеткам сердечной мышцы и смог принимать и обрабатывать их электрические сигналы в реальном времени.

Хороший шаг вперёд к созданию имплантатов, которые смогут идеально взаимодействовать с нервной системой, и, конечно, к новому поколению нейроинтерфейов, работающих с энергоэффективностью человеческого мозга

#нейроинтерфейсы

Constructing artificial neurons with functional parameters comprehensively matching biological values

Nature Communications - Artificial neurons typically have functional parameters that are mismatched with their biological counterpart. Here, the authors develop artificial neurons that emulate...

👍1

99 views13:52

Данные по-большому

⚡ Не рывок, а прорыв!

Команда UCLA создала оптическую генеративную модель, которая работает на свете, а не на GPU.

В демонстрации шум сначала кодируется в фазовые паттерны с помощью лёгкого энкодера, а затем свободное распространение света (оптический декодер) превращает их в изображения, цифры, одежду, бабочек, лица и даже картины в стиле Ван Гога.

🔥 Главное - во время генерации нет никакой вычислительной нагрузки.

Результаты сопоставимы с цифровыми диффузионными моделями и открывают путь к сверхбыстрому и энергоэффективному ИИ на фотонике.

📄 Paper (Nature): https://nature.com/articles/s41586-025-09446-5#MOESM

99 views15:17