Физика Облаков - Всё об ИТ-инфраструктуре, ЦОДах, частных и публичных облаках
374 subscribers
27 photos
1 video
2 files
64 links
Download Telegram
Пока общественно-политические СМИ захватила истерия по поводу китайского вируса в технических медиа взахлёб пишут про вышедший 7 февраля новый CPU от AMD - Threadripper 3990X. Это процессор для сегмента HEDT (High End Desktop) на базе микроархитектуры Zen 2 с впечатляющими характеристиками - 64 ядра (128 потоков), базовая частота 2.9Ghz, буст до 4.2Ghz.

В синтетических тестах он рвёт серверные платформы с двумя Xeon Platinum 8280 в среднем на 25% (сборка ядра Linux за 22 секунды - is it legal?). И это при стоимости в 3,990$ (цена совпадает с индексом модели 🥇) против ~20,000$ за два Xeon.

Как так вышло? Вот несколько мыслей на эту тему:
🏭 Intel производит CPU на собственных мощностях, которые уже несколько лет как застряли на техпроцессе 14nm (в прошлом году только что-то появилось на 10nm). AMD работает в модели "fabless", меняя поставщика на того, у которого в данный момент наиболее продвинутая технология (сейчас 7nm в TSMC).
🚀 Процессоры от AMD это на самом пачка мини-CPU "склеенных" внутренней шиной (NUMA уже внутри чипа), что позволяет достигать очень большого кол-ва ядер на один сокет. Есть правда и обратная сторона медали - больше чем на пару сокетов такие конструкции скорее всего не масштабируются из за высоких накладных расходов на обеспечение когерентности кэшей.
🔩 В Intel задрали цены, пользуясь отсутствием конкуренции, и были заняты развитием побочных направлений.

С такими новостями остаётся только ждать в этом году выхода новой серверной линейки на Zen 3 - похоже эпоха монополии Intel подходит к концу 📉.
​​Вышло обновление HPe MicroServer - Gen10 Plus. Xeon E-2224 4C/3.4Ghz (или Pentium 2C/3.8Ghz), до 32GB DDR4 RAM, 4x LFF SATA + SmartArray, 4x 1GBASE-T, 1x 16 PCIe Gen3, iLO.

Хорошая платформа для домашней лабы (или удалённой площадки), если возможностей мини-ПК типа Intel NUC недостаточно (мало NIC или HDD, нет PCIe и удалённого управления через iLO).
​​Вышел ежегодный рейтинг надёжности HDD от Backblaze - провайдера услуг "облачного" хранения данных.
​​IBM обновила линейку систем хранения данных FlashSystem. Теперь она объединена с моделями Storwize. Плюс вышли новые all-flash системы с софтом от того-же Storwize (ныне называется "Spectrum Virtualize"), в топовых конфигурациях обещают минимальный отклик 70 μs, data reduction до 5:1, до 18M IOPS, до 32PB емкости, итп итд.

Также обновились "головы" IBM SAN Volume Controller. Там теперь новые CPU, 25Gbe и 32G FC.

Сейчас по данным IDC IBM делит 4 место на рынке СХД с Hitachi и Huawei, думаю фейс-лифтинг линейки никак не изменит положение вещей.
​​Подборка проверенных конфигураций железа для домашних лаб на VMware vSphere - https://github.com/lamw/homelab
Inside Azure datacenter architecture with Mark Russinovich 🔥🔥🔥

Много интересного: подводные датацентры, сравнение производительности NAND и 3D XPoint, погружное жидкостное охлаждение серверов, новые сервисы Azure.

PS: Досмотрите до конца - Project Tardigrade это 🤯.

https://www.youtube.com/watch?v=X-0V6bYfTpA
Сегодня релиз Veeam Backup & Replication v10
Ключевые фишки:

📌 Бэкап данных с NFS и CIFS шар

📌 Улучшения в работе с Cloud Tier (заливка бэкапов в S3/Azure Blob Storage/итп):
1) В 9.5 можно было перемещать бэкапы в объектные хранилища по истечению срока их локального хранения для увеличения эффективной емкости СРК, теперь можно делать копии сразу после создания бэкапа, на случай потери локальных репозиториев.

2) Появилась возможность управления S3 Object Lock (можно указать срок в течении которого с залитыми в "облако" бэкапами ничего будет нельзя сделать).

Кстати посмотрите демо (начало с 5:50) Instant VM Recovery напрямую из Amazon S3 - это же 🤯.

📌 Возможность использования Linux (в 9.5 Windows-only) в качестве бэкап-прокси (пока правда только в режиме hot-add, т.е. нужно чтобы прокси был на ВМ в том же кластере среды виртуализации, что и защищаемые виртуалки). Обратите внимание на проект по автоматизации их деплоя. Ещё не пропустите тонкости создания xfs для использования в качестве фс для репозитория бэкапов.

PS:
Не понимаю почему Veeam до сих пор хотя бы минимально не вложился в поддержку legacy-платформ (ну типа Oracle на AIX), которые в корпоративном сегменте ещё лет 10 будут присутствовать. Это бы расширило их total addressable market в разы и отправило бы на свалку истории всякие netbackup'ы, data protector'ы и прочие tivoli. 🤷🏻‍♂️
Текущее состояние линейки серверных процессоров второго поколения (Rome) от AMD
В Google Cloud явно собрались в поход за деньгами в кровавый энтерпрайз. Новости последних пары дней:

- Google Anthos (гибридная платформа для разворачивания Kubernetes от Google в "частном" облаке) обзаводится экосистемой совместимых "on-premise" СХД. Уже есть поддержка продуктов от Dell EMC, HPE, NetApp, Pure Storage, Portworx и Robin.io.

- Google покупает Cornerstone, компания специализируется на миграции приложений с мейнфреймов.

🧐
​​Пост про новое поколение кастомных серверных платформ, которые используются в Cloudflare (крупнейший CDN, через который проходит траффик 12% всех сайтов). Вкратце:

- 1x AMD EPYC 7642 (48C, 2.4GHz, 256MB L3 Cache)
- 256G RAM @ 2933MHz
- 3x 1TB Samsung NVMe
- 2x25G Mellanox NIC
Обновилась линейка Xeon Scalable - вышли новые CPU на прошлогодней микроархитектуре Cascade Lake (14nm) в линейках Gold, Silver и Bronze (Platinum без изменений). Стандартное "больше ядер-кэша-мегагерцев".

Новые CPU можно опознать по суффиксу "R" в названии (не считая апгрейд 4209T до 4210T - это модели с повышенной максимальной 🌡️). Помимо обновления старых процессоров появились:
🔥 Два новых CPU с Turbo Boost до 4.5Ghz (6250 - на 8 ядер и 6256 - на 12 ядер)
🥇 Односокетная модель 3.9Ghz на 16 ядер - 6208U (ответ AMD)

Интересные наблюдения:
💰 Intel по сути снизил цены - обновленные CPU предлагаются за те же деньги что и старые, несмотря на прибавку к производительности. Более того - некоторые новые модели по сути заменяют (не считая ограничения на кол-во сокетов) собой CPU из линейки Platinum, но стоят в несколько раз дешевле (слава ценовой политике AMD).
📈 В маркетинговый месседж Intel возвращается риторика относительно высокой частоты и single-thread performance (надо же как-то дифференцироваться от AMD).
🏗️ Все новые модели (кроме 6208U) ограничены двумя сокетами, скорее всего в будущем весь хардкорный SMP уедет в линейку Platinum.
​​Продолжение темы про новые серверы на AMD EPYC в Cloudflare. В абсолютном большинстве тестов, связанных с обработкой веб-траффика, AMD EPYC 7642 (1x 48C) рвёт 2x Intel Xeon Platinum 6162 (2x 24C), при более низком электропотреблении и стоимости 🔥🔥🔥
​​Интересная аналитика от GigaOm - ландшафт рынка систем резервного копирования. Как читать:

Maturity - показатель зрелости продукта: распространнёности среди потребителей, наличия устойчивой экосистемы смежных решений и интеграций.
Innovation - индикатор упора на инновационные технические фишки, выделяющие решение из общей массы.
Feature Play - специализация и заточка под конкретные (точечные) задачи или сценарии использования.
Platform Play - ориентация на решение широкого спектра задач с большим количество функций и интеграций.

Точка - где продукт сейчас, вектор - направление развития. Чем ближе к центру по любой оси - тем 💪.

На мой взгляд очень точное видение рынка, тяжело где-то возразить. Всё так 👍
NetApp выпустил исследование надёжности SSD на базе статистики по отказам в своих файлерах (FAS). В выборку попала информация по 1.4 млн драйвов.

TLDR:

🎲 Ежегодный процент драйвов, требующих замены (Annual Replacement Rate, ARR) - 0.22% (при разбросе от 0.07% для самой надёжной модели, до 1.2% для самой ненадёжной; что именно это за модели к сожалению остаётся тайной).

Отдельно подмечают что даже две практически идентичных по характеристикам модели одного производителя могут сильно различаться по ARR.

Также действует правило - чем больше емкость, тем выше ARR.

Интенсивность отказов наиболее высока в период приработки, который для SSD длится более года, увеличения вероятности отказа ближе к концу жизненного цикла не происходит. Это резко отличается от HDD, для которых характерен короткий период приработки, низкий процент отказов в середине ЖЦ и постепенный рост вероятности отказа по мере старения привода.

💪 В целом SSD значительно надёжней HDD, для которых нормой считается ARR 2-9%.

🦆 Отказ SSD от износа - fake news. В среднем драйв в течении своего жизненного цикла использует менее 15% резервной емкости. Даже самые большие значения этой метрики в выборке не превышают 33%. Применение QLC NAND - не проблема с точки зрения износа.

🐞 Очень важно иметь последнюю версию прошивки на драйве - в некоторых случаях это снижает ARR на порядок, за счёт исправления багов. Однако процесс апгрейда как правило вендорами реализован крайне по уродски и 70% накопителей не получают апдейтов в течении жизненного цикла.

🚚 Большие RAID-группы из SSD - это нормально. Процент одновременных отказов не коррелирует с размером группы.

🥈Но в целом одновременные отказы - реальность. RAID5 недостаточно. Минимум двойная чётность.