CPU vs GPU vs TPU
Многие наверняка встречали 3 этих аббревиатуры.
CPU - central processing unit. Стандартный процессор, способный выполнять задачи общего назначения;
GPU - graphical processing unit. Графический ускоритель, выполняет более специализированные задачи, такие как параллельные вычисления;
TPU - tensor processing unit. Чип от google с уникальной архитектурой, направленной на максимальное ускорение обучения нейросетей всех типов.
Google в свое время совершил революцию, разработав первый чип для нейросетей. На TPUv1 они выпустили плату - ускоритель в формате SATA диска (слева на картинке). На данный момент google планирует выпускать TPUv6. Думаю, его потребление будет около 350Вт (против 75Вт для TPUv1). Однако предлагаю рассмотреть ту самую изначальную архитектуру, которая значительно обогнала GPU в 2016.
Сердце TPU - MMU (блок матричного перемножения весов и данных). Второй по важности элемент - объемный буфер для хранения промежуточных данных и шина памяти с высокой пропускной способностью. Поскольку умножение с накоплением больших матриц - основная операция, требуемая для работы нейросетей, TPU выполняет подобные задачи быстрее CPU и GPU. За счет архитектуры и языка (фреймворк TensorFlow), заточенных под конкретные операции, TPU значительно обгоняет своих оппонентов(CPU Intel Haswell, GPU Nvidia K80) что видно на графиках справа. Аналогичная ситуация и с производительность на ватт. Таким образом TPU и стал фаворитом для задач обучения нейросетей.
Многие наверняка встречали 3 этих аббревиатуры.
CPU - central processing unit. Стандартный процессор, способный выполнять задачи общего назначения;
GPU - graphical processing unit. Графический ускоритель, выполняет более специализированные задачи, такие как параллельные вычисления;
TPU - tensor processing unit. Чип от google с уникальной архитектурой, направленной на максимальное ускорение обучения нейросетей всех типов.
Google в свое время совершил революцию, разработав первый чип для нейросетей. На TPUv1 они выпустили плату - ускоритель в формате SATA диска (слева на картинке). На данный момент google планирует выпускать TPUv6. Думаю, его потребление будет около 350Вт (против 75Вт для TPUv1). Однако предлагаю рассмотреть ту самую изначальную архитектуру, которая значительно обогнала GPU в 2016.
Сердце TPU - MMU (блок матричного перемножения весов и данных). Второй по важности элемент - объемный буфер для хранения промежуточных данных и шина памяти с высокой пропускной способностью. Поскольку умножение с накоплением больших матриц - основная операция, требуемая для работы нейросетей, TPU выполняет подобные задачи быстрее CPU и GPU. За счет архитектуры и языка (фреймворк TensorFlow), заточенных под конкретные операции, TPU значительно обгоняет своих оппонентов(CPU Intel Haswell, GPU Nvidia K80) что видно на графиках справа. Аналогичная ситуация и с производительность на ватт. Таким образом TPU и стал фаворитом для задач обучения нейросетей.
🔥12👍3💯1
Designing_Manufacturable_and_Reliable_Printed_Circuit_Boards_Employing.pdf
925.8 KB
Прочитал статью про отмывку печатных плат и у меня есть отличная иллюстрация к чему же могут привести загрязнения. В прикрепленном документе рассмотрены причины возникновения дендритов на печатных платах (в том числе из - за загрязнений) и методы борьбы с ними. Помимо этого рассказаны и другие часто возникающие проблемы, снижающие надежность.
👍9🔥7💯1
Нашел сайт с проектами, по которым доступна вся необходимая документация (схемы, платы, файлы cad). Большинство проектов - вычислители/конвертеры на FPGA, RF карты и измерители. В основном встречаются платы в AD, иногда в Cadence и KiCad. Больше всего понравились проекты от CERN, как по оформлению так и по техническим решениям.
🔥20👍12🤩3❤1
Про оптику в вычислителях.
Летом прошлого года Broadcom анонсировал новые ASIC со встроенной в корпус оптикой. Основная идея в том, что потери в меди становятся критичными для современный свичей (которые работают на 106Gb/s на лейн), в связи этим приемопередатчики располагаются на одной подложке с ASICом. Данную технологию планируется применять не только для свичей датацентров. Актуальна она и для объединения тех же GPU, о чем Broadcom также упоминает, CPO GPU показана снизу справа. При этому потребление энергии на передачу данных снижается на 30-40% - очень существенно, учитывая, как все борются за Gb/ps/W.
Параллельно с этим DAC (Direct attached cable) модули постепенно изживают себя. При увеличении пропускной способности требуется больший диаметр микро - коаксиальных кабелей для сохранения потерь на том же уровне. Это приводит к росту цены на кабели, неудобству в производстве монтаже и прокладке. Тут пишут, что будущее для SFP на коротких расстояниях - пластиковые кабели e-Tube. Они дешевые, надежные, энергоэффективные и обеспечивают минимальную задержку (сравнительная таблица снизу).
Таким образом, оптика продолжает свою экспансию за счет расширения AI и HAAS. Однако электронике боятся особо нечего (особенно в системах с небольшой пропускной способностью) из за узких областей применений оптики.
Летом прошлого года Broadcom анонсировал новые ASIC со встроенной в корпус оптикой. Основная идея в том, что потери в меди становятся критичными для современный свичей (которые работают на 106Gb/s на лейн), в связи этим приемопередатчики располагаются на одной подложке с ASICом. Данную технологию планируется применять не только для свичей датацентров. Актуальна она и для объединения тех же GPU, о чем Broadcom также упоминает, CPO GPU показана снизу справа. При этому потребление энергии на передачу данных снижается на 30-40% - очень существенно, учитывая, как все борются за Gb/ps/W.
Параллельно с этим DAC (Direct attached cable) модули постепенно изживают себя. При увеличении пропускной способности требуется больший диаметр микро - коаксиальных кабелей для сохранения потерь на том же уровне. Это приводит к росту цены на кабели, неудобству в производстве монтаже и прокладке. Тут пишут, что будущее для SFP на коротких расстояниях - пластиковые кабели e-Tube. Они дешевые, надежные, энергоэффективные и обеспечивают минимальную задержку (сравнительная таблица снизу).
Таким образом, оптика продолжает свою экспансию за счет расширения AI и HAAS. Однако электронике боятся особо нечего (особенно в системах с небольшой пропускной способностью) из за узких областей применений оптики.
🔥8❤3👌2
Зачем нужен дополнительный диод в синхронном преобразователе?
В классической топологии понижающего преобразователя (слева сверху) присутствует диод и транзистор, они поочередно проводят ток. Для увеличения КПД была предложена синхронная топология, диод заменили на транзистор. Управляющий контроллер открывает нижний ключ в моменты, когда должен был открыться диод в классическом понижающем преобразователе. Таким образом, потери на диоде сведены практически к 0, поскольку теперь падение на нижнем ключе несравнимо мало (оно
зависит только от сопротивления его канала).
Казалось бы, все хорошо, но, как всегда, есть нюансы. В классической топологии коммутация происходила автоматически при запирании верхнего ключа (ток индуктивности моментально разряжает емкостью диода). В этом случае никогда не возникает ситуации, когда оба ключа открыты (что приводило бы к сквозным токам).
В синхронном преобразователе коммутацией руководит контроллер с драйвером. В случае если он замкнет два ключа одновременно, они сгорят из - за неограниченного тока. В связи с этим в контур управления вводят задержку между отключением верхнего ключа и включением нижнего (мертвое время). Как раз в течении этого времени будет проводить внутренний паразитный диод нижнего транзистора по аналогии с классическим ППН. Тут и происходят потери, которые довольно критичны для высокоэффективных преобразователей.
Первая часть потерь - проводимость внутреннего диода в течении мертвого времени. При больших токах значительно влияет на полный КПД преобразователя. Вторая часть - заряд обратного восстановления и выходная емкость диода. После периода проводимости к диоду прикладывается обратное напряжение, в результате возникает обратный заряд Qrr. Обеспечение дополнительным током диода ложится на верхний ключ, что приводит к очередным потерям, особенно на высоких частотах. Выход в данном случае - возвращение диода в нижнее плечо. В течении мертвого времени именно он возьмет на себя роль проводника тока, шунтируя внутренний диод транзистора. Важно, чтобы это был именно Шоттки, они имеют Qrr = 0 и малое прямое падение, что значительно снизит потери на проводимость. Снизу можно видеть, что для GaN транзисторов параллельные диоды практически обязательны. Поскольку у GaN при обратной проводимости канала напряжение больше в 2-3 раза, чем у MOSFETов.
В классической топологии понижающего преобразователя (слева сверху) присутствует диод и транзистор, они поочередно проводят ток. Для увеличения КПД была предложена синхронная топология, диод заменили на транзистор. Управляющий контроллер открывает нижний ключ в моменты, когда должен был открыться диод в классическом понижающем преобразователе. Таким образом, потери на диоде сведены практически к 0, поскольку теперь падение на нижнем ключе несравнимо мало (оно
зависит только от сопротивления его канала).
Казалось бы, все хорошо, но, как всегда, есть нюансы. В классической топологии коммутация происходила автоматически при запирании верхнего ключа (ток индуктивности моментально разряжает емкостью диода). В этом случае никогда не возникает ситуации, когда оба ключа открыты (что приводило бы к сквозным токам).
В синхронном преобразователе коммутацией руководит контроллер с драйвером. В случае если он замкнет два ключа одновременно, они сгорят из - за неограниченного тока. В связи с этим в контур управления вводят задержку между отключением верхнего ключа и включением нижнего (мертвое время). Как раз в течении этого времени будет проводить внутренний паразитный диод нижнего транзистора по аналогии с классическим ППН. Тут и происходят потери, которые довольно критичны для высокоэффективных преобразователей.
Первая часть потерь - проводимость внутреннего диода в течении мертвого времени. При больших токах значительно влияет на полный КПД преобразователя. Вторая часть - заряд обратного восстановления и выходная емкость диода. После периода проводимости к диоду прикладывается обратное напряжение, в результате возникает обратный заряд Qrr. Обеспечение дополнительным током диода ложится на верхний ключ, что приводит к очередным потерям, особенно на высоких частотах. Выход в данном случае - возвращение диода в нижнее плечо. В течении мертвого времени именно он возьмет на себя роль проводника тока, шунтируя внутренний диод транзистора. Важно, чтобы это был именно Шоттки, они имеют Qrr = 0 и малое прямое падение, что значительно снизит потери на проводимость. Снизу можно видеть, что для GaN транзисторов параллельные диоды практически обязательны. Поскольку у GaN при обратной проводимости канала напряжение больше в 2-3 раза, чем у MOSFETов.
👍20❤2🔥1
an958-683073-677286.pdf
1.1 MB
Два пособия от Intel и Alterа по топологии и целостности сигналов.
В первом документе рассмотрены общие принципы, используемые при проектирования плат с высокоскоростными интерфейсами: линии передачи, терминация, PDN и другое.
В первом документе рассмотрены общие принципы, используемые при проектирования плат с высокоскоростными интерфейсами: линии передачи, терминация, PDN и другое.
ug20298-683864-666567.pdf
1 MB
Второй документ рассказывает о более продвинутых техниках: снижение перекрестных помех, неравномерности импеданса, проектирование антипадов, подведение трасс к разъемам. Из интерфейсов PCIe Gen 4, QSFP-DD, есть примеры топологии MCIO и мезонинного разъема под карты.
🔥16👍10❤4❤🔥1👏1
Low Profile LTCC Inductor.pdf
1.2 MB
Занятная технология изготовления дросселей для плотных преобразователей.
Описанный метод позволяет значительно снизить габариты вашего источника (или увеличить Вт/мм^3).
Есть и нюансы, подобные дроссели предназначены для преобразователей с частотой выше 1Мгц. Максимально раскрывают свой потенциал в паре с GaN транзисторами.
Однако, мне не удалось найти в продаже подобные индуктивности как отдельные компоненты. Возможно, технология нашла применение только в нише модульных источников питания.
Описанный метод позволяет значительно снизить габариты вашего источника (или увеличить Вт/мм^3).
Есть и нюансы, подобные дроссели предназначены для преобразователей с частотой выше 1Мгц. Максимально раскрывают свой потенциал в паре с GaN транзисторами.
Однако, мне не удалось найти в продаже подобные индуктивности как отдельные компоненты. Возможно, технология нашла применение только в нише модульных источников питания.
🔥8🤔2👍1💩1
Loop response mesuarments.pdf
718.6 KB
Статья от AD, где рассказывают как изменять переходную характеристику вашего преобразователя. Встречаются микросхемы, в которых отсутствует доступ к резисторам обратной связи, как раз для таких случаев и применяется описанный метод
👍7🔥2👏1
Signal_Integrity_Characterization_of_Via_Stubs_on_High_Speed_DDR4.pdf
3.3 MB
Наглядный пример того, зачем высвреливают переходные отверстия для высокочастотных сигналов.
Предположим, вы трассируете печатную плату. Требуется соединить высокоскоростной шиной две микросхемы (в данной статье DDR4), расположенных на верхнем слое. С большой вероятностью соединить две большие микросхемы без пересечения проводников не выйдет. По итогу придется переходить на внутренние слои. Для удешевления в большинстве коммерческих плат не используют слепые и глухие переходные отверстия. Таким образом, если вам нужно перейти на внутренние слои, переходное отверстие будет насквозь проходить от верхнего до нижнего слоя. Поскольку вы перешли с верхнего слоя на 3 или, например, 5 слой, оставшийся метал переходного отверстия (с 3/5 слоя до самого низа) будет являться стабом.
Известно, что отросток от линии длинной 1/4 волны сигнала будет полностью отражать сигнал. Чем ближе участок от слоя 3/5 до нижнего слоя к 1/4 волны, тем больше от него будет отражение. В статье рассматривают 3 случая:
• Соединение двух чипов без стабов;
• Соединение двух чипов со стабом;
• Соединение чипа и DIMM модуля с двумя стабами.
Во втором случае при длине стаба от 73.1 милов интерфейс не проходит по BER. В третьем случае автор почему то выбрал слишком большую длину тракта и интерфейс не прошел по BER даже без стабов (со стабами еще хуже, что видно на картинках 18-19.
Итог: стабы - это плохо, особенно на толстых платах. Самый дешевый способ (помимо намеренного подвода проводников с нижних слоев) их избежать - высверливание переходных.
Предположим, вы трассируете печатную плату. Требуется соединить высокоскоростной шиной две микросхемы (в данной статье DDR4), расположенных на верхнем слое. С большой вероятностью соединить две большие микросхемы без пересечения проводников не выйдет. По итогу придется переходить на внутренние слои. Для удешевления в большинстве коммерческих плат не используют слепые и глухие переходные отверстия. Таким образом, если вам нужно перейти на внутренние слои, переходное отверстие будет насквозь проходить от верхнего до нижнего слоя. Поскольку вы перешли с верхнего слоя на 3 или, например, 5 слой, оставшийся метал переходного отверстия (с 3/5 слоя до самого низа) будет являться стабом.
Известно, что отросток от линии длинной 1/4 волны сигнала будет полностью отражать сигнал. Чем ближе участок от слоя 3/5 до нижнего слоя к 1/4 волны, тем больше от него будет отражение. В статье рассматривают 3 случая:
• Соединение двух чипов без стабов;
• Соединение двух чипов со стабом;
• Соединение чипа и DIMM модуля с двумя стабами.
Во втором случае при длине стаба от 73.1 милов интерфейс не проходит по BER. В третьем случае автор почему то выбрал слишком большую длину тракта и интерфейс не прошел по BER даже без стабов (со стабами еще хуже, что видно на картинках 18-19.
Итог: стабы - это плохо, особенно на толстых платах. Самый дешевый способ (помимо намеренного подвода проводников с нижних слоев) их избежать - высверливание переходных.
👍17🔥4❤3
SIJ-OCT-EBOOK-2025-v4.pdf
16 MB
Опубликовали новый выпуск SI журнала. Еще не читал, но на первый взгляд имеется парочку интересных статей
🔥11👍2👌1
Проектировать свои схемы всегда интереснее, но также полезно анализировать и перенимать чужой опыт. В связи с этим решил написать статью, в которой анализирую материнскую плату от Macbook Pro 15''. И могу сказать, что у Apple определенно есть хорошие решения.
❤18👍9👏7🔥3
Написал про нестандартные решения в схемах. Приглашаю в комментарии для рассказа о ваших находках.
Teletype
А так можно?
Вопрос, который особенно часто возникает вначале карьеры, когда ты смотришь на чужую схему. Казалось бы, схемотехника - максимально...
👍25🔥7👏2
Ну что же, вот и вторая часть. В этот раз разобрал аналоговые и оставшиеся силовые блоки.
Teletype
Разбираем чужие схемы ч.2
Продолжаем разбор схемы Macbook Pro 15\'\' на Intel i7. С первой частью можно ознакомиться тут.
🔥14👍8❤4
Typical High-Speed Layout Constraints versus Signal Speed.pdf
109.4 KB
Наткнулся на топологические правила для сигналов в зависимости от их частоты. Есть вопросы к некоторым правилам, но в целом хорошие рекомендации, что думаете?
❤6🔥6👍3
В этой части у нас архитектура, интерфейсы и цифровая логика.
Teletype
Разбираем чужие схемы ч.3
Продолжаем разбор схемы Macbook Pro 15\'\' на Intel i7. С первой частью можно ознакомиться тут, а со второй - тут.
👍7🔥7❤🔥2❤1💯1
Объединил две части с разбором схемы Macbook pro, отредактировал неоднозначные моменты и выложил на Хабр. Кто еще не читал, можно глянуть там.
Хабр
Разбираем схемотехнику Macbook Pro 15'' ч.1
Регулярно в процессе разработки электроники возникают вопросы: "А как правильно? А так можно? Будет ли это работать?". В связи с этим предлагаю посмотреть: а как же проектируют свои устройства...
🔥12❤5😍1
Forwarded from Господа Топологи
https://t.me/addlist/Mf0gmPX2cwM0MTIy
На основании ваших ответов на опрос - коммьюнити подборка каналов. Если вы хотите, чтобы ваш канал или не ваш канал был в ней - сообщите нам!
На основании ваших ответов на опрос - коммьюнити подборка каналов. Если вы хотите, чтобы ваш канал или не ваш канал был в ней - сообщите нам!
Telegram
Электроника
Lock Dok invites you to add the folder “Электроника”, which includes 12 chats.
👍5🥰1
Все торопятся закрыть задачи до нового года, а я завершаю серию статей про разбор схем Macbook. В этой части я объединил переработанную и дополненную часть 3 с канала и разбор оставшихся на страниц. Как по мне, получилось более цельно и понятно.
Habr
Разбираем схемотехнику Macbook Pro 15'' ч.2
Регулярно в процессе разработки электроники возникают вопросы: "А как правильно? А так можно? Будет ли это работать?". В связи с этим предлагаю посмотреть: а как же проектируют свои устройства...
🔥10👍5❤4
Current Mode-Controlled DC-DC Regulators P4.pdf
838.8 KB
Отошли от празднования?
Тогда вот материал, где How2power вместе с TI подробно разбирают обратную связь DC-DC по току. Полезно изучить, учитывая, что современные преобразователи все чаще уходят от регулирования только по напряжению.
Тогда вот материал, где How2power вместе с TI подробно разбирают обратную связь DC-DC по току. Полезно изучить, учитывая, что современные преобразователи все чаще уходят от регулирования только по напряжению.
👍20🔥10😱2