Lasiar работает 💡

Endianness или ~~конечность~~ порядок байт

Компьютеры по-разному хранят данные в оперативной памяти.

Меня всегда смущало, читая что-то, где есть двоичное представление
почему у некоторых старший байт слева, а у некоторых справа.

А все потому что люди до сих пор не договорились как хранить данные.

Есть системы, которые хранят от старшего (MSB most significant byte) к младшему (LSB least significant byte), а есть наоборот от LSB к MSB.

MSB и LSB не стоит путать с MSb (most significant bit) и LSb (least significant bit) одно про биты, другое про байты.

В 1980 году для обозначения порядка байтов было введено два понятия: Little-Endians и Big-Endians, ссылаясь на документ под названием Gulliver's Travel (1726 г.).

Little-Endian — (LE) порядок байт от LSB к MSB (слева направо)
Big-Endians — (BE) порядок байт от MSB к LSB (справа налево)

Как выглядит на практике?

const u uint32 = 1
le := make([]byte, 4)
binary.LittleEndian.PutUint32(le, u)

be := make([]byte, 4)
binary.BigEndian.PutUint32(be, u)

fmt.Printf("%b\n", le) // output: [1 0 0 0]
fmt.Printf("%b\n", be) // output: [0 0 0 1]

Берем 1 в uint16, в байтовом представлении у нас должна быть только одна единица в позиции LSB.

В Little-Endian единица находится слева.
В Big-Endian единица находится справа.

Важно: сами байты не поменялись, поменялся именно их порядок.

И зачем же знать все это дело?

Чтоб в ногу не стрелялось

— При работе с UTF-16, UTF-32 следует помнить про BOM (byte order mark), константа которая поможет определить порядок байт.
В LE это [254 255] в BE это [255 254].

— При сериализации слайс байтов в конкретный тип.

К примеру нам приходит слайс байтов, мы знаем что этот слайс на самом деле uint64.
И если мы сконвертируем через unsafe, мы можем выстрелить в ногу, из-за разности понимания старшого и младшего бита (пример выше).

— Обратный пример использования unsafe:

t := &struct {
  first, second uint16
}{
  first:  1,
  second: 0,
}

v := *(*uint32)(unsafe.Pointer(t))
fmt.Println(v) // output: 256 or 1

Результат может быть разным:
- 1 при Little-Endian
- 256 при Big-Endian

В комментарий скину код, который симулирует поведение при LE и при BE.

— В других случаях, которые я еще не придумал.

P.S.
PostgreSQL хранит файлы страниц как представление оперативной памяти, поэтому копирование файлов на другую машину с целью скопировать базу данных может быть ошибкой, из-за порядка байт.

✍4💅3❤2

313 viewsedited 20:49