Нормализация в Python
Нормализация - это полноценное приведение текста к единому представлению.
В данном примере sing1 - это «микрознак», а sing2 - греческая строчная буква «мю».
Интерпретатор Python'a видит эти символы как два разных, но в стандарте Unicode они имеют одинаковое отображение.
Метод casefold() нормализовал переменную sing1 (перевел к нижнему регистру и сконвертировал в Unicode форму).
Python Tech Code - подписаться
Нормализация - это полноценное приведение текста к единому представлению.
В данном примере sing1 - это «микрознак», а sing2 - греческая строчная буква «мю».
Интерпретатор Python'a видит эти символы как два разных, но в стандарте Unicode они имеют одинаковое отображение.
Метод casefold() нормализовал переменную sing1 (перевел к нижнему регистру и сконвертировал в Unicode форму).
Python Tech Code - подписаться
👍5🔥1
❤4🎉2👍1
Преобразование первого символа строки в верхний регистр
В этом примере используется метод capitalize(), который используется для преобразования первого символа строки в верхний регистр, а остальные символы в строке в нижний регистр.
В нашем случае первая буква "к" стала заглавной, а остальные буквы — строчными.
Python Tech Code - подписаться
В этом примере используется метод capitalize(), который используется для преобразования первого символа строки в верхний регистр, а остальные символы в строке в нижний регистр.
В нашем случае первая буква "к" стала заглавной, а остальные буквы — строчными.
Python Tech Code - подписаться
💘6👍2🥰2❤1
🔥3👏1🤔1
Удаляем дубликаты в списке
В этом примере код удалит дубликаты из списка. Теперь my_list будет содержать [1, 2, 3, 4, 5], без повторяющихся элементов.
Этот подход использует метод fromkeys() словаря, чтобы создать словарь с элементами списка как ключами (которые автоматически удаляют повторения), а затем преобразует словарь обратно в список.
Python Tech Code - подписаться
В этом примере код удалит дубликаты из списка. Теперь my_list будет содержать [1, 2, 3, 4, 5], без повторяющихся элементов.
Этот подход использует метод fromkeys() словаря, чтобы создать словарь с элементами списка как ключами (которые автоматически удаляют повторения), а затем преобразует словарь обратно в список.
Python Tech Code - подписаться
🔥2👍1😎1
Методы строки lower() и casefold()
Методы lower() и casefold() применяются для преобразования строк к нижнему регистру.
🔸
🔸casefold() нормализует* регистр символов, учитывая модификаторы регистра такие как умлауты и диакритические знаки, а также может обрабатывать символы из различных кодировок.
*нормализация может очень помочь для поиска валидных документов или индексирования текста.
Таким образом, если вам нужно обработать не только символы ASCII, но и другие символы, используйте casefold() вместо lower().
Python Tech Code - подписаться
Методы lower() и casefold() применяются для преобразования строк к нижнему регистру.
🔸
lower()
переводит все символы в нижний регистр и работает только с символами ASCII.🔸casefold() нормализует* регистр символов, учитывая модификаторы регистра такие как умлауты и диакритические знаки, а также может обрабатывать символы из различных кодировок.
*нормализация может очень помочь для поиска валидных документов или индексирования текста.
Таким образом, если вам нужно обработать не только символы ASCII, но и другие символы, используйте casefold() вместо lower().
Обычно метод lower() быстрее, чем casefold(), поскольку он выполняет меньше операций нормализации Юникода.
Python Tech Code - подписаться
🔥5👍2✍1
R-строки (Raw-strings)
R-строки представляют специальный тип строкового литерала, который позволяет игнорировать символы экранирования.
R-строки обычно используются при работе с путями файловой системы (например, Windows-пути) или при работе с регулярными выражениями, где символы экранирования играют особую роль.
Python Tech Code - подписаться
R-строки представляют специальный тип строкового литерала, который позволяет игнорировать символы экранирования.
R-строки обычно используются при работе с путями файловой системы (например, Windows-пути) или при работе с регулярными выражениями, где символы экранирования играют особую роль.
Python Tech Code - подписаться
👍4✍1🆒1
🔥3😁1😎1