Для того чтобы перекодировать строку из UTF-16 в UTF-8 в Python, можно воспользоваться стандартными методами работы с кодировками, предоставляемыми модулем codecs
. Вот пример кода:
import codecs # Исходная строка в UTF-16 string_utf16 = b'xffxfeHx00ex00lx00lx00ox00,x00 x00Wx00ox00rx00lx00dx00x00x00' # Декодируем строку из UTF-16 в Unicode string_unicode = string_utf16.decode('utf-16') # Кодируем строку из Unicode в UTF-8 string_utf8 = string_unicode.encode('utf-8') print(string_utf8)
Обратите внимание, что в примере используется байтовая строка b'xffxfeHx00ex00lx00lx00ox00,x00 x00Wx00ox00rx00lx00dx00x00x00'
, которая представляет собой текст "Hello, World" в кодировке UTF-16 с маркером порядка байт (BOM). Мы декодируем эту строку в Unicode, а затем кодируем в UTF-8.
После выполнения кода, вы получите строку в UTF-8, которая будет содержать те же символы, что и исходная строка, но уже в кодировке UTF-8.