Кодировка utf-8 и utf-8 (без ВОМ)

Недавно столкнулась с проблемой:  программа на PHP  выводила на сайте вместо русских символов ромбики. Вставляла разные операторы, пытаясь заменить на русский текст. Это не помогло. И вдруг — озарение. Проверила кодировку программы на PHP. Оказалась кодировка utf (без ВОМ). Если не ошибаюсь, UTF-8 (без BOM) — это кодировка, в которой каждому символу соответствует 1 байт. А просто UTF-8, тоже самое, только в начале файла идут символы ef bb bf (в HEX). Понятием BOM является символ Byte Order Mark из набора UNICODE (а значит он есть в любых Unicode Transformation Formats — не важно 8-ми , 16-и или 32-разрядных).
Другое дело, что всё же применительно к www — кодировку UTF-8 стараются использовать по умолчанию без этого символа (поскольку он мешает php-обработке).
Сам по себе этот символ никакой значимой информации (помимо того, что по его байтовому представлению можно опознать конкретную форму UNICODE) не несет.

Перекодировав программу PHP в кодировку utf-8 и появился  такой долгожданный русский текст.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *