Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251
Мне кажется вы продолжаете решать задачу не давая никаких исходных данных
Из тех отрывков, которые я пытаюсь вырвать из ваших постов я отчетливо вижу, что у вас каша в голове и вы не понимаете что такое кодировки и с чем их едят.
1. Конвертация строки из Windows-1252 (ISO 8859-1) в UTF-8 осуществляется очень просто:
PHP код:
function Convert($text) {
return mb_convert_encoding ( $text, 'UTF-8', 'ISO-8859-1' );
//return mb_convert_encoding ( $text, 'UTF-8', 'Windows-1252' );
}
Массив, соответственно, конвертируется єлемент за элементом.
Цитата:
Сообщение от Alex9944
СОбственно вопрос заключается в следующем - если русские символы будут записаны в кодировке iso можно ли их декодировать в utf так чтобы они стали человекочитаемы?
я надеюсь теперь точно понятно?..
|
Объясняю:
Русских символов, как таковых,
в ISO 8859-1 нет. Кодировка однобайтная, следовательно всего 256 возможных символов.
Пруф.
Кириллица же находится в том же диапазоне байт, просто в другой кодовой странице. Таким образом кириличным символам и специфическим восточноевропейским соответствуют одни и те же значения байта.
При попытке отправки русских букв со страницы в ISO 8859-1 они,
скорее всего, преобразуются в html-entities и могут выглядеть следующим образом:
АКе
или могут конвертироваться в юникод ещё Яваскриптом, при формировании JSON.
Откуда мне знать, если вы не даете исходных данных ни в каком виде?
Только исходя из того, что вы получаете на сервере, можно думать и смотреть, чего можно добиться в итоге.
ПС. Мбстринг так же понимает в качестве входной кодировки "HTML-ENTITIES" и "auto".
Но, вполне возможно, что сначала надо будет конвертнуть в ЮТФ примером выше, а только потом сделать html_entity_decode для исправления кириллицы.