Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251 - Веб-программирование

19.05.2011, 00:48

#1

Alex9944

Любитель

Пол: Мужской

Регистрация: 07.03.2011

Сообщений: 227

Благодарностей: 18

Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

может кто-то обладает такой вот экзотикой?

суть в том что есть код 1к+ строк, все что мне необходимо это чтобы строка в
ISO 8859-1 нормально декодировалась либо в UTF-8 либо в CP-1251...

Пробывал реализовать путем юзания iconv библиотеки, но увы не сложилось, рассмотрю любые предложения вплоть до использования других языков программирования, т.к. задачу решаю для себя а не для "дяди" - пути решения не принцыпиальны, главное чтобы работало, выручайте дорогие друзья а то мысли уже до крайностей доходят типа написать свою функцию декодирования, но т.к. это, мягко говоря - печально, прошу помощи, в противном случае прийдется реализовывать

заранее благодарен, выручайте ребята...

так же добавлю что большего опыта в плане кодировок не имел, по сему возможно я не знаю чего то очевидного, но гугл не спас...

также хотя бы для общего развития буду благодарен если кто-то поделится толковой ссылкой о том что такое mbstring и с чем его едят...

и вопрос - а вообще это возможно? ибо я уже сомневатся стал

__________________

hashcode profile

Последний раз редактировалось Alex9944; 19.05.2011 в 01:06.

20.05.2011, 01:55

#2

dkameleon

Пол: Мужской

Инвестирую в: Свой бизнес

Регистрация: 13.12.2006

Сообщений: 5,553

Благодарностей: 3,381

награды

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Это ж обычный Вестернеуропеан.
Любой более-менее грамотный редактор перекодирует.
в том числе и иконв.

лучше в ЮТФ, конечно же. Чтобы сохранить читаемость.
Приаттачивайте сюда.

20.05.2011, 09:59

#3

Alex9944

Любитель

Пол: Мужской

Регистрация: 07.03.2011

Сообщений: 227

Благодарностей: 18

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

мда... или я плохо обьяснил или вы плохо читали...
мне нужно чтобы изменялась кодировка в самом коде, поменять кодировку в блокноте это мягко говоря не то...
т.е. пришли строки в iso, мне надо чтобы внутри кода iso в utf декодировалось и на выходе не iso а utf8, так понятнее?

__________________

hashcode profile

20.05.2011, 21:20

#4

dkameleon

Пол: Мужской

Инвестирую в: Свой бизнес

Регистрация: 13.12.2006

Сообщений: 5,553

Благодарностей: 3,381

награды

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Так лучше.
Ни с иконв ни с мбстринг проблем не наблюдаю - и одна и втора либа очень просто и непринужденно конвертирует.

Примеры и дока:
https://www.php.net/manual/en/functio...t-encoding.php

21.05.2011, 15:13

#5

Alex9944

Любитель

Пол: Мужской

Регистрация: 07.03.2011

Сообщений: 227

Благодарностей: 18

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Я изваняюсь конечно, но вы или не винимательно читали или просто пропустили...

Цитата:

Сообщение от Alex9944

Пробывал реализовать путем юзания iconv библиотеки, но увы не сложилось

под пробывал реализовать я имел введу - ознакамливался с документацией и пробывал даже не в моем коде а на простых примерах - итог крякозяблики.
После написания этой темы даже не поленился и полностью прочитал мануалище на 20 ****иц, но всеравно не оно, поэтому и спросил в итоге:

Цитата:

Сообщение от Alex9944

а вообще это возможно?

на самом деле, если честно, то проблема уже не горит в принципе, решил путем написания кода с ноля, но все-же интересно каким образом реализовать сию процедуру

__________________

hashcode profile

21.05.2011, 15:32

#6

dkameleon

Пол: Мужской

Инвестирую в: Свой бизнес

Регистрация: 13.12.2006

Сообщений: 5,553

Благодарностей: 3,381

награды

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:

Сообщение от Alex9944

под пробывал реализовать я имел введу - ознакамливался с документацией и пробывал даже не в моем коде а на простых примерах - итог крякозяблики.

Вы ожидаете, что иконв вам будет текст переводить?

Вы понимаете вообще, что вам надо?

Думаю, без конкретного примера текста, кода и того, что вы хотите увидеть на выходе, даже обсуждать дальше нечего

22.05.2011, 17:57

#7

Alex9944

Любитель

Пол: Мужской

Регистрация: 07.03.2011

Сообщений: 227

Благодарностей: 18

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

о чем речь вообще о каком переводе? я гдето писал что мне перевод нужен? О_о
ок, по пунктам(-_-)

1)Запуливается JSON строка на сервер
2)Обрабатывается, формируется масив POST данных
3)после этого данные добавляются в txt файл

задача: между вторым и третим пунктом добавить декодирование POST массива с iso в utf-8.
СОбственно вопрос заключается в следующем - если русские символы будут записаны в кодировке iso можно ли их декодировать в utf так чтобы они стали человекочитаемы?
я надеюсь теперь точно понятно?..

чтобы снять все вопросы и вы кажлдый раз не писали чтото типа та ты *****:

$data['nickname'] = $_POST['nickname'];
$data['message'] = $_POST['message'];
$data['time'] = $time;

вот здесь в масиве POST данные с кодировкой iso, надо, если это возможно конечно - декодировать их в utf...
я прост оникогда с iso кодировкой до этого не работал и с ее тонкостями не знаком, соответственно как она себя ведет с русскими символами я безпонятия.
Просто скажите мне можно ли провернуть чтото подобное без колупания в примерно 1к строках работы c JSON данными. с уважением.

__________________

hashcode profile

Последний раз редактировалось Alex9944; 22.05.2011 в 18:03.

23.05.2011, 00:32

#8

dkameleon

Пол: Мужской

Инвестирую в: Свой бизнес

Регистрация: 13.12.2006

Сообщений: 5,553

Благодарностей: 3,381

награды

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Мне кажется вы продолжаете решать задачу не давая никаких исходных данных

Из тех отрывков, которые я пытаюсь вырвать из ваших постов я отчетливо вижу, что у вас каша в голове и вы не понимаете что такое кодировки и с чем их едят.

1. Конвертация строки из Windows-1252 (ISO 8859-1) в UTF-8 осуществляется очень просто:

PHP код:


			
function Convert($text) {
return mb_convert_encoding ( $text, 'UTF-8', 'ISO-8859-1' );
//return mb_convert_encoding ( $text, 'UTF-8', 'Windows-1252' );
}

Массив, соответственно, конвертируется єлемент за элементом.

Цитата:

Сообщение от Alex9944

СОбственно вопрос заключается в следующем - если русские символы будут записаны в кодировке iso можно ли их декодировать в utf так чтобы они стали человекочитаемы?
я надеюсь теперь точно понятно?..

Объясняю:
Русских символов, как таковых, в ISO 8859-1 нет. Кодировка однобайтная, следовательно всего 256 возможных символов. Пруф.
Кириллица же находится в том же диапазоне байт, просто в другой кодовой странице. Таким образом кириличным символам и специфическим восточноевропейским соответствуют одни и те же значения байта.

При попытке отправки русских букв со страницы в ISO 8859-1 они, скорее всего, преобразуются в html-entities и могут выглядеть следующим образом:
АКе
или могут конвертироваться в юникод ещё Яваскриптом, при формировании JSON.
Откуда мне знать, если вы не даете исходных данных ни в каком виде?

Только исходя из того, что вы получаете на сервере, можно думать и смотреть, чего можно добиться в итоге.

ПС. Мбстринг так же понимает в качестве входной кодировки "HTML-ENTITIES" и "auto".

Но, вполне возможно, что сначала надо будет конвертнуть в ЮТФ примером выше, а только потом сделать html_entity_decode для исправления кириллицы.

23.05.2011, 03:12

#9

Alex9944

Любитель

Пол: Мужской

Регистрация: 07.03.2011

Сообщений: 227

Благодарностей: 18

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

вопрос неактуален, преобразование руских символов с iso в utf = много ??????
следовательно такое преобразование невозможно

dkameleon, вы написали много всего но толковое я вижу только здесь

Цитата:

Сообщение от dkameleon

Русских символов, как таковых, в ISO 8859-1 нет.

за что конечно спс большое, но ненадо пожалуйста думать что человек в чем-то неразбирается если вы банально его не понимаете.

по поводу нубо инфы предоставленой вами:
непонятно что я такую инфу знаю если работаю с кодом такого размера? помоему это очевидно, а даже если бы не знал - гугл я юзать умею, ок?

а инфа типо они могут или они скорее всего не представляет никакой ценности, по факту - вы бы попробывали хотябы словечко с iso в utf в блокнотике декодировать...

__________________

hashcode profile

23.05.2011, 03:42

#10

dkameleon

Пол: Мужской

Инвестирую в: Свой бизнес

Регистрация: 13.12.2006

Сообщений: 5,553

Благодарностей: 3,381

награды

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:

Сообщение от Alex9944

а инфа типо они могут или они скорее всего не представляет никакой ценности, по факту - вы бы попробывали хотябы словечко с iso в utf в блокнотике декодировать...

я декодированием такой хрени занимаюсь последние лет пять.
при чем на 100% успешно, как вручную, так и для баз данных, и в ПХП,
и в десктопных АНСИ приложениях.

А вы до сих пор не показали примера входных данных, которые не можете сконвертировать. (кагбэ намекаю)

Цитата:

Сообщение от Alex9944

преобразование руских символов с iso в utf = много ??????
следовательно такое преобразование невозможно

если считать, что кодировка ISO 8859-1 не предполагает наличие русских символов, то можно согласиться.
но скорее всего вы делаете что-то неправильно

23.05.2011, 09:32

#11

Alex9944

Любитель

Пол: Мужской

Регистрация: 07.03.2011

Сообщений: 227

Благодарностей: 18

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

откройте блокнот и проверьте, чего вам стоит, да и если вы столько времени этим занимаетесь вы итак уже на 100% должны знать результат. а так - вам лень проверить изза того что вы "папко кодировок" и вы опять используете фразу

Цитата:

Сообщение от dkameleon

скорее всего

вместо того чтобы написать что - да таки этого сделать нельзя.
вообще меня поражает ваша самоувереность... спс конечно за пару ссылок с гугла... буду обращатся

PS:Если вы непоняли...

Цитата:

Сообщение от dkameleon

А вы до сих пор не показали примера входных данных, которые не можете сконвертировать. (кагбэ намекаю)

кагбэ вот

Цитата:

Сообщение от Alex9944

вопрос неактуален, преобразование руских символов с iso в utf = много ??????

__________________

hashcode profile

Последний раз редактировалось Alex9944; 23.05.2011 в 09:34.

23.05.2011, 12:21

#12

dkameleon

Пол: Мужской

Инвестирую в: Свой бизнес

Регистрация: 13.12.2006

Сообщений: 5,553

Благодарностей: 3,381

награды

Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:

Сообщение от Alex9944

кагбэ вот

Это пример кривизны рук.
Сокраняйте с сайта данные "как есть" и приаттачивайте здесь.

Цитата:

Сообщение от Alex9944

вместо того чтобы написать что - да таки этого сделать нельзя.

Повторяю ещё раз: однозначного ответа нет, пока не будут предоставлены реальные данные.

Цитата:

Сообщение от Alex9944

откройте блокнот и проверьте, чего вам стоит

Проверил. У мен всё декодирует и конвертирует как надо. Что дальше?

23.05.2011, 12:24

#13

dkameleon

Пол: Мужской

Инвестирую в: Свой бизнес

Регистрация: 13.12.2006

Сообщений: 5,553

Благодарностей: 3,381

награды

Re: Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Вообще, судя по вашим темам, кривизна рук у вас ещё та

https://mmgp.ru/showthread.php?t=95481
https://mmgp.ru/showthread.php?t=96048
https://mmgp.ru/showthread.php?t=96973

Надумаете адекватно решать проблемы, а не хамить тем, кто вам пытается помочь - вежливо попросите и я тымы откроют.

Похожие темы
Тема	Автор	Раздел	Ответов	Последнее сообщение
Функция java в php	OrlandO	Веб-программирование	10	28.10.2010 21:15
Функция the_excerpt() в Wordpress: использование и хитрости	eminkoff	Дайджест блогосферы	0	26.08.2010 14:52