Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251 - Веб-программирование | MMGP
Присоединяйтесь к нашему инвестиционному форуму, на котором уже 434,946 пользователей. Чтобы получить доступ ко многим закрытым разделам и начать общение -  .
Вход через:  
Все, что относится к Web-Программированию (PHP, Perl, JavaScript, MySQL, XML и т.д.)
При поддержке
Сеть доставки контента, выбранная космическими агентствами
Важная информация
Есть опыт работы с криптовалютами? Заведи Крипто-Блог и заработай на нём!
Торгуешь криптовалютой? Оставь свой отзыв о бирже!
Разбираешься в криптовалюте? Прими участие в акции Крипторайтер 2.0 (2-10 поинтов за 1000 символов)
Изменения в акции "Оплата за сообщения".
Как на одной публикации заработать $100
Тема закрыта
 
Первый пост Опции темы
Сообщения прочитаны и/или просмотрены Сегодня, 21:12
Старый 19.05.2011, 01:48
#1
Любитель
 
Пол: Мужской
Регистрация: 08.03.2011
Сообщений: 222
Благодарностей: 18
УГ: 0
КП: 0.000
Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

может кто-то обладает такой вот экзотикой?
суть в том что есть код 1к+ строк, все что мне необходимо это чтобы строка в
ISO 8859-1 нормально декодировалась либо в UTF-8 либо в CP-1251...

Пробывал реализовать путем юзания iconv библиотеки, но увы не сложилось, рассмотрю любые предложения вплоть до использования других языков программирования, т.к. задачу решаю для себя а не для "дяди" - пути решения не принцыпиальны, главное чтобы работало, выручайте дорогие друзья а то мысли уже до крайностей доходят типа написать свою функцию декодирования, но т.к. это, мягко говоря - печально, прошу помощи, в противном случае прийдется реализовывать

заранее благодарен, выручайте ребята...

так же добавлю что большего опыта в плане кодировок не имел, по сему возможно я не знаю чего то очевидного, но гугл не спас...

также хотя бы для общего развития буду благодарен если кто-то поделится толковой ссылкой о том что такое mbstring и с чем его едят...

и вопрос - а вообще это возможно? ибо я уже сомневатся стал

Последний раз редактировалось Alex9944; 19.05.2011 в 02:06.
Alex9944 вне форума  
Старый 20.05.2011, 02:55
#2
Модератор
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 14.12.2006
Сообщений: 4,231
Благодарностей: 3,800
УГ: 1
подарки
награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Это ж обычный Вестернеуропеан.
Любой более-менее грамотный редактор перекодирует.
в том числе и иконв.

лучше в ЮТФ, конечно же. Чтобы сохранить читаемость.
Приаттачивайте сюда.
dkameleon вне форума  
Старый 20.05.2011, 10:59
#3
Любитель
 
Пол: Мужской
Регистрация: 08.03.2011
Сообщений: 222
Благодарностей: 18
УГ: 0
КП: 0.000
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

мда... или я плохо обьяснил или вы плохо читали...
мне нужно чтобы изменялась кодировка в самом коде, поменять кодировку в блокноте это мягко говоря не то...
т.е. пришли строки в iso, мне надо чтобы внутри кода iso в utf декодировалось и на выходе не iso а utf8, так понятнее?
Alex9944 вне форума  
Старый 20.05.2011, 22:20
#4
Модератор
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 14.12.2006
Сообщений: 4,231
Благодарностей: 3,800
УГ: 1
подарки
награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Так лучше.
Ни с иконв ни с мбстринг проблем не наблюдаю - и одна и втора либа очень просто и непринужденно конвертирует.

Примеры и дока:
http://www.php.net/manual/en/functio...t-encoding.php
dkameleon вне форума  
Старый 21.05.2011, 16:13
#5
Любитель
 
Пол: Мужской
Регистрация: 08.03.2011
Сообщений: 222
Благодарностей: 18
УГ: 0
КП: 0.000
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Я изваняюсь конечно, но вы или не винимательно читали или просто пропустили...
Цитата:
Сообщение от Alex9944 Посмотреть сообщение
Пробывал реализовать путем юзания iconv библиотеки, но увы не сложилось
под пробывал реализовать я имел введу - ознакамливался с документацией и пробывал даже не в моем коде а на простых примерах - итог крякозяблики.
После написания этой темы даже не поленился и полностью прочитал мануалище на 20 ****иц, но всеравно не оно, поэтому и спросил в итоге:

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
а вообще это возможно?
на самом деле, если честно, то проблема уже не горит в принципе, решил путем написания кода с ноля, но все-же интересно каким образом реализовать сию процедуру
Alex9944 вне форума  
Старый 21.05.2011, 16:32
#6
Модератор
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 14.12.2006
Сообщений: 4,231
Благодарностей: 3,800
УГ: 1
подарки
награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
под пробывал реализовать я имел введу - ознакамливался с документацией и пробывал даже не в моем коде а на простых примерах - итог крякозяблики.
Вы ожидаете, что иконв вам будет текст переводить?

Вы понимаете вообще, что вам надо?


Думаю, без конкретного примера текста, кода и того, что вы хотите увидеть на выходе, даже обсуждать дальше нечего
dkameleon вне форума  
Старый 22.05.2011, 18:57
#7
Любитель
 
Пол: Мужской
Регистрация: 08.03.2011
Сообщений: 222
Благодарностей: 18
УГ: 0
КП: 0.000
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

о чем речь вообще о каком переводе? я гдето писал что мне перевод нужен? О_о
ок, по пунктам(-_-)

1)Запуливается JSON строка на сервер
2)Обрабатывается, формируется масив POST данных
3)после этого данные добавляются в txt файл

задача: между вторым и третим пунктом добавить декодирование POST массива с iso в utf-8.
СОбственно вопрос заключается в следующем - если русские символы будут записаны в кодировке iso можно ли их декодировать в utf так чтобы они стали человекочитаемы?
я надеюсь теперь точно понятно?..

чтобы снять все вопросы и вы кажлдый раз не писали чтото типа та ты *****:

$data['nickname'] = $_POST['nickname'];
$data['message'] = $_POST['message'];
$data['time'] = $time;

вот здесь в масиве POST данные с кодировкой iso, надо, если это возможно конечно - декодировать их в utf...
я прост оникогда с iso кодировкой до этого не работал и с ее тонкостями не знаком, соответственно как она себя ведет с русскими символами я безпонятия.
Просто скажите мне можно ли провернуть чтото подобное без колупания в примерно 1к строках работы c JSON данными. с уважением.

Последний раз редактировалось Alex9944; 22.05.2011 в 19:03.
Alex9944 вне форума  
Старый 23.05.2011, 01:32
#8
Модератор
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 14.12.2006
Сообщений: 4,231
Благодарностей: 3,800
УГ: 1
подарки
награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Мне кажется вы продолжаете решать задачу не давая никаких исходных данных
Из тех отрывков, которые я пытаюсь вырвать из ваших постов я отчетливо вижу, что у вас каша в голове и вы не понимаете что такое кодировки и с чем их едят.


1. Конвертация строки из Windows-1252 (ISO 8859-1) в UTF-8 осуществляется очень просто:
PHP код:
function Convert($text) {
return 
mb_convert_encoding $text'UTF-8''ISO-8859-1' );
//return mb_convert_encoding ( $text, 'UTF-8', 'Windows-1252' );

Массив, соответственно, конвертируется єлемент за элементом.


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
СОбственно вопрос заключается в следующем - если русские символы будут записаны в кодировке iso можно ли их декодировать в utf так чтобы они стали человекочитаемы?
я надеюсь теперь точно понятно?..
Объясняю:
Русских символов, как таковых, в ISO 8859-1 нет. Кодировка однобайтная, следовательно всего 256 возможных символов. Пруф.
Кириллица же находится в том же диапазоне байт, просто в другой кодовой странице. Таким образом кириличным символам и специфическим восточноевропейским соответствуют одни и те же значения байта.

При попытке отправки русских букв со страницы в ISO 8859-1 они, скорее всего, преобразуются в html-entities и могут выглядеть следующим образом:
АКе
или могут конвертироваться в юникод ещё Яваскриптом, при формировании JSON.
Откуда мне знать, если вы не даете исходных данных ни в каком виде?

Только исходя из того, что вы получаете на сервере, можно думать и смотреть, чего можно добиться в итоге.


ПС. Мбстринг так же понимает в качестве входной кодировки "HTML-ENTITIES" и "auto".

Но, вполне возможно, что сначала надо будет конвертнуть в ЮТФ примером выше, а только потом сделать html_entity_decode для исправления кириллицы.
dkameleon вне форума  
Старый 23.05.2011, 04:12
#9
Любитель
 
Пол: Мужской
Регистрация: 08.03.2011
Сообщений: 222
Благодарностей: 18
УГ: 0
КП: 0.000
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

вопрос неактуален, преобразование руских символов с iso в utf = много ??????
следовательно такое преобразование невозможно


dkameleon, вы написали много всего но толковое я вижу только здесь
Цитата:
Сообщение от dkameleon Посмотреть сообщение
Русских символов, как таковых, в ISO 8859-1 нет.
за что конечно спс большое, но ненадо пожалуйста думать что человек в чем-то неразбирается если вы банально его не понимаете.

по поводу нубо инфы предоставленой вами:
непонятно что я такую инфу знаю если работаю с кодом такого размера? помоему это очевидно, а даже если бы не знал - гугл я юзать умею, ок?

а инфа типо они могут или они скорее всего не представляет никакой ценности, по факту - вы бы попробывали хотябы словечко с iso в utf в блокнотике декодировать...
Alex9944 вне форума  
Старый 23.05.2011, 04:42
#10
Модератор
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 14.12.2006
Сообщений: 4,231
Благодарностей: 3,800
УГ: 1
подарки
награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
а инфа типо они могут или они скорее всего не представляет никакой ценности, по факту - вы бы попробывали хотябы словечко с iso в utf в блокнотике декодировать...
я декодированием такой хрени занимаюсь последние лет пять.
при чем на 100% успешно, как вручную, так и для баз данных, и в ПХП,
и в десктопных АНСИ приложениях.

А вы до сих пор не показали примера входных данных, которые не можете сконвертировать. (кагбэ намекаю)


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
преобразование руских символов с iso в utf = много ??????
следовательно такое преобразование невозможно
если считать, что кодировка ISO 8859-1 не предполагает наличие русских символов, то можно согласиться.
но скорее всего вы делаете что-то неправильно
dkameleon вне форума  
Старый 23.05.2011, 10:32
#11
Любитель
 
Пол: Мужской
Регистрация: 08.03.2011
Сообщений: 222
Благодарностей: 18
УГ: 0
КП: 0.000
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

откройте блокнот и проверьте, чего вам стоит, да и если вы столько времени этим занимаетесь вы итак уже на 100% должны знать результат. а так - вам лень проверить изза того что вы "папко кодировок" и вы опять используете фразу
Цитата:
Сообщение от dkameleon Посмотреть сообщение
скорее всего
вместо того чтобы написать что - да таки этого сделать нельзя.
вообще меня поражает ваша самоувереность... спс конечно за пару ссылок с гугла... буду обращатся
PS:Если вы непоняли...

Цитата:
Сообщение от dkameleon Посмотреть сообщение
А вы до сих пор не показали примера входных данных, которые не можете сконвертировать. (кагбэ намекаю)
кагбэ вот
Цитата:
Сообщение от Alex9944 Посмотреть сообщение
вопрос неактуален, преобразование руских символов с iso в utf = много ??????

Последний раз редактировалось Alex9944; 23.05.2011 в 10:34.
Alex9944 вне форума  
Старый 23.05.2011, 13:21
#12
Модератор
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 14.12.2006
Сообщений: 4,231
Благодарностей: 3,800
УГ: 1
подарки
награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
кагбэ вот
Это пример кривизны рук.
Сокраняйте с сайта данные "как есть" и приаттачивайте здесь.


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
вместо того чтобы написать что - да таки этого сделать нельзя.
Повторяю ещё раз: однозначного ответа нет, пока не будут предоставлены реальные данные.


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
откройте блокнот и проверьте, чего вам стоит
Проверил. У мен всё декодирует и конвертирует как надо. Что дальше?
dkameleon вне форума  
Старый 23.05.2011, 13:24
#13
Модератор
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 14.12.2006
Сообщений: 4,231
Благодарностей: 3,800
УГ: 1
подарки
награды Ветеран MMGP.RU Волшебный горшочек 
Re: Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Вообще, судя по вашим темам, кривизна рук у вас ещё та
http://mmgp.ru/showthread.php?t=95481
http://mmgp.ru/showthread.php?t=96048
http://mmgp.ru/showthread.php?t=96973

Надумаете адекватно решать проблемы, а не хамить тем, кто вам пытается помочь - вежливо попросите и я тымы откроют.
dkameleon вне форума  
Тема закрыта
Войдите, чтобы оставить комментарий.
Сообщения прочитаны и/или просмотрены Сегодня, 21:12
Опции темы

Быстрый переход
Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Функция java в php OrlandO Веб-программирование 10 28.10.2010 22:15
Функция the_excerpt() в Wordpress: использование и хитрости eminkoff Дайджест блогосферы 0 26.08.2010 15:52


Случайные темы
Аватара нет
SapaInv - sapainv.com
От uHYIPs в разделе «Архив: Список проблемных/неактивных/закрытых программ»
Аватара нет
WMID 236270942910 - кредит 10К$ 0,1% 180 дней
От Ria-neiron в разделе «Архив: Прием лимитов доверия»
Аватар forfor
Bibblio, платформа для рекомендации контента, привлекла $1,5 млн
От forfor в разделе «Новости в мире финансов и инвестиций»
Аватар Анна Чернобай
В кризис с плюсом. Выручка «Роснефти» за 9 месяцев — 19,4 млрд долл
От Анна Чернобай в разделе «Новости в мире финансов и инвестиций»
Аватара нет
WMID 103974828934 - Приём лимитов доверия
От randall-12 в разделе «Черный список должников»
.     
Пользователей
434,946
Тем
504,773
Сообщений
12,672,464

mmgp.telegram