MMGP logo
Присоединяйтесь к нашему инвестиционному форуму, на котором уже 640,997 пользователей. Чтобы получить доступ ко многим закрытым разделам и начать общение - зарегистрируйтесь прямо сейчас.
Все, что относится к Web-Программированию (PHP, Perl, JavaScript, MySQL, XML и т.д.)
Тема закрыта
Старый 19.05.2011, 00:48
#1
Любитель
 
Пол: Мужской
Регистрация: 07.03.2011
Сообщений: 227
Благодарностей: 18
Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

может кто-то обладает такой вот экзотикой?
суть в том что есть код 1к+ строк, все что мне необходимо это чтобы строка в
ISO 8859-1 нормально декодировалась либо в UTF-8 либо в CP-1251...

Пробывал реализовать путем юзания iconv библиотеки, но увы не сложилось, рассмотрю любые предложения вплоть до использования других языков программирования, т.к. задачу решаю для себя а не для "дяди" - пути решения не принцыпиальны, главное чтобы работало, выручайте дорогие друзья а то мысли уже до крайностей доходят типа написать свою функцию декодирования, но т.к. это, мягко говоря - печально, прошу помощи, в противном случае прийдется реализовывать

заранее благодарен, выручайте ребята...

так же добавлю что большего опыта в плане кодировок не имел, по сему возможно я не знаю чего то очевидного, но гугл не спас...

также хотя бы для общего развития буду благодарен если кто-то поделится толковой ссылкой о том что такое mbstring и с чем его едят...

и вопрос - а вообще это возможно? ибо я уже сомневатся стал
__________________

Последний раз редактировалось Alex9944; 19.05.2011 в 01:06.
Alex9944 вне форума
Старый 20.05.2011, 01:55
#2
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 13.12.2006
Сообщений: 5,553
Благодарностей: 3,381

награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Это ж обычный Вестернеуропеан.
Любой более-менее грамотный редактор перекодирует.
в том числе и иконв.

лучше в ЮТФ, конечно же. Чтобы сохранить читаемость.
Приаттачивайте сюда.
dkameleon вне форума
Старый 20.05.2011, 09:59
#3
Любитель
 
Пол: Мужской
Регистрация: 07.03.2011
Сообщений: 227
Благодарностей: 18
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

мда... или я плохо обьяснил или вы плохо читали...
мне нужно чтобы изменялась кодировка в самом коде, поменять кодировку в блокноте это мягко говоря не то...
т.е. пришли строки в iso, мне надо чтобы внутри кода iso в utf декодировалось и на выходе не iso а utf8, так понятнее?
__________________
Alex9944 вне форума
Старый 20.05.2011, 21:20
#4
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 13.12.2006
Сообщений: 5,553
Благодарностей: 3,381

награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Так лучше.
Ни с иконв ни с мбстринг проблем не наблюдаю - и одна и втора либа очень просто и непринужденно конвертирует.

Примеры и дока:
https://www.php.net/manual/en/functio...t-encoding.php
dkameleon вне форума
Старый 21.05.2011, 15:13
#5
Любитель
 
Пол: Мужской
Регистрация: 07.03.2011
Сообщений: 227
Благодарностей: 18
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Я изваняюсь конечно, но вы или не винимательно читали или просто пропустили...
Цитата:
Сообщение от Alex9944 Посмотреть сообщение
Пробывал реализовать путем юзания iconv библиотеки, но увы не сложилось
под пробывал реализовать я имел введу - ознакамливался с документацией и пробывал даже не в моем коде а на простых примерах - итог крякозяблики.
После написания этой темы даже не поленился и полностью прочитал мануалище на 20 ****иц, но всеравно не оно, поэтому и спросил в итоге:

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
а вообще это возможно?
на самом деле, если честно, то проблема уже не горит в принципе, решил путем написания кода с ноля, но все-же интересно каким образом реализовать сию процедуру
__________________
Alex9944 вне форума
Старый 21.05.2011, 15:32
#6
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 13.12.2006
Сообщений: 5,553
Благодарностей: 3,381

награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
под пробывал реализовать я имел введу - ознакамливался с документацией и пробывал даже не в моем коде а на простых примерах - итог крякозяблики.
Вы ожидаете, что иконв вам будет текст переводить?

Вы понимаете вообще, что вам надо?


Думаю, без конкретного примера текста, кода и того, что вы хотите увидеть на выходе, даже обсуждать дальше нечего
dkameleon вне форума
Старый 22.05.2011, 17:57
#7
Любитель
 
Пол: Мужской
Регистрация: 07.03.2011
Сообщений: 227
Благодарностей: 18
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

о чем речь вообще о каком переводе? я гдето писал что мне перевод нужен? О_о
ок, по пунктам(-_-)

1)Запуливается JSON строка на сервер
2)Обрабатывается, формируется масив POST данных
3)после этого данные добавляются в txt файл

задача: между вторым и третим пунктом добавить декодирование POST массива с iso в utf-8.
СОбственно вопрос заключается в следующем - если русские символы будут записаны в кодировке iso можно ли их декодировать в utf так чтобы они стали человекочитаемы?
я надеюсь теперь точно понятно?..

чтобы снять все вопросы и вы кажлдый раз не писали чтото типа та ты *****:

$data['nickname'] = $_POST['nickname'];
$data['message'] = $_POST['message'];
$data['time'] = $time;

вот здесь в масиве POST данные с кодировкой iso, надо, если это возможно конечно - декодировать их в utf...
я прост оникогда с iso кодировкой до этого не работал и с ее тонкостями не знаком, соответственно как она себя ведет с русскими символами я безпонятия.
Просто скажите мне можно ли провернуть чтото подобное без колупания в примерно 1к строках работы c JSON данными. с уважением.
__________________

Последний раз редактировалось Alex9944; 22.05.2011 в 18:03.
Alex9944 вне форума
Старый 23.05.2011, 00:32
#8
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 13.12.2006
Сообщений: 5,553
Благодарностей: 3,381

награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Мне кажется вы продолжаете решать задачу не давая никаких исходных данных
Из тех отрывков, которые я пытаюсь вырвать из ваших постов я отчетливо вижу, что у вас каша в голове и вы не понимаете что такое кодировки и с чем их едят.


1. Конвертация строки из Windows-1252 (ISO 8859-1) в UTF-8 осуществляется очень просто:
PHP код:
function Convert($text) {
return 
mb_convert_encoding $text'UTF-8''ISO-8859-1' );
//return mb_convert_encoding ( $text, 'UTF-8', 'Windows-1252' );

Массив, соответственно, конвертируется єлемент за элементом.


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
СОбственно вопрос заключается в следующем - если русские символы будут записаны в кодировке iso можно ли их декодировать в utf так чтобы они стали человекочитаемы?
я надеюсь теперь точно понятно?..
Объясняю:
Русских символов, как таковых, в ISO 8859-1 нет. Кодировка однобайтная, следовательно всего 256 возможных символов. Пруф.
Кириллица же находится в том же диапазоне байт, просто в другой кодовой странице. Таким образом кириличным символам и специфическим восточноевропейским соответствуют одни и те же значения байта.

При попытке отправки русских букв со страницы в ISO 8859-1 они, скорее всего, преобразуются в html-entities и могут выглядеть следующим образом:
АКе
или могут конвертироваться в юникод ещё Яваскриптом, при формировании JSON.
Откуда мне знать, если вы не даете исходных данных ни в каком виде?

Только исходя из того, что вы получаете на сервере, можно думать и смотреть, чего можно добиться в итоге.


ПС. Мбстринг так же понимает в качестве входной кодировки "HTML-ENTITIES" и "auto".

Но, вполне возможно, что сначала надо будет конвертнуть в ЮТФ примером выше, а только потом сделать html_entity_decode для исправления кириллицы.
dkameleon вне форума
Старый 23.05.2011, 03:12
#9
Любитель
 
Пол: Мужской
Регистрация: 07.03.2011
Сообщений: 227
Благодарностей: 18
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

вопрос неактуален, преобразование руских символов с iso в utf = много ??????
следовательно такое преобразование невозможно


dkameleon, вы написали много всего но толковое я вижу только здесь
Цитата:
Сообщение от dkameleon Посмотреть сообщение
Русских символов, как таковых, в ISO 8859-1 нет.
за что конечно спс большое, но ненадо пожалуйста думать что человек в чем-то неразбирается если вы банально его не понимаете.

по поводу нубо инфы предоставленой вами:
непонятно что я такую инфу знаю если работаю с кодом такого размера? помоему это очевидно, а даже если бы не знал - гугл я юзать умею, ок?

а инфа типо они могут или они скорее всего не представляет никакой ценности, по факту - вы бы попробывали хотябы словечко с iso в utf в блокнотике декодировать...
__________________
Alex9944 вне форума
Старый 23.05.2011, 03:42
#10
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 13.12.2006
Сообщений: 5,553
Благодарностей: 3,381

награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
а инфа типо они могут или они скорее всего не представляет никакой ценности, по факту - вы бы попробывали хотябы словечко с iso в utf в блокнотике декодировать...
я декодированием такой хрени занимаюсь последние лет пять.
при чем на 100% успешно, как вручную, так и для баз данных, и в ПХП,
и в десктопных АНСИ приложениях.

А вы до сих пор не показали примера входных данных, которые не можете сконвертировать. (кагбэ намекаю)


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
преобразование руских символов с iso в utf = много ??????
следовательно такое преобразование невозможно
если считать, что кодировка ISO 8859-1 не предполагает наличие русских символов, то можно согласиться.
но скорее всего вы делаете что-то неправильно
dkameleon вне форума
Старый 23.05.2011, 09:32
#11
Любитель
 
Пол: Мужской
Регистрация: 07.03.2011
Сообщений: 227
Благодарностей: 18
Автор темы Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

откройте блокнот и проверьте, чего вам стоит, да и если вы столько времени этим занимаетесь вы итак уже на 100% должны знать результат. а так - вам лень проверить изза того что вы "папко кодировок" и вы опять используете фразу
Цитата:
Сообщение от dkameleon Посмотреть сообщение
скорее всего
вместо того чтобы написать что - да таки этого сделать нельзя.
вообще меня поражает ваша самоувереность... спс конечно за пару ссылок с гугла... буду обращатся
PS:Если вы непоняли...

Цитата:
Сообщение от dkameleon Посмотреть сообщение
А вы до сих пор не показали примера входных данных, которые не можете сконвертировать. (кагбэ намекаю)
кагбэ вот
Цитата:
Сообщение от Alex9944 Посмотреть сообщение
вопрос неактуален, преобразование руских символов с iso в utf = много ??????
__________________

Последний раз редактировалось Alex9944; 23.05.2011 в 09:34.
Alex9944 вне форума
Старый 23.05.2011, 12:21
#12
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 13.12.2006
Сообщений: 5,553
Благодарностей: 3,381

награды Ветеран MMGP.RU Волшебный горшочек 
Re: функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Цитата:
Сообщение от Alex9944 Посмотреть сообщение
кагбэ вот
Это пример кривизны рук.
Сокраняйте с сайта данные "как есть" и приаттачивайте здесь.


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
вместо того чтобы написать что - да таки этого сделать нельзя.
Повторяю ещё раз: однозначного ответа нет, пока не будут предоставлены реальные данные.


Цитата:
Сообщение от Alex9944 Посмотреть сообщение
откройте блокнот и проверьте, чего вам стоит
Проверил. У мен всё декодирует и конвертирует как надо. Что дальше?
dkameleon вне форума
Старый 23.05.2011, 12:24
#13
 
Пол: Мужской
Инвестирую в: Свой бизнес
Регистрация: 13.12.2006
Сообщений: 5,553
Благодарностей: 3,381

награды Ветеран MMGP.RU Волшебный горшочек 
Re: Функция декодирвоания ISO 8859-1 d UTF-8 или CP-1251

Вообще, судя по вашим темам, кривизна рук у вас ещё та
https://mmgp.ru/showthread.php?t=95481
https://mmgp.ru/showthread.php?t=96048
https://mmgp.ru/showthread.php?t=96973

Надумаете адекватно решать проблемы, а не хамить тем, кто вам пытается помочь - вежливо попросите и я тымы откроют.
dkameleon вне форума
Тема закрыта
Войдите, чтобы оставить комментарий.
Опции темы

Быстрый переход
Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Функция java в php OrlandO Веб-программирование 10 28.10.2010 21:15
Функция the_excerpt() в Wordpress: использование и хитрости eminkoff Дайджест блогосферы 0 26.08.2010 14:52