title
Description
Body
Как правильно определить неизвестную кодировку и перекодировать её в utf-8?
При перекодировании windows-1251 в utf-8 все символы изменялись на какой-то непонятный код. Например двоеточие в \u003d\u0026gt; .
Помогите.
Неактивен
Вот как на google translate. В какой бы кодировке не скопировал туда - все нормально переводит. А у меня нет. И еще не знаешь, как сделать, чтобы на выходе получился форматированный текст? Перевод при помощи Google Translate Api.
|
|
Форматированный текст, типа если ввел
|
|
и перевел на английский, получилось:
|
|
Добавлено спустя 39 секунд:
PS: извиняюсь за функцию json2array - просто нету json'a нормального)
Неактивен
Я копирую текст с одного сайта, там кодировка windows-1251. Перевожу сразу оригинал - получаются кракозябры. Если изменяю кодировку при помощи iconv - появляется этот юникод.
По поводу кто возвращает сейчас скажу.
Добавлено спустя 4 минуты 30 секунд:
Этот юникод возвращает функция гугла. Еще оно <pre></pre> игнорирует.
Если без перевода, то все отлично получается, а так... странно
Добавлено спустя 6 минут 36 секунд:
а может это из-за аналога функции json?
Неактивен
DarkDaNTe написал:
Я копирую текст с одного сайта, там кодировка windows-1251. Перевожу сразу оригинал - получаются кракозябры.
я не понимаю где именно проблема. iconv дает это, либо апи гугла?
Неактивен
и после гугл апи <pre> не катит
Добавлено спустя 7 минут 45 секунд:
Интуиция решает) Вся проблема была в корявой функции, заменяющей нормальный json_decode.
Полазил по документации в гугле и нашел PEAR класс, рекомендованый гуглом, если нет json.
Зря только плохо думал про Google Api)
Все сделал) Но <pre> все еще не срабатывает)
Добавлено спустя 9 минут 35 секунд:
http://pear.php.net/pepr/pepr-proposal-show.php?id=198 - вот если кому пригодится.
|
|
Неактивен