Китайские кодировки :(

Статус
В этой теме нельзя размещать новые ответы.

svirol

Новичок
Китайские кодировки :(

Всем привет!
Проблема в следующем - на сайте предусматривается китайский язык (точнее - китайская версия сайта) :(. При этом основная часть данных будет храниться в б/д. Это было бы смешно, когда бы не было так грустно :( .
Кто-нибудь работал с китайским? Я поискала и нашла две кодировки - GB2312 и Big5. Какие чаще используються? Как это броузеры переваривают?
И как к этому отнесется MySQL? Возможна ли нормальная работа с базой данных, если хранить это как текстовые данные? Какие требования для этого должны быть к провайдеру?
 

Ratnik

Guest
У меня похожая проблема...

Сейчас делаю китайскую версию сайта...
Выделили переводчика, но он ничего в компах не сращивает...
Я поставил на ХР поддержку языков с иероглифами, и сейчас эксперементирую... по идее должно всё получиться... главно, не использовать в СУБД в одной таблице данных на русском и китайском, иначе абра-кадабра получается

-~{}~ 10.02.04 18:46:

Главное обязательно поставить
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
на тех страничках, которые будете русифицировать - тогда она будет передавать данные форма в UTF-8 и хоть трава не расти - всё пучком!!!

Я написал всё что нужно было :)

-~{}~ 10.02.04 18:46:

Кстати в одной таблице при этом хоть 10 языков засовывай... utf - сила !!!
 

espada

Guest
Полную гарантию дает только уникод. Если иероглифы заданы в виде &#22334; а шрифт задан Arial Unicode MS, то ни с БД, ни с чтением страниц проблем быть не должно.
 

Sych

Новичок
Может кто сталкивался - нужно перекодировать любимую GB2312 в utf-8 - делаем это счастье иконвом из командлайна причем иконв жутко ругается что не может сделать конверт - хотя у меня есть php скрипт который его успешно делает - но такой как там вариант мне не подходит, причем

Код:
iconv -l | grep GB
выдает

Код:
CN GB_1988-80 ISO-IR-57 ISO646-CN CSISO57GB1988
CHINESE GB_2312-80 ISO-IR-58 CSISO58GB231280
CN-GB-ISOIR165 ISO-IR-165
CN-GB EUC-CN EUCCN GB2312 CSGB2312
CP936 GBK MS936 WINDOWS-936
GB18030
HZ HZ-GB-2312
поддержка этой кодировки есть - но по сути ничего не работает

Код:
iconv -f GB2312 -t UTF-8 cn.txt >utf8.txt
iconv: cn.txt:
cannot convert
где порылась собака?????
 

dark-demon

d(^-^)b
храните данные в юникоде. если жалко пользователей - конвертируйте на выходе в ту кодировку, которую он запросит через http заголовки.
 

Sych

Новичок
dark-demon прочитай внимательно сообщение мое - мне надо как раз наоборот.
 

bakh

Абалдуй
dark-demon Тредстартера этот вопрос не интересует уже лет 5 (максимум)... ;)
 

alexey84

phplancer
разрабатывал один сайт на 8 языках (в том числе и на китайском), перебрал кучу кодировок и пришел к одному решению:
сервак лучше всего апач 2, иначе могут быть глюки при отправки данных из форм и записи их в базу, там иероглифы в хтмл сущности переводились, апач 2 мультиязычность поддерживает, поэтому все нормально заносилось в бд, и все данные хранил в utf8. Переводчику какую то прогу скачали, не помню название, типа ворда,только с китайской клавиатурой, он там все тексты набивал, а потом все это копировали и вставляли в базу.
 

Sych

Новичок
вообщем проблему решил - помог как не странно постгрес своими доками и коммментами - перед тем как конвертировать html и подобное iconv - файлик нужно пропустить через Tidy - и все будет в шоколаде.
 

Candy228

Новичок
Точно такая же проблема. Как решили, ребятки. Нужна срочна, капец. 10-й год уже долбусь с этим
 
Статус
В этой теме нельзя размещать новые ответы.
Сверху