Общими силами
Итак, в связи с полезными подвижками разыскиваются люди, которые помогут мне дописать эпическую повесть под названием “Практическое применение кодировок UTF на веб-страницах и связанных с ними системах и приложениях”.
Аутлайн примерно следующий:
- Что такое Unicode
- Кодировки и HTTP
- UTF-8, UTF-16 и UTF-32 BOM (маркер порядка байтов)
- UTF и сортировка
- UTF и URL
- UTF и CSS
- UTF и JavaScript
- UTF в HTML
- UTF в XML и веб-сервисах
- UTF в PHP
- UTF в MySQL
- UTF в PostgreSQL
- UTF и поисковые системы
- UTF и хостеры
Требуется практическая помощь в освещении вышеуказанных аспектов (по принципу - человек-два на каждый пункт). По два-три-четыре абзаца на каждый (по примеркам - вполне достаточно). Я конечно могу проделать все это сам, но на это у меня уйдет огромное количество времени и сил - и не может быть что я единственный, кого эта тема интересует. К тому же при помощи зала эта заметка будет дописана очень быстро (у меня черновик пылится уже который месяц).
Особенно тяжело мне будет раскапывать как живет с юникодом MySQL (а главное - каких версий). Более-менее все ясно с HTTP, HTML, PostgreSQL, PHP. CSS-пока не вполне, поскольку любое применение текста как такового в стилях носит полуэкспериментальный характер. Unicode collation - вообще совершенно специфическая история, но ее тоже следует упомянуть.
Получившееся готов опубликовать здесь отдельной страницей, дабы подчеркнуть, что это коллективная инициатива. Если есть предложения - пишите в комментарии к этой записи или на почту.
P.S. Имейте в виду, что освещение данного вопроса требует феноменального ректоцентризма, педантизма и занудства - в основном дабы выяснить, работает оно таки или нет. Функциональность конкретного софта в этой области очень часто отличается от заявленной (и даже нарисованной в интерфейсе и описанной в документации), поэтому проверять надо “по факту” - завелось или нет. Вознаграждение в деньгах не предоставляется (если только все это за копейки не соберется опубликовать какой-нибудь веб-журнал).
Если за неделю никого не обнаружится придется опять все делать самому™.