Общими силами

Итак, в связи с полезными подвижками разыскиваются люди, которые помогут мне дописать эпическую повесть под названием “Практическое применение кодировок UTF на веб-страницах и связанных с ними системах и приложениях”.

Аутлайн примерно следующий:

Что такое Unicode
Кодировки и HTTP
UTF-8, UTF-16 и UTF-32 BOM (маркер порядка байтов)
UTF и сортировка
UTF и URL
UTF и CSS
UTF и JavaScript
UTF в HTML
UTF в XML и веб-сервисах
UTF в PHP
UTF в MySQL
UTF в PostgreSQL
UTF и поисковые системы
UTF и хостеры

Требуется практическая помощь в освещении вышеуказанных аспектов (по принципу - человек-два на каждый пункт). По два-три-четыре абзаца на каждый (по примеркам - вполне достаточно). Я конечно могу проделать все это сам, но на это у меня уйдет огромное количество времени и сил - и не может быть что я единственный, кого эта тема интересует. К тому же при помощи зала эта заметка будет дописана очень быстро (у меня черновик пылится уже который месяц).

Особенно тяжело мне будет раскапывать как живет с юникодом MySQL (а главное - каких версий). Более-менее все ясно с HTTP, HTML, PostgreSQL, PHP. CSS-пока не вполне, поскольку любое применение текста как такового в стилях носит полуэкспериментальный характер. Unicode collation - вообще совершенно специфическая история, но ее тоже следует упомянуть.

Получившееся готов опубликовать здесь отдельной страницей, дабы подчеркнуть, что это коллективная инициатива. Если есть предложения - пишите в комментарии к этой записи или на почту.

P.S. Имейте в виду, что освещение данного вопроса требует феноменального ректоцентризма, педантизма и занудства - в основном дабы выяснить, работает оно таки или нет. Функциональность конкретного софта в этой области очень часто отличается от заявленной (и даже нарисованной в интерфейсе и описанной в документации), поэтому проверять надо “по факту” - завелось или нет. Вознаграждение в деньгах не предоставляется (если только все это за копейки не соберется опубликовать какой-нибудь веб-журнал).

Если за неделю никого не обнаружится придется опять все делать самому™.