title
Description
Body
В общем у меня состоит задача в создании ключевых юрл по именах видео для моего сайта "видеосейвера".
Я отказался от транслитерации имени для url так как имена могут быть на разных языках. В том числе и на иероглифах.
Решил вообще ничего не переводить а составлять юрл так как например в википедии
Я так понимаю нужно перевести символы двоеточие в " что бы не искривить html ну и что то сделать с такими символами как решетка и вопросительный знак. Пробовал решетку перекинуть в %23 а вопросительный знак в %3F а вообще меня это не удовлетворяет и Я решил эти два символа вообще вырезать
На что еще необходимо обратить внимание?
Неактивен
Активен
Я так подумал. Наверное стоит просто вырезать все эти символы ! " # % & ' * , : ; < = > ? [ ] ^ ` { | } <пробел> И после сделать эскэйп
Как вариант использовать только ключевые слова в юрле.
Но появляется другой вопрос как определить где знак препинания а где иероглиф, так как они не попадают под регулярку \w
Неактивен
TLENS, нет, стоит использовать rawurlencode. А в title добавлять оригинал. Браузер сам должен распарсить encoded данные и в адресной строке показать читаемый тест.
Активен
Gemorroj написал:
TLENS, нет, стоит использовать rawurlencode. А в title добавлять оригинал. Браузер сам должен распарсить encoded данные и в адресной строке показать читаемый тест.
В общем сделал так:
|
|
Неактивен
Gemorroj написал:
TLENS, нет, стоит использовать rawurlencode. А в title добавлять оригинал. Браузер сам должен распарсить encoded данные и в адресной строке показать читаемый тест.
В общем у меня появилась задача вырезать абсолютно все лишнее со строки и потом только сделать rawurlencode. Было бы идеально просто пройтись регуляркой типо replace(/[a-z\dа-яё\s]/gi, '-').replace(/_+/g, '-') но увы здесь мне нужно оставить всякие иероглифы от арабских до каких то там трех байтовых японских. В общем Я хз как все это сделать. Тцпо перечислить все разрешимые символы это долго и мучительно.
Неактивен