Кодировка и биллинг СМС


Здесь необходимо прояснить несколько вопросов относительно СМС во избежание проблем с биллингом.

Ограничение количества знаков 

Количество знаков в СМС ограничено. Если сообщение оказывается длиннее положенного, оно автоматически разбивается на несколько сообщений. Биллинг осуществляется за каждое сообщение 

Кодировка знаков 

Количество знаков в СМС зависит от языка (алфавита) и от типа кодировки. Семибитная кодировка стандартного латинского алфавита (GSM 03.38), который используется в английском и других европейских языках, включает ограниченное количество символов. Если используются только эти символы, длина СМС составляет 160 знаков. Если используется хотя бы один нестандартный символ, даже случайно, длина сообщения сокращается до 70 знаков. Соответственно, увеличивается количество отосланных СМС. 

В связи с тем, что знаки кириллицы не входит в набор стандартных символов семибитной кодировки, все СМС на русском языке имеют длину в 70 знаков. Подробнее о кодировке UTF-16, которая используется для русского алфавита, можно прочитать в соответствующей статье Википедии https://ru.wikipedia.org/wiki/UTF-16


Если же вы пользуетесь латинским алфавитом для написания СМС, будьте внимательны. Нестандартные символы могут появиться в сообщении по ошибке, например, при копировании из текстов Microsoft Word, особенно знаки препинания, вроде ‘ (апостроф) или “ (кавычки). Если это произойдет, система покажет предупреждение перед отправкой СМС.

Подробнее о кодировке GSM 7-bit можно почитать в статье Википедии https://en.wikipedia.org/wiki/GSM_03.38