Андрей Смирнов
Время чтения: ~21 мин.
Просмотров: 1

Исправляем проблемы с отображением русских букв в windows 10

Что такое кодировка текста и с чем ее едят?

Начать хотелось бы с того, что этой статьи могло бы и не быть, т.к. компьютерно-юзательная жизнь автора этих строк протекала вполне себе спокойно и достойно. Но вот в один прекрасный день, шляясь по просторам сети Интернет не со своего ПК, я столкнулся с непонятными явлениями на некоторых сайтах. Заходя на интернет-ресурсы, я видел не привычный нам русский алфавит и красивый понятный текст, а какую-то ересь в виде непонятной последовательности символов. Выглядела она примерно вот так (см. изображение).

Сначала я подумал, что моя любимая Мозилка (браузер Firefox) перегрелась и ей пора вызывать неотложку, но потом начал понимать, что проблема, скорее всего, на стороне ресурса сети и кроется она в неправильно настроенной кодировке. Это действительно оказалось так, и пошаманив немного с бубном, проблемка была оперативно решена. Результатом же всех моих любовных похождений и стал сегодняшний материал. Собственно, поехали разбираться в деталях.

Всю информацию, представленную в цифровом виде и находящуюся в глобальной паутине, нужно рассматривать с двух сторон: первая — со стороны пользователя (красивый и ухоженный текст на экране монитора) и вторая – со стороны поисковой машины (некий программный код, состоящий из различных тегов/метатегов, таблицы символов и прочее).

Если Вы хоть немного знакомы с языком разметки гипертекста (HTML), то должны быть в курсе, что сайт глазами поисковых машин (Google, Яндекс) видится не как обычный текст, а как структурированный документ, состоящий из последовательностей различного рода тегов. Чтобы было понятней, о чем я говорю, давайте взглянем на всеми нами любимый сайт Заметки Сис.Админа” проекта , но не глазами обычного пользователя, а «глазами» поисковика. Для этого нажимаем сочетание клавиш Сtrl+U (для браузеров Firefox и Chrome) и видим следующую картину (см. изображение):

Перед нами машинный вариант sonikelf.ru, вот в таком вот непрезентабельном виде он подается поисковым системам  и именно в таком виде они его и кушают. Если бы мы просто взяли и “засандалили” варианты статей из блокнота или Word обычным текстом, машины бы им не то что подавились, они бы даже и есть его не стали. Итак, перед нами главная страница проекта в HTML-виде

Обратите внимание на строку с надписью UTF-8, это не что иное, как пресловутая кодировка текста страницы, именно она и отвечает за формат вывода информации в презентабельном виде, в результате чего через браузер мы видим нормальный текст

Теперь давайте разберемся, почему же происходит так, что порой на экране монитора мы видим кракозябры. Все очень просто, проблема кроется в открытии файла в неверной кодировке. Если перевести на бытовой язык, то допустим Вас послали в магазин за молоком, а Вы притарабанили хлеб, вроде бы тоже съестное, но совсем другой формат продукта.

Итак, теперь давайте разбираться с теорией и для этого введем некоторые определения.

  1. Кодировка (или “Charset”) – соответствие набора символов набору числовых значений. Нужна для “сливания” информации в интернет, т.е. текстовая информация преобразуется в биты данных;
  2. Кодовая страница (“Codepage”) – 1 байтовая (8 бит) кодировка;
  3. Количество значений, принимаемое 1 байтом – 256 (два в восьмой).

Соответствие “символ-изображение” задается с помощью специальных кодовых таблиц, где каждому символу уже присвоен свой конкретный числовой код. Таких таблиц существует достаточно много, и в разных таблицах один и тот же символ может идентифицироваться по-разному (ему могут соответствовать разные числовые коды).

Все кодировки различаются количеством байт и набором специальных знаков, в которые преобразуется каждый символ исходного текста.

Примечание:Декодирование – операция, в результате которой происходит преобразование кода символа в изображение. В результате этой операции информация выводится на экран монитора пользователя.

В общем.. С определениями разобрались, а теперь давайте узнаем, какие же (кодировки) бывают.

Копирование и вставка

С ними мы познакомимся позже. Вопросительный знак вставить в текст за несколько минут помогут опции «Копировать» и «Вставить». Но как ими воспользоваться без специализированной таблицы символов «Виндовс»?

Для этого нужно:

  1. Отыскать где-нибудь текст, в котором уже имеется знак вопроса.
  2. Выделить его при помощи клавиатуры или курсора мыши.
  3. Кликнуть ПКМ, а затем выбрать команду «Копировать». Можно заменить эти операции сочетанием клавиш Ctrl + C.
  4. Установить активный курсор-указатель печати в место, где требуется постановка символа.
  5. Нажать правую кнопку мыши, а затем выбрать строчку «Вставить». В качестве альтернативы чаще всего пользуются сочетанием клавиш «Контрол» + V.

Этот метод тоже используется преимущественно при вставке в текст более необычных символов, нежели вопросительного знака.

На других языках и скриптах

Открывающие и закрывающие вопросительные знаки на испанском языке

Открывающие и закрывающие вопросительные знаки

В испанском языке , так как во втором издании Ortografia на Real Academia Española в 1754, вопросительные требуют как открытие ¿ и закрытие ? вопросительные знаки. Вопросительное предложение, предложение или фраза начинается с перевернутого вопросительного знака ¿ и заканчивается вопросительным знаком ? , как в:

Ella me pregunta «¿qué hora es?» — Она меня спрашивает„Сколько времени? “ «

Вопросительные знаки всегда должны совпадать, но для обозначения неуверенности, а не фактического допроса, опускание вводного допустимо, хотя и не рекомендуется:

Чингисхан (¿1162? –1227) предпочтительнее в испанском языке, чем Чингисхан (1162? –1227).

Отсутствие начального знака — обычное дело в неформальной письменной форме, но считается ошибкой. Единственное исключение — это когда вопросительный знак сочетается с восклицательным знаком, например:

¡Quién te имеет creído que eres? — ‘Кто ты, по-твоему, такой?!’

(Порядок также может быть изменен на обратный: начало с вопросительного знака и завершение с восклицательным знаком.) Тем не менее, даже здесь Academia рекомендует совпадение знаков препинания:

¡¿Quién te имеет creído que eres ?!

Открытие знак вопроса в Unicode является U + 00BF ¿ ПЕРЕВЕРНУТОГО знак вопроса (HTML   · ).

На других языках Испании

Галисийский также использует перевернутый начальный вопросительный знак, хотя обычно только в длинных предложениях или в случаях, которые в противном случае были бы неоднозначными. Басков использует только последний вопросительный знак.

Армянский вопросительный знак

Вопросительный знак на армянском

В армянском языке вопросительный знак — это диакритический знак, который принимает форму открытого круга и ставится над последней гласной вопросительного слова. Он определен в Unicode в U + 055E ◌՞ АРМЯНСКИЙ ВОПРОСИТЕЛЬНЫЙ ЗНАК .

Греческий вопросительный знак

Греческий знак вопроса (греческий: ερωτηματικό , латинизируется:  erōtīmatikó ) выглядит как ; . Он появился примерно в то же время, что и латинский, в 8 веке. Он был принят церковнославянским языком и в конечном итоге остановился на форме, по существу похожей на латинскую точку с запятой . В Unicode , она отдельно кодируются как U + 037E ; ГРЕЧЕСКИЙ знак вопроса , но сходство настолько велико , что точка коды является нормализована к U + 003B ; SEMICOLON , делая марки идентичными на практике. В греческом языке вопросительный знак используется даже для косвенных вопросов.

Зеркальный знак вопроса в скриптах с письмом справа налево

Зеркальный вопросительный знак на арабском и персидском языках

В арабском и других языках, использующих арабский шрифт, например персидский и урду , которые пишутся справа налево , вопросительный знак зеркально отражается справа налево от латинского вопросительного знака. В Юникоде доступны две кодировки: U + 061F ؟ ARABIC ВОПРОС MARK (HTML   · с двунаправленным код AL: справа налево арабский) и U + 2E2E ⸮ ПЕРЕВЕРНУТЫМ вопросительный знак (HTML   · с двунаправленным кодом Другие нейтралов). (Некоторые браузеры могут отображать символ в предыдущем предложении как прямой вопросительный знак из-за проблем со шрифтом или направленностью текста). Кроме того, тана сценарий Мальдивы использует зеркальный знак вопроса: މަރުހަބާ?

Арабский вопросительный знак также используется в некоторых других письмах справа налево: N’Ko и сирийском .

Иврит и идиш также пишутся справа налево, но они используют вопросительный знак, который появляется на странице в той же ориентации, что и вопросительный знак латинского алфавита.

Полный вопросительный знак на восточноазиатских языках

Вопросительный знак также используется в современном письме на китайском и японском языках , хотя и не является обязательным. Обычно он записывается в полноширинной форме на китайском и японском языках в Юникоде: U + FF1F ? ПОЛНОШИРИННЫЙ ВОПРОСНЫЙ ЗНАК (HTML  ).

В других скриптах

Некоторые другие скрипты имеют особый вопросительный знак:

  • U + 1367 ፧ ЭФИОПИЧЕСКИЙ ВОПРОСНЫЙ ЗНАК
  • U + A60F ꘏ ВОПРОСНЫЙ ЗНАК VAI
  • U + 2CFA ⳺ КОПТИЧЕСКИЙ СТАРЫЙ НУБИЙСКИЙ ЗНАК ПРЯМОГО ВОПРОСА и U + 2CFB ⳻ КОПТИЧЕСКИЙ СТАРЫЙ НУБИЙСКИЙ ЗНАК НЕПРЯМОГО ВОПРОСА
  • U + 1945᥅ ЛИМБУ ВОПРОСНЫЙ ЗНАК

Коренные языки Канады

В Канаде некоторые языки коренных народов используют знак вопроса для обозначения ʔ :

  • Чипевян
  • Догриб
  • Кутенай
  • Мускусный язык
  • Нутка
  • Slavey
  • Нитинахт
  • Томпсон
  • Lushootseed

Помощь Windows

Вопросительный знак — распространенный символ пунктуации. И его можно вставить в текст по-разному.

Третий способ решения поставленной задачи — это использование таблицы символов Windows. Он не так часто используется в реальной жизни, но имеет место.

Алгоритм действий будет приблизительно таким:

  1. Зайти в «Таблицу символов». Ее можно найти в «Пуске», в разделе «Стандартные», подпункте «Служебные».
  2. Отыскать в появившемся меню символ со знаком вопроса.
  3. Кликнуть по нему несколько раз левой кнопкой мышки.
  4. Нажать на кнопку «Копировать» в нижней части службы.
  5. Открыть текст, в котором необходимо поставить знак вопроса.
  6. Нажать Ctrl + V или ПКМ + команда «Вставить».

Как показывает практика, такой расклад чаще всего встречается при печати более необычных символов. Знаки препинания набираются намного проще посредством клавиатурной панели или специализированных кодов.

Как найти и устранить неполадки

Решения, которые описаны далее, очень просты, поскольку не потребуют серьезных действий, но причин существует довольно много. Причем можно обойтись без похода в ремонтную мастерскую.

Перезагрузка

Если устройство начало распечатывать иероглифы, то перезагрузку необходимо выполнить в первую очередь. Отключаем ПК и принтер, а после включаем через небольшой промежуток времени.

Вероятно, это незначительная поломка, которую можно решить с помощью этого простого способа. Если это не помогло, то нужно рассмотреть другие возможные варианты.

Использование другого программного обеспечения

Чаще всего непонятный текст вместо русских символов появляется при распечатке с помощью MS Word. Можно попытаться распечатать документ другим программным обеспечением.

Нужно пересохранить текст и открыть программой AdobeReader либо Foxit Reader. Произвести печать также можно в браузере, к примеру, Internet Explorer либо Chrome.

Распечатка изображения

Можно попробовать вместо текстового документа распечатать рисунок. Для чего необходимо:

  1. Запустить программу, использующуюся для отправки документа на устройство.
  2. Отыскать меню «Дополнительно».
  3. Нажать «Распечатать как рисунок», установить галочку.

Теперь устройство напечатает текстовый документ как рисунок. Иероглифы вместо русских букв, вероятней всего, видно не будет.

Изменение шрифта

Причина иногда состоит в шрифте. Устройство его не распознает, а распечатывает иероглифы вместо букв. Можно попробовать просто установить другой шрифт. Тем более это часто помогает, если используется не стандартный шрифт (к примеру, Times New Roman), а другой.

Также можно попробовать такой вариант: запретите подставку CourierNew:

  1. На панели управления отыщите меню с оборудованием.
  2. Выберите неработающий принтер.
  3. Нажмите кнопку «Свойства принтера», зайдите в меню «Параметры принтера».
  4. Отыщите подстановку шрифта и нажмите «Не подставлять».

Системные файлы

Иногда причина находится в системных файлах. После их восстановления это сможет помочь исправить проблему:

  1. Для начала необходимо открыть от имени администратора командную панель. Ввести в ней «sfc/scannow» и нажать «Ок».
  2. Подождите определенное время. После проверьте, была ли решена проблема.

Установка драйверов

Не редко эта неисправность возникает из-за драйверов. Устройство выдает иероглифы, так как драйверы неправильно установлены либо выдают сбой. Потому можно попытаться их установить заново. Для чего:

  1. В «Панели управления» нужно зайти в меню «Оборудование и звук» и отыскать неисправный принтер.
  2. После нажать ПКМ, выбрать «Удалить устройство».
  3. В «Программах и компонентах» необходимо удалить все программы, которые относятся к работе устройства.
  4. Затем отыскать диск, который должен идти в комплекте с оборудованием. С него заново установить требуемые программы.

Вредоносное ПО

Надо проверить ПК с помощью антивируса. Проблема может скрываться в этом.

Это главные причины, почему принтер печатает иероглифы, и способы их решения. Обычно этих простых действий вполне достаточно, так как эта неисправность может то появляться, то самостоятельно пропадать.

Решаем проблемы с кодировкой или как убрать кракозябры?

Итак, наша статья была бы неполной, если бы мы не затронули пользовательско-бытовые вопросы. Давайте их и рассмотрим и начнем с того, как (с помощью чего) можно посмотреть кодировку?

В любой операционной системе имеется таблица символов, ее не нужно докачивать, устанавливать – это данность свыше, которая располагается по адресу: “Пуск-программы-стандартные-служебные-таблица символов”. Это таблица векторных форм всех установленных в Вашей операционной системе шрифтов.

Выбрав “дополнительные параметры” (набор Unicode) и соответствующий тип начертания шрифта, Вы увидите полный набор символов, в него входящих. Кликнув по любому символу, Вы увидите его код в формате UTF-16, состоящий из 4-х шестнадцатеричных цифр (см. изображение).

Теперь пара слов о том, как убрать кракозябры. Они могут возникать в двух случаях:

  1. Со стороны пользователя — при чтении информации в интернет (например, при заходе на сайт);
  2. Или, как говорилось чуть выше, со стороны веб-мастера (например, при создании/редактировании текстовых файлов с поддержкой синтаксиса языков программирования в программе Notepad++ или из-за указания неправильной кодировки в коде сайта).

Рассмотрим оба варианта.

№1. Иероглифы со стороны пользователя.Допустим, Вы запустили ОС и в каком-то из приложений у Вас отображаются пресловутые каракули. Чтобы это исправить, идем по адресу: “Пуск — Панель управления — Язык и региональные стандарты — Изменение языка” и выбираем из списка, «Россия».

Также проверьте во всех вкладках, чтобы локализация была “Россия/русский” – это так называемая системная локаль.

Если Вы открыли сайт и вдруг поняли, что почитать информацию Вам не дают иероглифы, тогда стоит поменять кодировку средствами браузера (“Вид — Кодировка”). На какую? Тут все зависит от вида этих кракозябр. Ориентируйтесь на следующую шпаргалку (см. изображение).

№2. Иероглифы со стороны веб-мастера.Очень часто начинающие разработчики сайтов не придают большого значения кодировке создаваемого документа, в результате чего потом и сталкиваются с вышеозначенной проблемой. Вот несколько простых базовых советов для веб-мастеров, чтобы исправить беду.

Чтобы такого не происходило, заходим в редактор Notepad++ и выбираем в меню пункт “Кодировки”. Именно он поможет преобразовать имеющийся документ. Спрашивается, какой? Чаще всего (если сайт на WordPress или Joomla), то “Преобразовать в UTF-8 без BOM” (см. изображение).

Сделав такое преобразование, Вы увидите изменения в строке статуса программы.

Также во избежание кракозябр необходимо принудительно прописать информацию о кодировке в шапке сайта. Тем самым Вы укажите браузеру на то, что сайт стоит считывать именно в прописанной кодировке. Начинающему веб-мастеру необходимо понимать, что чехарда с кодировкой чаще всего возникает из-за несоответствия настроек сервера настройкам сайта, т.е. на сервере в базе данных прописана одна кодировка, а сайт отдает страницы в браузер в совершенной другой.

Для этого необходимо прописать “внаглую” (в шапку сайта, т.е, как частенько, в файл header.php) между тегами <head> </head> следующую строчку:

<meta http-equiv=»Content-Type» content=»text/html; charset=utf-8″>

Прописав такую строчку, Вы заставите браузер правильно интерпретировать кодировку, и иероглифы пропадут.

Также может потребоваться корректировка вывода данных из БД (MySQL). Делается сие так:

mysql_query(‘SET NAMES utf8’ );
myqsl_query(‘SET CHARACTER SET utf8’ );
mysql_query(‘SET COLLATION_CONNECTION=»utf8_general_ci'» ‘);

Как вариант, можно еще сделать ход конём и прописать в файл .htaccess такие вот строчки:

# BEGIN UTF8
AddDefaultCharset utf-8
AddCharset utf-8 *
<IfModule mod_charset.c>
CharsetSourceEnc utf-8
CharsetDefault utf-8
</IfModule>
# END UTF8

Все вышеприведенные методы (или некоторые из них), скорее всего, помогут Вам и Вашим будущим посетителям избавиться от ненавистных иероглифов и проблем с кодировкой. К сожалению, более подробно мы здесь инструкцию по веб-мастерским штукам рассматривать не будем, думаю, что они обязательно разберутся в подробностях при желании (как-никак у нас несколько другая тематика сайта).

Ну, вот и практическая часть статьи закончена, осталось подвести небольшие итоги.

Word

Иногда кодировка появляется и в документах Ворд. Иногда причиной того, что в ворде появились непонятные символы, является то, что у Вас на ПК установлен старый Ворд (до 2007 года), а документ создан в более поздних версиях софта. Чаще всего, такие «новые» файлы просто не открываются в старой версии, но иногда открываются в странной кодировке. Чтобы понять, так ли это, посмотрите в Свойствах файла, какой он имеет формат. «Новые» документы имеют формат docx. Преобразование файла в word до старого формата невозможно. Лучше установить обновление на MS Word. Изменить формат текстового документа на читаемый не сложно.

  • Еще до открытия файла, софт «понимает», что в нем проблема. При двойном клике на него Ворд откроет окно, где спросит – в какой кодировке открыть файл. Чтобы изменить кодировку текста в word, выполните алгоритм;
  • Попробуйте кодировку, предложенную программой;
  • Если не сработало, кликайте по очереди на предлагаемые типы;
  • Пробуйте менять типы кодировки и алфавит, типы кириллицы;
  • Как только текст станет читаемым нажмите ОК.

Иногда возникает проблема другого характера. Вы набираете текст в Ворде или Блокноте и замечаете, что на клавиатуре вместо букв печатаются цифры. Проблема связана с режимом Num Look и возникает на некоторых ноутбуках. Посмотрите на клавиатуру. Если на кнопках в правой части, кроме букв написаны и цифры, а вверху присутствует кнопка num lk, значит ноутбук оснащен данным режимом и Вы случайно включили. Для отключения нажмите кнопку Num Look или Fn+F11. Набор цифр прекратится, появятся буквы в привычном виде.

ПОСМОТРЕТЬ ВИДЕО

Виды кодировок текста

А их, в общем-то, хватает.

ASCII

Одной из самых “древних” считается американская кодировочная таблица (ASCII, читается как “аски”), принятая национальным институтом стандартов. Для кодировки она использовала 7 битов, в первых 128 значениях размещался английский алфавит (в нижнем и верхнем регистрах), а также знаки, цифры и символы. Она больше подходила для англоязычных пользователей и не была универсальной.

Кириллица

Отечественный вариант кодировки, для которого стали использовать вторую часть кодовой таблицы – символы с 129 по 256. Заточена под русскоязычную аудиторию.

Кодировки семейства MS Windows: Windows 1250-1258.

8-битные кодировки, появились как следствие разработки самой популярной операционной системы, Windows. Номера с 1250 по 1258 указывают на язык, под который они заточены, например, 1250 – для языков центральной Европы; 1251 – кириллический алфавит.

Код обмена информацией 8 бит – КОИ8

KOI8-R, KOI8-U, KOI-7 – стандарт для русской кириллицы в юникс-подобных операционных системах.

Юникод (Unicode)

Универсальный стандарт кодирования символов, позволяющий описать знаки практически всех письменных языков. Обозначение “U+xxxx” (хххх – 16-ричные цифры). Самые распространенные семейства кодировок UTF (Unicode Transformation Format): UTF-8, 16, 32.

В настоящее время, как говорится, “рулит” UTF-8 – именно она обеспечивают наилучшую совместимость со старыми ОС, которые использовали 8-битные символы. В UTF-8 кодировке находятся большинство сайтов в сети Интернет и именно этот стандарт является универсальным (поддержка кириллицы и латиницы).

Разумеется, я привел не все виды кодировок, а только наиболее ходовые. Если же Вы хотите для общего развития знать их все, то полный список можно отыскать в самом браузере. Для этого достаточно пройти в нем на вкладку “Вид-Кодировка-Выбрать список” и ознакомиться со всевозможными их вариантами (см. изображение).

Думаю возник резонный вопрос: “Какого лешего столько кодировок?”. Их изобилие и причины возникновения можно сравнить с таким явлением, как кроссбраузерность/кроссплатформенность. Это когда один и тот же сайт сайт отображается по-разному в различных интернет-обозревателях и на различных гаджет-устройствах. Кстати у сайта «Заметки Сис.Админа» с этим, как Вы заметили всё в порядке :).

Все эти кодировки – рабочие варианты, созданные разработчиками “под себя” и решение своих задач. Когда же их количество перевалило за все разумные пределы, а в поисковиках стали плодиться запросы типа: “Как убрать кракозябры в браузере?” — разработчики стали ломать голову над приведением всей этой каши к единому стандарту, чтобы, так сказать, всем было хорошо. И кодировка Unicode, в общем-то, это “хорошо” и сделала. Теперь если такие проблемы и возникают, то они носят локальный характер, и не знают как их исправить только совсем непросвещенные пользователи (впрочем, часто беда с кодировкой и отображением сайтов появляется из-за того, что веб-мастер указал на стороне сервера некорректный формат, и приходится переключать кодировку в браузере).

Ну вот, собственно, пока вся «базово необходимая» теория, которая позволит Вам “не плавать” в кодировочных вопросах, теперь переходим к практической части статьи.

Что такое кодировка текста и с чем ее едят?

Начать хотелось бы с того, что этой статьи могло бы и не быть, т.к. компьютерно-юзательная жизнь автора этих строк протекала вполне себе спокойно и достойно. Но вот в один прекрасный день, шляясь по просторам сети Интернет не со своего ПК, я столкнулся с непонятными явлениями на некоторых сайтах. Заходя на интернет-ресурсы, я видел не привычный нам русский алфавит и красивый понятный текст, а какую-то ересь в виде непонятной последовательности символов. Выглядела она примерно вот так (см. изображение).

Сначала я подумал, что моя любимая Мозилка (браузер Firefox) перегрелась и ей пора вызывать неотложку, но потом начал понимать, что проблема, скорее всего, на стороне ресурса сети и кроется она в неправильно настроенной кодировке. Это действительно оказалось так, и пошаманив немного с бубном, проблемка была оперативно решена. Результатом же всех моих любовных похождений и стал сегодняшний материал. Собственно, поехали разбираться в деталях.

Всю информацию, представленную в цифровом виде и находящуюся в глобальной паутине, нужно рассматривать с двух сторон: первая — со стороны пользователя (красивый и ухоженный текст на экране монитора) и вторая – со стороны поисковой машины (некий программный код, состоящий из различных тегов/метатегов, таблицы символов и прочее).

Если Вы хоть немного знакомы с языком разметки гипертекста (HTML), то должны быть в курсе, что сайт глазами поисковых машин (Google, Яндекс) видится не как обычный текст, а как структурированный документ, состоящий из последовательностей различного рода тегов. Чтобы было понятней, о чем я говорю, давайте взглянем на всеми нами любимый сайт Заметки Сис.Админа” проекта , но не глазами обычного пользователя, а «глазами» поисковика. Для этого нажимаем сочетание клавиш Сtrl+U (для браузеров Firefox и Chrome) и видим следующую картину (см. изображение):

Перед нами машинный вариант sonikelf.ru, вот в таком вот непрезентабельном виде он подается поисковым системам  и именно в таком виде они его и кушают. Если бы мы просто взяли и “засандалили” варианты статей из блокнота или Word обычным текстом, машины бы им не то что подавились, они бы даже и есть его не стали. Итак, перед нами главная страница проекта в HTML-виде

Обратите внимание на строку с надписью UTF-8, это не что иное, как пресловутая кодировка текста страницы, именно она и отвечает за формат вывода информации в презентабельном виде, в результате чего через браузер мы видим нормальный текст

Теперь давайте разберемся, почему же происходит так, что порой на экране монитора мы видим кракозябры. Все очень просто, проблема кроется в открытии файла в неверной кодировке. Если перевести на бытовой язык, то допустим Вас послали в магазин за молоком, а Вы притарабанили хлеб, вроде бы тоже съестное, но совсем другой формат продукта.

Итак, теперь давайте разбираться с теорией и для этого введем некоторые определения.

  1. Кодировка (или “Charset”) – соответствие набора символов набору числовых значений. Нужна для “сливания” информации в интернет, т.е. текстовая информация преобразуется в биты данных;
  2. Кодовая страница (“Codepage”) – 1 байтовая (8 бит) кодировка;
  3. Количество значений, принимаемое 1 байтом – 256 (два в восьмой).

Соответствие “символ-изображение” задается с помощью специальных кодовых таблиц, где каждому символу уже присвоен свой конкретный числовой код. Таких таблиц существует достаточно много, и в разных таблицах один и тот же символ может идентифицироваться по-разному (ему могут соответствовать разные числовые коды).

Все кодировки различаются количеством байт и набором специальных знаков, в которые преобразуется каждый символ исходного текста.

В общем.. С определениями разобрались, а теперь давайте узнаем, какие же (кодировки) бывают.

Функции текстового редактора

Нужно поставить знак вопроса в тексте? Некоторые предпочитают пользоваться встроенными в текстовые редакторы опциями. К примеру, «Специальной вставкой». С ее помощью юзеры могут набирать на компьютере математические формулы или «рисовать» специальные символы прямо во время создания документа.

Руководство по достижению желаемого результата имеет такую форму:

  1. Зайти в Word.
  2. В верхней части окна приложения перейти во вкладку «Вставить».
  3. Щелкнуть по надписи «Символ». Иногда можно увидеть надпись «Специальный символ».
  4. Откроется меню, напоминающее «Таблицу символов Windows». Здесь придется отыскать знак, который хочется печатать.
  5. Дважды кликнуть по миниатюре с соответствующей надписью.

Можно закрывать окно. Быстро, просто и очень удобно. Даже начинающий пользователь сможет справиться с поставленной задачей за пару минут.

Текстовые документы

Именно в документах Ворда, Блокнота и т.п. такая кодировка встречается чаще всего. Кодировка – набор знаков, благодаря которым происходит печать текста на определенном алфавите. Теоретически, любой документ сохраняется в различных шифрованиях, но пользователи почти никогда не прибегают к таким действиям. Потому, если Вы видите вместо букв вопросительные знаки и т.п., то маловероятно, что это сделано намеренно. Скорее всего, ввиду системного сбоя у пользователя, создавшего документ, он сохранился не в той кодировки. Кроме того, дело может быть и в сбои на Вашем ПК, в результате чего файл не открывается правильно.

Наиболее часто проблема возникает при использовании Блокнота. Также встречается в файлах php, css, info и подобных текстовых. Гораздо реже в Ворде. Кроме того, путаница с шифрованием встречается в браузере, там Вы также можете увидеть кракозябры вместо русских букв. В последнем случае избавиться от нее особенно трудно.

Послесловие

Сегодня мы познакомились с таким понятием, как кодировка текста. Уверен, теперь при возникновении каракулей на мониторе компьютера Вы не спасуете, а вспомните все приведенные здесь методы и решите вопрос в свою пользу!

На сим все, спасибо за внимание и до новых встреч. P.S

Комментарии, как и всегда, ждут Ваших горячих дискуссий и вопросов, так что отписываем.P.P.S: За существование данной статьи спасибо члену команды 25 КАДР

P.S. Комментарии, как и всегда, ждут Ваших горячих дискуссий и вопросов, так что отписываем.P.P.S: За существование данной статьи спасибо члену команды 25 КАДР

Рейтинг автора
5
Материал подготовил
Максим Иванов
Наш эксперт
Написано статей
129
Ссылка на основную публикацию
Похожие публикации