В статье рассматривается решение проблемы, из-за которой в Windows Таблица символов не работает. Та является встроенным в систему средством написания особых знаков для каждого из имеющихся в Windows фонов, символов из непредставленных в ней языков, а также общепринятых экономических, технических и т.п. обозначений. Это градусы, «собачки», баксы и т.п. Для быстрого доступа к Таблице символов можно использовать либо быструю команду вызова из консоли команд, через Пуск и т.д.
charmap.exe
либо готовыми сочетаниями клавиш при работе в текстовом редакторе. По примеру символа градуса из статьи «Как добавить символ градуса в документ?«. Для тех, кто использует Таблицу символов регулярно, невозможность запустить её ставит пользователя в тупик. Рассмотрим самые частые причины её поломки и способы решения.
- Наиболее часто виной тому программы, установленные со стороны. В функциях некоторых из них те позволяют за собой застолблять функциональные клавиши типа Alt или Ctrl. Это проявляется именно в тех случаях, когда символ в текстовый документ вы привыкли вставлять именно через «Alt + «.
- Но если проблема подстерегла вас прямо сейчас, попробуйте сначала просто перезагрузить компьютер. После этого проверьте систему в Центре обновлений на предмет имеющихся патчей и по необходимости установите всё, что Центром предлагается…
- …однако, если проблема вас подстерегла именно после установки последнего обновления и не исчезает с перезагрузкой, есть смысл последние обновления удалить.
- Если используете правую числовую часть клавиатуры, проверьте работает ли Numlock. Раскладка клавиатуры также иногда влияет на работу Таблицы. Alt + Shift вам в помощь. Если проблема появляется только при использовании так называемых Alt-кодов, проверьте настройки мыши в части Специальных возможностей. Поиграйте с настройками в части двух верхних галочек в чек боксах первых двух пунктов. Быстрая команда доступа к ним и скрин экрана прилагаются:
ms-settings:easeofaccess-mouse
- Думаю также, что до создания новой учётной записи с новым пользователем, у которого не установлено ни одной программы и которого не коснулись никакие изменения, у вас не дойдёт. Этот вариант с вашей учёткой проблем не решит — он сможет лишь показать, что с вашей действительно что-то не так.
Другим способом исправлением проблемы с Таблицей символов является исключение сторонних программ. Хотя бы на время одного сеанса. Это легко сделать с помощью Безопасного режима. Подготовиться к переходу в Безопасный режим легко. Наберите в строке Выполнить (Win + R) команду
msconfig -1
Дальше по скрину:
Подробнее про режим в статьях в ссылках. Находясь в Безопасном режиме, попробуйте вызвать Таблицу оттуда. Если успешно — делайте выводы и ищите виновника с целью от него избавиться. Для возвращения в нормальный режим не забудьте деактивировать чек-бокс.
Таблица символов не работает: поправим реестр.
Если ничего не поправилось, отправляемся в реестр через редактор
regedit.exe
в ключ
КомпьютерHKEY_CURRENT_USERControl PanelInput Method
Справа создадим строковый параметр с именем EnableHexNumpad и присвоим ему значение 1. Перезагружаемся и проверяем.
Проверяйте систему ремонтными утилитами.
Следующие способы общеприняты для системы, у которой, вероятно, произошло повреждение системных файлов и встроенных приложений. Для ремонта применяется связка двух команд, запускаемых из консоли cmd, запущенной от имени администратора. И лучше в таком порядке (вторая команда требует выхода в сеть) в три шага:
sfc /scannow Dism /Online /Cleanup-Image /RestoreHealth sfc /scannow
Успехов.
Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Сегодня мы поговорим с вами про то, откуда берутся кракозябры на сайте и в программах, какие кодировки текста существуют и какие из них следует использовать. Подробно рассмотрим историю их развития, начиная от базовой ASCII, а также ее расширенных версий CP866, KOI8-R, Windows 1251 и заканчивая современными кодировками консорциума Юникод UTF 16 и 8.
Кому-то эти сведения могут показаться излишними, но знали бы вы, сколько мне приходит вопросов именно касаемо вылезших кракозябров (не читаемого набора символов). Теперь у меня будет возможность отсылать всех к тексту этой статьи и самостоятельно отыскивать свои косяки. Ну что же, приготовьтесь впитывать информацию и постарайтесь следить за ходом повествования.
ASCII — базовая кодировка текста для латиницы
Развитие кодировок текстов происходило одновременно с формированием отрасли IT, и они за это время успели претерпеть достаточно много изменений. Исторически все начиналось с довольно-таки не благозвучной в русском произношении EBCDIC, которая позволяла кодировать буквы латинского алфавита, арабские цифры и знаки пунктуации с управляющими символами.
Но все же отправной точкой для развития современных кодировок текстов стоит считать знаменитую ASCII (American Standard Code for Information Interchange, которая по-русски обычно произносится как «аски»). Она описывает первые 128 символов из наиболее часто используемых англоязычными пользователями — латинские буквы, арабские цифры и знаки препинания.
Еще в эти 128 знаков, описанных в ASCII, попадали некоторые служебные символы навроде скобок, решеток, звездочек и т.п. Собственно, вы сами можете увидеть их:
Именно эти 128 символов из первоначального вариант ASCII стали стандартом, и в любой другой кодировке вы их обязательно встретите и стоять они будут именно в таком порядке.
Но дело в том, что с помощью одного байта информации можно закодировать не 128, а целых 256 различных значений (двойка в степени восемь равняется 256), поэтому вслед за базовой версией Аски появился целый ряд расширенных кодировок ASCII, в которых можно было кроме 128 основных знаков закодировать еще и символы национальной кодировки (например, русской).
Тут, наверное, стоит еще немного сказать про системы счисления, которые используются при описании. Во-первых, как вы все знаете, компьютер работает только с числами в двоичной системе, а именно с нулями и единицами («булева алгебра», если кто проходил в институте или в школе). Один байт состоит из восьми бит, каждый из которых представляет из себя двойку в степени, начиная с нулевой, и до двойки в седьмой:
Не трудно понять, что всех возможных комбинаций нулей и единиц в такой конструкции может быть только 256. Переводить число из двоичной системы в десятичную довольно просто. Нужно просто сложить все степени двойки, над которыми стоят единички.
В нашем примере это получается 1 (2 в степени ноль) плюс 8 (два в степени 3), плюс 32 (двойка в пятой степени), плюс 64 (в шестой), плюс 128 (в седьмой). Итого получает 233 в десятичной системе счисления. Как видите, все очень просто.
Но если вы присмотритесь к таблице с символами ASCII, то увидите, что они представлены в шестнадцатеричной кодировке. Например, «звездочка» соответствует в Аски шестнадцатеричному числу 2A. Наверное, вам известно, что в шестнадцатеричной системе счисления используются кроме арабских цифр еще и латинские буквы от A (означает десять) до F (означает пятнадцать).
Ну так вот, для перевода двоичного числа в шестнадцатеричное прибегают к следующему простому и наглядному способу. Каждый байт информации разбивают на две части по четыре бита, как показано на приведенном выше скриншоте. Т.о. в каждой половинке байта двоичным кодом можно закодировать только шестнадцать значений (два в четвертой степени), что можно легко представить шестнадцатеричным числом.
Причем, в левой половине байта считать степени нужно будет опять начиная с нулевой, а не так, как показано на скриншоте. В результате, путем нехитрых вычислений, мы получим, что на скриншоте закодировано число E9. Надеюсь, что ход моих рассуждений и разгадка данного ребуса вам оказались понятны. Ну, а теперь продолжим, собственно, говорить про кодировки текста.
Расширенные версии Аски — кодировки CP866 и KOI8-R с псевдографикой
Итак, мы с вами начали говорить про ASCII, которая являлась как бы отправной точкой для развития всех современных кодировок (Windows 1251, юникод, UTF 8).
Изначально в нее было заложено только 128 знаков латинского алфавита, арабских цифр и еще чего-то там, но в расширенной версии появилась возможность использовать все 256 значений, которые можно закодировать в одном байте информации. Т.е. появилась возможность добавить в Аски символы букв своего языка.
Тут нужно будет еще раз отвлечься, чтобы пояснить — зачем вообще нужны кодировки текстов и почему это так важно. Символы на экране вашего компьютера формируются на основе двух вещей — наборов векторных форм (представлений) всевозможных знаков (они находятся в файлах со шрифтами, которые установлены на вашем компьютере) и кода, который позволяет выдернуть из этого набора векторных форм (файла шрифта) именно тот символ, который нужно будет вставить в нужное место.
Понятно, что за сами векторные формы отвечают шрифты, а вот за кодирование отвечает операционная система и используемые в ней программы. Т.е. любой текст на вашем компьютере будет представлять собой набор байтов, в каждом из которых закодирован один единственный символ этого самого текста.
Программа, отображающая этот текст на экране (текстовый редактор, браузер и т.п.), при разборе кода считывает кодировку очередного знака и ищет соответствующую ему векторную форму в нужном файле шрифта, который подключен для отображения данного текстового документа. Все просто и банально.
Значит, чтобы закодировать любой нужный нам символ (например, из национального алфавита), должно быть выполнено два условия — векторная форма этого знака должна быть в используемом шрифте и этот символ можно было бы закодировать в расширенных кодировках ASCII в один байт. Поэтому таких вариантов существует целая куча. Только лишь для кодирования символов русского языка существует несколько разновидностей расширенной Аски.
Например, изначально появилась CP866, в которой была возможность использовать символы русского алфавита и она являлась расширенной версией ASCII.
Т.е. ее верхняя часть полностью совпадала с базовой версией Аски (128 символов латиницы, цифр и еще всякой лабуды), которая представлена на приведенном чуть выше скриншоте, а вот уже нижняя часть таблицы с кодировкой CP866 имела указанный на скриншоте чуть ниже вид и позволяла закодировать еще 128 знаков (русские буквы и всякая там псевдографика):
Видите, в правом столбце цифры начинаются с 8, т.к. числа с 0 до 7 относятся к базовой части ASCII (см. первый скриншот). Т.о. русская буква «М» в CP866 будет иметь код 9С (она находится на пересечении соответствующих строки с 9 и столбца с цифрой С в шестнадцатеричной системе счисления), который можно записать в одном байте информации, и при наличии подходящего шрифта с русскими символами эта буква без проблем отобразится в тексте.
Откуда взялось такое количество псевдографики в CP866? Тут все дело в том, что эта кодировка для русского текста разрабатывалась еще в те мохнатые года, когда не было такого распространения графических операционных систем как сейчас. А в Досе, и подобных ей текстовых операционках, псевдографика позволяла хоть как-то разнообразить оформление текстов и поэтому ею изобилует CP866 и все другие ее ровесницы из разряда расширенных версий Аски.
CP866 распространяла компания IBM, но кроме этого для символов русского языка были разработаны еще ряд кодировок, например, к этому же типу (расширенных ASCII) можно отнести KOI8-R:
Принцип ее работы остался тот же самый, что и у описанной чуть ранее CP866 — каждый символ текста кодируется одним единственным байтом. На скриншоте показана вторая половина таблицы KOI8-R, т.к. первая половина полностью соответствует базовой Аски, которая показана на первом скриншоте в этой статье.
Среди особенностей кодировки KOI8-R можно отметить то, что русские буквы в ее таблице идут не в алфавитном порядке, как это, например, сделали в CP866.
Если посмотрите на самый первый скриншот (базовой части, которая входит во все расширенные кодировки), то заметите, что в KOI8-R русские буквы расположены в тех же ячейках таблицы, что и созвучные им буквы латинского алфавита из первой части таблицы. Это было сделано для удобства перехода с русских символов на латинские путем отбрасывания всего одного бита (два в седьмой степени или 128).
Windows 1251 — современная версия ASCII и почему вылезают кракозябры
Дальнейшее развитие кодировок текста было связано с тем, что набирали популярность графические операционные системы и необходимость использования псевдографики в них со временем пропала. В результате возникла целая группа, которая по своей сути по-прежнему являлись расширенными версиями Аски (один символ текста кодируется всего одним байтом информации), но уже без использования символов псевдографики.
Они относились к так называемым ANSI кодировкам, которые были разработаны американским институтом стандартизации. В просторечии еще использовалось название кириллица для варианта с поддержкой русского языка. Примером такой может служить Windows 1251.
Она выгодно отличалась от используемых ранее CP866 и KOI8-R тем, что место символов псевдографики в ней заняли недостающие символы русской типографики (окромя знака ударения), а также символы, используемые в близких к русскому славянских языках (украинскому, белорусскому и т.д.):
Из-за такого обилия кодировок русского языка, у производителей шрифтов и производителей программного обеспечения постоянно возникала головная боль, а у нас с вам, уважаемые читатели, зачастую вылезали те самые пресловутые кракозябры, когда происходила путаница с используемой в тексте версией.
Очень часто они вылезали при отправке и получении сообщений по электронной почте, что повлекло за собой создание очень сложных перекодировочных таблиц, которые, собственно, решить эту проблему в корне не смогли, и зачастую пользователи для переписки использовали транслит латинских букв, чтобы избежать пресловутых кракозябров при использовании русских кодировок подобных CP866, KOI8-R или Windows 1251.
По сути, кракозябры, вылазящие вместо русского текста, были результатом некорректного использования кодировки данного языка, которая не соответствовала той, в которой было закодировано текстовое сообщение изначально.
Допустим, если символы, закодированные с помощью CP866, попробовать отобразить, используя кодовую таблицу Windows 1251, то эти самые кракозябры (бессмысленный набор знаков) и вылезут, полностью заменив собой текст сообщения.
Аналогичная ситуация очень часто возникает при создании сайтов на WordPress и Joomla, форумов или блогов, когда текст с русскими символами по ошибке сохраняется не в той кодировке, которая используется на сайте по умолчанию, или же не в том текстовом редакторе, который добавляет в код отсебятину не видимую невооруженным глазом.
В конце концов такая ситуация с множеством кодировок и постоянно вылезающими кракозябрами многим надоела, появились предпосылки к созданию новой универсальной вариации, которая бы заменила собой все существующие и решила бы, наконец, на корню проблему с появлением не читаемых текстов. Кроме этого существовала проблема языков подобных китайскому, где символов языка было гораздо больше, чем 256.
Юникод (Unicode) — универсальные кодировки UTF 8, 16 и 32
Эти тысячи знаков языковой группы юго-восточной Азии никак невозможно было описать в одном байте информации, который выделялся для кодирования символов в расширенных версиях ASCII. В результате был создан консорциум под названием Юникод (Unicode — Unicode Consortium) при сотрудничестве многих лидеров IT индустрии (те, кто производит софт, кто кодирует железо, кто создает шрифты), которые были заинтересованы в появлении универсальной кодировки текста.
Первой вариацией, вышедшей под эгидой консорциума Юникод, была UTF 32. Цифра в названии кодировки означает количество бит, которое используется для кодирования одного символа. 32 бита составляют 4 байта информации, которые понадобятся для кодирования одного единственного знака в новой универсальной кодировке UTF.
В результате чего, один и тот же файл с текстом, закодированный в расширенной версии ASCII и в UTF-32, в последнем случае будет иметь размер (весить) в четыре раза больше. Это плохо, но зато теперь у нас появилась возможность закодировать с помощью ЮТФ число знаков, равное двум в тридцать второй степени (миллиарды символов, которые покроют любое реально необходимое значение с колоссальным запасом).
Но многим странам с языками европейской группы такое огромное количество знаков использовать в кодировке вовсе и не было необходимости, однако при задействовании UTF-32 они ни за что ни про что получали четырехкратное увеличение веса текстовых документов, а в результате и увеличение объема интернет трафика и объема хранимых данных. Это много, и такое расточительство себе никто не мог позволить.
В результате развития Юникода появилась UTF-16, которая получилась настолько удачной, что была принята по умолчанию как базовое пространство для всех символов, которые у нас используются. Она использует два байта для кодирования одного знака. Давайте посмотрим, как это дело выглядит.
В операционной системе Windows вы можете пройти по пути «Пуск» — «Программы» — «Стандартные» — «Служебные» — «Таблица символов». В результате откроется таблица с векторными формами всех установленных у вас в системе шрифтов. Если вы выберете в «Дополнительных параметрах» набор знаков Юникод, то сможете увидеть для каждого шрифта в отдельности весь ассортимент входящих в него символов.
Кстати, щелкнув по любому из них, вы сможете увидеть его двухбайтовый код в формате UTF-16, состоящий из четырех шестнадцатеричных цифр:
Сколько символов можно закодировать в UTF-16 с помощью 16 бит? 65 536 (два в степени шестнадцать), и именно это число было принято за базовое пространство в Юникоде. Помимо этого существуют способы закодировать с помощью нее и около двух миллионов знаков, но ограничились расширенным пространством в миллион символов текста.
Но даже эта удачная версия кодировки Юникода не принесла особого удовлетворения тем, кто писал, допустим, программы только на английском языке, ибо у них, после перехода от расширенной версии ASCII к UTF-16, вес документов увеличивался в два раза (один байт на один символ в Аски и два байта на тот же самый символ в ЮТФ-16).
Вот именно для удовлетворения всех и вся в консорциуме Unicode было решено придумать кодировку переменной длины. Ее назвали UTF-8. Несмотря на восьмерку в названии, она действительно имеет переменную длину, т.е. каждый символ текста может быть закодирован в последовательность длиной от одного до шести байт.
На практике же в UTF-8 используется только диапазон от одного до четырех байт, потому что за четырьмя байтами кода ничего уже даже теоретически не возможно представить. Все латинские знаки в ней кодируются в один байт, так же как и в старой доброй ASCII.
Что примечательно, в случае кодирования только латиницы, даже те программы, которые не понимают Юникод, все равно прочитают то, что закодировано в ЮТФ-8. Т.е. базовая часть Аски просто перешла в это детище консорциума Unicode.
Кириллические же знаки в UTF-8 кодируются в два байта, а, например, грузинские — в три байта. Консорциум Юникод после создания UTF 16 и 8 решил основную проблему — теперь у нас в шрифтах существует единое кодовое пространство. И теперь их производителям остается только исходя из своих сил и возможностей заполнять его векторными формами символов текста. Сейчас в наборы даже эмодзи смайлики добавляют.
В приведенной чуть выше «Таблице символов» видно, что разные шрифты поддерживают разное количество знаков. Некоторые насыщенные символами Юникода шрифты могут весить очень прилично. Но зато теперь они отличаются не тем, что они созданы для разных кодировок, а тем, что производитель шрифта заполнил или не заполнил единое кодовое пространство теми или иными векторными формами до конца.
Кракозябры вместо русских букв — как исправить
Давайте теперь посмотрим, как появляются вместо текста кракозябры или, другими словами, как выбирается правильная кодировка для русского текста. Собственно, она задается в той программе, в которой вы создаете или редактируете этот самый текст, или же код с использованием текстовых фрагментов.
Для редактирования и создания текстовых файлов лично я использую очень хороший, на мой взгляд, Html и PHP редактор Notepad++. Впрочем, он может подсвечивать синтаксис еще доброй сотни языков программирования и разметки, а также имеет возможность расширения с помощью плагинов. Читайте подробный обзор этой замечательной программы по приведенной ссылке.
В верхнем меню Notepad++ есть пункт «Кодировки», где у вас будет возможность преобразовать уже имеющийся вариант в тот, который используется на вашем сайте по умолчанию:
В случае сайта на Joomla 1.5 и выше, а также в случае блога на WordPress следует во избежании появления кракозябров выбирать вариант UTF 8 без BOM. А что такое приставка BOM?
Дело в том, что когда разрабатывали кодировку ЮТФ-16, зачем-то решили прикрутить к ней такую вещь, как возможность записывать код символа, как в прямой последовательности (например, 0A15), так и в обратной (150A). А для того, чтобы программы понимали, в какой именно последовательности читать коды, и был придуман BOM (Byte Order Mark или, другими словами, сигнатура), которая выражалась в добавлении трех дополнительных байтов в самое начало документов.
В кодировке UTF-8 никаких BOM предусмотрено в консорциуме Юникод не было и поэтому добавление сигнатуры (этих самых пресловутых дополнительных трех байтов в начало документа) некоторым программам просто-напросто мешает читать код. Поэтому мы всегда при сохранении файлов в ЮТФ должны выбирать вариант без BOM (без сигнатуры). Таким образом, вы заранее обезопасите себя от вылезания кракозябров.
Что примечательно, некоторые программы в Windows не умеют этого делать (не умеют сохранять текст в ЮТФ-8 без BOM), например, все тот же пресловутый Блокнот Windows. Он сохраняет документ в UTF-8, но все равно добавляет в его начало сигнатуру (три дополнительных байта). Причем эти байты будут всегда одни и те же — читать код в прямой последовательности. Но на серверах из-за этой мелочи может возникнуть проблема — вылезут кракозябры.
Поэтому ни в коем случае не пользуйтесь обычным блокнотом Windows для редактирования документов вашего сайта, если не хотите появления кракозябров. Лучшим и наиболее простым вариантом я считаю уже упомянутый редактор Notepad++, который практически не имеет недостатков и состоит из одних лишь достоинств.
В Notepad ++ при выборе кодировки у вас будет возможность преобразовать текст в кодировку UCS-2, которая по своей сути очень близка к стандарту Юникод. Также в Нотепаде можно будет закодировать текст в ANSI, т.е. применительно к русскому языку это будет уже описанная нами чуть выше Windows 1251. Откуда берется эта информация?
Она прописана в реестре вашей операционной системы Windows — какую кодировку выбирать в случае ANSI, какую выбирать в случае OEM (для русского языка это будет CP866). Если вы установите на своем компьютере другой язык по умолчанию, то и эти кодировки будут заменены на аналогичные из разряда ANSI или OEM для того самого языка.
После того, как вы в Notepad++ сохраните документ в нужной вам кодировке или же откроете документ с сайта для редактирования, то в правом нижнем углу редактора сможете увидеть ее название:
Чтобы избежать кракозябров, кроме описанных выше действий, будет полезным прописать в его шапке исходного кода всех страниц сайта информацию об этой самой кодировке, чтобы на сервере или локальном хосте не возникло путаницы.
Вообще, во всех языках гипертекстовой разметки кроме Html используется специальное объявление xml, в котором указывается кодировка текста.
<?xml version="1.0" encoding="windows-1251"?>
Прежде, чем начать разбирать код, браузер узнает, какая версия используется и как именно нужно интерпретировать коды символов этого языка. Но что примечательно, в случае, если вы сохраняете документ в принятом по умолчанию юникоде, то это объявление xml можно будет опустить (кодировка будет считаться UTF-8, если нет BOM или ЮТФ-16, если BOM есть).
В случае же документа языка Html для указания кодировки используется элемент Meta, который прописывается между открывающим и закрывающим тегом Head:
<head> ... <meta charset="utf-8"> ... </head>
Эта запись довольно сильно отличается от принятой в стандарте в Html 4.01, но полностью соответствует новому внедряемому потихоньку стандарту Html 5, и она будет стопроцентно правильно понята любыми используемыми на текущий момент браузерами.
По идее, элемент Meta с указание кодировки Html документа лучше будет ставить как можно выше в шапке документа, чтобы на момент встречи в тексте первого знака не из базовой ANSI (которые правильно прочитаются всегда и в любой вариации) браузер уже должен иметь информацию о том, как интерпретировать коды этих символов.
Содержание
- 1 Исправление отображения кириллицы с помощью настроек языка и региональных стандартов Windows 10
- 2 Использование реестра, если метод выше не помог
- 3 Как исправить иероглифы Windows 10 путем изменения кодовых страниц
- 3.1 С помощью редактора реестра
- 4 Word
- 5 Сложные решения
- 6 Исправляем отображение русских букв в Windows 10
- 7 Используем системные настройки для решения проблемы
- 8 Notepad +++
- 9 Отдельные программы
- 10 Как решить проблему
- 11 Мета тег charset
- 12 Виды кодировок текста
- 13 Как устранить проблему самостоятельно
- 13.1 Шаг 1
- 13.2 Шаг 2
- 13.3 Шаг 3
- 13.4 Шаг 4
- 13.5 Шаг 5
- 13.6 Шаг 6
- 14 Решаем проблемы с кодировкой или как убрать кракозябры?
- 15 Ошибочное представление данных для Excel отчетов
- 15.1 Печать изображения
- 15.2 Шрифты
- 16 Картинка – пример проблемы с текстом
- 17 Юникод (Unicode) — универсальные кодировки UTF 8, 16 и 32
- 18 Инструкция по изменению кодировки в стандартном блокноте
- 19 Как исправить кракозябры и иероглифы в Windows 10
Исправление отображения кириллицы с помощью настроек языка и региональных стандартов Windows 10
Самый простой и часто рабочий способ удалить кракозябры и вернуть русские буквы в Windows 10 — исправить некоторые некорректные настройки в параметрах системы.
Для этого вам потребуется выполнить следующие действия (примечание: я также упоминаю названия необходимых элементов на английском языке, так как иногда возникает необходимость поправить кириллицу в англоязычных версиях системы без необходимости изменения язык интерфейса).
- Откройте Панель управления (для этого вы можете начать вводить «Панель управления» или «Панель управления» в поиске на панели задач.
- Убедитесь, что в поле «Просмотр по» установлено значение «Значки», и выберите «Регион).
- На вкладке «Администрирование» в разделе «Язык для программ, не поддерживающих Юникод» нажмите кнопку «Изменить языковой стандарт системы).
- Выберите русский язык, нажмите «ОК» и подтвердите перезагрузку компьютера.
После перезагрузки проверьте, решена ли проблема с отображением русских букв в интерфейсе программы и (или) документах — обычно кракозябры решаются после этих простых шагов.
Использование реестра, если метод выше не помог
Мы создаем обычный файл в текстовом редакторе, но даем ему расширение .reg, чтобы позже мы могли применить все сохраненные в нем настройки. Итак, каким должно быть содержимое рег-файла?
Что такое FPS в играх
Наберем его ручками или скопируем в буфер обмена следующие значения:
Редактор реестра Windows версии 5.00
HKEY_LOCAL_MACHINE SOFTWARE Microsoft Windows NT CurrentVersion FontMapper «ARIAL» = двойное слово: 00000000
HKEY_LOCAL_MACHINE SOFTWARE Microsoft Windows NT CurrentVersion FontSubstitutes «Arial, 0 ″ =» Arial, 204 «» Comic Sans MS, 0 ″ = «Comic Sans MS, 204» «Courier, 0 ″ =» Courier New, 204 «» Courier, 204 «=» Courier New, 204 «» MS Sans Serif, 0 «=» MS Sans Serif, 204 «» Tahoma, 0 «=» Tahoma, 204 «» Times New Roman, 0 «=» Times New Roman, 204 «» Verdana, 0 ″ = «Verdana, 204»
Когда все указанные строки будут в файле .reg, запустите его, согласитесь на внесение изменений в систему, затем перезагрузите компьютер и просмотрите результаты. Кракозябры должны исчезнуть.
Важное примечание: перед тем, как вносить какие-либо изменения в реестр, лучше всего создать резервную копию (другими словами резервную копию) реестра, чтобы последующие изменения не привели к краху операционной системы, и в этом не было необходимости переустановить на ноль. Однако, если вы уверены, что эти шаги безопасны для вашей операционной системы, вы можете пропустить этот шаг.
Как исправить иероглифы Windows 10 путем изменения кодовых страниц
Кодовые страницы — это таблицы, в которых определенные символы связаны с определенными байтами, а отображение кириллицы в виде иероглифов в Windows 10 обычно связано с тем, что кодовая страница по умолчанию установлена неверно, и это можно исправить несколькими способами которые могут быть полезны по запросу, не меняйте системный язык в параметрах.
С помощью редактора реестра
Первый способ — использовать редактор реестра. На мой взгляд, это самый щадящий метод для системы, однако я рекомендую создать точку восстановления перед запуском. Совет по точке восстановления применим ко всем методам, описанным в этом руководстве.
- Нажмите клавиши Win + R на клавиатуре, введите regedit и нажмите Enter, откроется редактор реестра.
- Перейдите к разделу реестра HKEY_LOCAL_MACHINE SYSTEM CurrentControlSet Control Nls CodePage и прокрутите до конца этого раздела с правой стороны.
- Дважды щелкните параметр ACP, установите значение 1251 (кодовая страница кириллицы), нажмите кнопку ОК и закройте редактор реестра.
- Перезагрузите компьютер (особенно перезагрузка, а не выключение и повторное включение, это может иметь решающее значение в Windows 10).
Обычно это решает проблему с отображением русских букв. Вариант метода с использованием редактора реестра (но менее предпочтительный) — посмотреть текущее значение параметра ACP (обычно 1252 для изначально англоязычных систем), затем в том же разделе реестра найти параметр с именем 1252 и изменить его значение от c_152.nls до c_1251 nls.
Word
Иногда кодировка также появляется в документах Word. Иногда причиной появления искаженных символов в Word является то, что на ПК установлено старое приложение Word (до 2007 года), а документ был создан в более поздних версиях программного обеспечения. Чаще всего такие «новые» файлы просто не открываются в старой версии, а иногда открываются со странной кодировкой. Чтобы узнать, так ли это, посмотрите в свойствах файла, какой это формат. «Новые» документы представлены в формате docx. Преобразовать файл в слово в старом формате невозможно. Лучше установить обновление на MS Word. Изменить формат текстового документа на читаемый несложно.
- Еще до открытия файла программа «понимает», что с ним проблема. Если дважды щелкнуть по нему, Word откроет окно с вопросом, в какой кодировке открыть файл. Чтобы изменить кодировку текста в word, следуйте алгоритму;
- Попробуйте кодировку, предложенную программой;
- Если не работает, щелкните по очереди предложенные типологии;
- Попробуйте изменить типы кодировки и алфавит, типы кириллицы;
- Как только текст станет разборчивым, нажмите ОК.
Иногда возникает проблема иного характера. Вы набираете текст в Word или Блокноте и замечаете, что на клавиатуре печатаются числа, а не буквы. Проблема связана с режимом Num Look и возникает на некоторых ноутбуках. Посмотри на клавиатуру. Если на кнопках с правой стороны кроме букв написаны цифры, а вверху есть кнопка num lk, то в ноутбуке установлен этот режим и вы случайно его включили. Чтобы отключить, нажмите кнопку Num Look или Fn + F11. Набор цифр прекратится, буквы появятся в обычном виде.
Сложные решения
К этим решениям стоит переходить, если проблема не решается и продолжает раздражать. Устройство печатает иероглифы вместо русских букв по причинам, которые будут рассмотрены ниже.
Дело могло быть в системных файлах. Их сброс может устранить проблему.
Открываем командную строку от имени администратора. Вбиваем команду «sfc / scannow» и нажимаем «Enter».
Команда sfc / scannow
Ждем несколько минут или секунд. Итак, давайте проверим, решена ли проблема.
Часто эта ошибка возникает из-за драйверов. Принтер печатает иероглифы, потому что драйверы неверны или работают некорректно. Следовательно, вы можете попробовать их переустановить. Из-за этого:
- Во вкладке «Оборудование и звук» Панели управления находим наш принтер.
Вкладка «Оборудование и звук
- Нажмите ПКМ, выберите «Удалить устройство».
- В разделе «Программы и компоненты» мы удаляем все программы, связанные с работой нашего устройства.
- После удаления находим диск, идущий в комплекте с печатающим устройством. Со снегом переустанавливаем все необходимые программы и драйвера.
Если у вас нет диска, Windows 7 или более поздняя версия обычно просит вас установить необходимые драйверы, если вы повторно подключите принтер к компьютеру. Если этого не произошло, вам следует посетить сайт производителя и самостоятельно загрузить необходимое программное обеспечение.
Проверьте свой компьютер антивирусом. Причина может заключаться во вредоносном ПО.
Вот основные способы решения этой проблемы. Как правило, можно ограничиться простыми действиями, так как эта ошибка появляется и исчезает сама по себе.
Исправляем отображение русских букв в Windows 10
Есть два способа решить эту проблему. Они связаны с изменением настроек системы или определенных файлов. Они различаются по сложности и эффективности, поэтому начнем с легкости. Если первый вариант не приносит результатов, переходите ко второму и внимательно следуйте изложенным там инструкциям.
Прежде всего, хотелось бы отметить такую настройку, как «Региональные правила». В зависимости от своего состояния текст в дальнейшем отображается во многих системных и сторонних программах. Вы можете поменять его на русский язык следующим образом:
-
- Откройте меню «Пуск» и введите «Панель управления» в строке поиска. Щелкните отображаемый результат, чтобы получить доступ к этому приложению.
-
- Найдите «Региональные правила» среди представленных предметов и щелкните левой кнопкой мыши по этому значку.
-
- Появится новое меню с несколькими вкладками. В этом случае вас интересует «Дополнительно», где вы должны нажать кнопку «Изменить язык системы…».
-
- Убедитесь, что пункт «Русский (Россия)» выбран, в противном случае выберите его во всплывающем меню. Также можно порекомендовать активировать бета-версию Unicode — это иногда также влияет на правильное отображение кириллицы. После всех изменений нажмите «ОК».
-
- Изменения вступят в силу только после перезагрузки компьютера, и вы получите уведомление при выходе из меню настроек.
Подождите, пока компьютер перезагрузится, и проверьте, удалось ли вам решить проблему с русскими буквами. Если нет, перейдите к следующему, более сложному варианту решения этой проблемы.
Кодовые страницы выполняют функцию преобразования символов в байты. Существует множество разновидностей таких таблиц, каждая из которых работает с определенным языком. Часто причиной появления кракозябров является именно неправильно выбранная страница. Далее мы покажем вам, как изменить значения в редакторе реестра.
Мы настоятельно рекомендуем вам создать точку восстановления перед запуском этого метода, это поможет вам вернуть конфигурацию перед внесением изменений, если после них что-то пойдет не так. Подробное руководство по этой теме вы найдете в других наших материалах по ссылке ниже.
-
- Нажмите комбинацию клавиш Win + R, чтобы запустить приложение «Выполнить», введите в строке regedit и нажмите OK».
- В окне редактирования реестра есть много каталогов и параметров. Все они структурированы, и нужная вам папка находится по следующему пути: HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlNls
- Выберите «CodePage» и пройдите вниз, чтобы найти там имя «ACP». В столбце «Значение» вы увидите четыре числа, если 1251 там не задано, дважды щелкните ЛКМ по строке.
-
- Двойной щелчок левой кнопкой мыши открывает окно редактирования настройки строки, в котором необходимо установить значение 1251.
Если значение уже равно 1251, вы должны сделать несколько разных вещей:
-
- В той же папке «CodePage» перейдите вверх по списку и найдите строковый параметр с именем «1252». Справа вы увидите, что его значение похоже на c_1252.nls. Это нужно исправить, введя один вместо двух последних. Дважды щелкните строку.
-
- Откроется окно редактирования, в котором вы сможете произвести необходимую манипуляцию.
После завершения работы с редактором реестра обязательно перезагрузите компьютер, чтобы все изменения вступили в силу.
Замена кодовой страницы
Некоторые пользователи не хотят редактировать реестр по определенным причинам или считают эту задачу слишком сложной. Альтернативный вариант изменения кодовой страницы — перезапись ее вручную. Его производят буквально в несколько этапов:
-
- Откройте «Этот компьютер» и перейдите по пути C: WindowsSystem32, найдите в папке файл C_1252.NLS, щелкните его правой кнопкой мыши и выберите «Свойства».
-
- Перейдите на вкладку «Безопасность» и найдите кнопку «Дополнительно».
-
- вам необходимо указать имя владельца, для этого нажмите на соответствующую ссылку вверху.
-
- В пустое поле введите имя активного пользователя с правами администратора, затем нажмите «ОК».
-
- Вы снова будете перенаправлены на вкладку «Безопасность», где вам нужно будет настроить параметры доступа администратора.
-
- Выберите строку «Администраторы» с помощью ЛКМ и предоставьте им полный доступ, установив флажок рядом с соответствующей записью. Не забудьте применить свои изменения, когда закончите.
-
- Вернитесь в ранее открытый каталог и переименуйте отредактированный файл, изменив его расширение с NLS, например, на TXT. Затем, удерживая CTRL, перетащите элемент «C_1251.NLS» вверх, чтобы создать копию.
-
- Щелкните правой кнопкой мыши созданную копию и переименуйте объект в C_152.NLS.
Таким нехитрым способом происходит замена кодовой страницы. Осталось только перезагрузить ПК и убедиться, что способ сработал.
Как видите, есть два довольно простых метода исправить ошибку отображения русского текста в операционной системе Windows 10. Выше вы были представлены каждому. Надеюсь, предоставленное нами руководство помогло с этой проблемой.
Используем системные настройки для решения проблемы
В первую очередь попробуем исправить ошибку через панель управления. Чтобы получить к нему доступ, нажмите клавишу ПКМ на кнопке меню «Пуск» и выберите соответствующий пункт из выпадающего списка.
В открывшемся новом окне найдите раздел Часы, Язык, Регион.
В новом разделе выберите категорию региональных стандартов.
Здесь мы можем настроить дату и время, а также числовой разделитель, количество дробных значений, формат отрицательных чисел, систему единиц и т.д.
Здесь также предлагается изменить формат денежных единиц и их обозначение. Здесь мы можем настроить локальные параметры для разных регионов, включая текстовые символы, отображаемые в системе. Это те варианты, которые нас интересуют. Чтобы выбрать их, перейдите на вкладку «Дополнительно» вверху окна.
Перейдите в раздел выбора языка, не поддерживающего Unicode, затем выберите вариант изменения языка системы.
В списке выберите нужный вариант (в нашем случае «Русский (Россия)» и нажмите «ОК»)
В появившемся окне уведомления выберите «Перезагрузить сейчас».
ПК перезагрузится, после чего проблема с кракозябрами должна исчезнуть. Однако этот метод не всегда работает. Если это не помогло решить проблему, рассмотрим другой вариант, когда нам нужно поработать с реестром.
Notepad +++
Самый простой способ открыть документ Блокнота, где вместо букв — квадратов, — использовать стороннее программное обеспечение. Популярный Блокнот +++. Это тот же Блокнот, но с дополнительными функциями. Он имеет следующие преимущества:
- Бесплатное распространение;
- Как и в Word, в нем есть кнопка для отмены последнего действия;
- Поддержка одновременной работы с несколькими файлами;
- Позволяет изменить или выбрать шифрование.
- Автоматически добавлять тексты песен;
- Плагины поддержки.
- Чтобы преобразовать иероглифы вместо русских букв, откройте в этой программе документ Блокнота. В верхней строке меню найдите вкладку Кодировки. Нажмите здесь. Откроется меню со списком всех их типов. Не всегда очевидно, какой тип шифрования использовался, поэтому, чтобы выбрать правильный для перекодирования, нужно попробовать несколько. Выделите текст перед этим.
По мере применения кодировок шрифты в документе могут изменяться (один щелчок в меню) или оставаться такими же. В результате после его применения текст станет читабельным.
Отдельные программы
Вам просто нужно помнить, что перед использованием каждого из вышеперечисленных методов рекомендуется сделать резервную копию системы, которая позволит вам сохранить все ваши документы и только важные файлы. И в этом случае вы избавите себя от случайных сложностей, которые могут возникнуть в процессе исправления ситуации, когда на вашем ПК на Windows 10 вместо русских букв отображаются иероглифы или кракозябры.
Как решить проблему
важно понимать, что, как правило, проблемы возникают с русским языком. С английским и другими языками латинского алфавита проблем не возникает. Дело в том, что русский язык — кириллица. Поэтому решим проблему с кириллицей, а не столько с русскими буками. Учтите, что не все утилиты поддерживают этот язык, и дело только в кодировке. Однако, если утилита официальная, популярная и современная, любые трудности с отображением текста — явная проблема, которую необходимо решать.
Первый шаг — проверить настройки вашего компьютера. Для этого зайдите в «Панель управления». Для этого, щелкнув правой кнопкой мыши на Пуск, вызовите диалоговое меню, в котором будет соответствующий пункт.
Далее откроется окно, в котором нужно изменить режим «Просмотр» на «Категория», затем выбрать пункт «Часы, язык, регион».
Откроется новое окно, в котором нужно выбрать «Региональные правила».
Не смотрите на то, что здесь выставлены часы и время, вам нужно перейти в раздел «Подробнее», где вы можете найти необходимый элемент об отображении требуемой локали отображения символов в операционной системе. Это именно то, что вам нужно.
В новом окне найдите запись «Язык для программ, не поддерживающих Юникод». На этой странице вам нужно найти пункт «Изменить язык системы».
Щелкаем по пункту выше и в новом окне выбираем вариант «Русский (Россия)».
Не пугайтесь, сразу после выбора или редактирования вы увидите уведомление о том, что ваш компьютер будет перезагружен. Единственное, что вы можете сделать, это отменить изменения, вернуться позже или перезагрузить устройство прямо сейчас. Выберите наиболее удобный для вас вариант.
После перезагрузки компьютера попробуйте запустить программу, которая ранее вызвала проблему. Скорее всего, ситуация кардинально изменится. И вы уже увидите русские буквы, в крайнем случае английские. Например так:
Это самый простой способ, даже если это не так. Обратите внимание, что система может потребовать от вас внести некоторые изменения в реестр вручную. Сделать это можно даже без специальных знаний о компьютерах. Поэтому попробуйте следующие шаги.
Мета тег charset
Если вы сделали то, что я описал в предыдущем шаге, и ваша проблема не решена, то пора попробовать второй способ устранения кракозябра.
Все, что нам нужно сделать, это поместить следующий код между тегамиместо. Прежде всего, проверьте, есть ли у вас этот метатег. Если да, посмотрите значение параметра charset.
Темы WordPress обычно уже имеют этот тег по умолчанию, и он выглядит так:
Виды кодировок текста
И в целом их достаточно.
- ASCII
Одна из самых старых — это американская кодовая таблица (ASCII, читается как «asci»), принятая Национальным институтом стандартов. Для кодирования он использовал 7 бит, первые 128 значений содержали английский алфавит (нижний и верхний регистры), а также знаки, числа и символы. Он больше подходил для англоговорящих пользователей и не был универсальным.
- Кириллица
Отечественный вариант кодировки, для которого стали использовать вторую часть кодовой таблицы — символы от 129 до 256. Заточка для русскоязычной аудитории.
- Кодировки семейства MS Windows: Windows1250-1258.
8-битные кодировки появились в результате развития самой популярной операционной системы Windows. Цифры от 1250 до 1258 указывают на язык, для которого они заточены, например 1250 для языков Центральной Европы; 1251 — кириллица.
- 8-битный код обмена информацией — KOI8
КОИ8-Р, КОИ8-У, КОИ-7 — стандарт русской кириллицы в Unix-подобных операционных системах.
- Юникод
Универсальный стандарт кодировки символов, позволяющий описывать символы практически любого письменного языка. Обозначение «U + xxxx» (xxxx — шестнадцатеричные цифры). Наиболее распространенные семейства кодировок UTF (Unicode Transformation Format) — это UTF-8, 16, 32.
В настоящее время, как говорится, «правила» UTF-8: это тот, который обеспечивает лучшую совместимость с предыдущими операционными системами, которые использовали 8-битные символы. Большинство сайтов в Интернете имеют кодировку UTF-8, и именно этот стандарт является универсальным (поддержка кириллицы и латиницы).
Очевидно, я указал не все типы кодировок, а только самые распространенные. Если вы хотите узнать их все для общего развития, полный список можно найти в самом браузере. Для этого перейдите на вкладку «Просмотр-Кодировка-Выбрать список» и ознакомьтесь со всеми их параметрами (см. Изображение).
Думаю, возник резонный вопрос: «какого хрена столько кодировок?» Их обилие и причины их появления можно сравнить с таким явлением, как кроссбраузерность / кроссплатформенность. Это происходит, когда один и тот же сайт по-разному просматривается в разных интернет-браузерах и на разных гаджетах. Кстати, на сайте «Заметки от Sis.Admin» с этим, как вы заметили, все в порядке :).
Все эти кодировки являются рабочими вариантами, созданными разработчиками «для себя» и решающими их проблемы. Когда их количество превысило все разумные пределы и в поисковых системах появляются такие запросы, как: «Как удалить кракозябры в браузере?» — разработчики принялись за то, чтобы привести всю эту кашу к одному стандарту, чтобы, так сказать, всем было хорошо. А кодировка Unicode в целом работала «нормально». Теперь, если такие проблемы возникают, они носят локальный характер и только совершенно несведущие пользователи не знают, как их решать (однако часто возникают проблемы с кодировкой и отображением сайтов из-за того, что веб-мастер указал неверный формат на сторонний сервер, и вам нужно изменить кодировку в вашем браузере).
Ну собственно говоря, пока вся «основная необходимая» теория, которая позволит вам «не плавать» в вопросах кодирования, теперь перейдем к практической части статьи.
Как устранить проблему самостоятельно
Есть несколько решений. Совет вручную установить желаемый тип кодировки работает не для всех браузеров. В Google Chrome несколько лет назад убрали меню, что позволяло настраивать браузер самостоятельно. По умолчанию настройки кодировки выполняются автоматически. Чтобы восстановить нормальный вид страниц госуслуг, нужно выполнить несколько шагов.
Шаг 1
Браузер кэширует старые файлы и использует их для загрузки общедоступных сервисов. Перезагрузите браузер, если не работает, удалите cookie.
Шаг 2
Перейти на сайт После загрузки данных этот сайт автоматически перенаправляется на портал Госуслуг.
После переключения с на сайт можно открыть с помощью ярлыков быстрого запуска.
Шаг 3
Проблема с появлением иероглифов может повторяться много раз, когда в настройках браузера установлена опция «Очистить куки при выходе».
Шаг 4
Причиной появления неразборчивых текстов может быть ошибка в языковых настройках программы. Чтобы исправить это, вам нужно открыть «Панель управления» и выбрать раздел «Язык и региональные стандарты». Русский язык и регион «Россия» должны быть установлены».
Шаг 5
Для Windows XP «Таблицы кодов таблиц преобразования» также перечислены внизу страницы. Здесь нужно поставить русский алфавит на строку с номером 20880.
Шаг 6
Браузер может вылетать из-за различных системных файлов (C_; C_; C_; C_; C_). В этом случае вам придется их переименовать; для любителя такая задача может оказаться сложной. Лучше всего доверить переустановку системы и изменение системных файлов специалисту.
Решаем проблемы с кодировкой или как убрать кракозябры?
Итак, наша статья была бы неполной, если бы мы не коснулись повседневных проблем пользователей. Давайте посмотрим на них и начнем с того, как (что) вы можете посмотреть на кодирование?
В любой операционной системе есть таблица символов, ее не нужно скачивать, устанавливать — это данные сверху, которые можно найти по адресу: «Start-programs-standard-service-symbol table». Это таблица векторных форм всех шрифтов, установленных в вашей операционной системе.
Выбрав «дополнительные параметры» (набор Unicode) и соответствующий тип стиля шрифта, вы увидите весь включенный в него набор символов. Нажав на любой символ, вы увидите его код в формате UTF-16, состоящий из 4-х шестнадцатеричных цифр (см. Изображение).
Теперь пару слов о том, как убрать кракозябры. Они могут возникнуть в двух случаях:
- Пользователем — при чтении информации в Интернете (например, при посещении веб-сайта);
- Или, как было сказано чуть выше, со стороны веб-мастера (например, при создании / редактировании текстовых файлов с поддержкой синтаксиса языка программирования в программе Notepad ++ или при указании неправильной кодировки в коде сайта).
Рассмотрим оба варианта.
# 1. Иероглифы на стороне пользователя.
Допустим, вы запустили операционную систему и в одном из приложений видите печально известные каракули. Чтобы исправить это, перейдите в: «Пуск — Панель управления — Язык и региональные стандарты — Изменить язык» и выберите «Россия» из списка».
Также проверьте во всех вкладках, что локаль «Россия / Русский» — это так называемая системная локаль.
Если вы открыли сайт и вдруг поняли, что иероглифы не дают возможности прочитать информацию, то вам следует изменить кодировку через браузер («Просмотр — Кодировка»). На что? Все зависит от вида этих кракозябов. Сосредоточьтесь на следующей шпаргалке (см. Изображение).
Н. 2. Иероглифы на стороне вебмастера.
Чаще всего начинающие разработчики сайтов не придают особого значения кодировке создаваемого документа, из-за чего сталкиваются с указанной выше проблемой. Вот несколько базовых советов для веб-мастеров по решению проблемы.
Чтобы этого не произошло, зайдите в редактор Notepad ++ и выберите в меню пункт «Кодировки». Именно он поможет преобразовать существующий документ. Вопрос в том, какой именно? Очень часто (если сайт на WordPress или Joomla) потом «Конвертировать в UTF-8 без BOM» (см. Изображение).
После этого преобразования вы увидите изменения в строке состояния программы.
Также во избежание кракозябра необходимо принудительно прописать кодировочную информацию в шапке сайта. Таким образом, вы указываете браузеру, что сайт следует читать в заданной кодировке. Начинающий веб-мастер должен понимать, что качественный скачок в кодировании происходит чаще из-за несоответствия между настройками сервера и настройками сайта, например, на сервере в базе данных записывается шифрование, и сайт полностью отправляет страницы в браузер другой.
Для этого необходимо между тегами написать «нагло» (в шапке сайта, то есть, как часто, в файле header.php следующая строка:
Написав такую строку, вы заставите браузер правильно интерпретировать кодировку, и иероглифы исчезнут.
Вам также может потребоваться изменить вывод данных из базы данных (MySQL). Делается это так:
mysql_query (‘УСТАНОВИТЬ ИМЕНА utf8’);
myqsl_query (‘УСТАНОВИТЬ НАБОР СИМВОЛОВ utf8’);
mysql_query (‘SET COLLATION_CONNECTION = «utf8_general_ci’» ‘);
В качестве альтернативы вы также можете сделать движение лошади и написать следующие строки в файле .htaccess:
# START UTF8
AddDefaultCharset utf-8
Добавить набор символов utf-8 *CharsetSourceEnc utf-8
CharsetDefault utf-8# END UTF8
все вышеперечисленные методы (или некоторые из них), вероятно, помогут вам и вашим будущим посетителям избавиться от ненавистных иероглифов и проблем с кодированием. К сожалению, мы не будем здесь подробно останавливаться на инструкциях к статьям веб-мастеров, я думаю, они обязательно поймут это подробно, если захотят (в конце концов, у нас немного другая тема сайта).
Ошибочное представление данных для Excel отчетов
В некоторых устаревших версиях MS Office, например в версии Excel 2010 (любая разрядность), в ячейках для отчетов Excel неверное представление значений даты (вместо даты отображается 5-значное числовое значение) . Эта ошибка была исправлена в рамках обновлений Office 2010, например, до.
Иногда возникает проблема с принтерами: при печати появляются иероглифы. Такое случается с редким пользователем, часто проблема разрешается сама собой без каких-либо действий. Кроме того, эти проблемы чаще встречаются на машинах HP. Если у вас возникла эта проблема, читайте дальше.
Следующие ниже решения просты, так как не требуют от пользователя каких-либо серьезных действий. Однако их может быть достаточно, чтобы решить проблему. В этом случае это можно будет сделать без проблем.
Это то, что вам нужно сделать с самого начала, если ваш принтер печатает символы вместо букв. Выключите компьютер и принтер, а затем снова включите их через несколько минут.
Чаще всего при печати через MS Word вместо текста выходят иероглифы. Попробуйте распечатать текст с помощью другой программы.
Для этого вы можете повторно сохранить файл в формате PDF и открыть его с помощью Adobe Acrobat Reader или FoxitReader. Вы также можете печатать с помощью браузера, такого как Google Chrome или Internet Explorer .
Печать изображения
Попробуйте распечатать изображение вместо текста. Для этого вам понадобятся:
- Откройте окно в программе, которая используется для отправки файла на печать.
- Найдите на нем кнопку «Дополнительно» или «Дополнительные настройки», в зависимости от того, в какой программе вы выполняете печать.
- В открывшемся окне найдите параметр «Печать как изображение» или «Печать растрового изображения», поставьте перед ним галочку.
Теперь аппарат печатает текст как изображение. Вероятно, вы не увидите иероглифов вместо русских букв.
Шрифты
Проблема могла быть в шрифтах. Устройство их не читает, а печатает искаженные символы вместо русских букв. Попробуйте использовать для текста другие шрифты. Это будет особенно актуально, если вы выбрали экзотические, а не классические шрифты (Arial, Calibri.
Попробуйте и это: не допускайте замены Courier New. Из-за этого:
- В Панели управления найдите элемент с устройствами.
- Найдите там проблемный принтер.
- Откройте «Свойства принтера», перейдите на вкладку «Настройки устройства».
- Найдите таблицу замены символов и выберите «Не заменять» для указанного выше символа.
Картинка – пример проблемы с текстом
У вас может быть что-то похожее, точно такое же или совершенно другое. Как бы то ни было, если вы видите, что вместо того, что должно было быть на странице, у вас есть другие данные, можете смело пользоваться этой инструкцией.
Как правило, проблема возникает не во всех приложениях, а только в особых случаях. Наиболее частые «места» возникновения проблем:
- Рабочий стол;
- Новые программы;
- Внутри слова;
Это только самые популярные причины, есть и другие. Например, даже в Windows 10 кодирование может улетать, поэтому не беспокойтесь, если ваш конкретный случай не описан в примерах, решение, скорее всего, будет описано ниже.
Юникод (Unicode) — универсальные кодировки UTF 8, 16 и 32
Эти тысячи символов языковой группы Юго-Восточной Азии не могут быть описаны в одном байте информации, который был выделен для кодирования символов в расширенных версиях ASCII. В результате был создан консорциум под названием Unicode (Unicode — Unicode Consortium) при сотрудничестве многих лидеров ИТ-сектора (тех, кто производит программное обеспечение, тех, кто кодирует оборудование, тех, кто создает символы), заинтересованных в появлении универсального текста кодирование.
Первым вариантом, выпущенным под эгидой консорциума Unicode, был UTF 32. Число в имени кодировки указывает количество битов, используемых для кодирования символа. 32 бита — это 4 байта информации, которая потребуется для кодирования одного символа в новой универсальной кодировке UTF.
Следовательно, один и тот же файл с текстом, закодированным в расширенной версии ASCII и в UTF-32, в последнем случае будет иметь размеры (вес) в четыре раза больше. Это плохо, но теперь у нас есть возможность кодировать с помощью UTP количество символов, равное двум в степени тридцати секунд (миллиарды символов, которые покрывают любое действительно необходимое значение с колоссальным запасом).
Но многим странам с языками европейской группы не нужно было использовать такое большое количество символов в кодировке, но при использовании UTF-32 они получали четырехкратное увеличение веса текстовых документов даром, и В результате увеличивается объем интернет-трафика и объем хранимых данных. Это много, и никто не мог себе позволить такие траты.
В результате развития Unicode появился UTF-16, который оказался настолько успешным, что был принят по умолчанию в качестве базового пространства для всех используемых нами символов. Он использует два байта для кодирования символа. Посмотрим, как выглядит этот чехол.
В операционной системе Windows вы можете пройти по пути «Пуск» — «Программы» — «Стандартные» — «Системные инструменты» — «Карта символов». В результате откроется таблица с векторными формами всех шрифтов, установленных в системе. Если вы выберете набор символов Unicode в «Дополнительные параметры», вы сможете увидеть весь набор символов, включенных в него, отдельно для каждого шрифта.
Кстати, щелкнув по одному из них, можно увидеть его двухбайтовый код в формате UTF-16, состоящий из четырех шестнадцатеричных цифр:
Сколько символов можно закодировать в UTF-16 с 16 битами? 65 536 (два в степени шестнадцати), и именно это число было принято в качестве базового места в Юникоде. Также есть способы кодирования с его помощью и около двух миллионов символов, но они были ограничены расширенным пространством в один миллион символов текста.
Но даже эта удачная версия кодировки Unicode не принесла большого удовлетворения тем, кто писал, например, программы только на английском языке, потому что после перехода с расширенной версии ASCII на UTF-16 вес документов увеличился вдвое (один байт для символа в Aski и два байта для того же символа в UTP-16).
к удовлетворению всех и всего консорциума Unicode было решено предложить кодирование переменной длины. Они назвали это UTF-8. Несмотря на цифру восемь в названии, она действительно имеет переменную длину, т.е каждый символ текста может быть закодирован в последовательности длиной от одного до шести байтов.
На практике в UTF-8 используется только диапазон от одного до четырех байтов, потому что за пределами четырех байтов кода это даже теоретически невозможно представить. Все содержащиеся в нем латинские символы кодируются одним байтом, как и в старом добром ASCII.
Что примечательно, в случае кодирования только латинского алфавита даже те программы, которые не понимают Unicode, все равно будут читать то, что закодировано в UTF-8. Это основная часть Asuka только что вошла в идею консорциума Unicode.
Кириллические символы в UTF-8 кодируются двумя байтами, а, например, грузинские символы — тремя байтами. После создания UTF 16 и 8 Консорциум Unicode решил основную проблему: теперь у нас есть единое пространство кода в наших символах. И теперь их создатели могут заполнить его только векторными формами текстовых символов, исходя из своих сильных сторон и способностей. Теперь в наборы также добавляют смайлики-эмодзи.
В «Таблице символов» выше вы можете видеть, что разные шрифты поддерживают разное количество символов. Некоторые символы Unicode могут быть очень тяжелыми. Но теперь они отличаются не тем, что созданы для разных кодировок, а тем, что создатель шрифта до конца заполнил или не заполнил единое пространство кода определенными векторными фигурами.
Инструкция по изменению кодировки в стандартном блокноте
Обычно он находится по следующему пути: «запуск», «все программы», «стандартные». Нашел? Давайте откроем. Если вы хотите работать с существующим документом, нажмите «файл», «открыть» и выберите его.
После написания текста или открытия готового документа в меню «файл» нажмите «сохранить как».
После этого на экране появляется окно, в котором вы можете выбрать подходящий вариант из представленного списка.
Выбираем подходящий вариант, место для сохранения документа и подтверждаем операцию. Это все. Это было легко? Фактически, выполнение работы может занять всего несколько секунд.
Как исправить кракозябры и иероглифы в Windows 10
- Нажмите Win + R и введите control. Система откроет классическую панель управления.
- На домашней странице выберите Часы, язык и регион — изменение формата даты, времени и числа.
- В открывшемся окне «Регион» откройте вкладку «Еще.
- Нажмите кнопку «Изменить язык системы» в разделе «Язык» окна программы, не поддерживающей Юникод.
- В открывшемся окне выберите из выпадающего списка нужный вам язык, например Русский (Россия). Щелкните ОК.
- Windows предупредит вас, что вам необходимо перезагрузить компьютер, чтобы изменения вступили в силу. Согласитесь на перезагрузку сейчас и нажмите «Перезагрузить сейчас.
После запуска компьютера текст должен появиться должным образом.
Источники
- https://remontka.pro/fix-cyrillic-windows-10/
- https://brit03.ru/ustrojstva/vmesto-teksta-neponyatnye-simvoly.html
- https://pcyk.ru/windows/chto-delat-kogda-v-dokumente-poyavlyayutsya-neponyatnye-simvoly-i-ieroglify/
- https://HuaweiNews.ru/gadzhety-obzory/neponyatnye-simvoly-vmesto-bukv.html
- https://2compa.ru/kompjutery-i-tehnologii/poleznoe/pojavilis-krakozjabry-vmesto-russkih-bukv-v-windows-10/
- https://win10m.ru/krakozyabry-i-ieroglify-vmesto-bukv.html
- https://sonikelf.ru/kodirovka-teksta-sajtov-i-ne-tolko-razbor-poletov-i-reshenie-problem/
- [https://prooneplus.ru/printery/ieroglify-vmesto-russkih-bukv-vmesto-teksta-kvadratiki-chto-delat-96270]
- [https://KtoNaNovenkogo.ru/vokrug-da-okolo/kodirovka-teksta-krakozyabry-ascii-yunikod-utf-8-rasshirennaya-ascii-windows-1251-cp866-koi8-r-problemy-s-kodirovkoj.html]
[свернуть]
Что делать, если в документе «Word» открываются иероглифы?
Первым долгом нам нужно проверить расширение файла, который мы открываем. Если это документ «Word», то он может быть представлен в двух форматах – «doc» и «docx». Расширение «doc» привязано к программе «Word» ниже версии 2007 года, а «docx» — соответственно, используется в «Word 2007/2010/2013/2016».
Если вы в более старой версии «Word» откроете файл с расширением «docx», то увидите эти самые непонятные иероглифы. То есть новые файлы не поддерживаются более ранней версией текстового редактора. И что в этом случае нужно сделать? Просто установить новую версию от 2007 года.
Если вам нужно проверить, какое расширение имеет тот или иной документ «Word», то кликните по нему правой кнопкой мышки, зайдите в контекстном меню в «Свойства» и в открывшемся окне на вкладке «Подробно» обратите внимание на имя файла:
Также при открытии непонятного документа программа «Word» (официальной непиратской версии) должна спросить, в какой кодировке следует представить текст:
Программа «Word» должна спросить, в какой кодировке следует представить текст
Обычно кодировка определяется автоматически, но возможны и случаи исключения. Если программа предлагает вам выбрать кодировку, то тут могут возникнуть некоторые проблемы. Дело в том, что иногда сделать правильный выбор придется при помощи «метода тыка», хотя по умолчанию следует выбирать «Windows (по умолчанию)», если вы не открываете какой-то редкий документ:
Выбираем кодировку вручную
Как исправить иероглифы Windows 10 путем изменения кодовых страниц
Кодовые страницы представляют собой таблицы, в которых определенным байтам сопоставляются определенные символы, а отображение кириллицы в виде иероглифов в Windows 10 связано обычно с тем, что по умолчанию задана не та кодовая страница и это можно исправить несколькими способами, которые могут быть полезны, когда требуется не изменять язык системы в параметрах.
С помощью редактора реестра
Первый способ — использовать редактор реестра. На мой взгляд, это самый щадящий для системы метод, тем не менее, рекомендую создать точку восстановления прежде чем начинать. Совет про точки восстановления относится и ко всем последующим способам в этом руководстве.
- Нажмите клавиши Win+R на клавиатуре, введите regedit и нажмите Enter, откроется редактор реестра.
- Перейдите к разделу реестра HKEY_LOCAL_MACHINE SYSTEM CurrentControlSetControl Nls CodePage и в правой части пролистайте значения этого раздела до конца.
- Дважды нажмите по параметру ACP, установите значение 1251 (кодовая страница для кириллицы), нажмите Ок и закройте редактор реестра.
- Перезагрузите компьютер (именно перезагрузка, а не завершение работы и включение, в Windows 10 это может иметь значение).
Обычно, это исправляет проблему с отображением русских букв. Вариация способа с помощью редактора реестра (но менее предпочтительная) — посмотреть на текущее значение параметра ACP (обычно — 1252 для изначально англоязычных систем), затем в том же разделе реестра найти параметр с именем 1252 и изменить его значение с c_1252.nls на c_1251.nls.
Путем подмена файла кодовой страницы на c_1251.nls
Второй, не рекомендуемый мной способ, но иногда выбираемый теми, кто считает, что правка реестра — это слишком сложно или опасно: подмена файла кодовой страницы в C: Windows System32 (предполагается, что у вас установлена западно-европейская кодовая страница — 1252, обычно это так. Посмотреть текущую кодовую страницу можно в параметре ACP в реестре, как было описано в предыдущем способе).
- Зайдите в папку C: Windows System32 и найдите файл c_1252.NLS, нажмите по нему правой кнопкой мыши, выберите пункт «Свойства» и откройте вкладку «Безопасность». На ней нажмите кнопку «Дополнительно».
- В поле «Владелец» нажмите «Изменить».
- В поле «Введите имена выбираемых объектов» укажите ваше имя пользователя (с правами администратора). Если в Windows 10 используется учетная запись Майкрософт, вместо имени пользователя укажите адрес электронной почты. Нажмите «Ок» в окне, где указывали пользователя и в следующем (Дополнительные параметры безопасности) окне.
- Вы снова окажетесь на вкладке «Безопасность» в свойствах файла. Нажмите кнопку «Изменить».
- Выберите пункт «Администраторы» (Administrators) и включите полный доступ для них. Нажмите «Ок» и подтвердите изменение разрешений. Нажмите «Ок» в окне свойств файла.
- Переименуйте файл c_1252.NLS (например, измените расширение на .bak, чтобы не потерять этот файл).
- Удерживая клавишу Ctrl, перетащите находящийся там же в C: Windows System32 файл c_1251.NLS (кодовая страница для кириллицы) в другое место этого же окна проводника, чтобы создать копию файла.
- Переименуйте копию файла c_1251.NLS в c_1252.NLS.
- Перезагрузите компьютер.
После перезагрузки Windows 10 кириллица должна будет отображаться не в виде иероглифов, а как обычные русские буквы.
Что делать, если вместо текста иероглифы (в Word, браузере или текстовом документе)
Наверное, каждый пользователь ПК сталкивался с подобной проблемой: открываешь интернет-страничку или документ Microsoft Word — а вместо текста видишь иероглифы (различные «крякозабры», незнакомые буквы, цифры и т.д. (как на картинке слева…)).
Хорошо, если вам этот документ (с иероглифами) не особо важен, а если нужно обязательно его прочитать?! Довольно часто подобные вопросы и просьбы помочь с открытием подобных текстов задают и мне. В этой небольшой статье я хочу рассмотреть самые популярные причины появления иероглифов (разумеется, и устранить их).
Иероглифы в текстовых файлах (.txt)
Кодировка — это набор символов, необходимый для того, чтобы полностью обеспечить написание текста на определенном алфавите (в том числе цифры и специальные знаки). Более подробно об этом здесь: https://ru.wikipedia.org/wiki/Набор_символов
Чаще всего происходит одна вещь: документ открывается просто не в той кодировке из-за чего происходит путаница, и вместо кода одних символов, будут вызваны другие. На экране появляются различные непонятные символы (см. рис. 1)…
Рис. 1. Блокнот — проблема с кодировкой
Как с этим бороться?
На мой взгляд лучший вариант — это установить продвинутый блокнот, например Notepad++ или Bred 3. Рассмотрим более подробно каждую из них.
Notepad++
Один из лучших блокнотов как для начинающих пользователей, так и для профессионалов. Плюсы: бесплатная программа, поддерживает русский язык, работает очень быстро, подсветка кода, открытие всех распространенных форматов файлов, огромное количество опций позволяют подстроить ее под себя.
В плане кодировок здесь вообще полный порядок: есть отдельный раздел «Кодировки» (см. рис. 2). Просто попробуйте сменить ANSI на UTF-8 (например).
Рис. 2. Смена кодировки в Notepad++
После смены кодировки мой текстовый документ стал нормальным и читаемым — иероглифы пропали (см. рис. 3)!
Рис. 3. Текст стал читаемый… Notepad++
Bred 3
Еще одна замечательная программа, призванная полностью заменить стандартный блокнот в Windows. Она так же «легко» работает со множеством кодировок, легко их меняет, поддерживает огромное число форматов файлов, поддерживает новые ОС Windows (8, 10).
Решаем проблемы с кодировкой или как убрать кракозябры?
Итак, наша статья была бы неполной, если бы мы не затронули пользовательско-бытовые вопросы. Давайте их и рассмотрим и начнем с того, как (с помощью чего) можно посмотреть кодировку?
В любой операционной системе имеется таблица символов, ее не нужно докачивать, устанавливать – это данность свыше, которая располагается по адресу: “Пуск-программы-стандартные-служебные-таблица символов”. Это таблица векторных форм всех установленных в Вашей операционной системе шрифтов.
Выбрав “дополнительные параметры” (набор Unicode) и соответствующий тип начертания шрифта, Вы увидите полный набор символов, в него входящих. Кликнув по любому символу, Вы увидите его код в формате UTF-16, состоящий из 4-х шестнадцатеричных цифр (см. изображение).
Теперь пара слов о том, как убрать кракозябры. Они могут возникать в двух случаях:
- Со стороны пользователя — при чтении информации в интернет (например, при заходе на сайт);
- Или, как говорилось чуть выше, со стороны веб-мастера (например, при создании/редактировании текстовых файлов с поддержкой синтаксиса языков программирования в программе Notepad++ или из-за указания неправильной кодировки в коде сайта).
Рассмотрим оба варианта.
№1. Иероглифы со стороны пользователя.Допустим, Вы запустили ОС и в каком-то из приложений у Вас отображаются пресловутые каракули. Чтобы это исправить, идем по адресу: “Пуск — Панель управления — Язык и региональные стандарты — Изменение языка” и выбираем из списка, «Россия».
Также проверьте во всех вкладках, чтобы локализация была “Россия/русский” – это так называемая системная локаль.
Если Вы открыли сайт и вдруг поняли, что почитать информацию Вам не дают иероглифы, тогда стоит поменять кодировку средствами браузера (“Вид — Кодировка”). На какую? Тут все зависит от вида этих кракозябр. Ориентируйтесь на следующую шпаргалку (см. изображение).
№2. Иероглифы со стороны веб-мастера.Очень часто начинающие разработчики сайтов не придают большого значения кодировке создаваемого документа, в результате чего потом и сталкиваются с вышеозначенной проблемой. Вот несколько простых базовых советов для веб-мастеров, чтобы исправить беду.
Чтобы такого не происходило, заходим в редактор Notepad++ и выбираем в меню пункт “Кодировки”. Именно он поможет преобразовать имеющийся документ. Спрашивается, какой? Чаще всего (если сайт на WordPress или Joomla), то “Преобразовать в UTF-8 без BOM” (см. изображение).
Сделав такое преобразование, Вы увидите изменения в строке статуса программы.
Также во избежание кракозябр необходимо принудительно прописать информацию о кодировке в шапке сайта. Тем самым Вы укажите браузеру на то, что сайт стоит считывать именно в прописанной кодировке. Начинающему веб-мастеру необходимо понимать, что чехарда с кодировкой чаще всего возникает из-за несоответствия настроек сервера настройкам сайта, т.е. на сервере в базе данных прописана одна кодировка, а сайт отдает страницы в браузер в совершенной другой.
Для этого необходимо прописать “внаглую” (в шапку сайта, т.е, как частенько, в файл header.php) между тегами <head> </head> следующую строчку:
Прописав такую строчку, Вы заставите браузер правильно интерпретировать кодировку, и иероглифы пропадут.
Также может потребоваться корректировка вывода данных из БД (MySQL). Делается сие так:
mysql_query(‘SET NAMES utf8’ ); myqsl_query(‘SET CHARACTER SET utf8’ ); mysql_query(‘SET COLLATION_CONNECTION=»utf8_general_ci’» ‘);
Как вариант, можно еще сделать ход конём и прописать в файл .htaccess такие вот строчки:
# BEGIN UTF8 AddDefaultCharset utf-8 AddCharset utf-8 * CharsetSourceEnc utf-8 CharsetDefault utf-8 # END UTF8
Все вышеприведенные методы (или некоторые из них), скорее всего, помогут Вам и Вашим будущим посетителям избавиться от ненавистных иероглифов и проблем с кодировкой. К сожалению, более подробно мы здесь инструкцию по веб-мастерским штукам рассматривать не будем, думаю, что они обязательно разберутся в подробностях при желании (как-никак у нас несколько другая тематика сайта).
Ну, вот и практическая часть статьи закончена, осталось подвести небольшие итоги.
Вместо текста иероглифы, квадратики и крякозабры (в браузере, Word, тексте, окне Windows)
Подскажите пожалуйста, почему у меня некоторые странички в браузере отображают вместо текста иероглифы, квадратики и не пойми что (ничего нельзя прочесть). Раньше такого не было.
Доброго времени суток!
Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные «крякозабры» (как я их называю), и прочитать это нереально.
Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из Википедии ), а браузер пытается открыть его в другой. Из-за такого рассогласования, вместо текста — непонятный набор символов.
Попробуем исправить это.
Случаи некорректного отображения текста
Конечно, когда в программе наотрез отказываются открываться, казалось бы, родные форматы, это поправить очень сложно, а то и практически невозможно. Но, бывают случаи, когда они открываются, а их содержимое невозможно прочесть. Речь сейчас идет о тех случаях, когда вместо текста, кстати, с сохраненной структурой, вставлены какие-то закорючки, «перевести» которые невозможно.
Эти случаи чаще всего связаны лишь с одним — с неверной кодировкой текста. Точнее, конечно, будет сказать, что кодировка не неверная, а просто другая. Не воспринимающаяся программой. Интересно еще то, что общего стандарта для кодировки нет. То есть, она может разниться в зависимости от региона. Так, создав файл, например, в Азии, скорее всего, открыв его в России, вы не сможете его прочитать.
В этой статье речь пойдет непосредственно о том, как поменять кодировку в Word. Кстати, это пригодится не только лишь для исправления вышеописанных «неисправностей», но и, наоборот, для намеренного неправильного кодирования документа.
Исправляем иероглифы на текст
Браузер
Вообще, раньше Internet Explorer часто выдавал подобные крякозабры,
В процессе работы в Windows 10 может возникнуть ситуация, когда русские символы в системе перестают корректно отображаться. Вместо них мы видим нечто невразумительное, некие иероглифы или кракозябры, не обладающие каким-либо практическим смыслом. Обычно такое случается, когда неправильно выбрана локаль в региональных настройках.
Частенько это имеет место быть, когда вы работаете с русскоязычными символами в операционке с английской локализацией, поскольку в ней для русскоязычной программы по умолчанию отсутствуют средства обработки кириллицы, да и какого-либо другого языка с нелатинскими символами, будь это греческая, китайская либо японская языковая конструкция. В этой статье я расскажу, как убрать кракозябры в Windows 10, и вместо них работать с корректно отображающимися русскими символами.
Обычно кракозябры отображаются не везде. К примеру, кириллические символы в названиях программ на рабочем столе написаны абсолютно правильно, без ошибок, а вот если запустить на инсталляцию один из дистрибутивов с поддержкой русского языка, то тут же все начинает идти вкривь и вкось, текст становится нечитаемым, и вы буквально не знаете, что делать.
Ниже я расскажу, как избавиться от этой проблемы, решив ее в свою пользу раз и навсегда.
Стоит понимать, что вся проблема в том, что в вашей операционной системе изначально отсутствует поддержка кириллицы. Скорее всего, вы установили дистрибутив на английском языке, и поверх него установили расширенный пакет для русификации системы, но это не решает всех проблем. Текст все равно является нечитаемым, а описанная проблема остается и никуда не исчезает.
Первое, что может прийти в голову в данной ситуации — это переставить ОС с нуля на русскую версию, где изначально уже присутствует поддержка кириллических символов. Но предположим, что этот вариант для вас не годится, поскольку вы хотите работать именно в англоязычной среде, где все символы кириллицы отображаются корректно и без багов. Именно о такой ситуации и пойдет речь в моей инструкции, которая в этом случае и придется вам как никогда кстати.
Программы для очистки компьютера от мусора
Суть проблемы
Как правило, мы можем наблюдать эти кракозябры не в каждой программе. Например, символы, изображённые кириллицей в названии программ, отображены корректно. Но если запустить программу установки дистрибутивов, поддерживающих русский язык, мы получаем неведомую нам «китайскую грамоту».
И, пожалуй, основная проблема кроется в том, что в имеющейся ОС по дефолту отсутствует поддержка кириллических символов. На практике это может значить, что вы инсталлировали английский дистрибутив с установленным поверх него расширенным пакетом русификации. Однако последний не смог решить проблему корректно.
Первое, что пытаются делать пользователи в такой ситуации – переустановка операционки с чистого листа. Однако не все согласятся на такое, ведь кто-то, возможно, намеренно хочет работать с англоязычной средой. И в этой среде кириллические символы по идее могут и должны отображаться корректно.
Виды кодировок текста
А их, в общем-то, хватает.
- ASCII
Одной из самых “древних” считается американская кодировочная таблица (ASCII, читается как “аски”), принятая национальным институтом стандартов. Для кодировки она использовала 7 битов, в первых 128 значениях размещался английский алфавит (в нижнем и верхнем регистрах), а также знаки, цифры и символы. Она больше подходила для англоязычных пользователей и не была универсальной.
- Кириллица
Отечественный вариант кодировки, для которого стали использовать вторую часть кодовой таблицы – символы с 129 по 256. Заточена под русскоязычную аудиторию.
- Кодировки семейства MS Windows: Windows 1250-1258.
8-битные кодировки, появились как следствие разработки самой популярной операционной системы, Windows. Номера с 1250 по 1258 указывают на язык, под который они заточены, например, 1250 – для языков центральной Европы; 1251 – кириллический алфавит.
- Код обмена информацией 8 бит – КОИ8
KOI8-R, KOI8-U, KOI-7 – стандарт для русской кириллицы в юникс-подобных операционных системах.
- Юникод (Unicode)
Универсальный стандарт кодирования символов, позволяющий описать знаки практически всех письменных языков. Обозначение “U+xxxx” (хххх – 16-ричные цифры). Самые распространенные семейства кодировок UTF (Unicode Transformation Format): UTF-8, 16, 32.
В настоящее время, как говорится, “рулит” UTF-8 – именно она обеспечивают наилучшую совместимость со старыми ОС, которые использовали 8-битные символы. В UTF-8 кодировке находятся большинство сайтов в сети Интернет и именно этот стандарт является универсальным (поддержка кириллицы и латиницы).
Разумеется, я привел не все виды кодировок, а только наиболее ходовые. Если же Вы хотите для общего развития знать их все, то полный список можно отыскать в самом браузере. Для этого достаточно пройти в нем на вкладку “Вид-Кодировка-Выбрать список” и ознакомиться со всевозможными их вариантами (см. изображение).
Думаю возник резонный вопрос: “Какого лешего столько кодировок?”. Их изобилие и причины возникновения можно сравнить с таким явлением, как кроссбраузерность/кроссплатформенность. Это когда один и тот же сайт сайт отображается по-разному в различных интернет-обозревателях и на различных гаджет-устройствах. Кстати у сайта «Заметки Сис.Админа» с этим, как Вы заметили всё в порядке :).
Все эти кодировки – рабочие варианты, созданные разработчиками “под себя” и решение своих задач. Когда же их количество перевалило за все разумные пределы, а в поисковиках стали плодиться запросы типа: “Как убрать кракозябры в браузере?” — разработчики стали ломать голову над приведением всей этой каши к единому стандарту, чтобы, так сказать, всем было хорошо. И кодировка Unicode, в общем-то, это “хорошо” и сделала. Теперь если такие проблемы и возникают, то они носят локальный характер, и не знают как их исправить только совсем непросвещенные пользователи (впрочем, часто беда с кодировкой и отображением сайтов появляется из-за того, что веб-мастер указал на стороне сервера некорректный формат, и приходится переключать кодировку в браузере).
Ну вот, собственно, пока вся «базово необходимая» теория, которая позволит Вам “не плавать” в кодировочных вопросах, теперь переходим к практической части статьи.
Используем системные настройки для решения проблемы
Прежде всего, попробуем исправить ошибку через панель управления. Чтобы зайти в неё нажимаем ПКМ по кнопке-меню «Пуск» и в выпавшем списке выбираем соответствующий пункт.
В открывшемся новом окне находим раздел Часы, язык, регион.
В новом разделе выбираем категорию региональных стандартов.
Здесь мы сможем настроить вариант даты и времени, а также числовой разделитель, количество дробных значений, формат отрицательных чисел, систему единиц измерения и пр.
Также здесь нам предлагается изменить формат денежных единиц и обозначение таковых. Здесь же мы можем настроить локальные параметры для разных регионов, включая отображаемые в системе текстовые символы. Именно эти опции нас и интересуют. Для их выбора переходим ко вкладке «Дополнительно» в верхней части окна.
Переходим в раздел выбора языка, не поддерживающего Юникод, и далее выбираем опцию изменение языка системы.
В списке выбираем нужный вариант (в нашем случае «Русский (Россия)» и нажимаем «ОК»)
В появившемся окне уведомлений выбираем «Перезагрузить сейчас».
ПК уйдёт в перезагрузку, после чего проблема с кракозябрами должна исчезнуть. Однако не всегда этот способ срабатывает. Если он не помог решить проблему, рассмотрим ещё один вариант, в котором нам придётся поработать с реестром.
Notepad +++
Самый простой способ открыть документ Блокнот, где вместо букв квадратики – применить сторонний софт. Популярен Notepad+++. Это тот же Блокнот, но обладающий дополнительными функциями. Имеет следующие преимущества:
- Распространяется бесплатно;
- Как и Ворд, имеет кнопку отмены последнего действия;
- Поддерживает одновременную работу с несколькими файлами;
- Позволяет изменить или выбрать шифрование.
- Автоматически дописывает тексты;
- Поддерживает плагины.
- LiveJournal
- Blogger
Чтобы иероглифы вместо русских букв преобразовались, откройте документ Блокнота в данной программе. В ленте меню сверху найдите вкладку Кодировки. Нажмите на нее. Откроется меню с перечислением всех их типов. Не всегда очевидно, какой именно тип шифрования применялся, потому, чтобы выбрать правильный для перекодировки, нужно попробовать несколько. Текст пред этим выделите.
По мере применения кодировок, символы в документе могут меняться (по одному нажатию в меню) или оставаться неизменными. В результате, после применения определенной, текст станет читаемым.
- LiveJournal
- Blogger
Редактируем страницу кода вручную
Страницы кода отвечают за сопоставление символов с байтами. Таких таблиц бывает много, и каждая из них работает с различными языками. Зачастую кракозябры появляются при неправильном выборе страницы и её сопоставлении. Чтобы исправить это, нам предстоит поработать с реестром. Для этого:
- Win+R запускаем системную службу «Выполнить». Прописываем в единственной строке regedit и жмём Ок.
- В окне реестра нам нужно перейти по следующему пути: HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlNls
- Здесь выбираем папку CodePage и в правой части окна идём вниз, чтобы найти пункт ACP.
- Дважды кликаем ЛКМ по ACP, и перед нами открывается окно изменений строковых настроек. Здесь выставляем значение 1251. Если такое значение уже установлено для этого пункта, тогда нужно сделать по-другому.
Находясь в том же разделе CodePage, в правой части окна ищем пункт 1252. Жмём по нему дважды ЛКМ и в появившемся окне меняем текущее значение 1252 на 1251.
После произведённых манипуляций отправляем компьютер в перезагрузку, чтобы применённые изменения вступили в силу.
Post Views: 50
Использование реестра, если метод выше не помог
Создадим в текстовом редакторе обычный файлик, но дадим ему расширение .reg, дабы впоследствии можно было применить все настройки, хранящиеся в нем. Итак, какое же содержимое reg-файла должно быть?
Что такое FPS в играх
Наберем в него ручками или скопируем через буфер обмена следующие значения:
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindows NTCurrentVersionFontMapper] «ARIAL»=dword:00000000
[HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindows NTCurrentVersionFontSubstitutes] «Arial,0″=»Arial,204» «Comic Sans MS,0″=»Comic Sans MS,204» «Courier,0″=»Courier New,204» «Courier,204″=»Courier New,204» «MS Sans Serif,0″=»MS Sans Serif,204» «Tahoma,0″=»Tahoma,204» «Times New Roman,0″=»Times New Roman,204» «Verdana,0″=»Verdana,204»
Когда все указанные строки окажутся в reg-файле, запустим его, согласимся с внесением изменений в систему, после чего выполним перезагрузку ПК и смотрим на результаты. Кракозябры должны исчезнуть.
Важное замечание: перед внесением изменений в реестр лучше создать резервную копию (другими словами, бэкап) реестра, дабы вносимые впоследствии изменения не повлекли за собой крах операционки, и ее не пришлось переустанавливать с нуля. Тем не менее, если вы уверены, что эти действия безопасны для вашей ОС, можете этот пункт упустить.
Мета тег charset
Если вы сделали то, что я описывал в предыдущем шаге и ваша проблема не разрешилась, тогда самое время испробовать второй метод устранения кракозябров.
Всё, что нам требуется, это вставить следующий код между тегами
сайта. Прежде всего проверьте, возможно этот метатег у вас уже присутствует. Если да, то посмотрите какое у него стоит значение параметра charset.
<meta charset=»UTF-8″ />
В темах WordPress обычно этот тег уже имеется по умолчанию и выглядит следующим образом:
Самый простой и чаще всего работающий способ убрать кракозябры и вернуть русские буквы в Windows 10 — исправить некоторые неправильные настройки в параметрах системы.
Для этого потребуется выполнить следующие шаги (примечание: привожу также названия нужных пунктов на английском, так как иногда необходимость исправить кириллицу возникает в англоязычных версиях системы без нужды менять язык интерфейса).
- Откройте панель управления (для этого можно начать набирать «Панель управления» или «Control Panel» в поиске на панели задач.
- Убедитесь, что в поле «Просмотр» (View by) установлено «Значки» (Icons) и выберите пункт «Региональные стандарты» (Region).
- На вкладке «Дополнительно» (Administrative) в разделе «Язык программ, не поддерживающих Юникод» (Language for non-Unicode programs) нажмите по кнопке «Изменить язык системы» (Change system locale).
- Выберите русский язык, нажмите «Ок» и подтвердите перезагрузку компьютера.