Как найти самое популярное слово

Запросы – это те фразы и словосочетания, с помощью которых идет продвижение сайта и его страниц в поисковой системе. Чем они популярнее (то бишь идеально соответствуют интересам целевой аудитории), тем быстрее ресурс будет продвигаться на первые позиции выдачи. Но это не единственная цель, для которой нужно составлять статистику запросов.

Я подробно расскажу, кому и зачем это нужно, а также опишу основные способы поиска топа запросов Яндекса за месяц.

Зачем нужно знать запросы в Яндексе

Как я уже сказала, чем частотнее запросы, по которым продвигается сайт, тем быстрее он поднимется на вершины поисковой выдачи Яндекса. Сам контент при этом должен быть не менее интересным, причем как целевой аудитории, так и поисковым роботам.

Отслеживание поисковых трендов также необходимо и для других целей – прогнозирования роста трафика на вашем сайте, оценки перспективности выбранной тематики или направления в бизнесе, а также поиска сезонных трендов. Помимо прочего, анализ самых запрашиваемых слов может понадобиться для формирования и оценки маркетинговых кампаний.

Комьюнити теперь в Телеграм

Подпишитесь и будьте в курсе последних IT-новостей

Подписаться

Как узнать топ запросов Яндекса

Существует несколько сервисов, с помощью которых можно узнать о том, кто и что ищет в Яндексе. В первую очередь я рассмотрю инструменты самой компании, а уже потом буду разбирать сторонние сервисы.

Яндекс.Вордстат

Чтобы сервис Вордстат работал нормально, прежде всего надо авторизоваться в своем профиле Яндекс. Далее действовать очень просто – надо ввести в строке ключевую фразу. Сервис может потребовать ввод капчи, дабы подтвердить, что вы не робот.

Сортировку можно проводить по словам, регионам, а также истории запросов. В первом случае будут отображаться другие популярные фразы, а во втором – популярность их в конкретном регионе. Можно фильтровать запросы, выбирая показы исключительно в мобильной версии и так далее.

Поиск популярных поисковых запросов через Яндекс.Вордстат

При подборе ключевых слов отображается два столбца – в левом запрашиваемое, а в правом похожее, смежное из этой же тематики. В данном сервисе можно также уточнять некоторые запросы с помощью специальных операторов. К примеру, если заключить ключевое слово в кавычки «», в результатах будут отображены все возможные словоформы.

Другой вариант – заключить искомое слово в восклицательные знаки. В таком случае выделенное слово будет искаться в точном вхождении, без изменения формы. И главное, что знак этот должен ставиться перед каждым словом, которое должно быть найдено без изменений.

Еще один инструмент – квадратные скобки [ ]. В данном случае будет зафиксирован порядок слов в ключевой фразе. А вот скобки () и прямой разделитель | используются для создания комбинаций ключевых запросов.

С помощью знаков можно также добавлять или убавлять слова. Символ плюса «+» фиксирует стоп-слова, не имеющие дополнительного смысла, а минус «-», наоборот, убирает ненужные слова из фразы.

Яндекс.Вебмастер

В Яндекс.Вебмастер тоже доступна статистика поисковых запросов. Он показывает те, что используются на вашем сайте, выделяет из них наиболее популярные и показывает статистику домена с вашими конкурентами. Вся необходимая информация будет отображаться в разделе «Поисковые запросы». Только прежде надо привязать к сервису собственный сайт, а только потом смотреть статистику.

Яндекс.Директ

Яндекс.Директ в первую очередь предназначен для создания рекламных объявлений. Но с его помощью можно также собирать популярные ключевые слова и фразы. Единственный минус, возможно, актуальный не для всех – прежде всего необходимо создать рекламную кампанию в сервисе, а уже потом переходить к поиску.

В Яндекс.Директ предусмотрена встроенная статистика ключевых фраз. Она лишь показывает, сколько человек в предыдущем месяце искали введенные вами ключи, а также популярные схожие запросы.

Serpstat

Поиск популярных ключевых запросов в Serpstat

В Serpstat есть отдельная страница с инструментом для анализа ключевых фраз. Здесь необходимо ввести определенное ключевое слово или фразу, затем нажать на кнопку «Получить данные», и сервис приведет подробную информацию по нему.

Минус – без регистрации никакой информации вы не получите. Тут можно залогиниться с помощью Google или Facebook. В результатах, кстати, будет показана частотность, ее стоимость в контекстной рекламе, конкуренты, а также платная и органическая выдача.

Только вот как определить, в каком регионе и к какой поисковой системе они относятся? Легко! Просто на итоговой странице открыть выпадающее меню справа и настроить регион. Выбор невелик, конечно…

Выбор региона при поиске популярных ключевых запросов в Serpstat

Если же вы только создаете сайт и оптимизируете его, но не знаете, какие ключевые слова популярны, можно посмотреть раздел «Подбор фраз». Он находится в категории «Анализ ключевых фраз», далее «SEO-анализ». На этой странице выдаются все вариации искомой ключевой фразы, по которым сайты ранжируются в топ-50 органической выдачи поисковой сети Яндекс. Также предоставляются основные показатели по ключам в различных регионах и их стоимость.

По бесплатному тарифу можно посмотреть только 10 ключевых фраз. Чтобы увидеть больше, необходимо купить платную версию.

Магадан

Предупреждаю заранее, что Магадан – это не онлайн-сервис, а программа для установки на компьютер. С ее помощью можно проводить сбор и анализ статистики по ключевым фразам из Яндекс.Директа, группировать и объединять запросы, фильтровать их и даже хранить в различных базах.

Как пользоваться программой Магадан для поиска ТОПа запросов

У программы, конечно же, есть две версии – LITE и PRO. Первая ознакомительная, с ограничениями по функционалу, но скорее в плане автоматики сбора данных, нежели в ее объемах. В PRO, понятно, нет никаких ограничений.

Key Collector

Еще одна хорошая программа для оптимизации сайта – это Key Collector. С ее помощью можно быстро собрать поисковые запросы из Яндекса, узнать их стоимость и эффективность. Самое интересное, что в ней есть 70 параметров для оценки ключевых фраз и даже проведение экспертного анализа на соответствие сайта семантическому ядру. Бесплатная версия этой программы называется «Слобоеб», но она сильно ограничена по функционалу и скорости сбора ключевых слов. 

Заключение

Одни из самых эффективных и востребованных инструментов для поиска топа запросов Яндекса – это Вордстат и Serpstat. Первый абсолютно бесплатен и дает море информации, но ее сбор и аналитику придется осуществлять полностью вручную. Если времени на это нет, рекомендую сразу рассматривать второй вариант – Serpstat. Функционал сервиса огромен, так вдобавок он собирает и анализирует данные по определенным запросам. Да, у него тоже есть минусы, один из которых – не такой уж широкий перечень доступных для поиска регионов.

Выбор за вами! 

Мы уже анализировали самые частые слова в тексте, но делали это быстро, на коленке и с помощью Экселя. Теперь подойдём к этому серьёзно и используем дата-сайенс и Python — с ним такой анализ будет проще, быстрее и эффективнее. Заодно научимся делать такое красивое облако самых частых слов — это из первого тома «Войны и мира»:

Анализируем самые частые слова в любом тексте

Что делаем

Сегодня мы проанализируем текст всех томов «Войны и мира» и посмотрим, изменятся ли самые частые слова, как это будет выглядеть в облаке. Интересно, можно ли по таким облакам хотя бы примерно понять общее настроение или содержание текста.

Логика будет простая:

  1. Скачиваем четыре тома, каждый отдельным текстовым файлом.
  2. Пишем алгоритм, который проанализирует слова в первом томе.
  3. Генерируем для него облако слов.
  4. Меняем имя файла в программе и получаем картинки для трёх оставшихся томов.
  5. Смотрим, что получилось, и сравниваем картинки между собой.

Вместо художественного текста анализировать так можно что угодно: статьи «Кода», записи в дневнике или инструкцию от пылесоса.

Загружаем текст

Мы всё будем делать в редакторе VS Code — он бесплатный, есть окно вывода сообщений и ошибок, а ещё он умеет сразу показывать сгенерированные картинки в отдельном окне.

Также нам понадобятся все тома «Войны и мира»:

Их нужно положить в ту же папку, где будет скрипт.

Создаём новый python-файл, указываем в нём путь к файлу, потом загружаем в переменную и сразу проверяем, получилось или нет. Для этого выводим первые 300 символов текста:

# открываем текстовый файл
f = open('tom1.txt', "r", encoding="utf-8")
# закидываем его содержимое в переменную
text = f.read()
# выводим начало, чтобы убедиться, что всё считалось правильно
print(text[:300])

Анализируем самые частые слова в любом тексте

Видно, что файл считался нормально, всё на месте. Ещё сразу становится понятно, что в тексте будет много французского языка — это тоже мы учтём при анализе.

Убираем лишнее

Сейчас в тексте много лишнего, что будет мешать анализу:

  • цифры,
  • знаки препинания,
  • большие и маленькие буквы,
  • переносы строк.

Исправим это с помощью встроенного модуля String — в нём уже есть почти вся пунктуация, которую мы дополним несколькими символами:

# переводим символы в нижний регистр, чтобы всё было одинаково
text = text.lower()
# подключаем встроенный модуль работы со строками
import string
# добавляем к стандартным знакам пунктуации кавычки и многоточие
spec_chars = string.punctuation + '«»t—…’'
# очищаем текст от знаков препинания
text = "".join([ch for ch in text if ch not in spec_chars])
# подключаем регулярные выражения
import re
# меняем переносы строк на пробелы
text = re.sub('n', ' ', text)
# убираем из текста цифры
text = "".join([ch for ch in text if ch not in string.digits])
# смотрим на результат
print(text[:300])

Анализируем самые частые слова в любом тексте

Текст стал однородным: его теперь сложно читать, зато компьютеру будет легко распознать каждое слово. 

Библиотека NLTK и токенизация

Дальше нам понадобится NLTK — мощная библиотека для обработки текста. Технически это даже не одна библиотека, а набор модулей, внутри которых тоже может быть разное, но для простоты назовём это так.

Токенизация — это сегментация, или разделение текста на отдельные компоненты, а токены — это и есть те самые компоненты. Так как мы ищем самые популярные слова, то нам нужно токенизировать на уровне слов. Например, если токенизировать по словам предложение «и швец, и жнец, и на дуде игрец», то токены будут такие: «и», «швец», «жнец», «на», «дуде», «игрец».

Важно помнить, что с точки зрения библиотеки, токены — это не строки, хотя они и хранятся там в таком виде. Чтобы можно было работать с ними как со строками, мы будем их отдельно приводить к этому виду.

Для установки библиотеки используем команду:

pip install nltk

Для установки отдельных модулей, например, word_tokenize, нам понадобится сделать такое:

  1. В терминале VS Code выполнить команду python (или python3). Запустится среда выполнения Python, в которой мы будем дальше работать.
  2. Пишем и выполняем команду import nltk — она подгрузит библиотеку в Python.
  3. После этого установим нужный модуль командой nltk.download('word_tokenize')
  4. Также можем сразу установить второй модуль, который мы будем использовать: nltk.download('stopwords').
  5. Выходим из среды Python, набрав в консоли команду exit().

Теперь найдём первые 5 самых популярных слов в тексте:

# из библиотеки обработки текста подключаем модуль для токенизации слов
from nltk import word_tokenize
# токенизируем текст
text_tokens = word_tokenize(text)
# подключаем библиотеку для работы с текстом
import nltk
# переводим токены в текстовый формат
text = nltk.Text(text_tokens)
# подключаем статистику 
from nltk.probability import FreqDist
# и считаем слова в тексте по популярности
fdist = FreqDist(text)
# выводим первые 5 популярных слов
print(fdist.most_common(5))

Анализируем самые частые слова в любом тексте

Чистим текст от стоп-слов

Стоп-слова в NLTK — это те слова, которые мешают правильно оценить весь текст. К ним относятся:

  • предлоги и союзы,
  • местоимения,
  • междометия,
  • артикли,
  • слова-связки.

Чтобы избавиться от них, используем специальный модуль, в котором уже собраны все стоп-слова из разных языков. Сразу добавим туда стоп-слова из французского языка, так как герои романа часто общаются друг с другом по-французски:

# подключаем модуль со стоп-словами
from nltk.corpus import stopwords
# добавляем русские и французские стоп-слова
russian_stopwords = stopwords.words("russian")
russian_stopwords += stopwords.words("french")
# перестраиваем токены, не учитывая стоп-слова
text_tokens = [token.strip() for token in text_tokens if token not in russian_stopwords]
# снова приводим токены к текстовому виду
text = nltk.Text(text_tokens)
# считаем заново частоту слов
fdist_sw = FreqDist(text)
# показываем самые популярные
print(fdist_sw.most_common(10))

Анализируем самые частые слова в любом тексте

Стало лучше, но появилась новая проблема: судя по первой десятке, герои слишком много говорят — «cказал», «сказала», «говорил». Для чистоты эксперимента их тоже можно убрать из текста, поместив их в список стоп-слов. Туда же отнесём «это» и «что»:

# добавляем свои слова в этот список
russian_stopwords.extend(['это', 'чтò','всё','сказал', 'сказала','говорил','говорила'])
# перестраиваем токены, не учитывая стоп-слова
text_tokens = [token.strip() for token in text_tokens if token not in russian_stopwords]
# снова приводим токены к текстовому виду
text = nltk.Text(text_tokens)
# считаем заново частоту слов
fdist_sw = FreqDist(text)
# показываем самые популярные

Анализируем самые частые слова в любом тексте

Рисуем облако слов

У нас всё готово, чтобы вывести слова в виде красивой картинки: чем чаще встречается слово, тем большим шрифтом оно будет написано. Сделаем это с помощью библиотеки wordcloud, которую нужно будет установить отдельно:

pip install wordcloud

# подключаем библиотеку для создания облака слов
from wordcloud import WordCloud
# и графический модуль, с помощью которого нарисуем это облако
import matplotlib.pyplot as plt
# переводим всё в текстовый формат
text_raw = " ".join(text)
# готовим размер картинки
wordcloud = WordCloud(width=1600, height=800).generate(text_raw)
plt.figure( figsize=(20,10), facecolor='k')
# добавляем туда облако слов
plt.imshow(wordcloud)
# выключаем оси и подписи
plt.axis("off")
# убираем рамку вокруг
plt.tight_layout(pad=0)
# выводим картинку на экран
plt.show()

Анализируем самые частые слова в любом тексте

Чтобы сохранить картинку, надо нажать значок дискеты в нижнем меню

Точно так же получаем картинки для второго, третьего и четвёртого тома — просто меняем название файла в первой команде скрипта и запускаем код:

Анализируем самые частые слова в любом тексте

Второй том — главным персонажем становится Наташа, за ней с большим отрывом идут Пьер и князь Андрей
Анализируем самые частые слова в любом тексте
Третий том — вперёд выходят Пьер и Наполеон, а за ними с большим отставанием все остальные
Анализируем самые частые слова в любом тексте
Четвёртый том — всё вращается вокруг Пьера и Наташи

Что с этим можно сделать

Вот несколько идей:

  1. Подразбить тома на главы и посмотреть на частотность на микроуровне.
  2. Докрутить токенизатор, возвращая все слова в начальную форму, и проанализировать снова.
  3. Докрутить токенизатор, чтобы он отдельно смотрел на существительные, отдельно — на прилагательные, отдельно — на глаголы. В идеале ещё отделить имена людей и имена собственные.
  4. Заменить частотность на анализ связей: например, что чаще всего делал Пьер или Наташа? 
  5. Насобирать своих старых текстов из соцсетей и проанализировать, как вы менялись с годами: какие слова использовали. Для этого сначала напарсить сайт, не привлекая внимания. 
  6. Записать свою устную речь, расшифровать через облако и найти слова-паразиты.
  7. То же самое, но с другими людьми.
  8. Напарсить текстов какого-нибудь издания до того, как сменилась команда, и после.
  9. Насобирать новостных сюжетов за год и построить карту популярных слов в течение года.
  10. Ничего из этого не делать, а открыть API-платформу OpenAI и натренировать нейронку на всём корпусе текстов Толстого. 

Что-то из этого мы сделаем в будущем. Или это вы сделаете сами, потому что пойдёте заниматься дата-сайенсом впереди нас.

Вёрстка:

Кирилл Климентьев


Загрузить PDF


Загрузить PDF

Из этой статьи вы узнаете, как найти популярные и трендовые ключевые слова с помощью бесплатных инструментов в интернете. Ключевые слова используются в интернет-маркетинге для улучшения поисковой оптимизации (англ. search engine optimization, SEO), создания мета-описаний и актуализации социальных сетей. Определение наиболее популярных ключевых слов на текущий момент может помочь повысить эффективность вашей маркетинговой стратегии.

  1. Изображение с названием Find The Most Searched Keywords Step 1

    1

    Перейдите по адресу: https://trends.google.com/trends/?geo=RU. Google Trends является одним из самых надежных сервисов для получения актуальной информации о том, чем интересуется мировое сообщество. Для определения ключевых запросов можно использовать несколько инструментов.

  2. Изображение с названием Find The Most Searched Keywords Step 2

    2

    Откройте меню в верхнем левом углу страницы и выберите Анализ. На этой странице представлена информация о популярности ключевых слов за определенный период времени. Прокрутите вниз, чтобы найти два столбца ключевых слов: «Темы поиска» и «Поисковые запросы». Конкретные популярные ключевые слова отображены в столбце «Поисковые запросы» в правой части страницы.

    • Чтобы найти ключевые слова, связанные с другим ключевым словом или темой, введите нужное слово в поле «Добавить поисковый запрос» вверху и нажмите Enter или Return. Информация о популярности этого ключевого слова, а также связанные ключевые слова отобразятся в столбце «Похожие запросы».
    • Чтобы отобразить результаты только для определенной точки мира, раскройте меню с пометкой «По всему миру» и выберите регион.
    • Чтобы ограничить показ ключевых слов конкретным периодом времени, раскройте меню «За 12 месяцев» и выберите другой период.
    • Чтобы увидеть ключевые слова, соответствующие определенной теме, раскройте меню «Все категории» и выберите тему.
    • Чтобы отобразить ключевые слова из определенных сервисов компании Google, таких как YouTube и Google Покупки, раскройте меню «Веб-поиск» и выберите другой раздел.
  3. Изображение с названием Find The Most Searched Keywords Step 3

    3

    Откройте меню в левом верхнем углу страницы и выберите Популярные запросы. На этой странице представлены главные поисковые тренды за сутки на основе данных, собранных Google. Количество поисковых запросов по ключевому слову отображается в правой части строки.

    • Нажмите на стрелку вниз рядом с количеством поисковых запросов, чтобы найти похожие ключевые слова в разделе «Похожие запросы».
    • Прокрутите вниз, чтобы увидеть популярные тренды за вчерашний день. Прокрутите дальше, чтобы увидеть данные за остальные дни.
    • Чтобы увидеть результаты по странам, раскройте меню стран на синей панели (где указана ваша текущая страна) и выберите другую страну.
  4. Изображение с названием Find The Most Searched Keywords Step 4

    4

    Нажмите на Поисковые тренды сейчас на синей панели вверху страницы. Здесь отображаются почасовые обновления популярности различных ключевых слов за последние 24 часа.

    • Нажмите на стрелку вниз в дальнем правом углу строки, чтобы увидеть график популярности ключевого слова.
    • Раскройте список «Все категории» и выберите, запросы какой категории отобразить.
    • Чтобы увидеть результаты по странам, раскройте меню стран на синей панели (где указана ваша текущая страна) и выберите другую страну.

    Реклама

  1. Изображение с названием Find The Most Searched Keywords Step 5

    1

    Перейдите по адресу: https://www.wordstream.com/keywords. Бесплатный инструмент поиска ключевых слов Wordstream поможет вам выявить, какие слова и фразы принесут больше пользы от использования их в рекламных кампаниях.

    • Если вы используете стороннее дополнение для просмотра веб-страниц, такое как Privacy Badger, вам нужно будет отключить его, чтобы воспользоваться этим инструментом.
    • Инструментом WordStream можно пользоваться бесплатно до 30 раз. Если вы уже потратили все запросы, найдите альтернативу этому сайту, например https://www.wordtracker.com.
  2. Изображение с названием Find The Most Searched Keywords Step 6

    2

    Введите в строку поиска ключевое слово или фразу. Это первое поле в голубой полосе под заголовком «Free Keyword Tool».

    • Если вы хотите сузить результаты поиска, настройте фильтры с помощью меню «Choose industry» (Выбор отрасли) и «Select Country» (Выбор страны).
    • Чтобы увидеть, насколько эффективно подобраны ключевые слова на вашем сайте, введите в поисковое поле свой URL-адрес.
  3. Изображение с названием Find The Most Searched Keywords Step 7

    3

    Нажмите на оранжевую кнопку Search (Поиск). Отобразится несколько ключевых слов, которые помогут вам сориентировать свою маркетинговую кампанию.

  4. Изображение с названием Find The Most Searched Keywords Step 8

    4

    Проведите до 30 бесплатных исследований ключевых слов. Запишите новые популярные ключевые слова, которые позволят вам разработать более эффективные PPC-объявления (Pay Per Click — объявления с оплатой за клик) и провести соответствующие меры по поисковой оптимизации.

    • Инструмент WordStream особенно эффективен при работе с РРС-рекламой, поскольку он позволяет узнать, какие именно ключевые запросы используют люди для поиска и покупки товаров. Проведя ранжирование запросов по популярности, вы сможете значительно повысить эффективность PPC-рекламы.

    Реклама

  1. Изображение с названием Find The Most Searched Keywords Step 9

    1

    Перейдите по адресу: https://www.google.com. Один из самых простых способов поиска ключевых слов заключается в использовании функции автозаполнения поисковой системы Google.

  2. Изображение с названием Find The Most Searched Keywords Step 10

    2

    Начните вводить поисковый запрос. По мере ввода Google начнет отображать популярные поисковые запросы, которые связаны с вашим.

    • Ищите «главные» высокочастотные ключевые слова. Это наиболее популярные запросы. Как правило, это широкие и общие определения, и оплата РРС-баннеров по ним будет самой высокой.
    • Также обратите внимание на низкочастотные запросы, которые касаются вашего сайта или товаров. Обычно они состоят из 3–5 терминов или слов. Люди используют эти запросы для поиска конкретного товара. РРС-баннеры для составных таких ключевых фраз обходятся дешевле, поскольку количество поисковых запросов обычно меньше, поэтому эту технику используют в целевом маркетинге.
  3. Изображение с названием Find The Most Searched Keywords Step 11

    3

    Удалите поисковый запрос из строки поиска и попробуйте другой. В отличие от других инструментов, этот можно использовать для поиска ключевых слов неограниченное количество раз.

    Реклама

  1. Изображение с названием Find The Most Searched Keywords Step 12

    1

    Узнайте у веб-администратора, какую программу для аналитики использует ваш сайт. Если вы поручили управление сайтом другому человеку, он сможет подсказать вам, где найти аналитические данные вашего сайта. С помощью них можно узнать, какие термины используют пользователи для поиска вашего сайта.

    • Если вы используете WordPress.com, в программе Jetpack есть инструмент автоматической аналитики, а также простое средство визуализации данных, которое можно найти на главной панели сайта.
    • Если вы еще не пользуетесь программами для анализа трафика своего сайта, начните это делать прямо сейчас. Зарегистрируйте бесплатный аккаунт в Google Аналитике и разместите соответствующий код на страницах сайта для отслеживания трафика в течение суток.
  2. Изображение с названием Get a Job Fast Step 1

    2

    Найдите в аналитической программе раздел, посвященный ключевым словам. Большинство программ предоставят вам список наиболее популярных запросов, которые использовались для перехода на ваш сайт.

  3. Изображение с названием Spot Fake News Sites Step 12

    3

    Следите за этим списком популярных ключевых слов. Если ключевое слово приносит вам трафик, продолжайте использовать его в ходе SEO-оптимизации и РРС-рекламы. После внедрения ключевых фраз обратите внимание на то, как эти изменения повлияли на популярность вашего сайта.

    • Данные о популярных запросах в конкретном регионе меняются каждую неделю. После запуска РРС-рекламы и внедрения оптимизированных низкочастотных фраз в наполнение сайта популярные запросы могут измениться.
    • Если популярные поисковые фразы носят обобщенный характер, можно предположить, что использование такого термина или фразы будет более эффективно для РРС-маркетинга, но конкуренция в этой области очень велика. В этом случае для повышения популярности следует отслеживать второстепенные ключевые запросы и создавать более качественный контент, чтобы повлиять на рейтинг вашего ресурса в поисковых системах.

    Реклама

Об этой статье

Эту страницу просматривали 32 232 раза.

Была ли эта статья полезной?

Попробуйте так:

text = '''
Существует культ Питона, называемый "Дзеном Питона" (The Zen of Python).
Автором этих постулатов считается Тим Пейтерс.
Основные постулаты:
Красивое лучше, чем уродливое.
Явное лучше, чем неявное.
Простое лучше, чем сложное.
Сложное лучше, чем запутанное.
Плоское лучше, чем вложенное.
Разреженное лучше, чем плотное.
Читаемость имеет значение.
Особые случаи не настолько особые, чтобы нарушать правила.
При этом практичность важнее безупречности.
Ошибки никогда не должны замалчиваться.
Если не замалчиваются явно.
Встретив двусмысленность, отбрось искушение угадать.
Должен существовать один — и, желательно, только один — очевидный способ сделать это.
Хотя он поначалу может быть и не очевиден, если вы не голландец. [1]
Сейчас лучше, чем никогда.
Хотя никогда зачастую лучше, чем прямо сейчас.
Если реализацию сложно объяснить — идея плоха.
Если реализацию легко объяснить — идея, возможно, хороша.
Пространства имён — отличная штука! Будем делать их побольше.'''

lst_no = ['.', ',', ':', '!', '"', "'", '[', ']', '-', '—', '(', ')'  ]   # и т.д.
lst = []

for word in text.lower().split():
    if not word in lst_no:
        _word = word 
        if word[-1] in lst_no:
            _word = _word[:-1]
        if word[0] in lst_no:
            _word = _word[1:] 
        lst.append(_word)

_dict = dict()
for word in lst:
    _dict[word] = _dict.get(word, 0) + 1

# сортируем словарь посредством формирования списка (значение, ключ)
_list = []
for key, value in _dict.items():
    _list.append((value, key))
    _list.sort(reverse=True)

# печатаем первые 10 самых используемых слов
print('Первые 10 самых используемых слов:')
for freq, word in _list[0:10]:
    print(f'{word:>10} -> {freq:>3}')

print('nили так: (с условием, что длина слова > 4- букв) n')
_dict = {(i, lst.count(i)) for i in lst}
_list = []

for word, kol in _dict:
    _list.append((kol, word))
    _list.sort(reverse=True)
    
for freq, word in _list[0:20]:
    if len(word) > 4:
        print('{0:10} {1}'.format (word, freq))


Update

Подскажите, для чего используется _ перед dict и list?

_word, _dict, _list — это обычные имена переменных,
такие как my_word, my_dict, my_list.

Также вопрос почему длина слова от 4?

Это просто шло вам бонусом, если вам не надо — убираю.

text = '''
Напишите программу, которая считывает текст из файла (в файле может быть 
больше одной строки) и выводит самое частое слово в этом тексте и через 
пробел то, сколько раз оно встретилось. Если таких слов несколько, вывести 
лексикографически первое (можно использовать оператор < для строк). 
В качестве ответа укажите вывод программы, а не саму программу. 
Слова, написанные в разных регистрах, считаются одинаковыми.

Использовать надо циклы, списки, словари. Не использовать lambda, 
регулярные выражения и доп.модули, и все что надо импортировать. 
В файле, который дается для обработки нет осмысленных слов, знаков и т.п. 
Там по сути наборы букв разделенные пробелами и в разном регистре, 
например: gtdFtd jy k dyygGTDHj kdH DJDJ.

У меня получился вот такой код. Вроде по логике должно работать. 
Но ответ не принимает как правильный. Помогите пожалуйста разобраться в чем моя ошибка.

Подскажите, для чего используется _ перед dict и list? 

`_word`, `_dict`, `_list` - это обычные имена переменных, 
такие как `my_word`, `my_dict`, `my_list`. 

Также вопрос почему длина слова от 4? - это просто шло вам бонусом, 
если вам не надо - убираю.
'''

lst_no = ['.', ',', ':', '!', '"', "'", '[', ']', '-', '—', '(', ')', '?', '_', '`'  ]   # и т.д.
lst = []

for word in text.lower().split():
    if not word in lst_no:
        _word = word 
        if word[-1] in lst_no:
            _word = _word[:-1]
        if word[0] in lst_no:
            _word = _word[1:] 
        lst.append(_word)

_dict = dict()
for word in lst:
    _dict[word] = _dict.get(word, 0) + 1

# сортируем словарь посредством формирования списка (значение, ключ)
_list = []
for key, value in _dict.items():
    _list.append((value, key))
    _list.sort(reverse=True)

# самое частое слово в этом тексте
print(f'самое частое слово в этом тексте -> `{_list[0][1]}`, использовалось `{_list[0][0]}` раз.')

Как найти самые популярные слова в выбранном тексте

Как проанализировать выбранный текст и найти в нем популярные слова и слова, которые встречаются рядом с ними чаще всего. Инструкция по работе с модулем «Статистика слов»: как запустить задачу и скачать результат.

Возможности

Общее представление о возможностях, которые дают результаты работы модуля «Статистика слов».

Модуль «Статистика слов» находится во вкладке «Разное» в VK Apps-версии (браузерной) — по ссылке (доступно для зарегистрированных пользователей).

В рекламном кабинете ВКонтакте можно запускать рекламу по ключевым словам: словосочетаниям и фразам, с помощью которых пользователи ищут нужный товар/услугу во ВКонтакте. Благодаря модулю «Статистика слов» можно проанализировать текст (например, описание товаров сообществ конкурентов) и найти самые популярные слова, а также слова, которые встречаются рядом с ними чаще всего. Такие слова и словосочетания можно использовать при настройке рекламы в ВК по ключевым словам.

Описание входных параметров

В модуле «Статистика слов» можно проанализировать выбранный текст и собрать слова / группу слов, которые встречаются в тексте чаще всего.

Модуль «Статистика постов» в VK Apps-версии

Для того чтобы проанализировать нужный текст и найти в нем самые популярные слова / группу слов:

1. Укажите данные для анализа. В качестве исходных данных можно использовать слова, словосочетания, фразы, текст. Чтобы проанализировать текст целиком, не используйте в нем переносы предложений на другую строку. Если текст будет разделен на абзацы, каждый абзац будет проанализирован как отдельный текст.

2. Фильтр настройки результатов:

  • Укажите, какое количество слов должно быть в результатах рядом с самым популярным.
  • Отметьте, должны ли стоп-слова (предлоги, частицы, междометия и т. п.) попасть в результаты работы модуля.
  • Отметьте, указывать в результатах дублирующиеся слова или нет.

Описание результатов выполненной задачи

Как посмотреть и сохранить результаты работы модуля.

Результаты работы модуля «Статистика слов»:

1. Скачать результаты в формате TXT на компьютер.

2. Количество самых популярных сочетаний без учета редко встречающихся слов.

3. Результаты работы модуля: самые популярные слова анализируемого текста и слова, которые встречаются рядом с ними чаще всего.

Ознакомиться с инструкциями по работе с другими модулями можно по ссылке

Получайте клиентов из ВК, используя все возможности Церебро. Подключить можно тут.

Понравилась статья? Поделить с друзьями:
  • Как найти клиента мтс
  • Как найти где находится телефон билайн
  • Как составить полную систему вычетов
  • Как найти скорость движения планет по орбите
  • Как составить договор для сдачи квартиры квартирантам образец