Как составить анкету для научного исследования - Исправление недочетов и поиск решений вместе с Examum.ru

Анкетирование как метод исследования все чаще используется в современном мире. Он помогает собрать нужную информацию.

Оглавление:

Анкетирование в социологии — общее понятие, цели и задачи

Виды анкетирования

Анкета и ее структура

Виды вопросов для анкеты

Как составить анкету для социологического опроса

Правила составления анкеты

Как оформить результаты анкетирования

Плюсы и минусы анкетирования

Данная статья расскажет о том, какие цели преследует данный вид исследования, как создаются анкеты и опросные листы, чего следует избегать при их составлении и как анализировать результаты.

Анкетирование в социологии — общее понятие, цели и задачи

Социальное анкетирование является полезным инструментом для получения информации от людей. То есть, основная цель – собрать данные.

Чем отличается анкетирование от тестирования? Тестирование – это испытание людей на определенный уровень знаний, умений или общую интеллектуальную развитость.

Итак, тестирование имеет другую цель, по сравнению с анкетированием. Тестирование чаще всего используется в педагогике.

Анкетер – это человек, который проводит анкетирование; респондент (или информант) – тот, кто заполняет анкету.

Есть несколько различных задач, которые стоят перед анкетированием:

Узнать новую теоретическую информацию.
Узнать больше о целевой аудитории. Анкеты, определяющие, чего хотят потребители, что им нужно, и что им нравится, пригодятся при сегментировании списков на основе этих факторов. Чем более узкими и конкретными являются списки, тем выше шансы на успешный коэффициент конверсии.
Получить отзывы о недавнем событии, продукте или услуге: если аудитория высказывает свое мнение, это поможет добиться больших успехов в будущих начинаниях.
Проверить знания. Интервьюирование может использоваться (но более редко) для определения уровня знаний. Для этого чаще используют тестирование.
Уточнить точку зрения. Анкеты, используемые в качестве пояснения, имеют большое значение для уменьшения недопонимания и, следовательно, более эффективного общения в дальнейшем.
Установить позитивные отношения: когда открываются линии связи, это показывает респондентам, что их мнение ценят.

Виды анкетирования

В зависимости от количества респондентов анкетирование бывает:

индивидуальное — проводится с одним участником;
групповое — анкеты раздают небольшому количеству людей, которые находятся в одном помещении и проходят пункты вопросника.

В зависимости от способа распространения вопросники делятся на такие категории:

Компьютерная анкета — участникам предлагают заполнить анкету, которая отправляется по почте. Преимущества такого вида включают в себя их недорогую цену, экономию времени, респондент не чувствует давления, поэтому может ответить, когда у него есть время, давая более точные ответы. Однако, главный недостаток заключается в том, что иногда информанты не удосуживаются ответить и могут просто игнорировать опрос.
Телефонный опросник — исследователь может позвонить потенциальным участникам с целью попросить их ответить на вопросы. Преимущество телефонной анкеты в том, что она может быть заполнена за короткий промежуток времени. Основным недостатком является то, что большинство людей не чувствуют себя комфортно, передавая информацию по телефону.
Внутренний опрос — этот вид предполагает, что исследователь посещает информантов в их домах или на рабочих местах. Преимущество внутреннего опроса заключается в том, что люди могут уделять больше внимания всем блокам вопросника. Тем не менее внутренние исследования также имеют ряд недостатков, которые включают в себя длительность и дороговизну, а респонденты, возможно, не захотят пригласить анкетера в свой дом или на рабочее место по различным причинам.
Почтовая анкета — вопросники такого рода предполагают, что исследователь отправляет респонденту психологический опросник по почте, часто с приложением предварительно оплаченного конверта. Почтовые анкеты имеют преимущество в предоставлении более точного ответа, потому что участники могут ответить в свободное время. Недостатки заключаются в том, что такой метод дорогой, отнимает много времени и иногда письма оказываются в корзине.

Отдельно выделяют двухтуровое анкетирование. В первом туре проводится обычный опрос нескольких участников. А во втором туре участники обмениваются вопросниками и анализируют результаты друг друга.

Анкета и ее структура

Анкета представляет собой структурированную форму, состоящую из формализованного набора вопросов, предназначенных для сбора информации по определенным темам от одного или нескольких респондентов.

Другими словами, это методика сбора данных, при которой информантов просят дать некоторую информацию. Независимо от формы (письменный или печатный), опрос имеет определенную структуру.

Вводная часть

Цель вводной части – побудить желание поделиться информацией. Вводная часть (или шапка) состоит из приветствия и обращения к респонденту. В обращении нужно объяснить цель анкетирования и правила заполнения.

В этой части важно гарантировать анонимность и безопасность данных, а так же нужно заранее поблагодарить респондента. Шаблон вводной части изображен ниже.

Паспортичка

Это блок, в котором участник рассказывает про себя: возраст, пол, социальная принадлежность, профессия, род занятий и другие демографические данные. Паспортичка может размещаться как вначале, так и в конце опросника. Пример приведен ниже.

Основная часть

Это самая большая часть опроса, которая состоит из блоков вопросов разной формы и сложности. Образец основной части изображен ниже.

Виды вопросов для анкеты

Анкеты могут включать в себя следующие типы:

Открытые вопросы отличаются от других типов, используемых в анкетах, тем, что они могут дать неожиданные результаты, которые могут сделать исследование более оригинальным и ценным. Тем не менее такие результаты трудно проанализировать. Примеры открытых вопросов включают в себя такие виды:
- полностью неструктурированный – например, такой: «Как вы относитесь к кошкам?»;
- завершение предложения – информанты заканчивают неполное предложение. Например, «Самое важное соображение в моем решении купить новый дом – это…»;
- завершение истории. Респонденты заканчивают неполную историю;
- тематический апперцептивный тест. Участники объясняют картину или рассказывают о том, что, по их мнению, происходит на картинке;
Вопросы со множественным выбором. Респондентам предлагается набор ответов, которые они должны выбрать. Недостаток такого вида в том, что если имеется слишком много ответов на выбор, то это делает психологическую анкету запутанной и скучной.
Дихотомические вопросы — этот вид предполагает на выбор два варианта: да или нет.
Матричные вопросы — такой блок выглядит как матрица с категориями ответов вверху и списком вопросов внизу. Это обеспечивает эффективное использование пространства страницы и времени участников.
Масштабные вопросы — они дают возможность информантам ранжировать доступные ответы в масштабе заданного диапазона значений (например, от 1 до 10).
Вопросы на случай непредвиденных обстоятельств – пункт, которому уделяют внимание только в том случае, если человек дает конкретный ответ на предыдущий вопрос. Это позволяет не опрашивать людей, которые не имеют отношения к теме.

Как составить анкету для социологического опроса

Желательно избегать определенных типов вопросов, таких как:

Гипотетические. Следует избегать формулировок, вводящих в заблуждение предположениями и фантазиями. Варианты:
- неправильно: «Как должна работать наша служба поддержки?»;
- правильно: «Что Вас не устраивает в работе нашей службы поддержки?»;
Смущающие. Не нужно заставлять респондентов чувствовать себя неловко, расспрашивая подробности о личных проблемах, которые, в свою очередь, могут привести к потере доверия. Если же нужно включить такой пункт, то важно показать участнику, что его не будут осуждать за ответ. Примеры:
- неправильно: «Вы помогаете бедным людям?»;
- правильно: «Одни люди считают, что не обязательно оказывать финансовую помощь трудоспособным бедным. А как Вы считаете?»;
Чрезвычайно положительные/отрицательные. Необходимо тщательно продумать формулировку, чтобы избежать резких положительных или отрицательных оттенков. Примеры:
- неправильно: «Разве Вы не удовлетворены своей работой?»;
- правильно: «Вы удовлетворены своей работой?».

Правила составления анкеты

Разработка анкеты – это многоэтапный процесс, требующий внимания к деталям на каждом этапе.

Следующие правила помогут упростить этот процесс:

Решить, что нужно охватить в вопроснике. Четкое определение темы имеет первостепенное значение, поскольку это является основным шагом при разработке.
Не менять слова. Важно, чтобы слова или фразы, которые используются, были сформулированы максимально просто. Если пункты неясны, информанты могут просто выбрать любые варианты, что приведет к неточным данным.
Задавать только один вопрос за раз. Варианты, когда в одном вопросе, задаются сразу два, будут давать не точный результат, потому что могут получится разные ответы.
Правильно формулировать пункты анкеты с вариантами ответов: при разработке анкетер должен быть гибким с точки зрения «выбора варианта». Иногда респонденты не обязательно хотят выбирать один из вариантов ответа, предоставленных создателем опроса, в такой ситуации полезно иметь «другой» вариант.
Открытый или закрытый вопрос — это сложный выбор: анкетер может оказаться в ситуации, когда потребуется сделать четкий выбор между открытым или закрытым видом. Но решение в этом случае нужно принять обдуманно.
Важно знать аудиторию: как правило, исследователь должен знать свою целевую аудиторию. Например, если целевой аудиторией является россияне, то отправка вопросника на иностранном языке не даст желаемых результатов.
Чувствительные вопросы в середине опросника могут привести к тому, что участники не закончат опрос. Лучше всего блоки личных и демографических данных располагать в конце.

Как оформить результаты анкетирования

Оформление итогов опроса предполагает визуализацию данных. Для этого используют различные типы диаграмм в зависимости от видов анкет.

Если вопросы предлагают два варианта (например, «да» и «нет»), круговая диаграмма – самый простой вариант представления данных.

Если нужно сравнить показатели отклика нескольких групп, лучше выбрать гистограмму. Связку выровненных столбцов гораздо проще сравнить, чем несколько круговых диаграмм. При этом важно обозначить каждый столбец процентом для ясности.

В вопросах со шкалой оценок участникам предлагается спектр возможных ответов. Столбчатая диаграмма с разбивкой на 100% – самый простой вариант для визуализации собранных данных.

В дополнение к другим результатам опроса можно использовать итоги демографических опросов как часть анализа. Включая такие факторы, как возраст, пол, уровень дохода и даже географическое положение, можно получить интересную инфографику.

Визуализация данных опроса на карте – интересный способ включить демографический компонент в инфографику.

Гистограммы, с другой стороны, могут использоваться, чтобы показать возрастное распределение определенной популяции.

Обработка результатов открытых вопросов представляет собой небольшую проблему. Чтобы визуализировать итоги, нужно каким-то образом сгруппировать ответы, используя общие ключевые слова или другие факторы.

Облака слов, хотя некоторые эксперты по визуализации осуждают их использование, могут способствовать получению сводных данных.

В противном случае придется провести более интенсивный ручной анализ: просмотреть открытые ответы и создать категории. После этого можно представить результаты в виде гистограммы, подобно этой, которая показывает процент комментариев, попадающих в каждую категорию.

Плюсы и минусы анкетирования

Преимущества:

Анкеты являются одним из наиболее экономически эффективных и доступных способов сбора количественных данных. Особенно онлайн и мобильные опросы имеют очень низкую стоимость и щедрый охват.
Они практичны. Помимо того, что вопросники являются недорогими и гибкими, они также являются практическим способом сбора данных. Они могут быть нацелены на группы по конкретному выбору и управляться различными способами.
Масштабируемость. Опросники позволяют собирать информацию от большой аудитории.
Научный анализ и прогнозы. Чем больше данных удается собрать, тем яснее станет картина. Вся эта информация дает маркетологам возможность создавать новые стратегии и следить за тенденциями в аудитории. Анализ отчетов может использоваться для составления прогнозов и даже создания контрольных показателей для последующих вопросников.
Анонимность. В социологических опросах не нужно указывать личность. Но для обеспечения чувства точной конфиденциальности лучше использовать компьютерное анкетирование. Анонимное компьютерное интервьюирование дает самые точные результаты.
Легкая стандартизация. Исследователь может быть уверен, что все участники выборки отвечают на одни и те же пункты.

Проведение анкетирования имеет такие недостатки:

Используя почтовое анкетирование, исследователь никогда не может быть уверен, что тот, кому была отправлена психологическая анкета, действительно заполнит ее.
Исследователь не может быть полностью уверен, что задаваемые вопросы значат для всех информантов то же, что и для исследователя.
Нечестность. Люди не могут быть полностью правдивыми в своих ответах. Это может произойти по разным причинам, в том числе из-за предвзятости социальной желательности и попыток защитить частную жизнь.
Некоторые данные трудно анализировать. Вопросники дают много данных. Открытые вопросы допускают индивидуальные ответы, которые не могут быть определены количественно и должны быть рассмотрены человеком.
Пропущенные пункты. При использовании вопросников есть вероятность, что некоторые пункты будут проигнорированы.

Источник

Download Article

A questionnaire is a technique for collecting data in which a respondent provides answers to a series of questions.^[1] To develop a questionnaire that will collect the data you want takes effort and time. However, by taking a step-by-step approach to questionnaire development, you can come up with an effective means to collect data that will answer your unique research question.

1
Identify the goal of your questionnaire. What kind of information do you want to gather with your questionnaire? What is your main objective? Is a questionnaire the best way to go about collecting this information?
- Come up with a research question. It can be one question or several, but this should be the focal point of your questionnaire.
- Develop one or several hypotheses that you want to test. The questions that you include on your questionnaire should be aimed at systematically testing these hypotheses.
2
Choose your question type or types. Depending on the information you wish to gather, there are several possible types of questions to include on your questionnaire, each with unique pros and cons. Here are the types of commonly used questions on a questionnaire:
- Dichotomous question: this is a question that will generally be a “yes/no” question, but may also be an “agree/disagree” question. It is the quickest and simplest question to analyze, but is not a highly sensitive measure.
- Open-ended questions: these questions allow the respondent to respond in their own words. They can be useful for gaining insight into the feelings of the respondent, but can be a challenge when it comes to analysis of data. It is recommended to use open-ended questions to address the issue of “why.”^[2]
- Multiple choice questions: these questions consist of three or more mutually-exclusive categories and ask for a single answer or several answers.^[3] Multiple choice questions allow for easy analysis of results, but may not give the respondent the answer they want.
- Rank-order (or ordinal) scale questions: this type of question asks your respondent to rank items or choose items in a particular order from a set. For example, it might ask your respondents to order five things from least to most important. These types of questions forces discrimination among alternatives, but does not address the issue of why the respondent made these discriminations.^[4]
- Rating scale questions: these questions allow the respondent to assess a particular issue based on a given dimension. You can provide a scale that gives an equal number of positive and negative choices, for example, ranging from “strongly agree” to “strongly disagree.”^[5] These questions are very flexible, but also do not answer the question “why.”
Advertisement
3
Develop questions for your questionnaire. The questions that you develop for your questionnaire should be clear, concise, and direct. This will ensure that you get the best possible answers from your respondents.
- Write questions that are succinct and simple. You should not be writing complex statements or using technical jargon, as it will only confuse your respondents and lead to incorrect responses.
- Ask only one question at a time. This will help avoid confusion
- Beware of asking for private or “sensitive” information.^[6] This can be something as simple as age or weight, or something as complex as past sexual history.
  - Asking questions such as these usually require you to anonymize or encrypt the demographic data you collect.
- Determine if you will include an answer such as “I don’t know” or “Not applicable to me.” While these can give your respondents a way of not answering certain questions, providing these options can also lead to missing data, which can be problematic during data analysis.
- Put the most important questions at the beginning of your questionnaire.^[7] This can help you gather important data even if you sense that your respondents may be becoming distracted by the end of the questionnaire.
4
Restrict the length of your questionnaire. Keep your questionnaire as short as possible. More people will be likely to answer a shorter questionnaire, so make sure you keep it as concise as possible while still collecting the necessary information.^[8] If you can make a questionnaire that only requires 5 questions, do it.
- Only include questions that are directly useful to your research question.^[9] A questionnaire is not an opportunity to collect all kinds of information about your respondents.
- Avoid asking redundant questions. This will frustrate those who are taking your questionnaire.
5
Identify your target demographic. Is there a certain group of people who you want to target with your questionnaire? If so, it is best to determine this before you begin to distribute your questionnaire.^[10]
- Consider if you want your questionnaire to collect information from both men and women. Some studies will only survey one sex.
- Determine whether you want your survey to collect information from both children and adults. Many surveys only target certain age ranges for which the questions are applicable.
  - Consider including a range of ages in your target demographic. For example, you can consider young adult to be 18-29 years old, adults to be 30-54 years old, and mature adults to be 55+. Providing the an age range will help you get more respondents than limiting yourself to a specific age.
- Consider what else would make a person a target for your questionnaire. Do they need to drive a car? Do they need to have health insurance? Do they need to have a child under 3? Make sure you are very clear about this before you distribute your questionnaire.
6
Ensure you can protect privacy. Make your plan to protect respondents’ privacy before you begin writing your survey. This is a very important part of many research projects.
- Consider an anonymous questionnaire. You may not want to ask for names on your questionnaire. This is one step you can take to prevent privacy, however it is often possible to figure out a respondent’s identity using other demographic information (such as age, physical features, or zipcode).
- Consider de-identifying the identity of your respondents. Give each questionnaire (and thus, each respondent) a unique number or word, and only refer to them using that new identifier. Shred any personal information that can be used to determine identity.
- Remember that you do not need to collect much demographic information to be able to identify someone. People may be wary to provide this information, so you may get more respondents by asking less demographic questions (if it is possible for your questionnaire).
- Make sure you destroy all identifying information after your study is complete.

1
Introduce yourself. Your introduction should explain who you are, and what your credentials are. You should clarify if you are working alone or as a part of a team. Include the name of the academic institution or company for whom you are collecting data. Here are some examples:
- My name is Jack Smith and I am one of the creators of this questionnaire. I am part of the Department of Psychology at the University of Michigan, where I am focusing in developing cognition in infants.
- I’m Kelly Smith, a 3rd year undergraduate student at the University of New Mexico. This questionnaire is part of my final exam in statistics.
- My name is Steve Johnson, and I’m a marketing analyst for The Best Company. I’ve been working on questionnaire development to determine attitudes surrounding drug use in Canada for several years.
2
Explain the purpose of the questionnaire.^[11] Many people will not answer a questionnaire without understanding what the goal of the questionnaire is. No long explanation is needed; instead, a few concise sentences will do the trick. Here are some examples:
- I am collecting data regarding the attitudes surrounding gun control. This information is being collected for my Anthropology 101 class at the University of Maryland.
- This questionnaire will ask you 15 questions about your eating and exercise habits. We are attempting to make a correlation between healthy eating, frequency of exercise, and incidence of cancer in mature adults.
- This questionnaire will ask you about your recent experiences with international air travel. There will be three sections of questions that will ask you to recount your recent trips and your feelings surrounding these trips, as well as your travel plans for the future. We are looking to understand how a person’s feelings surrounding air travel impact their future plans.
3
Reveal what will happen with the data you collect. Are you collecting these data for a class project, or for a publication? Are these data to be used for market research? Depending on what you intend to do with the data you collect from your questionnaire, there may be different requirements that you need to pay attention to before distributing your survey.
- Beware that if you are collecting information for a university or for publication, you may need to check in with your institution’s Institutional Review Board (IRB) for permission before beginning. Most research universities have a dedicated IRB staff, and their information can usually be found on the school’s website.
- Remember that transparency is best. It is important to be honest about what will happen with the data you collect.
- Include an informed consent for if necessary. Note that you cannot guarantee confidentiality, but you will make all reasonable attempts to ensure that you protect their information.^[12]
4
Estimate how long the questionnaire will take. Before someone sits down to take your questionnaire, it may be helpful for them to know whether the questionnaire will take them 10 minutes or 2 hours. Providing this information at the onset of your questionnaire is more likely to get you more complete questionnaires in the end.
- Time yourself taking the survey. Then consider that it will take some people longer than you, and some people less time than you.
- Provide a time range instead of a specific time. For example, it’s better to say that a survey will take between 15 and 30 minutes than to say it will take 15 minutes and have some respondents quit halfway through.
- Use this as a reason to keep your survey concise! You will feel much better asking people to take a 20 minute survey than you will asking them to take a 3 hour one.
5
Describe any incentives that may be involved. An incentive is anything that you can offer as a reward at the end of the questionnaire. Incentives can be many types of things: they can be monetary, desired prizes, gift certificates, candy, etc. There are both pros and cons to offering incentives.
- Incentives can attract the wrong kind of respondent. You don’t want to incorporate responses from people who rush through your questionnaire just to get the reward at the end. This is a danger of offering an incentive.^[13]
- Incentives can encourage people to respond to your survey who might not have responded without a reward. This is a situation in which incentives can help you reach your target number of respondents.^[14]
- Consider the strategy used by SurveyMonkey. Instead of directly paying respondents to take their surveys, they offer 50 cents to the charity of their choice when a respondent fills out a survey. They feel that this lessens the chances that a respondent will fill out a questionnaire out of pure self-interest.^[15]
- Consider entering each respondent in to a drawing for a prize if they complete the questionnaire. You can offer a 25$ gift card to a restaurant, or a new iPod, or a ticket to a movie. This makes it less tempting just to respond to your questionnaire for the incentive alone, but still offers the chance of a pleasant reward.
6
Make sure your questionnaire looks professional. Because you want people to have confidence in you as a data collector, your questionnaire must have a professional look.
- Always proof read. Check for spelling, grammar, and punctuation errors.
- Include a title. This is a good way for your respondents to understand the focus of the survey as quickly as possible.
- Thank your respondents. Thank them for taking the time and effort to complete your survey.

1
Do a pilot study. Ask some people you know to take your questionnaire (they will not be included in any results stemming from this questionnaire), and be prepared to revise it if necessary.^[16] Plan to include 5-10 people in the pilot testing of your questionnaire.^[17] Get their feedback on your questionnaire by asking the following questions:
- Was the questionnaire easy to understand? Were there any questions that confused you?
- Was the questionnaire easy to access? (Especially important if your questionnaire is online).
- Do you feel the questionnaire was worth your time?
- Were you comfortable answering the questions asked?
- Are there any improvements you would make to the questionnaire?
2
Disseminate your questionnaire. You need to determine what is the best way to disseminate your questionnaire.^[18] There are several common ways to distribute questionnaires:
- Use an online site, such as SurveyMonkey.com. This site allows you to write your own questionnaire with their survey builder, and provides additional options such as the option to buy a target audience and use their analytics to analyze your data.^[19]
- Consider using the mail. If you mail your survey, always make sure you include a self-addressed stamped envelope so that the respondent can easily mail their responses back. Make sure that your questionnaire will fit inside a standard business envelope.
- Conduct face-to-face interviews. This can be a good way to ensure that you are reaching your target demographic and can reduce missing information in your questionnaires, as it is more difficult for a respondent to avoid answering a question when you ask it directly.
- Try using the telephone. While this can be a more time-effective way to collect your data, it can be difficult to get people to respond to telephone questionnaires.
3
Include a deadline. Ask your respondents to have the questionnaire completed and returned to you by a certain date to ensure that you have enough time to analyze the results.
- Make your deadline reasonable. Giving respondents up to 2 weeks to answer should be more than sufficient. Anything longer and you risk your respondents forgetting about your questionnaire.
- Consider providing a reminder. A week before the deadline is a good time to provide a gentle reminder about returning the questionnaire. Include a replacement of the questionnaire in case it has been misplaced by your respondent.^[20]

Add New Question

Question

How can I develop a questionnaire involving children?

Questions need to be direct and simple. Keep the number of questions low since children get easily distracted and have limited attention spans.
Question

How do I develop a questionnaire for integration of drawing with geometry?

Think of questions that give you the conclusions you need, and make sure people can only answer «yes» or «no.»
Question

What design considerations should be included when creating a questionnaire?

If you want to generate comparable data, use true/false questions, multiple choice, or numerical scales. To gather more detail, use open-ended questions. When wording the questions, consider the age range, cultural background, and educational level of your intended participants.

See more answers

Ask a Question

200 characters left

Include your email address to get a message when this question is answered.

Submit

Thanks for submitting a tip for review!

References

About This Article

Article SummaryX

To develop a questionnaire for research, identify the main objective of your research to act as the focal point for the questionnaire. Then, choose the type of questions that you want to include, and come up with succinct, straightforward questions to gather the information that you need to answer your questions. Keep your questionnaire as short as possible, and identify a target demographic who you would like to answer the questions. Remember to make the questionnaires as anonymous as possible to protect the integrity of the person answering the questions! For tips on writing out your questions and distributing the questionnaire, keep reading!

Did this summary help you?

Thanks to all authors for creating a page that has been read 567,275 times.

Reader Success Stories

Abdul Bari Khan

Nov 11, 2020

«This gave a full view about questionnaire development, administration and distribution, pilot survey, and write up…» more

Did this article help you?

Источник

Перевод с английского под ред. А.Ю. Алексеевой

ВВЕДЕНИЕ

Использование анкет при проведении научных исследований в области медицинского образования
В области медицинского образования опросы используются повсеместно. Примерами могут служить широко распространенная оценка медицинских курсов и медицинской практики студентами, а также опросы удовлетворенности пациентов и исследования самооценки студентов. Кроме того, инструменты опроса широко используются при проведении научных исследований в области медицинского образования. В нашем недавнем обзоре оригинальных исследовательских статей, опубликованных в журнале «Medical Teacher» в 2011 и 2012 гг., мы обнаружили, что 37 (24%) статей включали в себя опросы как часть исследования. Точно так же опросы обычно используются при проведении исследований в области высшего медицинского образования. По данным за тот же двухлетний период (2011–2012 гг.), опросы были включены в 75% исследовательских статей, опубликованных в журнале «Journal of Graduate Medical Education» («Журнал высшего медицинского образования»).

Несмотря на широкое распространение опросов в области медицинского образования, в медицинской учебной литературе содержится ограниченное количество рекомендаций относительно наилучшего способа разработки опроса (Gehlbach et al., 2010). Поэтому зачастую опросы разрабатываются без соблюдения строгих методологий или «надлежащей практики» в этой области. В итоге надежность оценок, полученных в результате опросов, часто оказывается недостаточной, равно как и обоснованность предлагаемой интерпретации и использования этих оценок. Другими словами, когда опросы плохо разработаны, из-за различных типов ошибок измерения они могут не уловить суть того, что разработчик опроса пытается измерить. Например, плохая формулировка вопросов, их запутанная структура и неадекватные варианты ответов – все это может повлиять на надежность и достоверность собранных данных, что крайне затрудняет получение полезных выводов (Sullivan, 2011). Имея в виду указанные проблемы, в этом руководстве AMEE мы поставили цель описать систематический процесс разработки, который будет способствовать созданию надежных и валидных инструментов опроса, используемых в медицинском образовании и исследованиях. Таким образом, мы надеемся предоставить медицинским педагогам практическое руководство по повышению качества опросов, которые они разрабатывают для оценки и исследовательских целей.

Практические аспекты

Анкетирование широко применяется при проведении научных исследований в области медицинского образования, но методики разработки таких анкет различаются по качеству, в этой области отсутствуют согласованные строгие стандарты.
В этом руководстве AMEE представлен систематический 7-этапный процесс создания высококачественных опросных шкал, пригодных для исследовательских целей и оценки программ.
Процесс объединяет в единое целое несколько методик, используемых разработчиками опросов.
Процесс разработки опроса, описанный в настоящем руководстве, включает следующие 7 этапов: 1) проведение обзора литературы; 2) проведение интервью и/или фокус-групп; 3) синтез данных, полученных при проведении обзора литературы и интервью/фокус-групп; 4) разработка вопросов; 5) сбор обратной связи по вопросам с помощью экспертной проверки; 6) проведение когнитивных интервью, чтобы убедиться в правильном понимании вопросов респондентами; 7) проведение пробного анкетирования («пилотирование»).
Этот 7-этапный процесс разработки опросов отличается от ранее описанных процессов тем, что он сочетает в себе данные, полученные от других экспертов в данной области, а также от потенциальных участников. Кроме того, в этом процессе основное внимание уделяется задаче обеспечения точности собираемых данных путем тщательной разработки вопросов.

СИСТЕМАТИЧЕСКИЙ 7-ЭТАПНЫЙ ПРОЦЕСС РАЗРАБОТКИ ШКАЛЫ ОПРОСА

Термин «опрос» достаточно широкий и может включать в себя вопросы, используемые в телефонном интервью, набор вопросов, используемых в фокус-группе, а также вопросы для самостоятельного ответа пациента (Dillman et al., 2009). Хотя методики, описанные в этом руководстве AMEE, могут быть использованы для повышения качества всего вышеперечисленного, мы сосредоточиваемся главным образом на опросных листах для самостоятельного заполнения, которые часто называют анкетами. Для большинства анкет главная цель состоит в том, чтобы разработать набор вопросов, которые каждый респондент будет интерпретировать одинаково, на которые каждый респондент будет отвечать точно, при которых респондент будет иметь желание и мотивацию отвечать. 7 этапов, представленных в табл. 1 и описанных ниже, не охватывают всех аспектов разработки опроса и не являются единственным способом разработки высококачественной анкеты. Скорее, эти этапы объединяют и сочетают в себе множество методов разработки опросов, существующих в социальных науках, и они могут направлять разработчиков на пути их создания. Систематическое выполнение каждого этапа позволит оптимизировать качество анкет в области медицинского образования и повысить шансы на сбор высококачественных данных.

Анкеты хорошо подходят для сбора данных об абстрактных идеях или концепциях, которые иначе трудно поддаются количественной оценке, таких как мнения, установки и убеждения. Кроме того, анкеты могут быть полезны для сбора информации о поведении, которое не может наблюдаться непосредственно (например, учеба дома), при условии, что респонденты готовы и способны сообщать об этом поведении. Однако прежде чем создавать анкету, необходимо сначала понять, является ли опрос лучшим методом для решения поставленной в исследовании задачи или изучаемого конструкта. Конструкт – это модель, идея или теория, которую исследователь пытается оценить. В медицинском образовании многие конструкты, представляющие интерес, нельзя наблюдать непосредственно: удовлетворенность студентов новым учебным планом, оценка пациентами своего физического дискомфорта и т. д. Поскольку документирование этих явлений требует измерения восприятия людей, анкеты часто являются наиболее прагматичным подходом к оценке конструктов.

В медицинском образовании многие конструкты хорошо подходят для оценки с помощью анкет. Однако, поскольку психологические, не поддающиеся наблюдению конструкты, такие как мотивация преподавателя, уверенность врача и удовлетворенность обучающихся, не имеют общепринятой системы показателей, их трудно измерить с помощью одного вопроса анкеты. Другими словами, существует практически всеобщее согласие в отношении единиц и метода измерения некоторых конструктов, таких как вес или расстояние, и поэтому одного измерения может быть достаточно. Однако для более точного измерения не поддающихся наблюдению психологических конструктов часто требуются шкалы. Измерительные шкалы представляют собой группы сходных вопросов в анкете, предназначенной для оценки одного и того же базового конструкта (DeVellis, 2003). Хотя шкалы сложнее разрабатывать и для этого требуется больше времени, они дают исследователям много преимуществ. В частности, шкалы позволяют более полно, точно и последовательно оценить лежащий в их основе конструкт (McIver, Carmines, 1981). Таким образом, шкалы широко используются во многих областях, включая медицинское образование, психологию и политологию. В качестве примера рассмотрим исследователя вопросов медицинского образования, интересующегося оценкой удовлетворенности студентов-медиков. Один из методов состоит в том, чтобы просто задать один вопрос об удовлетворенности (например, насколько вы были удовлетворены учебой на медицинском факультете?). Однако более эффективный метод состоит в том, чтобы задать ряд вопросов, призванных охватить различные аспекты конструкта удовлетворенности (например, насколько вы были удовлетворены средствами обучения, насколько эффективны были ваши преподаватели и насколько простым был процесс планирования?). Используя этот подход, можно рассчитать средний балл по всем вопросам определенной шкалы и использовать его в исследовании.

Из-за преимуществ оценки этих типов психологических конструктов с помощью шкал процесс разработки опроса, к которому мы сейчас обратимся, будет сосредоточен, в частности, на разработке шкал.

ЭТАП I. ПРОВЕДЕНИЕ ОБЗОРА ЛИТЕРАТУРЫ

I этапом разработки анкеты является обзор литературы. Обзор литературы имеет две основные цели: (1) четко определить конструкт и (2) определить, существуют ли уже методы измерения конструкта (или связанных с ним конструктов). Обзор литературы помогает согласовать определение конструкта с соответствующей теорией и исследованиями в этой области и в то же время помогает исследователю определить, какие измерительные шкалы или вопросы можно использовать или адаптировать для текущей цели (Gehlbach et al., 2010).

Формулировка четкого определения конструкта является необходимым первым шагом в любом исследовании валидности (Cook, Beckman, 2006). Хорошее определение позволит прояснить, как конструкт позиционируется в существующей литературе, как он соотносится с другими конструктами и чем отличается от связанных конструктов (Gehlbach, Brinkworth, 2011).

Хорошо сформулированное определение также помогает определить уровень абстракции, на котором измеряется данный конструкт (так называемый размер зерна, как это определено в работе Gehlbach, Brinkworth, 2011). Например, для изучения степени уверенности обучающихся медиков в том, что они овладели необходимыми клиническими навыками, можно было бы разработать шкалы для оценки их уверенности в овладении навыками аускультации сердца (на мелкозернистом конце спектра), проведения физикального обследования (на среднезернистом конце спектра) или овладении клиническими навыками, необходимыми для преподаваемой медицинской дисциплины (на крупнозернистом конце спектра).

Хотя многие исследователи вопросов медицинского образования предпочитают разрабатывать опросы самостоятельно, возможно, более эффективный способ состоит в том, чтобы адаптировать существующий опросник (особенно если авторы существующего опросника собрали доказательства валидности в предыдущей работе), чем начинать с нуля. В этом случае обычно достаточно обратиться к авторам с просьбой адаптировать их анкету. Однако важно отметить, что термин «ранее валидированный опросник» является неправильным. Валидность оценок, полученных на основе определенного опросника или шкалы опроса, зависит, помимо прочего, от целевой группы населения, местной специфики и предполагаемого использования оценок шкалы. Таким образом, разработчики опросов собирают доказательства надежности и валидности своих измерительных шкал в определенном контексте, с определенной выборкой и для определенной цели.

Как описано в Стандартах образовательного и психологического тестирования (Standards for Educational and Psychological Testing), под валидностью подразумевается степень, с которой предполагаемое использование оценки поддерживается фактическими данными и теорией (AERA, APA & NCME, 1999). Процесс валидации является наиболее фундаментальным фактором при разработке и оценке инструмента измерения, и этот процесс включает в себя накопление доказательств во времени, в разных условиях и выборках для построения научно обоснованной аргументации валидности. Таким образом, установление валидности – это непрерывный процесс сбора доказательств (Kane, 2006). Кроме того, важно признать, что надежность и валидность – это свойства не опроса как инструмента, а оценки опроса и их интерпретации (AERA, APA & NCME, 1999). Например, опрос об удовлетворенности обучающихся может быть уместен для оценки аспектов благополучия студентов, но такой опрос не будет подходить для отбора лучших студентов-медиков. В этом примере опросный лист не претерпел изменений, изменилась только интерпретация оценок (Cook, Beckman, 2006).

Существует много веских причин для использования или небольшой адаптации существующего опросника. В этом случае можно провести сравнение с врачом, который должен решить, какое лечение наиболее эффективно. Преобладающее большинство практикующих врачей не проводят собственных сравнительных исследований, чтобы определить лучшие методы лечения для своих пациентов. Они, скорее, полагаются на опубликованные исследования, так как очевидно, что было бы нецелесообразно проводить такие исследования в отношении каждого случая заболевания. Точно так же медицинские преподаватели не могут разрабатывать собственные анкеты для каждого поставленного в исследовании вопроса или образовательного вмешательства. Как и клинические испытания, разработка качественного опросника требует времени, знаний, навыков и достаточного количества ресурсов. Таким образом, существующий хорошо разработанный опросник часто может позволить медицинским преподавателям направить свои ограниченные ресурсы на решение других проблем.

Если продолжать аналогию с клиническими исследованиями, можно привести следующий пример: когда практикующие врачи рассматривают отчет об исследовании, который имеет отношение к их клиническому вопросу, они должны решить, можно ли его применить к их пациенту. Как правило, при этом необходимо определить, являются ли выявленные в исследовании взаимосвязи причинно-следственными (внутренняя валидность) и применимы ли результаты к популяции пациентов данного врача (внешняя валидность). Аналогичным образом, анкеты, обнаруженные в ходе поиска литературы, должны быть критически проанализированы на предмет валидности, а затем на предмет возможности применения к целевой аудитории преподавателя. Если разработчики опросов найдут шкалы, которые точно соответствуют их конструкту, специфике и предполагаемому использованию, они могут использовать такие шкалы, внеся в них лишь незначительные изменения. В некоторых случаях сами вопросы могут быть плохо сформулированы, но их содержание может быть полезным для составления новых вопросов (Gehlbach, Brinkworth, 2011). Делать такие выводы будет тем легче, чем больше разработчик опроса знает о конструкте (посредством обзора литературы) и передовой практике составления вопросов (как описано в IV этапе).

ЭТАП II. ПРОВЕДЕНИЕ ИНТЕРВЬЮ И/ИЛИ ФОКУС-ГРУППЫ

После того как обзор литературы показал, что необходимо разработать новый опросник, и помог определить конструкт, следующим шагом является выяснение того, соответствует ли концептуализация конструкта тому, как потенциальные респонденты его представляют (Gehlbach, Brinkworth, 2011). Другими словами, включают ли и исключают ли респонденты те же признаки конструкта, которые описаны в литературе? Какой язык используют респонденты при описании конструкта? Чтобы ответить на эти вопросы и убедиться, что конструкт определен с разных точек зрения, исследователи обычно собирают данные непосредственно от людей, которые очень схожи с изучаемой популяцией.

Для иллюстрации этого этапа на помощь приходит другая аналогия из клинической практики. Многие практикующие врачи сталкивались с тем, что много времени тратится на разработку подходящей с медицинской точки зрения схемы лечения, но она оказывается неприемлемой для пациентов (например, слишком дорогая). В этом случае врач и пациент должны разработать новый план, приемлемый для обоих. Если бы точка зрения пациента была рассмотрена раньше, первоначальный план, вероятно, был бы более эффективным. Многие врачи также испытывали трудности при лечении пациента, и только после того, как коллега переосмыслил проблему, был выработан более эффективный метод лечения. Конструкт не исключение. Исследователь, разрабатывающий опросник, как и врач, лечащий пациента, много думал над определением конструкта. Однако исследователь неизбежно привносит в это определение свои взгляды и предубеждения, а язык, используемый в литературе, может быть техническим и трудным для понимания. Таким образом, необходимо учитывать другие точки зрения. Самое главное, как целевая популяция (пациент из предыдущего примера) концептуализирует и понимает конструкт? Как и в случае с пациентом, другие точки зрения иногда имеют решающее значение для успеха проекта. Например, изучая литературу об удовлетворенности студентов медицинскими учебными заведениями, исследователь может не найти упоминаний об учебной практике предоставления студентам видео- или аудиозаписей лекций (так как эта практика является довольно новой). Однако в беседе со студентами исследователь может обнаружить, что современные студенты привыкли к подобной практике и учитывают ее при формировании своего мнения о преподавании в медицинском учебном заведении.

Чтобы выполнить II этап, разработчику опроса потребуется информация от потенциальных респондентов. Интервью и/или фокус-группы дают возможность получить эту информацию. Независимо от выбранного подхода, этот этап должен быть направлен на достижение двух основных целей. Во-первых, исследователям нужно услышать, как участники говорят о конструкте своими словами, без подсказок или с незначительными подсказками со стороны исследователя. После сбора произвольной информации от участников разработчики опроса могут затем задать более целенаправленные вопросы, чтобы оценить, согласны ли респонденты с тем, как конструкт был охарактеризован в литературе. Эту процедуру следует повторять до тех пор, пока не будет достигнут порог насыщения, когда исследователь больше не получает новой информации о том, как потенциальные респонденты концептуализируют конструкт. Конечный результат интервью и/или фокус-группы должен состоять в подробном описании того, как потенциальные респонденты концептуализируют и понимают конструкт. Затем эти данные будут использоваться на
III и IV этапах.

ЭТАП III. СИНТЕЗ ДАННЫХ, ПОЛУЧЕННЫХ ПРИ ПРОВЕДЕНИИ ОБЗОРА ЛИТЕРАТУРЫ И ИНТЕРВЬЮ/ФОКУС-ГРУПП

На этом этапе определение конструкта уже сформулировано медицинским преподавателем, разрабатывающим анкету, проводящим обзор литературы и составляющим портрет целевой аудитории. На III этапе осуществляется согласование этих определений. Поскольку определение конструкта задает направление всех последующих этапов (например, разработку вопросов), разработчик проекта должен приложить все усилия, чтобы выполнить этот этап должным образом.

Одним из эффективных способов выполнения III этапа является разработка всеобъемлющего списка показателей для конструкта путем объединения результатов обзора литературы и интервью/фокус-групп (Gehlbach, Brinkworth, 2011). Когда в этих источниках данных фигурируют аналогичные списки, процесс не представляет сложности. Когда эти данные концептуально схожи, но литература и потенциальные респонденты описывают конструкт с использованием разной терминологии, имеет смысл использовать лексику потенциальных респондентов. Например, при оценке уверенности преподавателя (иногда называемой самоэффективностью преподавателя), вероятно, более уместно спрашивать преподавателей об их «уверенности в апробации новых методов обучения», чем об их «эффективности в экспериментировании с новыми педагогическими методами» (Gehlbach et al., 2010). Наконец, если какой-либо показатель присутствует в одном источнике и отсутствует в другом, большинство разработчиков анкет захотят включить такой вопрос, по крайней мере на начальном этапе. На последующих этапах разработчики будут иметь возможность определить с помощью экспертных оценок (этап IV) и когнитивных интервью (этап VI), по-прежнему ли предложенные вопросы подходят для исследования конструкта. Каким бы ни был метод, используемый для консолидации данных на I и II этапах, окончательное определение и перечень показателей должны быть всеобъемлющими, отражающими как литературу, так и мнения целевой аудитории.

Стоит отметить, что ученые могут иметь веские основания остановиться на определении конструкта, отличном от того, что встречается в литературе. Однако, когда это происходит, следует понимать, как именно и почему определение конструкта отличается от имеющихся. Например, отличается ли восприятие целевой аудитории от восприятия, описанного в предыдущих работах? Применяется ли новая теория образования? Какова бы ни была причина, это обоснование будет необходимо для публикации опросника. Наличие четкого определения конструкта с объяснением того, чем он отличается от других версий конструкта, поможет коллегам и исследователям решить, как лучше использовать опросник как в сравнении с предыдущими исследованиями, так и с развитием новых областей научных исследований.

ЭТАП IV. РАЗРАБОТКА ВОПРОСОВ

Цель этого этапа состоит в том, чтобы составить анкетные вопросы, верно отражающие изучаемый конструкт на языке, который респонденты могут легко понять. Одним из важных аспектов разработки анкеты является количество вопросов, необходимых для адекватной оценки конструкта. Простого ответа здесь нет. Идеальное количество вопросов зависит от нескольких факторов, включая сложность конструкта и уровень, на котором предполагается его оценить (т. е. размер зерна). В целом хорошей практикой является разработка большего количества вопросов, чем в конечном итоге потребуется в окончательной шкале (например, разработка 15 потенциальных вопросов с надеждой в конечном итоге создать шкалу из восьми вопросов), так как некоторые вопросы, скорее всего, будут удалены или пересмотрены позже в процессе разработки анкеты (Gehlbach, Brinkworth, 2011). В конечном счете решение о количестве вопросов – это дело профессионального суждения, но для большинства узко определенных конструктов шкалы, содержащие от 6 до 10 вопросов, обычно достаточны, чтобы верно уловить суть рассматриваемого явления.

Следующая задача состоит в том, чтобы сформулировать ясные, недвусмысленные вопросы, используя лексику целевой популяции. Хотя некоторые аспекты составления вопросов остаются формой искусства, этот процесс должен основываться на все более и более прочном научном фундаменте и накопленном передовом опыте. Например, использование вопросов, а не утверждений, избегание негативных и предвзятых формулировок, приведение сути вопроса в соответствие с ответами и использование ответов, подчеркивающих измеряемый конструкт, вместо ответов на вопросы о согласии/несогласии с утверждением в целом (Artino et al., 2011) – все это передовые методы, подтвержденные документальными доказательствами. Хотя некоторые исследователи вопросов медицинского образования могут рассматривать эти принципы как проявление здравого смысла, опыт говорит нам, что передовые методы зачастую не соблюдаются.

Обзор всех рекомендаций относительно того, как лучше формулировать вопросы, строить список ответов и создавать визуальный дизайн отдельных элементов опроса и анкет в целом, выходит за рамки данного руководства AMEE. Однако, как отмечалось выше, существует множество замечательных работ по этой теме (например, DeVillis, 2003; Dillman et al., 2009; Fowler, 2009). Чтобы помочь читателям понять некоторые из наиболее важных и часто игнорируемых передовых методов, в табл. 2 мы привели некоторые ошибки, допускаемые при составлении вопросов, и предложили соответствующие решения.

Другой важной частью процесса разработки опросника является выбор вариантов ответов, которые будут использоваться для каждого пункта. Закрытые вопросы могут иметь неупорядоченные (номинальные) варианты ответов, которые не имеют естественного порядка, или упорядоченные (порядковые) варианты ответов. Кроме того, в анкете может быть вопрос на ранжирование (например, «оцените следующие элементы, где 1 – лучший и 6 – худший») или задание на ранжирование, где необходимо выбрать ответ по шкале Лайкерта. Хотя обзор всех доступных вариантов ответов выходит за рамки настоящего руководства AMEE, разработчикам опросников рекомендуется адаптировать эти варианты к конструктам, которые они пытаются оценить (и ознакомиться с одной из многих замечательных работ по этой теме, например Dillman et al., 2009; McCoach et al., 2013). Чтобы помочь читателям понять некоторые часто игнорируемые передовые методы, в табл. 2 и на рисунке мы привели несколько распространенных ошибок, которые разработчики совершают при составлении и оформлении своих вариантов ответов. Шкалы ответов Лайкерта в настоящее время являются наиболее популярным способом сбора ответов при анкетировании, в значительной степени благодаря простоте использования и адаптируемости для измерения множества различных конструктов (McCoach et al., 2013). В табл. 3 приводится несколько примеров 5- и 7-балльных шкал ответов, которые могут использоваться при разработке инструментов опроса на основе шкалы Лайкерта.

После того как разработчики опроса закончат составление пунктов анкеты и выберут якоря ответов, появятся различные источники доказательств, которые могут применяться для оценки валидности опросника и его предполагаемого использования. Эти источники валидности были описаны в Стандартах образовательного и психологического тестирования (Standards for Educational and Psychological Testing) как доказательства, основанные на следующем: 1) содержание; 2) процесс предоставления ответов; 3) внутренняя структура; 4) отношения с другими переменными и 5) последствия (AERA, APA & NCME, 1999). Следующие 3 этапа процесса разработки опроса хорошо вписываются в указанную классификацию и описаны ниже.

ЭТАП V. ПРОВЕДЕНИЕ ЭКСПЕРТНОЙ ВАЛИДАЦИИ

После определения конструкта и составления предположительных вопросов важным этапом в разработке нового опросника является сбор доказательств валидности на основе содержания опроса (так называемая содержательная валидность) (AERA, APA & NCME, 1999). Этот этап включает в себя сбор данных от специалистов по информационному наполнению и имеет целью установить, что отдельные элементы опроса соответствуют измеряемому конструкту и что ключевые элементы или показатели не были пропущены (Polit, Beck, 2004; Waltz et al., 2005). Привлечение экспертов для систематического анализа содержания опроса может существенно повысить общее качество и репрезентативность элементов шкалы (Polit, Beck, 2006).

Описание этапа по установлению содержательной валидности для нового инструмента опроса можно найти в различных литературных источниках (например, McKenzie et al., 1999; Rubio et al., 2003). Ниже мы суммируем несколько наиболее важных составляющих этого этапа. Во-первых, прежде чем набирать группу экспертов для оценки содержания нового опросника, следует разработать конкретные критерии для определения квалификации эксперта. Эти критерии часто основываются на опыте или знании измеряемого конструкта, но на практике они также зависят от готовности и доступности отдельных специалистов, которых привлекают к участию в разработке опроса (McKenzie et al., 1999). Одним из эффективных методов поиска экспертов является подбор авторов из библиографических списков статей, просматриваемых в ходе поиска литературы. В литературе нет единого мнения относительно количества экспертов, которое следует использовать для проведения содержательной валидации. Однако количество привлеченных экспертов будет оказывать влияние на многие количественные методы, используемые для анализа полученных от экспертов данных. Рубио (Rubio et al., 2003) рекомендует использовать 6–10 экспертов, признавая при этом, что большее число экспертов (до 20) позволит сформировать более четкий консенсус относительно оцениваемого конструкта, а также качества и релевантности предлагаемых пунктов шкалы.

В целом ключевыми областями для экспертной оценки в рамках процесса валидации являются репрезентативность, ясность, релевантность и распределение. Репрезентативность определяется как полнота охвата конструкта вопросами (в целом), ясность – как четкость формулировок вопросов, а релевантность – как степень, в которой каждый вопрос действительно относится к конкретным аспектам конструкта. Распределение ответов на вопрос не всегда измеряется во время экспертной проверки, так как оно отражает более тонкий аспект: насколько «трудно» было бы респонденту выбрать высокий балл по конкретному вопросу. Другими словами, среднему студенту медику может быть очень трудно ответить положительно на вопрос об уверенности в себе: «Насколько вы уверены, что можете получить 100% на экзамене по анатомии?», но этому же студенту может быть легче дать твердый положительный ответ на вопрос: «Насколько вы уверены, что можете сдать экзамен по анатомии?». В общем, разработчики анкет должны стремиться к тому, чтобы иметь в своем распоряжении целый ряд вопросов различной сложности (Tourangeau et al., 2000).

После определения состава группы экспертов можно приступить к созданию формы содержательной валидации, которая определяет конструкт и дает экспертам возможность предоставить обратную связь по отдельной вышеупомянутой теме или их совокупности. Приоритеты каждого разработчика опроса в отношении содержательной валидации могут отличаться, поэтому разработчикам рекомендуется адаптировать формы содержательной валидации таким образом, чтобы они отражали эти приоритеты.

Существует множество методов анализа количественных данных, собранных в форме экспертной валидации, но вне зависимости от используемого метода критерий приемлемости того или иного вопроса или шкалы следует определить заранее (Beck, Gable, 2001). Общими параметрами, используемыми для принятия решений о включении и исключении отдельных вопросов, являются коэффициент содержательной валидности, индекс содержательной валидности и индекс факториальной валидности. Подробнее о том, как рассчитать и интерпретировать эти показатели, см. в работах McKenzie et al. (1999) и Rubio et al. (2003). (Пример формы содержательной валидации см. в работе Gehlbach, Brinkworth, 2011.)

Наряду со сбором количественных данных, разработчики опросников должны предоставить экспертам возможность давать комментарии в свободной форме. Этот подход может быть особенно эффективен для изучения того, какие показатели или аспекты конструкта недостаточно хорошо представлены существующими вопросами. Данные, собранные на основании комментариев в свободной форме и последующего качественного анализа, часто позволяют получить информацию, которую не дают количественные данные, и могут привести к серьезным дополнениям к вопросам и шкалам (или исключениям из них) (McKenzie et al., 1999).

Существует множество способов анализа содержательной валидности нового опроса с помощью экспертной валидации. Оптимальный подход должен быть направлен на различные области, в которых исследователи испытывают наибольшие опасения по поводу шкалы (релевантности, ясности и т. д.) для каждого отдельного элемента и для каждого набора элементов или каждой шкалы. Количественные данные в сочетании с качественными данными экспертов призваны повысить содержательную валидность нового опросника или измерительной шкалы и в конечном счете эффективность инструмента опроса в целом.

ЭТАП VI. ПРОВЕДЕНИЕ КОГНИТИВНЫХ ИНТЕРВЬЮ

После того как эксперты помогли уточнить элементы шкалы, важно собрать доказательства валидности процесса предоставления ответов, чтобы оценить, как потенциальные участники интерпретируют ваши элементы и пункты ответов (AERA, APA & NCME 1999). Одним из способов сбора таких доказательств является процесс, известный под названием «когнитивное интервью» или «когнитивное предварительное тестирование» (Willis, 2005). Подобно тому как эксперты используются для определения содержательной валидности нового опроса, не менее важно определить, как потенциальные респонденты интерпретируют вопросы, и соответствует ли их интерпретация тому, что имеет в виду разработчик анкеты (Willis, 2005; Karabenick et al., 2007). Результаты когнитивных интервью могут быть полезны для выявления ошибок, которые респонденты допускают в своей интерпретации вопроса или вариантов ответа (Napoles-Springer et al., 2006; Karabenick et al., 2007). Как качественный метод, анализ опирается не на статистические проверки цифровых данных, а на кодирование и интерпретацию письменных заметок, сделанных в ходе проведения интервью. Таким образом, размеры выборки, используемой для когнитивного интервьюирования, обычно невелики и могут включать всего 10–30 участников (Willis, Artino, 2013). Для небольших исследовательских проектов в области медицинского образования может быть достаточно всего 5–6 участников, если разработчик опроса способен выявить потенциальную предвзятость в очень небольших выборках (Willis, Artino, 2013).

В когнитивном интервью используются методы психологии и традиционно предполагается, что, отвечая на вопросы, респонденты проходят через ряд когнитивных процессов. Эти этапы включают в себя понимание сути вопроса и выбор ответа, извлечение соответствующей информации из долговременной памяти, вынесение суждения, основанного на понимании вопроса и извлеченной из памяти информации, и, наконец, выбор ответа (Tourangeau et al., 2000). Поскольку респонденты могут испытывать трудности на любом этапе, когнитивное интервью следует разрабатывать и планировать так, чтобы все потенциальные проблемы были решены. Важным I этапом в процессе когнитивного интервью является создание критериев кодирования, отражающих предполагаемый смысл каждого вопроса (Karabenick et al., 2007), которые затем могут использоваться для интерпретации ответов, собранных в ходе когнитивного интервью.

Двумя основными методами проведения когнитивного интервью являются техника «думай вслух» и вербальное зондирование. Техника «думай вслух» требует от респондентов вербализации каждой мысли, которая приходит им в голову при ответе на каждый вопрос. В этом случае интервьюер просто поддерживает его действия, поощряя респондента продолжать говорить и записывать сказанное для последующего анализа (Willis, Artino, 2013). Этот метод может дать ценную информацию, но он, как правило, является неестественным и трудным для большинства респондентов, и это может привести к тому, что создатель опроса должен будет отбраковывать множество данных открытых ответов.

Дополнительная процедура – вербальное зондирование, – является более активной формой сбора данных, когда интервьюер задает серию зондирующих вопросов, предназначенных для получения конкретной информации (Willis, Artino, 2013) (список часто используемых вербальных зондов см. в табл. 4). Вербальное зондирование классически делится на параллельное и ретроспективное. При параллельном зондировании интервьюер задает респонденту конкретные вопросы о его мыслительных процессах, в то время как респондент отвечает на каждый вопрос. Параллельное зондирование, хотя и нарушает общий ход интервью, имеет то преимущество, что позволяет участникам отвечать на вопросы, пока их мысли свежи. Ретроспективное зондирование, с другой стороны, происходит после того, как участник завершил весь опрос (или часть опроса), и, как правило, в меньшей степени нарушает мыслительный процесс респондента, чем параллельное зондирование. Недостатком ретроспективного зондирования является риск смещения воспоминаний и ретроспективных эффектов (Drennan, 2003). Модификация двух методов вербального зондирования определяется как немедленное ретроспективное зондирование, которое позволяет интервьюеру найти естественные контрольные точки в опросе. Немедленное ретроспективное зондирование дает возможность интервьюеру провести исследование, не прерываясь между каждым пунктом (Watt et al., 2008). Этот подход имеет потенциальное преимущество, заключающееся в уменьшении предвзятости воспоминаний и ретроспективных эффектов при одновременном ограничении числа прерываний респондента со стороны интервьюера и снижении искусственности процесса. На практике во многих когнитивных интервью на самом деле используется комбинация методов «думай вслух» и вербального зондирования с целью более эффективного выявления потенциальных ошибок.

После завершения когнитивного интервью проводится анализ полученных качественных данных. Существует несколько методов анализа. Одним из методов количественного анализа результатов когнитивного интервью является кодирование. Этот метод состоит в том, что для распространенных ошибок респондентов (например, респондент запрашивает разъяснения) устанавливаются заранее определенные коды, и по каждому вопросу количество ошибок каждого типа заносится в таблицу (Napoles-Springer et al., 2006). Кроме того, коды могут ранжироваться в соответствии с заранее определенной степенью серьезности ошибки. Хотя количественные результаты этого анализа часто легко интерпретируются, при использовании этого метода можно пропустить ошибки, которые трудно предсказать. Кроме того, он не позволяет полностью объяснить, почему возникает ошибка (Napoles-Springer et al., 2006). К тому же к когнитивному интервью также может применяться качественный подход посредством анализа взаимодействия. Как правило, анализ взаимодействия пытается описать и объяснить способы, которыми люди интерпретируют ответы и взаимодействуют во время разговора, и этот метод может применяться в ходе когнитивного интервью для определения смысла ответов (Napoles-Springer et al., 2006). Исследования показали, что сочетание кодирования и анализа взаимодействия может быть достаточно эффективным и предоставляет больше информации о «когнитивной валидности» нового опросника (Napoles-Springer et al., 2006).

Важность сходного понимания респондентами каждого вопроса неразрывно связана с общей надежностью оценок любого нового опросника. Кроме того, необходимость понимания респондентами каждого вопроса так, как он был задуман создателем опроса, всецело обусловливает валидность опроса и выводов, которые могут быть сделаны на основании полученных данных. В совокупности эти два аспекта критически важны для создания качественного опросника, и каждый аспект может быть решен с помощью хорошо продуманного когнитивного интервью. В конечном счете независимо от методов, используемых для проведения когнитивных интервью и анализа данных, собранная информация должна использоваться для изменения и улучшения анкеты в целом и отдельных элементов опроса.

ЭТАП VII. ПРОВЕДЕНИЕ ПРОБНОГО АНКЕТИРОВАНИЯ («ПИЛОТИРОВАНИЕ»)

Несмотря на все усилия, предпринятые исследователями вопросов медицинского образования в ходе вышеупомянутого процесса разработки опроса, формулировка некоторых элементов анкеты все еще может быть некорректной (Gehlbach, Brinkworth, 2011). Таким образом, следующим этапом являются пилотное тестирование опросника и продолжение сбора доказательств валидности. В основе двух наиболее распространенных подходов лежат его внутренняя структура и связи с другими переменными (AERA, APA & NCME, 1999). Во время пилотного тестирования участники целевой группы проходят опрос в заранее определенном формате (например, в онлайн- или бумажном формате). Затем данные, полученные в ходе пилотного теста, анализируются для оценки диапазона и вариантности вопросов, надежности всей шкалы и корреляций вопросов и суммарных баллов. На этом этапе разработчики опросов должны также изучить описательную статистику (например, средние значения и стандартные отклонения) и гистограммы, которые демонстрируют распределение ответов по вопросам. Этот анализ может помочь в выявлении элементов, которые могут функционировать не так, как предполагал разработчик.

Для определения внутренней структуры опросника и оценки степени, в которой элементы в рамках конкретной шкалы измеряют единый базовый конструкт (т. е. одномерность шкалы), разработчикам опросов следует рассмотреть возможность использования передовых статистических методов, таких как факторный анализ. Факторный анализ – это статистическая процедура, предназначенная для оценки «количества различных конструктов, необходимых для учета схемы корреляций в наборе показателей» (Fabriger, Wegener, 2012, с. 3). Чтобы оценить размерность шкалы опроса, которая была целенаправленно построена для оценки одного конструкта (например, с использованием процессов, описанных в этом исследовании), мы рекомендуем использовать методы подтверждающего факторного анализа. В то же время другие ученые утверждают, что при оценке новых шкал целесообразнее применять исследовательский факторный анализ (McCoach et al., 2013). Независимо от конкретного применяемого анализа исследователи должны знать, что методы факторного анализа зачастую плохо изучены и плохо реализуются. К счастью, литература изобилует многими полезными руководствами (см., например, Pett et al., 2003; McCoach et al., 2013).

Проведение анализа надежности – еще один важный шаг на этапе пилотного тестирования. Наиболее распространенный способ оценки надежности шкалы – вычисление коэффициента «альфа Кронбаха». Альфа Кронбаха – это мера внутренней согласованности оценок элементов (т. е. степень, в которой оценки отдельных элементов на шкале коррелируют друг с другом). Это функция корреляции между пунктами и общим количеством пунктов по определенной шкале. Важно отметить, что альфа Кронбаха не является хорошим показателем одномерности шкалы (измерение единого концепта), как часто предполагается (Schmitt, 1996). Таким образом, в большинстве случаев разработчики исследования должны сначала провести факторный анализ, чтобы оценить одномерность шкалы, а затем приступить к анализу надежности, чтобы оценить внутреннюю согласованность элементов шкалы (Schmitt, 1996).

Поскольку альфа Кронбаха чувствительна к длине шкалы, при прочих равных условиях более длинная шкала в большинстве случаев будет характеризоваться более высоким значением коэффициента альфа Кронбаха. Безусловно, длину шкалы и связанное с этим повышение надежности внутренней согласованности следует соизмерять с чрезмерной нагрузкой респондентов и сопутствующими ошибками в ответах, которые могут возникнуть, когда опросники становятся слишком длинными и респонденты устают. Наконец, крайне важно признать, что надежность – необходимое, но недостаточное условие валидности (AERA, APA & NCME, 1999). Другими словами, для того, чтобы результаты опроса считались достоверными, они должны быть в первую очередь надежными. Однако надежные оценки не обязательно являются достоверными для данной цели.

После оценки одномерности и внутренней согласованности шкалы разработчики опросов часто формируют суммарные баллы для каждой шкалы. В зависимости от рассматриваемого вопроса исследования суммарные баллы могут затем использоваться в качестве независимых или зависимых переменных. При попытке оценить трудноизмеримые образовательные конструкты, такие как мотивация, уверенность и удовлетворенность, обычно имеет смысл создать суммарный балл для каждой шкалы опроса, чем использовать отдельные элементы опроса в качестве переменных (Sullivan, Artino, 2013). Суммарный балл – это просто средняя оценка (взвешенная или невзвешенная) всех элементов в пределах определенной шкалы. Использование средних оценок имеет несколько явных преимуществ по сравнению с суммированием элементов в рамках определенной шкалы или подшкалы. Во-первых, средние оценки обычно выводятся с использованием той же шкалы ответов, что и для отдельных элементов. Этот подход способствует прямой интерпретации средних оценок с точки зрения ответов. Во-вторых, использование средних оценок позволяет понять, насколько велики (или малы) измеряемые различия на самом деле при сравнении отдельных лиц или групп. Как предупреждал Колливер и соавт. (Colliver et al., 2010), «суммы рейтинговых оценок отражают как рейтинговые оценки, так и количество элементов, что увеличивает различия между оценками и делает различия более важными, чем они есть» (стр. 591).

После создания суммарных баллов для каждой шкалы опроса полученные переменные могут быть изучены для определения их отношения к другим переменным, которые были собраны. Цель этого шага – определить, согласуются ли взаимосвязи переменных с теорией и предыдущими исследованиями. Так, например, можно было бы ожидать, что суммарные баллы по шкале, предназначенной для оценки уверенности обучающихся в своих навыках наложения швов, будут положительно коррелировать с количеством успешных выполненных процедур наложения швов (так как практика укрепляет уверенность) и отрицательно коррелировать с тревожностью, связанной с процедурой (так как более уверенные в себе обучающиеся также демонстрируют меньший уровень тревожности). Таким образом, разработчики опросов оценивают валидность созданных ими шкал с точки зрения их взаимосвязи с другими переменными (AERA, APA & NCME, 1999). Стоит отметить, что в приведенном выше примере разработчик опроса оценивает корреляции между вновь разработанными оценками шкалы и как объективной мерой (количество процедур), так и субъективной мерой (баллы по шкале тревожности). Оба эти подхода целесообразны для оценки взаимосвязи новой шкалы с другими переменными.

ЗАКЛЮЧЕНИЕ

В этом руководстве AMEE представлен систематический 7-этапный процесс разработки шкал опроса. Следует отметить, что многие важные темы, связанные с организацией и проведением опросов, выходят за рамки нашей статьи, посвященной разработке шкал, и поэтому не обсуждались в данном руководстве. Эти темы включают, помимо прочего, одобрение анкет для научных исследователей с этической точки зрения, формат опроса (бумажный или электронный), методы определения выборки, получение высоких показателей ответов, предоставление стимулов и управление данными. Эти и многие другие темы подробно рассматриваются в других источниках (например, Dillman et al., 2009). Мы также признаем, что представленная здесь методология не является единственным способом разработки и создания высококачественного опросника. Однако мы надеемся, что, читая это руководство, исследователи вопросов медицинского образования придут к пониманию важности следования системному, основанному на доказательствах подходу к разработке анкет. Это не только повышает качество опросников, используемых в медицинском образовании, но и потенциально может положительно повлиять на общее качество исследований в области медицинского образования, авторы значительной части которых используют анкетирование.

Взгляды, выраженные в этой статье, принадлежат авторам и не обязательно отражают официальную позицию Военно-медицинского университета, Военно-морского флота США, Вооруженных сил США, Военно-воздушных сил США или Министерства обороны.

Фрагменты настоящего руководства AMEE были ранее опубликованы в журнале «Journal of Graduate Medical Education and Academic Medicine» и используются с прямого разрешения издателей (Gehlbach et al., 2010; Artino et al., 2011; Artino, Gehlbach, 2012; Rickards et al., 2012; Magee et al., 2013; Willis, Artino, 2013).

Глоссарий

Закрытый вопрос – в опрос анкеты с конечным числом категорий ответов, из которых респондент может выбрать вариант.
Когнитивное интервьюирование (или когнитивное предварительное тестирование) – основанный на фактических данных качественный метод, специально предназначенный для исследования того, удовлетворяет ли вопрос анкеты его предполагаемой цели.

Параллельное зондирование – метод вербального зондирования, при котором интервьюер задает зондирующий вопрос сразу же после того, как респондент прочитал вслух каждый вопрос анкеты и ответил на него.

Конструкт – гипотетическое понятие или характеристика (нечто «сконструированное»), для измерения которых предназначен опрос или тест. Исторически сложилось так, что термин «конструкт» был зарезервирован для обозначения характеристик, которые не могут наблюдаться непосредственно. Однако в последнее время этот термин получил более широкое определение.

Содержательная валидность – доказательство, полученное в результате анализа взаимосвязи между содержанием инструмента опроса и конструктом, который он призван измерять.

Факторный анализ – набор статистических процедур, предназначенных для оценки количества различных конструктов, необходимых для учета схемы корреляций в наборе показателей.

Открытый вопрос – в опрос анкеты, который требует от респондентов ответа в свободной форме (например, число, список или более длинный, развернутый ответ).

Надежность – степень, в которой оценки, полученные с помощью конкретной процедуры измерения или инструмента (например, опроса), являются последовательными и воспроизводимыми. Надежность – необходимое, но недостаточное условие валидности.

Якоря ответов – пункты, указанные в ряду вариантов ответа (например, абсолютно неважно, не очень важно, в меру важно, довольно важно и чрезвычайно важно).

Валидность процесса предоставления ответа – доказательство валидности, полученное в результате анализа того, как респонденты интерпретируют значение конкретных пунктов измерительной шкалы.

Ретроспективное зондирование – метод вербального зондирования, при котором интервьюер задает зондирующие вопросы после того, как респондент завершил весь опрос (или часть опроса).

Шкала – два или более элементов, предназначенных для измерения конструкта.

Интервьюирование по методу «думай вслух» – когнитивный метод интервьюирования, при котором респондентов просят активно вербализовать свои мысли, когда они пытаются ответить на оцениваемые вопросы анкеты.

Валидность – степень, в которой предлагаемые интерпретации оценок инструмента подтверждаются данными и теорией.

Аргументация валидности – процесс накопления доказательств с целью обеспечения надежной научной основы для предлагаемого использования оценок инструмента.

Вербальное зондирование – когнитивный метод интервьюирования, при котором интервьюер задает серию зондирующих вопросов, специально предназначенных для получения подробной информации, выходящей за рамки обычно предоставляемой респондентами.

Заявление о наличии/отсутствии заинтересованности. Некоторые авторы являются военнослужащими. Параграф 105 раздела 17 Свода федеральных законов США предусматривает, что «защита авторских прав в соответствии с данным разделом недоступна для работ сотрудников правительства Соединенных Штатов». Параграф 101 раздела 17 Свода федеральных законов США определяет работу сотрудника правительства Соединенных Штатов как работу, подготовленную военнослужащим или служащим правительства Соединенных Штатов в рамках своих служебных обязанностей.

СВЕДЕНИЯ ОБ АВТОРАХ

Артино-мл. Энтони Р. (Anthony R. Artino Jr.)* – PhD, доцент кафедры профилактической медицины и биометрии, главный исследователь нескольких финансируемых исследовательских проектов, соруководитель проекта по исследованию результатов долгосрочного развития карьеры (LTCOS) стажеров Военно-медицинского университета (USU). Его исследования посвящены изучению роли академической мотивации, эмоций и саморегуляции в различных ситуациях. Получил ученую степень доктора наук (PhD) по направлению «педагогическая психология» в Университете Коннектикута.
E-mail: anthony.artino@usuhs.edu

Ля Рошель Джеффри С. (Jeffrey S. La Rochelle) – MD, MPH, заместитель руководителя программы ординатуры по внутренним болезням Национального военно-медицинского центра имени Уолтера Рида, директор Центра развития комплексных клинических навыков Военно-медицинского университета, адъюнкт-профессор медицины Военно-медицинского университета. Его исследования посвящены применению теоретически обоснованных образовательных методов и оценок, а также разработке объективных структурированных клинических экзаменов (OSCE). Получил ученые степени MD и MPH в Военно-медицинском университете.

Дези Кент Дж. (Kent J. Dezee) – MD, MPH, руководитель программы стипендий по общей медицине, адъюнкт-профессор медицины Военно-медицинского университета. Его исследования посвящены изучению показателей успеха студентов-медиков в медицинском вузе, ординатуре и за ее пределами. Получил ученую степень MD в Государственном университете штата Огайо и MPH в Военно-медицинском университете.

Гюнтер Гельбах (Hunter Gehlbach) – PhD, доцент Гарвардской высшей школы образования. Читает курс по построению шкал опросов, его исследования включают экспериментальную работу по разработке оптимальных шкал, а также проекты по созданию шкал для разработки наилучших показателей восприятия учебных заведений родителями и учащимися. Проявляет значительный интерес к применению социально-психологических принципов к проблемам образования. Получил ученую степень доктора наук (PhD) по программе «Психологические исследования в образовании» в Стэнфордском университете.

ЛИТЕРАТУРА/REFERENCES

• American Educational Research Association (AERA), American Psychological Association (APA) & National Council on Measurement in Education (NCME). Standards for education and psychological testing. Washington, DC: American Educational Research Association, 1999.
• Artino A.R., Gehlbach H., Durning S.J. AM last page: Avoiding five common pitfalls of survey design. Acad Med. 2011; 86: 1327.
• Artino A.R., Gehlbach H. AM last page: avoiding four visual design pitfalls in survey development. Acad Med. 2012; 87: 1452.
• Beck C.T., Gable R.K. Ensuring content validity: An illustration of the process. J Nurs Meas. 2001; 9: 201–15.
• Christian L.M., Parsons N.L., Dillman D.A. Designing scalar questions for web surveys. Sociol Method Res. 2009; 37: 393–425.
• Colliver J.A., Conlee M.J., Verhulst S.J., Dorsey J.K. Reports of the decline of empathy during medical education are greatly exaggerated: a reexamination of the research. Acad Med. 2010; 85: 588–93.
• Cook D.A., Beckman T.J. Current concepts in validity and reliability for psychometric instruments: theory and application. Am J Med. 2006; 119: 166.e7–16.
• DeVellis R.F. Scale development: theory and applications. 2nd ed. Newbury Park, CA: Sage, 2003.
• Dillman D., Smyth J., Christian L. Internet, mail, and mixed-mode surveys: the tailored design method. 3rd ed. Hoboken, NJ: Wiley, 2009.
• Drennan J. Cognitive interviewing: verbal data in the design and pretesting of questionnaires. J Adv Nurs. 2003; 42 (1): 57–63.
• Fabrigar L.R., Wegener D.T. Exploratory factor analysis. New York: Oxford University Press, 2012.
• Fowler F.J. Survey research methods. 4th ed. Thousand Oaks, CA: Sage, 2009.
• Gehlbach H., Artino A.R., Durning S. AM last page: survey development guidance for medical education researchers. Acad Med. 2010; 85: 925.
• Gehlbach H., Brinkworth M.E. Measure twice, cut down error: a process for enhancing the validity of survey scales. Rev Gen Psychol. 2011; 15: 380–7.
• Kane M.T. Validation in educational measurement. 4th ed. Westport, CT: American Council on Education/Praeger, 2006.
• Karabenick S.A., Woolley M.E., Friedel J.M., Ammon B.V., Blazevski J., Bonney C.R., et al. Cognitive processing of self-report items in educational research: do they think what we mean? Educ Psychol. 2007; 42 (3): 139–51.
• Krosnick J.A. Survey research. Annu Rev Psychol. 1999; 50: 537–67.
• Magee C., Byars L., Rickards G., Artino A.R. Tracing the steps of survey design: a graduate medical education research example. J Grad Med Educ. 2013; 5 (1): 1–5.
• McCoach D.B., Gable R.K., Madura J.P. Instrument development in the affective domain: school and corporate applications. 3rd ed. New York: Springer, 2013.
• McIver J.P., Carmines E.G. Unidimensional scaling. Beverly Hills, CA: Sage, 1981.
• McKenzie J.F., Wood M.L., Kotecki J.E., Clark J.K., Brey R.A. Establishing content validity: Using qualitative and quantitative steps. Am J Health Behav. 1999; 23 (4): 311–8.
• Napoles-Springer A.M., Olsson-Santoyo J., O’Brien H., Stewart A.L. Using cognitive interviews to develop surveys in diverse populations. Med Care. 2006; 44 (11): s21–30.
• Pett M.A., Lackey N.R., Sullivan J.J. Making sense of factor analysis: the use of factor analysis for instrument development in health care research. Thousand Oaks, CA: Sage, 2003.
• Polit D.F., Beck C.T. Nursing research: principles and methods. 7th ed. Philadelphia: Lippincott Williams and Wilkins, 2004.
• Polit D.F., Beck C.T. The content validity index: are you sure you know what’s being reported? Critique and recommendations. Res Nurs Health. 2006; 29: 489–97.
• Rickards G., Magee C., Artino A.R. You can’t fix by analysis what you’ve spoiled by design: developing survey instruments and collecting validity evidence. J Grad Med Educ. 2012; 4 (4): 407–10.
• Rubio D.M., Berg-Weger M., Tebb S.S., Lee E.S., Rauch S. Objectifying content validity: Conducting a content validity study in social work research. Soc Work Res. 2003; 27 (2): 94–104.
• Schmitt N. Uses and abuses of coefficient alpha. Psychol Assess. 1996; 8: 350–3.
• Schwarz N. Self-reports: How the questions shape the answers. Am Psychol. 1999; 54: 93–105.
• Sullivan G. A primer on the validity of assessment instruments. J Grad Med Educ. 2011; 3 (2): 119–20.
• Sullivan G.M., Artino A.R. Analyzing and interpreting data from Likerttype scales. J Grad Med Educ. 2013; 5 (4): 541–2.
• Tourangeau R., Rips L.J., Rasinski K.A. The psychology of survey response. New York: Cambridge University Press, 2000.
• Waltz C.F., Strickland O.L., Lenz E.R. Measurement in nursing and health research. 3rd ed. New York: Springer, 2005.
• Watt T., Rasmussen A.K., Groenvold M., Bjorner J.B., Watt S.H., Bonnema S.J., et al. Improving a newly developed patient-reported outcome for thyroid patients, using cognitive interviewing. Qual Life Res. 2008; 17: 1009–17.
• Weng L.J. Impact of the number of response categories and anchor labels on coefficient alpha and test-retest reliability. Educ Psychol Meas. 2004; 64: 956–72.
• Willis G.B., Artino A.R. What do our respondents think we’re asking? Using cognitive interviewing to improve medical education surveys. J Grad Med Educ. 2013; 5 (3): 353–6.
• Willis G.B. Cognitive interviewing: a tool for improving questionnaire design. Thousand Oaks, CA: Sage, 2005.

Источник

РУКОВОДСТВО AMEE № 87. РАЗРАБОТКА АНКЕТ ДЛЯ НАУЧНЫХ ИССЛЕДОВАНИЙ В ОБЛАСТИ МЕДИЦИНСКОГО ОБРАЗОВАНИЯ*

Артино-мл. Э.Р.1, Ля Рошель Д.С.1, Дези К. Дж.1, Гельбах Г.:

1 Военно-медицинский университет (США)

2 Гарвардская высшая школа образования (США)

Перевод с английского под ред. А.Ю. Алексеевой

Это руководство AMEE посвящено разработке и созданию опросных листов для самостоятельного заполнения, обычно называемых анкетами. Анкеты широко используются при проведении научных исследований в области медицинского образования. К сожалению, методики разработки таких анкет различаются по качеству, в этой области отсутствуют согласованные строгие стандарты. Поэтому качество анкет, используемых при проведении научных исследований в области медицинского образования, существенно различается. Для решения этой проблемы в настоящем Руководстве AMEE представлена системная 7-этапная методика разработки высококачественных опросных листов с особым акцентом на создание шкал опроса. Эти 7 этапов охватывают не все аспекты разработки опросов и не являются единственным способом создания высококачественной анкеты. Напротив, они сочетают в себе несколько методик и позволяют создать на их основе согласованный процесс для разработчиков анкет всех уровней. Систематическое выполнение каждого из этих шагов повысит вероятность того, что создатели опроса будут измерять именно то, что они хотят измерить.

AMEE GUIDE # 87. DEVELOPING QUESTIONNAIRES FOR EDUCATIONAL RESEARCH

Artino Jr.A.R.1, La Rochelle J.S.1, Dezee K.J.1, Gehlbach H.2

1 Uniformed Services University of the Health Sciences, USA

2 Harvard Graduate School of Education, USA

In this AMEE Guide, we consider the design and development of self-administered surveys, commonly called questionnaires. Questionnaires are widely employed in medical education research. Unfortunately, the processes used to develop such questionnaires vary in quality and lack consistent, rigorous standards. Consequently, the quality of the questionnaires used in medical education research is highly variable. To address this problem, this AMEE Guide presents a systematic, seven-step process for designing high-quality questionnaires, with particular emphasis on developing survey scales. These seven steps do not address all aspects of survey design, nor do they represent the only way to develop a high-quality questionnaire. Instead, these steps synthesize multiple survey design techniques and organize them into a cohesive process for questionnaire developers of all levels. Addressing each of these steps systematically will improve the probabilities that survey designers will accurately measure what they intend to measure. Artino Jr. A.R., La Rochelle J.S., Dezee K.J., Gehlbach H. Developing questionnaires for educational research: AMEE Guide No. 87. 2014; 36:6, 463-74.

DOI: 10.3109/0142159X2014.889814.

* Это руководство было опубликовано в журнале «Medical Teacher»: Artino Jr. A.R., La Rochelle J.S., Dezee K.J., Gehlbach H. Developing questionnaires for educational research: AMEE Guide No. 87. 2014; 36: 6, 463-74. DOI: 10.3109/0142159X.2014.889814

ВВЕДЕНИЕ

Использование анкет

при проведении научных исследований

в области медицинского образования

В области медицинского образования опросы используются повсеместно. Примерами могут служить широко распространенная оценка медицинских курсов и медицинской практики студентами, а также опросы удовлетворенности пациентов и исследования самооценки студентов. Кроме того, инструменты опроса широко используются при проведении научных исследований в области медицинского образования. В нашем недавнем обзоре оригинальных исследовательских статей, опубликованных в журнале «Medical Teacher»

в 2011 и 2012 гг., мы обнаружили, что 37 (24%) статей включали в себя опросы как часть исследования. Точно так же опросы обычно используются при проведении исследований в области высшего медицинского образования. По данным за тот же двухлетний период (2011-2012 гг.), опросы были включены в 75% исследовательских статей, опубликованных в журнале «Journal of Graduate Medical Education» («Журнал высшего медицинского образования»).

Практические аспекты

■ Анкетирование широко применяется при проведении научных исследований в области медицинского образования, но методики разработки таких анкет различаются по качеству, в этой области отсутствуют согласованные строгие стандарты.

■ В этом руководстве АМЕЕ представлен систематический 7-этапный процесс создания высококачественных опросных шкал, пригодных для исследовательских целей и оценки программ.

■ Процесс объединяет в единое целое несколько методик, используемых разработчиками опросов.

■ Процесс разработки опроса, описанный в настоящем руководстве, включает следующие 7 этапов: 1) проведение обзора литературы; 2) проведение интервью и/или фокус-групп; 3) синтез данных, полученных при проведении обзора литературы и интервью/фокус-групп; 4) разработка вопросов; 5) сбор обратной связи по вопросам с помощью экспертной проверки; 6) проведение когнитивных интервью, чтобы убедиться в правильном понимании вопросов респондентами; 7) проведение пробного анкетирования («пилотирование»).

■ Этот 7-этапный процесс разработки опросов отличается от ранее описанных процессов тем, что он сочетает в себе данные, полученные от других экспертов в данной области, а также от потенциальных участников. Кроме того, в этом процессе основное внимание уделяется задаче обеспечения точности собираемых данных путем тщательной разработки вопросов.

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

без соблюдения строгих методологий или «надлежащей практики» в этой области. В итоге надежность оценок, полученных в результате опросов, часто оказывается недостаточной, равно как и обоснованность предлагаемой интерпретации и использования этих оценок. Другими словами, когда опросы плохо разработаны, из-за различных типов ошибок измерения они могут не уловить суть того, что разработчик опроса пытается измерить. Например, плохая формулировка вопросов, их запутанная структура и неадекватные варианты ответов — все это может повлиять на надежность и достоверность собранных данных, что крайне затрудняет получение полезных выводов (Sullivan, 2011). Имея в виду указанные проблемы, в этом руководстве AMEE мы поставили цель описать систематический процесс разработки, который будет способствовать созданию надежных и валидных инструментов опроса, используемых в медицинском образовании и исследованиях. Таким образом, мы надеемся предоставить медицинским педагогам практическое руководство по повышению качества опросов, которые они разрабатывают для оценки и исследовательских целей.

СИСТЕМАТИЧЕСКИЙ 7-ЭТАПНЫЙ ПРОЦЕСС РАЗРАБОТКИ ШКАЛЫ ОПРОСА

заполнения, которые часто называют анкетами. Для большинства анкет главная цель состоит в том, чтобы разработать набор вопросов, которые каждый респондент будет интерпретировать одинаково, на которые каждый респондент будет отвечать точно, при которых респондент будет иметь желание и мотивацию отвечать. 7 этапов, представленных в табл. 1 и описанных ниже, не охватывают всех аспектов разработки опроса и не являются единственным способом разработки высококачественной анкеты. Скорее, эти этапы объединяют и сочетают в себе множество методов разработки опросов, существующих в социальных науках, и они могут направлять разработчиков на пути их создания. Систематическое выполнение каждого этапа позволит оптимизировать качество анкет в области медицинского образования и повысить шансы на сбор высококачественных данных.

Анкеты хорошо подходят для сбора данных об абстрактных идеях или концепциях, которые иначе трудно поддаются количественной оценке, таких как мнения, установки и убеждения. Кроме того, анкеты могут быть полезны для сбора информации о поведении, которое не может наблюдаться непосредственно (например, учеба дома), при условии,что респонденты готовы и способны сообщать об этом поведении. Однако прежде чем создавать анкету, необходимо сначала понять, является ли опрос лучшим методом для решения поставленной в исследовании задачи или изучаемого конструкта. Конструкт — это модель, идея или теория, которую исследователь пытается оценить. В медицинском образовании многие конструкты, представляющие интерес, нельзя наблюдать непосредственно: удовлетворенность студентов новым учебным планом, оценка пациентами

своего физического дискомфорта и т.д. Поскольку документирование этих явлений требует измерения восприятия людей, анкеты часто являются наиболее прагматичным подходом к оценке конструктов.

В медицинском образовании многие конструкты хорошо подходят для оценки с помощью анкет. Однако, поскольку психологические, не поддающиеся наблюдению конструкты, такие как мотивация преподавателя, уверенность врача и удовлетворенность обучающихся, не имеют общепринятой системы показателей, их трудно измерить с помощью одного вопроса анкеты. Другими словами, существует практически всеобщее согласие в отношении единиц и метода измерения некоторых конструктов, таких как вес или расстояние, и поэтому одного измерения может быть достаточно. Однако для более точного измерения не поддающихся наблюдению психологических конструктов часто требуются шкалы. Измерительные шкалы представляют собой группы сходных вопросов в анкете, предназначенной для оценки одного и того же базового конструкта (DeVeUis, 2003). Хотя шкалы сложнее разрабатывать и для этого требуется больше времени, они дают исследователям много преимуществ. В частности, шкалы позволяют более полно, точно и последовательно оценить лежащий в их основе конструкт (McIver, Carmines, 1981). Таким образом, шкалы широко используются во многих областях, включая медицинское образование, психологию и политологию. В качестве примера рассмотрим исследователя вопросов медицинского образования, интересующегося оценкой удовлетворенности студентов-медиков. Один из методов состоит в том, чтобы просто задать один вопрос об удовлетворенности (например, насколько вы были удовлетворены учебой на

медицинском факультете?). Однако более эффективный метод состоит в том, чтобы задать ряд вопросов, призванных охватить различные аспекты конструкта удовлетворенности (например, насколько вы были удовлетворены средствами обучения, насколько эффективны были ваши преподаватели и насколько простым был процесс планирования?). Используя этот подход, можно рассчитать средний балл по всем вопросам определенной шкалы и использовать его в исследовании.

ЭТАП I. ПРОВЕДЕНИЕ ОБЗОРА ЛИТЕРАТУРЫ

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

Таблица 1. 7-этапный процесс разработки измерительных шкал опроса для исследователей вопросов медицинского образования

Этап Цель

1. Проведение обзора литературы Позволяет согласовать определение конструкта с соответствующей теорией и предыдущими исследованиями, а также определить, какие измерительные шкалы или вопросы можно использовать или адаптировать для текущей цели

2. Проведение интервью и/или фокус-групп Позволяет узнать, как изучаемая популяция концептуализирует и описывает представляющий интерес конструкт

3. Синтез данных, полученных при проведении обзора литературы и интервью/фокус-групп Позволяет придать концептуализации конструкта теоретическое значение для ученых в данной области и при этом использовать язык, понятный изучаемой популяции

4. Разработка вопросов Вопросы должны быть четкими, понятными и написанными в соответствии с современной передовой практикой разработки опросов

5. Проведение экспертной валидации Позволяет оценить, насколько ясны вопросы и насколько они соответствуют представляющему интерес конструкту

6. Проведение когнитивных интервью Позволяет убедиться, что респонденты интерпретируют вопросы так, как это задумано разработчиком опроса

7. Проведение пробного анкетирования («пилотирование») Позволяет проверить вариантность вопроса, достоверность полученных данных и конвергентную/дискриминантную валидность по отношению к другим оценкам

Адаптировано с разрешения Липпинкотта Уильямса (Lippincott Williams) и Уилкинса/Уолтерса (Wilkins/Wolters). Kluwer Health: Gehlbach H, Artino A.R. Jr., Durning S. AM last page: survey development guidance for medical education researchers. Acad Med. 2010; 85 (5): 925.

(на среднезернистом конце спектра) или овладении клиническими навыками, необходимыми для преподаваемой медицинской дисциплины (на крупнозернистом конце спектра).

чинать с нуля. В этом случае обычно достаточно обратиться к авторам с просьбой адаптировать их анкету. Однако важно отметить, что термин «ранее валидированный опросник» является неправильным. Валид-ность оценок, полученных на основе определенного опросника или шкалы опроса, зависит, помимо прочего, от целевой группы населения, местной специфики и предполагаемого использования оценок шкалы. Таким образом, разработчики опросов собирают доказательства надежности и валидности своих измерительных шкал в определенном контексте, с определенной выборкой и для определенной цели.

Как описано в Стандартах образовательного и психологического тестирования (Standards for Educational and Psychological Testing), под валидностью подразумевается степень, с которой предполагаемое использование оценки поддерживается фактическими данными и теорией (AERA, APA & NCME, 1999). Процесс валидации является наиболее фундаментальным фактором при разработке и оценке инструмента измерения, и этот процесс включает в себя накопление доказательств во времени, в разных условиях и выборках для построения научно обоснованной аргументации валидности. Таким образом, установление валидности — это непрерывный процесс сбора доказательств (Kane, 2006). Кроме того, важно признать, что надежность и валидность — это свойства не опроса как инструмента, а оценки опроса и их интерпретации (AERA, APA & NCME, 1999). Например, опрос об удовлетворенности обучающихся может быть уместен для оценки аспектов благополучия студентов, но такой опрос не будет подходить для отбора лучших студентов-медиков. В этом примере опросный лист не претерпел изменений, изменилась только интерпретация оценок (Cook, Beckman, 2006).

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

а затем на предмет возможности применения к целевой аудитории преподавателя. Если разработчики опросов найдут шкалы, которые точно соответствуют их конструкту, специфике и предполагаемому использованию, они могут использовать такие шкалы, внеся в них лишь незначительные изменения. В некоторых случаях сами вопросы могут быть плохо сформулированы, но их содержание может быть полезным для составления новых вопросов (Gehlbach, Brinkworth, 2011). Делать такие выводы будет тем легче, чем больше разработчик опроса знает о конструкте (посредством обзора литературы) и передовой практике составления вопросов (как описано в IV этапе).

ЭТАП II. ПРОВЕДЕНИЕ ИНТЕРВЬЮ И/ИЛИ ФОКУС-ГРУППЫ

оказывается неприемлемой для пациентов (например, слишком дорогая). В этом случае врач и пациент должны разработать новый план, приемлемый для обоих. Если бы точка зрения пациента была рассмотрена раньше, первоначальный план, вероятно, был бы более эффективным. Многие врачи также испытывали трудности при лечении пациента, и только после того, как коллега переосмыслил проблему, был выработан более эффективный метод лечения. Конструкт не исключение. Исследователь, разрабатывающий опросник, как и врач, лечащий пациента, много думал над определением конструкта. Однако исследователь неизбежно привносит в это определение свои взгляды и предубеждения, а язык, используемый в литературе, может быть техническим и трудным для понимания. Таким образом, необходимо учитывать другие точки зрения. Самое главное, как целевая популяция (пациент из предыдущего примера) концептуализирует и понимает конструкт? Как и в случае с пациентом, другие точки зрения иногда имеют решающее значение для успеха проекта. Например, изучая литературу об удовлетворенности студентов медицинскими учебными заведениями, исследователь может не найти упоминаний об учебной практике предоставления студентам видео- или аудиозаписей лекций (так как эта практика является довольно новой). Однако в беседе со студентами исследователь может обнаружить, что современные студенты привыкли к подобной практике и учитывают ее при формировании своего мнения о преподавании в медицинском учебном заведении.

подхода, этот этап должен быть направлен на достижение двух основных целей. Во-первых, исследователям нужно услышать, как участники говорят о конструкте своими словами, без подсказок или с незначительными подсказками со стороны исследователя. После сбора произвольной информации от участников разработчики опроса могут затем задать более целенаправленные вопросы, чтобы оценить, согласны ли респонденты с тем, как конструкт был охарактеризован в литературе. Эту процедуру следует повторять до тех пор, пока не будет достигнут порог насыщения, когда исследователь больше не получает новой информации о том, как потенциальные респонденты концептуализируют конструкт. Конечный результат интервью и/или фокус-группы должен состоять в подробном описании того, как потенциальные респонденты концептуализируют и понимают конструкт. Затем эти данные будут использоваться на III и IV этапах.

ЭТАП III. СИНТЕЗ ДАННЫХ, ПОЛУЧЕННЫХ ПРИ ПРОВЕДЕНИИ ОБЗОРА ЛИТЕРАТУРЫ И ИНТЕРВЬЮ/ФОКУС-ГРУПП

На этом этапе определение конструкта уже сформулировано медицинским преподавателем, разрабатывающим анкету, проводящим обзор литературы и составляющим портрет целевой аудитории. На III этапе осуществляется согласование этих определений. Поскольку определение конструкта задает направление всех последующих этапов (например, разработку вопросов), разработчик проекта должен приложить все усилия, чтобы выполнить этот этап должным образом.

Одним из эффективных способов выполнения III этапа является разработка всеобъемлющего списка показателей для

конструкта путем объединения результатов обзора литературы и интервью/фокус-групп ^еЫЬасЬ, Впп1^ог1Ь, 2011). Когда в этих источниках данных фигурируют аналогичные списки, процесс не представляет сложности. Когда эти данные концептуально схожи, но литература и потенциальные респонденты описывают конструкт с использованием разной терминологии, имеет смысл использовать лексику потенциальных респондентов. Например, при оценке уверенности преподавателя (иногда называемой самоэффективностью преподавателя), вероятно, более уместно спрашивать преподавателей об их «уверенности в апробации новых методов обучения», чем об их «эффективности в экспериментировании с новыми педагогическими методами» (ЭеЫЬасЬ е1 а1., 2010). Наконец, если какой-либо показатель присутствует в одном источнике и отсутствует в другом, большинство разработчиков анкет захотят включить такой вопрос, по крайней мере на начальном этапе. На последующих этапах разработчики будут иметь возможность определить с помощью экспертных оценок (этап IV) и когнитивных интервью (этап VI), по-прежнему ли предложенные вопросы подходят для исследования конструкта. Каким бы ни был метод, используемый для консолидации данных на I и II этапах, окончательное определение и перечень показателей должны быть всеобъемлющими, отражающими как литературу, так и мнения целевой аудитории.

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

приятия, описанного в предыдущих работах? Применяется ли новая теория образования? Какова бы ни была причина, это обоснование будет необходимо для публикации опросника. Наличие четкого определения конструкта с объяснением того, чем он отличается от других версий конструкта, поможет коллегам и исследователям решить, как лучше использовать опросник как в сравнении с предыдущими исследованиями, так и с развитием новых областей научных исследований.

ЭТАП IV. РАЗРАБОТКА ВОПРОСОВ

Цель этого этапа состоит в том, чтобы составить анкетные вопросы, верно отражающие изучаемый конструкт на языке, который респонденты могут легко понять. Одним из важных аспектов разработки анкеты является количество вопросов, необходимых для адекватной оценки конструкта. Простого ответа здесь нет. Идеальное количество вопросов зависит от нескольких факторов, включая сложность конструкта и уровень, на котором предполагается его оценить (т.е. размер зерна). В целом хорошей практикой является разработка большего количества вопросов,чем в конечном итоге потребуется в окончательной шкале (например, разработка 15 потенциальных вопросов с надеждой в конечном итоге создать шкалу из восьми вопросов), так как некоторые вопросы, скорее всего, будут удалены или пересмотрены позже в процессе разработки анкеты (Gehlbach, Brinkworth, 2011). В конечном счете решение о количестве вопросов — это дело профессионального суждения, но для большинства узко определенных конструктов шкалы, содержащие от 6 до 10 вопросов, обычно достаточны, чтобы верно уловить суть рассматриваемого явления.

Следующая задача состоит в том, чтобы сформулировать ясные,недвусмысленные вопросы, используя лексику целевой популяции. Хотя некоторые аспекты составления вопросов остаются формой искусства, этот процесс должен основываться на все более и более прочном научном фундаменте и накопленном передовом опыте. Например, использование вопросов, а не утверждений, избегание негативных и предвзятых формулировок, приведение сути вопроса в соответствие с ответами и использование ответов, подчеркивающих измеряемый конструкт, вместо ответов на вопросы о согласии/несогласии с утверждением в целом (Artino et al., 2011) — все это передовые методы, подтвержденные документальными доказательствами. Хотя некоторые исследователи вопросов медицинского образования могут рассматривать эти принципы как проявление здравого смысла, опыт говорит нам, что передовые методы зачастую не соблюдаются.

Другой важной частью процесса разработки опросника является выбор вариантов ответов, которые будут использоваться для каждого пункта. Закрытые

вопросы могут иметь неупорядоченные (номинальные) варианты ответов, которые не имеют естественного порядка, или упорядоченные (порядковые) варианты ответов. Кроме того, в анкете может быть вопрос на ранжирование(например, «оцените следующие элементы, где 1 — лучший и 6 — худший») или задание на ранжирование, где необходимо выбрать ответ по шкале Лайкерта. Хотя обзор всех доступных вариантов ответов выходит за рамки настоящего руководства АМЕЕ, разработчикам опросников рекомендуется адаптировать эти варианты к конструктам, которые они пытаются оценить (и ознакомиться с одной из многих замечательных работ по этой теме, например йШтап е1 а1., 2009; МсОоасЬ е1 а1., 2013). Чтобы помочь читателям понять некоторые часто игнорируемые передовые методы, в табл. 2 и на рисунке мы привели несколько распространенных ошибок, которые разработчики совершают при составлении и оформлении своих вариантов ответов. Шкалы ответов Лайкерта в настоящее время являются наиболее популярным способом сбора ответов при анкетировании, в значительной степени благодаря простоте использования и адаптируемости для измерения множества различных конструктов (МсОоасЬ е1 а1., 2013). В табл. 3 приводится несколько примеров 5- и 7-балльных шкал ответов, которые могут использоваться при разработке инструментов опроса на основе шкалы Лайкерта.

в Стандартах образовательного и психологического тестирования (Standards for Educational and Psychological Testing) как доказательства, основанные на следующем: 1) содержание; 2) процесс предоставления ответов; 3) внутренняя структура; 4) отношения с другими переменными и 5) последствия (AERA, APA & NCME, 1999). Следующие 3 этапа процесса разработки опроса хорошо вписываются в указанную классификацию и описаны ниже.

ЭТАП V. ПРОВЕДЕНИЕ ЭКСПЕРТНОЙ ВАЛИДАЦИИ

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

критерии для определения квалификации эксперта. Эти критерии часто основываются на опыте или знании измеряемого конструкта, но на практике они также зависят от готовности и доступности отдельных специалистов, которых привлекают к участию в разработке опроса (McKenzie et al., 1999). Одним из эффективных методов поиска экспертов является подбор авторов из библиографических списков статей, просматриваемых в ходе поиска литературы. В литературе нет единого мнения относительно количества экспертов, которое следует использовать для проведения содержательной валидации. Однако количество привлеченных экспертов будет оказывать влияние на многие количественные методы, используемые для анализа полученных от экспертов данных. Рубио (Rubio et al., 2003)рекомендует использовать 6-10 экспертов, признавая при этом, что большее число экспертов (до 20) позволит сформировать более четкий консенсус относительно оцениваемого конструкта, а также качества и релевантности предлагаемых пунктов шкалы.

медику может быть очень трудно ответить положительно на вопрос об уверенности в себе: «Насколько вы уверены, что можете получить 100% на экзамене по анатомии?», но этому же студенту может быть легче дать твердый положительный ответ на вопрос: «Насколько вы уверены, что можете сдать экзамен по анатомии?». В общем, разработчики анкет должны стремиться к тому, чтобы иметь в своем распоряжении целый ряд вопросов различной сложности (Tourangeau et al., 2000).

Существует множество методов анализа количественных данных, собранных в форме экспертной валидации, но вне зависимости от используемого метода критерий приемлемости того или иного вопроса или шкалы следует определить заранее (Beck, Gable, 2001). Общими параметрами, используемыми для принятия решений о включении и исключении отдельных вопросов, являются коэффициент содержательной валид-ности, индекс содержательной валидности и индекс факториальной валидности. Подробнее о том, как рассчитать и интерпретировать эти показатели, см. в работах McKenzie et al. (1999) и Rubio et al. (2003). (Пример формы содержательной валидации см. в работе Gehlbach, Brinkworth, 2011.)

Существует множество способов анализа содержательной валидности нового опроса с помощью экспертной валидации. Оптимальный подход должен быть направлен на различные области, в которых исследователи испытывают наибольшие опасения по поводу шкалы (релевантности, ясности и т.д.) для каждого отдельного элемента и для каждого набора элементов или каждой шкалы. Количественные данные в сочетании с качественными данными экспертов призваны повысить содержательную валид-ность нового опросника или измерительной шкалы и в конечном счете эффективность инструмента опроса в целом.

ЭТАП VI. ПРОВЕДЕНИЕ КОГНИТИВНЫХ ИНТЕРВЬЮ

После того как эксперты помогли уточнить элементы шкалы, важно собрать доказательства валидности процесса предоставления ответов, чтобы оценить, как потенциальные участники интерпретируют ваши элементы и пункты ответов (AERA, APA & NCME 1999). Одним из способов сбора таких доказательств является процесс, из-

вестный под названием «когнитивное интервью» или «когнитивное предварительное тестирование» (Willis, 2005). Подобно тому как эксперты используются для определения содержательной валидности нового опроса, не менее важно определить, как потенциальные респонденты интерпретируют вопросы, и соответствует ли их интерпретация тому, что имеет в виду разработчик анкеты (Willis, 2005; Karabenick et al., 2007). Результаты когнитивных интервью могут быть полезны для выявления ошибок, которые респонденты допускают в своей интерпретации вопроса или вариантов ответа (Napoles-Springer et al., 2006; Karabenick et al., 2007). Как качественный метод, анализ опирается не на статистические проверки цифровых данных, а на кодирование и интерпретацию письменных заметок, сделанных в ходе проведения интервью. Таким образом, размеры выборки, используемой для когнитивного интервьюирования, обычно невелики и могут включать всего 10-30 участников (Willis, Artino, 2013). Для небольших исследовательских проектов в области медицинского образования может быть достаточно всего 5-6 участников, если разработчик опроса способен выявить потенциальную предвзятость в очень небольших выборках (Willis, Artino, 2013).

-и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ж о ш о 1э

о >

00 VJ

■о

ш а

8.S

ü tu

BJ I

2J3

л> ^ 1э а

¡S

I £

О I

о s

О Я

OiQ ■а = ш® ив о о ш ш ш tu

> «О

«О о Е

CD Ь 0″ 1=1

1=1

<т> 10

П>’

ь 0″

СП

Таблица 2. Передовые методы составления вопросов на основе научных данных, полученных в ходе исследования методов разработки анкет

Ошибка Пример(ы) вопросов В чем проблема Решение Пример(ы) вопросов Литература

Формулирование двупроб-лемного вопроса — Как часто вы обращаетесь за помощью к медицинским сестрам и административному персоналу, если сталкиваетесь с какой-либо проблемой? Респондентам трудно ответить на пункты анкеты, содержащие несколько вопросов (на которые, следовательно, можно дать несколько ответов). В этом примере респондент может часто обращаться за помощью к медицинским сестрам и гораздо реже обращаться к административному персоналу. Если бы это было так, респонденту было бы затруднительно ответить на этот вопрос. Один вопрос должен выражать одну мысль Если один пункт содержит несколько вопросов/идей, следует либо (1) разработать несколько пунктов для каждого вопроса, который представляется важным, либо (2) включить только один наиболее важный вопрос. Будьте особенно осторожны с союзами в вопросах — Как часто вы обращаетесь за помощью к медицинским сестрам,если сталкиваетесь с какой-либо проблемой? — Как часто вы обращаетесь за помощью к административному персоналу, если сталкиваетесь с какой-либо проблемой? Tourangeau et al., 2000; Dillman et al., 2009

Использование в вопросах отрицательной лексики — Сколько раз в среднем за неделю у вас не получается начать занятия вовремя? — Старший ординатор не должен нести ответственность за отказ пациентам в приеме Отрицательная лексика затрудняет понимание вопроса респондентами и предоставление точного ответа. Двойное отрицание представляет особую сложность и повышает погрешность измерения. Если респонденту приходится отвечать «да» в значении «нет» (или «согласен» для выражения несогласия), вопрос поставлен некорректно Убедитесь, что ответ «да» означает «да» и «нет» означает «нет». Как правило, это означает, что вопрос должен формулироваться в положительной тональности — Сколько раз в среднем за неделю вы начинаете занятия вовремя? — Следует ли старшему ординатору нести ответственность за прием пациентов? Dillman et al., 2009

Использование утверждений вместо вопросов Уверен, что смогу хорошо успевать по этому предмету. Совсем неверно. Не совсем верно. В некоторой степени верно. В основном верно. Абсолютно верно Опрос — это диалог между исследователем и респондентами. Чтобы понять смысл пунктов опроса, респонденты полагаются на «подразумеваемые предположения, которые управляют разговором в повседневной жизни» (Schwarz, 1999). Очень редко люди ранжируют утверждения в обычных разговорах Формулируйте пункты анкеты в виде вопросов. Вопросы носят более живой и непосредственный характер, мозг легче их обработает. Люди имеют больше опыта в ответах на вопросы Насколько вы уверены, что сможете хорошо успевать по этому предмету? Совсем не уверен. Не совсем уверен. В меру уверен. Вполне уверен. Совершенно уверен Krosnick, 1999; Schwarz, 1999; Tourangeau, et al. 2000; Dillman et al., 2009

Окончание табл. 2

Ошибка Пример(ы) вопросов В чем проблема Решение Пример(ы) вопросов Литература

Использование Высокая стоимость Ответы на вопросы о согласии/ Используйте Насколько Krosnick,

ответов на медицинских услуг несогласии не подчеркивают специфические большое значение 1999;

вопросы в настоящее время измеряемый конструкт и скорее ответы, в настоящее время Tourangeau

о согласии/ является самой побуждают выражать молчаливое подчеркивающие имеет проблема et al., 2000;

несогласии важной проблемой согласие (т.е. имеют тенденцию изучаемый высокой стоимости Dillman et

в Америке. побуждать к одобрению любого конструкт. медицинских услуг al., 2009

Совершенно утверждения, сделанного в пункте, Это позволяет в Америке?

не согласен. независимо от его содержания). уменьшить Абсолютно

Не согласен. Кроме того, предоставление выражение небольшое.

Где-то посередине. вариантов ответов на вопросы молчаливого Не совсем большое.

Согласен. о согласии/несогласии могут согласия В меру большое.

Абсолютно побудить респондентов менее и удерживает Довольно большое.

согласен тщательно продумывать свои внимание Чрезвычайно

ответы при заполнении анкеты респондентов на большое

рассматриваемом

конструкте,

что снижает

погрешность

измерения

Ответов Насколько Количество ответов влияет на Для получения Насколько Weng, 2004

слишком полезным было надежность набора вопросов. стабильных полезным было

мало для вас обучение Слишком маленькое количество ответов участников для вас обучение

или слишком в медицинском ответов снижает надежность используйте в медицинском

много учебном заведении опроса в целом. Однако 5 ответов и более. учебном заведении

с точки зрения существует точка уменьшения В большинстве с точки зрения

принятия отдачи, за пределами которой случаев принятия

клинических увеличение количества ответов не использование клинических

решений? повышает надежность опроса более 7-9 ответов решений?

Абсолютно вряд ли будет Абсолютно

бесполезно. иметь смысл для бесполезно.

В некоторой большинства Не очень полезно.

степени полезно. респондентов и не В меру полезно.

Очень полезно повысит надежность Довольно полезно.

опроса Чрезвычайно

полезно

Адаптировано с разрешения Липпинкотта Уильямса (Lippincott Williams) и Уилкинса/Уолтерса (Wilkins/Wolters). Kluwer Health: Artino A.R. Jr., Gehlbach H., Durning S.J. AM last page: Avoiding five common pitfalls of survey design. Acad Med. 2011; 86 (10): 1327.

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

Литература

1. Обозначение только конечных точек вариантов ответа

Обозначьте в словесной форме все Юч^-тюК,

варианты ответа 1999

Обозначение только конечных точек оставляет значение необозначенных вариантов открытым для интерпретации респондентами. Различные респонденты могут по-разному интерпретировать необозначенные варианты. Эта неопределенность увеличивает погрешность измерения.

Некорректный вопрос:

Насколько интересным вы считаете этот курс по клиническому мышлению?

• Совершенно неинтересным.

• Чрезвычайно интересным

Обозначение каждого варианта ответа повышает согласованность концептуального интервала между вариантами ответа и увеличивает вероятность того, что все респонденты будут интерпретировать варианты ответа одинаково. Кроме того, варианты ответа имеют сопоставимый визуальный вес, поэтому взгляд респондентов не притягивается к определенным вариантам.

Скорректированный вопрос:

Насколько интересным вы считаете этот курс по клиническому мышлению?

• Совершенно неинтересным.

• Не совсем интересным.

• В меру интересным.

• Довольно интересным.

• Чрезвычайно интересным

2. Обозначение вариантов ответа одновременно цифрами и словами

Из-за дополнительной информации, которую респонденты должны обработать, включая цифровые и словесные обозначения, увеличивается время ответа. Подразумеваемое значение отрицательных чисел может создавать особую путаницу и приводить к лишним ошибкам. Например, в приведенном ниже вопросе узнать «немного» кажется несовместимым с количеством «-1».

Некорректный вопрос:

Как много вы узнали на сегодняшнем

семинаре?

• -2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

почти ничего • -1

немного • 0

кое-что • 1

достаточно • 2

очень много

Используйте только словесные обозначения

Всегда пользуйтесь только словесными обозначениями для всех вариантов ответа. Это уменьшит когнитивную нагрузку ваших респондентов и, скорее всего, уменьшит погрешность измерения. Скорректированный вопрос: Как много вы узнали на сегодняшнем семинаре?

• Почти ничего

• Немного

• Кое-что

• Достаточно

• Очень много

С1″1^ап в! а1., 2009; Krosnick, 1999

Ошибка

Ошибка Решение Литература

3. Неравномерное расстояние между Поддерживайте равное расстояние Dillman

вариантами ответа между вариантами ответа et al., 2009

Визуальное расстояние между Поддержание равного расстояния

вариантами ответа может привлечь между вариантами ответа укрепит

респондентов к одним вариантам представление о том, что концептуально

и отвлечь от других, что, в свою существует равное пространство или

очередь, может заставить их выбирать «расстояние» между всеми вариантами

одни варианты чаще. Кроме того, ответа. В результате ответы будут менее

неравномерное расстояние между предвзятыми, что уменьшит погрешность

вариантами ответа может сместить измерения.

визуальную среднюю точку шкалы.

Скорректированный вопрос:

Некорректный вопрос:

Много ли вы узнали от своих коллег на этом

Много ли вы узнали от своих коллег на курсе?

этом курсе? • Почти ничего

• Почти ничего • Немного

• Немного • Кое-что

• Кое-что • Достаточно

• Достаточно • Очень много

• Очень много

4. Размещение второстепенных Используйте дополнительный Dillman

вариантов ответа вместе с основными интервал, чтобы визуально отделить et al., 2009

вариантами ответа второстепенные варианты ответа от

основных вариантов

Размещение второстепенных вариантов

ответа, таких как «не знаю», «нет Использование дополнительного интервала,

мнения» или «неприменимо», вместе чтобы визуально отделить второстепенные

с основными вариантами может сместить варианты ответа от основных вариантов.

визуальную и концептуальную среднюю Вариантами можно сместить визуальную

точку шкалы ответов, тем самым искажая и концептуальную среднюю точку шкалы

результаты. ответов, тем самым уменьшая погрешность

измерения. Эта рекомендация — полезное

Некорректный вопрос: исключение из приведенного выше правила

о поддержании

Насколько вы удовлетворены качеством равного интервала между вариантами

библиотечного обслуживания? ответов.

• Совершенно не удовлетворен

• Не очень удовлетворен Скорректированный вопрос:

• В меру удовлетворен

• Вполне удовлетворен Насколько вы удовлетворены качеством

• Чрезвычайно удовлетворен библиотечного обслуживания?

• Неприменимо • Совершенно не удовлетворен

• Не очень удовлетворен

• В меру удовлетворен

• Вполне удовлетворен

• Чрезвычайно удовлетворен

• Неприменимо

Передовые методы создания визуального дизайна на основе научных данных, полученных в ходе исследования методов разработки анкет

Адаптировано с разрешения Липпинкотта Уильямса (Lippincott Williams) и Уилкинса/Уолтерса (Wilkins/Wolters) Kluwer Health: Artino A.R., Gehlbach H. M last page: Avoiding four visualdesign pitfalls in survey development. Academic Medicine. 2012; 87: 1452.

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

Таблица 3. Примеры различных вариантов ответа по типу шкалы Лайкерта

Оцениваемый конструкт 5-балльные однополярные шкалы ответов 7-балльные биполярные шкалы ответов

Уверенность • Совсем не уверен. • Не совсем уверен. • В меру уверен. • Вполне уверен. • Совершенно уверен • Абсолютно не уверен. • В меру не уверен. • Немного не уверен. • Не имею определенного мнения (нейтрален). • Не совсем уверен. • В меру уверен. • Абсолютно уверен

Заинтересованность • Совершенно неинтересно. • Немного интересно. • В меру интересно. • Довольно интересно. • Чрезвычайно интересно • Очень интересно. • В меру интересно. • Немного интересно. • Не имею определенного мнения (нейтрален). • Немного интересно. • В меру интересно. • Очень интересно

Усилие • Почти без усилий. • Немного усилий. • Некоторое усилие. • Довольно много усилий. • Огромные усилия

Важность • Неважно. • Не очень важно. • В меру важно. • Довольно важно. • Существенно.

Удовлетворенность • Совершенно не удовлетворен. • Не очень удовлетворен. • В меру удовлетворен. • Вполне удовлетворен. • Чрезвычайно удовлетворен • Совершенно не удовлетворен. • В меру не удовлетворен. • Немного не удовлетворен. • Не имею определенного мнения (нейтрален). • Не очень удовлетворен. • В меру удовлетворен. • Совершенно удовлетворен

Частота • Почти никогда. • Время от времени. • Иногда. • Часто. • Почти всегда

любом этапе, когнитивное интервью следует разрабатывать и планировать так, чтобы все потенциальные проблемы были решены. Важным I этапом в процессе когнитивного интервью является создание критериев кодирования, отражающих предполагаемый

смысл каждого вопроса (КагаЬешск е1 а1., 2007), которые затем могут использоваться для интерпретации ответов, собранных в ходе когнитивного интервью.

Двумя основными методами проведения когнитивного интервью являются техника

«думай вслух» и вербальное зондирование. Техника «думай вслух» требует от респондентов вербализации каждой мысли, которая приходит им в голову при ответе на каждый вопрос. В этом случае интервьюер просто поддерживает его действия, поощряя респондента продолжать говорить и записывать сказанное для последующего анализа (Willis, Artino, 2013). Этот метод может дать ценную информацию, но он, как правило, является неестественным и трудным для большинства респондентов, и это может привести к тому, что создатель опроса должен будет отбраковывать множество данных открытых ответов.

Дополнительная процедура — вербальное зондирование, — является более активной формой сбора данных, когда интервьюер задает серию зондирующих вопросов, предназначенных для получения конкретной информации (Willis, Artino, 2013) (список часто используемых вербальных зондов см. в табл. 4). Вербальное зондирование классически делится на параллельное и ретроспективное. При параллельном зондировании интервьюер задает респонденту конкретные вопросы о его мыслительных процессах, в то время как респондент отвечает на каждый вопрос. Параллельное зондирование, хотя и нарушает общий ход интервью, имеет то преимущество, что позволяет участникам отвечать на вопросы, пока их мысли свежи. Ретроспективное зондирование, с другой стороны, происходит после того, как участник завершил весь опрос (или часть опроса), и, как правило, в меньшей степени нарушает мыслительный процесс респондента, чем параллельное зондирование. Недостатком ретроспективного зондирования является риск смещения воспоминаний и ретроспективных эффектов (Drennan, 2003). Моди-

фикация двух методов вербального зондирования определяется как немедленное ретроспективное зондирование, которое позволяет интервьюеру найти естественные контрольные точки в опросе. Немедленное ретроспективное зондирование дает возможность интервьюеру провести исследование, не прерываясь между каждым пунктом (Watt et al., 2008). Этот подход имеет потенциальное преимущество, заключающееся в уменьшении предвзятости воспоминаний и ретроспективных эффектов при одновременном ограничении числа прерываний респондента со стороны интервьюера и снижении искусственности процесса. На практике во многих когнитивных интервью на самом деле используется комбинация методов «думай вслух» и вербального зондирования с целью более эффективного выявления потенциальных ошибок.

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

Таблица 4. Примеры широко используемых вербальных зондов

Вид вербального зонда Пример

Понимание/интерпретация «Что в вашем понимании означает термин «непрерывное медицинское образование»»?

Перефразирование «Вы могли бы переформулировать вопрос своими словами?»

Оценка уверенности «Насколько вы уверены в том, что прошли обучение по трем официальным образовательным программам?»

Воспоминание «Как вы помните, что прошли обучение по трем официальным образовательным программам?» «Как вы пришли к такому ответу?»

Конкретный вопрос «Почему вы говорите, что, по вашему мнению, важно, чтобы врачи получали непрерывное медицинское образование?»

Общий вопрос «Как вы пришли к такому ответу?» «Вам было легко или трудно ответить на этот вопрос?» «Я заметил вашу неуверенность. Скажите, о чем вы думали». «Расскажите об этом что-нибудь еще»

Адаптировано с разрешения журнала Journal of Graduate Medical Education: Willis G.B., Artino A.R. Jr. What do our respondents think we’re asking? Using cognitive interviewing to improve medical education surveys. J Grad Med Educ. 2013; 5: 353-6.

же к когнитивному интервью также может применяться качественный подход посредством анализа взаимодействия. Как правило, анализ взаимодействия пытается описать и объяснить способы, которыми люди интерпретируют ответы и взаимодействуют во время разговора, и этот метод может применяться в ходе когнитивного интервью для определения смысла ответов (№ро1ез-Брппдег е1 а1., 2006). Исследования показали, что сочетание кодирования и анализа взаимодействия может быть достаточно эффективным и предоставляет больше информации о «когнитивной валидности» нового опросника №аро1е8-Брппдег е1 а1., 2006).

опроса, всецело обусловливает валидность опроса и выводов, которые могут быть сделаны на основании полученных данных. В совокупности эти два аспекта критически важны для создания качественного опросника, и каждый аспект может быть решен с помощью хорошо продуманного когнитивного интервью. В конечном счете независимо от методов, используемых для проведения когнитивных интервью и анализа данных, собранная информация должна использоваться для изменения и улучшения анкеты в целом и отдельных элементов опроса.

ЭТАП VII. ПРОВЕДЕНИЕ ПРОБНОГО АНКЕТИРОВАНИЯ(«ПИЛОТИРОВАНИЕ»)

Несмотря на все усилия, предпринятые исследователями вопросов медицинского образования в ходе вышеупомянутого процесса разработки опроса, формулировка не-

которых элементов анкеты все еще может быть некорректной (Gehlbach, Brinkworth, 2011). Таким образом, следующим этапом являются пилотное тестирование опросника и продолжение сбора доказательств валидности. В основе двух наиболее распространенных подходов лежат его внутренняя структура и связи с другими переменными (AERA, APA & NCME, 1999). Во время пилотного тестирования участники целевой группы проходят опрос в заранее определенном формате (например, в онлайн- или бумажном формате). Затем данные, полученные в ходе пилотного теста, анализируются для оценки диапазона и вариантности вопросов, надежности всей шкалы и корреляций вопросов и суммарных баллов. На этом этапе разработчики опросов должны также изучить описательную статистику (например, средние значения и стандартные отклонения) и гистограммы, которые демонстрируют распределение ответов по вопросам. Этот анализ может помочь в выявлении элементов, которые могут функционировать не так, как предполагал разработчик.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с использованием процессов, описанных в этом исследовании), мы рекомендуем использовать методы подтверждающего факторного анализа. В то же время другие ученые утверждают, что при оценке новых шкал целесообразнее применять исследовательский факторный анализ (McCoach et al., 2013). Независимо от конкретного применяемого анализа исследователи должны знать, что методы факторного анализа зачастую плохо изучены и плохо реализуются. К счастью, литература изобилует многими полезными руководствами (см., например, Pett et al., 2003; McCoach et al., 2013).

Проведение анализа надежности — еще один важный шаг на этапе пилотного тестирования. Наиболее распространенный способ оценки надежности шкалы — вычисление коэффициента «альфа Кронбаха». Альфа Кронбаха — это мера внутренней согласованности оценок элементов (т.е. степень, в которой оценки отдельных элементов на шкале коррелируют друг с другом). Это функция корреляции между пунктами и общим количеством пунктов по определенной шкале. Важно отметить, что альфа Кронбаха не является хорошим показателем одномерности шкалы (измерение единого концепта), как часто предполагается (Schmitt, 1996). Таким образом, в большинстве случаев разработчики исследования должны сначала провести факторный анализ, чтобы оценить одномерность шкалы, а затем приступить к анализу надежности, чтобы оценить внутреннюю согласованность элементов шкалы (Schmitt, 1996).

Руководство AMEE № 87. Разработка анкет для научных исследований

в области медицинского образования

занное с этим повышение надежности внутренней согласованности следует соизмерять с чрезмерной нагрузкой респондентов и сопутствующими ошибками в ответах, которые могут возникнуть, когда опросники становятся слишком длинными и респонденты устают. Наконец, крайне важно признать, что надежность — необходимое, но недостаточное условие валидности (AERA, APA & NCME, 1999). Другими словами, для того, чтобы результаты опроса считались достоверными, они должны быть в первую очередь надежными. Однако надежные оценки не обязательно являются достоверными для данной цели.

После оценки одномерности и внутренней согласованности шкалы разработчики опросов часто формируют суммарные баллы для каждой шкалы. В зависимости от рассматриваемого вопроса исследования суммарные баллы могут затем использоваться в качестве независимых или зависимых переменных. При попытке оценить трудноизмеримые образовательные конструкты, такие как мотивация, уверенность и удовлетворенность, обычно имеет смысл создать суммарный балл для каждой шкалы опроса, чем использовать отдельные элементы опроса в качестве переменных (Sullivan, Artino, 2013). Суммарный балл -это просто средняя оценка (взвешенная или невзвешенная) всех элементов в пределах определенной шкалы. Использование средних оценок имеет несколько явных преимуществ по сравнению с суммированием элементов в рамках определенной шкалы или подшкалы. Во-первых, средние оценки обычно выводятся с использованием той же шкалы ответов, что и для отдельных элементов. Этот подход способствует прямой интерпретации средних оценок с точки зрения ответов. Во-вторых, использование

средних оценок позволяет понять, насколько велики (или малы) измеряемые различия на самом деле при сравнении отдельных лиц или групп. Как предупреждал Колливер и соавт. (Colliver et al., 2010), «суммы рейтинговых оценок отражают как рейтинговые оценки, так и количество элементов, что увеличивает различия между оценками и делает различия более важными, чем они есть» (стр. 591).

После создания суммарных баллов для каждой шкалы опроса полученные переменные могут быть изучены для определения их отношения к другим переменным, которые были собраны. Цель этого шага -определить, согласуются ли взаимосвязи переменных с теорией и предыдущими исследованиями. Так, например, можно было бы ожидать, что суммарные баллы по шкале, предназначенной для оценки уверенности обучающихся в своих навыках наложения швов, будут положительно коррелировать с количеством успешных выполненных процедур наложения швов (так как практика укрепляет уверенность) и отрицательно коррелировать с тревожностью, связанной с процедурой (так как более уверенные в себе обучающиеся также демонстрируют меньший уровень тревожности). Таким образом, разработчики опросов оценивают валидность созданных ими шкал с точки зрения их взаимосвязи с другими переменными (AERA, APA & NCME, 1999). Стоит отметить, что в приведенном выше примере разработчик опроса оценивает корреляции между вновь разработанными оценками шкалы и как объективной мерой (количество процедур), так и субъективной мерой (баллы по шкале тревожности). Оба эти подхода целесообразны для оценки взаимосвязи новой шкалы с другими переменными.

Глоссарий

■ Закрытый вопрос — вопрос анкеты с конечным числом категорий ответов, из которых респондент может выбрать вариант.

■ Когнитивное интервьюирование (или когнитивное предварительное тестирование) — основанный на фактических данных качественный метод, специально предназначенный для исследования того, удовлетворяет ли вопрос анкеты его предполагаемой цели.

■ Параллельное зондирование — метод вербального зондирования, при котором интервьюер задает зондирующий вопрос сразу же после того, как респондент прочитал вслух каждый вопрос анкеты и ответил на него.

■ Конструкт — гипотетическое понятие или характеристика (нечто «сконструированное»), для измерения которых предназначен опрос или тест. Исторически сложилось так, что термин «конструкт» был зарезервирован для обозначения характеристик, которые не могут наблюдаться непосредственно. Однако в последнее время этот термин получил более широкое определение.

■ Содержательная валидность — доказательство, полученное в результате анализа взаимосвязи между содержанием инструмента опроса и конструктом, который он призван измерять.

■ Факторный анализ — набор статистических процедур, предназначенных для оценки количества различных конструктов, необходимых для учета схемы корреляций в наборе показателей.

■ Открытый вопрос — вопрос анкеты, который требует от респондентов ответа в свободной форме (например, число, список или более длинный, развернутый ответ).

■ Надежность — степень, в которой оценки, полученные с помощью конкретной процедуры измерения или инструмента (например, опроса), являются последовательными и воспроизводимыми. Надежность — необходимое, но недостаточное условие валид-ности.

■ Якоря ответов — пункты, указанные в ряду вариантов ответа (например, абсолютно неважно, не очень важно, в меру важно, довольно важно и чрезвычайно важно).

■ Валидность процесса предоставления ответа — доказательство валидности, полученное в результате анализа того, как респонденты интерпретируют значение конкретных пунктов измерительной шкалы.

■ Ретроспективное зондирование — метод вербального зондирования, при котором интервьюер задает зондирующие вопросы после того, как респондент завершил весь опрос (или часть опроса).

■ Шкала — два или более элементов, предназначенных для измерения конструкта.

■ Интервьюирование по методу «думай вслух» — когнитивный метод интервьюирования, при котором респондентов просят активно вербализовать свои мысли, когда они пытаются ответить на оцениваемые вопросы анкеты.

Руководство АМЕЕ № 87. Разработка анкет для научных исследований

в области медицинского образования

■ Валидность — степень, в которой предлагаемые интерпретации оценок инструмента подтверждаются данными и теорией.

■ Аргументация валидности — процесс накопления доказательств с целью обеспечения надежной научной основы для предлагаемого использования оценок инструмента.

■ Вербальное зондирование — когнитивный метод интервьюирования, при котором интервьюер задает серию зондирующих вопросов, специально предназначенных для получения подробной информации, выходящей за рамки обычно предоставляемой респондентами.

■ Заявление о наличии/отсутствии заинтересованности. Некоторые авторы являются военнослужащими. Параграф 105 раздела 17 Свода федеральных законов США предусматривает, что «защита авторских прав в соответствии с данным разделом недоступна для работ сотрудников правительства Соединенных Штатов». Параграф 101 раздела 17 Свода федеральных законов США определяет работу сотрудника правительства Соединенных Штатов как работу, подготовленную военнослужащим или служащим правительства Соединенных Штатов в рамках своих служебных обязанностей.

ЗАКЛЮЧЕНИЕ

В этом руководстве АМЕЕ представлен систематический 7-этапный процесс разработки шкал опроса. Следует отметить, что многие важные темы, связанные с организацией и проведением опросов, выходят за рамки нашей статьи, посвященной разработке шкал, и поэтому не обсуждались в данном руководстве. Эти темы включают, помимо прочего, одобрение анкет для научных исследователей с этической точки зрения, формат опроса (бумажный или электронный), методы определения выборки, получение высоких показателей ответов, предоставление стимулов и управление данными. Эти и многие другие темы подробно рассматриваются в других источниках(например, ОШтап е1 а1., 2009). Мы также признаем, что представленная здесь методология не является единственным способом разработки и создания высококачественного опросника. Однако мы надеемся, что, читая это руководство, исследователи вопросов

медицинского образования придут к пониманию важности следования системному, основанному на доказательствах подходу к разработке анкет. Это не только повышает качество опросников, используемых в медицинском образовании, но и потенциально может положительно повлиять на общее качество исследований в области медицинского образования,авторы значительной части которых используют анкетирование.

СВЕДЕНИЯ ОБ АВТОРАХ

Артино-мл. Энтони Р. (Anthony R. Artino Jr.)* — PhD, доцент кафедры профилактической медицины и биометрии, главный исследователь нескольких финансируемых исследовательских проектов, соруководитель проекта по исследованию результатов долгосрочного развития карьеры (LTCOS) стажеров Военно-медицинского университета (USU). Его исследования посвящены изучению роли академической мотивации, эмоций и саморегуляции в различных ситуациях. Получил ученую степень доктора наук (PhD) по направлению «педагогическая психология» в Университете Коннектикута.

E-mail: anthony.artino0usuhs.edu

Ля Рошель Джеффри С. (Jeffrey S. La Rochelle) — MD, MPH, заместитель руководителя программы ординатуры по внутренним болезням Национального военно-медицинского центра имени Уолтера Рида, директор Центра развития комплексных клинических навыков Военно-медицинского университета, адъюнкт-профессор медицины Военно-медицинского университета. Его исследования посвящены применению теоретически обоснованных образовательных методов и оценок, а также разработке объективных структурированных клинических экзаменов (OSCE). Получил ученые степени MD и MPH в Военно-медицинском университете.

Дези Кент Дж. (Kent J. Dezee) — MD, MPH, руководитель программы стипендий по общей медицине, адъюнкт-профессор медицины Военно-медицинского университета. Его исследования посвящены изучению показателей успеха студентов-медиков в медицинском вузе, ординатуре и за ее пределами. Получил ученую степень MD в Государственном университете штата Огайо и MPH в Военно-медицинском университете.

Гюнтер Гельбах (Hunter Gehlbach) — PhD, доцент Гарвардской высшей школы образования. Читает курс по построению шкал опросов, его исследования включают экспериментальную работу по разработке оптимальных шкал, а также проекты по созданию шкал для разработки наилучших показателей восприятия учебных заведений родителями и учащимися. Проявляет значительный интерес к применению социально-психологических принципов к проблемам образования. Получил ученую степень доктора наук (PhD) по программе «Психологические исследования в образовании» в Стэнфордском университете.

ЛИТЕРАТУРА/REFERENCES

• Artino A.R., Gehlbach H., Durning S.J. AM last page: Avoiding five common pitfalls of survey design. Acad Med. 2011; 86: 1327.

• Artino A.R., Gehlbach H. AM last page: avoiding four visual design pitfalls in survey development. Acad Med. 2012; 87: 1452.

*Автор для корреспонденции.

Руководство АМЕЕ № 87. Разработка анкет для научных исследований

в области медицинского образования

Beck C.T., Gable R.K. Ensuring content validity: An illustration of the process. J Nurs Meas. 2001; 9: 201-15. Christian L.M., Parsons N.L., Dillman D.A. Designing scalar questions for web surveys. Sociol Method Res. 2009; 37: 393-425.

Colliver J.A., Conlee M.J., Verhulst S.J., Dorsey J.K. Reports of the decline of empathy during medical education are greatly exaggerated: a reexamination of the research. Acad Med. 2010; 85: 588-93.

Cook D.A., Beckman T.J. Current concepts in validity and reliability for psychometric instruments: theory and application. Am J Med. 2006; 119: 166.e7-16.

DeVellis R.F. Scale development: theory and applications. 2nd ed. Newbury Park, CA: Sage, 2003. Dillman D., Smyth J., Christian L. Internet, mail, and mixed-mode surveys: the tailored design method. 3rd ed. Hoboken, NJ: Wiley, 2009.

Drennan J. Cognitive interviewing: verbal data in the design and pretesting of questionnaires. J Adv Nurs. 2003; 42 (1): 57-63.

Fabrigar L.R., Wegener D.T. Exploratory factor analysis. New York: Oxford University Press, 2012. Fowler F.J. Survey research methods. 4th ed. Thousand Oaks, CA: Sage, 2009.

Gehlbach H., Artino A.R., Durning S. AM last page: survey development guidance for medical education researchers. Acad Med. 2010; 85: 925.

Gehlbach H., Brinkworth M.E. Measure twice, cut down error: a process for enhancing the validity of survey scales. Rev Gen Psychol. 2011; 15: 380-7.

Kane M.T. Validation in educational measurement. 4th ed. Westport, CT: American Council on Education/Praeger, 2006.

Karabenick S.A., Woolley M.E., Friedel J.M., Ammon B.V., Blazevski J., Bonney C.R., et al. Cognitive processing of self-report items in educational research: do they think what we mean? Educ Psychol. 2007; 42 (3): 139-51. Krosnick J.A. Survey research. Annu Rev Psychol. 1999; 50: 537-67.

Magee C., Byars L., Rickards G., Artino A.R. Tracing the steps of survey design: a graduate medical education research example. J Grad Med Educ. 2013; 5 (1): 1-5.

McCoach D.B., Gable R.K., Madura J.P. Instrument development in the affective domain: school and corporate applications. 3rd ed. New York: Springer, 2013.

Mclver J.P., Carmines E.G. Unidimensional scaling. Beverly Hills, CA: Sage, 1981.

McKenzie J.F., Wood M.L., Kotecki J.E., Clark J.K., Brey R.A. Establishing content validity: Using qualitative and quantitative steps. Am J Health Behav. 1999; 23 (4): 311-8.

Napoles-Springer A.M., Olsson-Santoyo J., O’Brien H., Stewart A.L. Using cognitive interviews to develop surveys in diverse populations. Med Care. 2006; 44 (11): s21-30. Pett M.A., Lackey N.R., Sullivan J.J. Making sense of factor analysis: the use of factor analysis for instrument development in health care research. Thousand Oaks, CA: Sage, 2003.

Polit D.F., Beck C.T. Nursing research: principles and methods. 7th ed. Philadelphia: Lippincott Williams and Wilkins, 2004.

Polit D.F., Beck C.T. The content validity index: are you sure you know what’s being reported? Critique and recommendations. Res Nurs Health. 2006; 29: 489-97. Rickards G., Magee C., Artino A.R. You can’t fix by analysis what you’ve spoiled by design: developing survey nstruments and collecting validity evidence. J Grad Med Educ. 2012; 4 (4): 407-10.

Rubio D.M., Berg-Weger M., Tebb S.S., Lee E.S., Rauch S. Objectifying content validity: Conducting a content validity study in social work research. Soc Work Res. 2003; 27 (2): 94-104. Schmitt N. Uses and abuses of coefficient alpha. Psychol Assess. 1996; 8: 350-3. Schwarz N. Self-reports: How the questions shape the answers. Am Psychol. 1999; 54: 93-105. Sullivan G. A primer on the validity of assessment instruments. J Grad Med Educ. 2011; 3 (2): 119-20. Sullivan G.M., Artino A.R. Analyzing and interpreting data from Likerttype scales. J Grad Med Educ. 2013; 5 (4): 541-2. Tourangeau R., Rips L.J., Rasinski K.A. The psychology of survey response. New York: Cambridge University Press, 2000.

Waltz C.F., Strickland O.L., Lenz E.R. Measurement in nursing and health research. 3rd ed. New York: Springer, 2005. Watt T., Rasmussen A.K., Groenvold M., Bjorner J.B., Watt S.H., Bonnema S.J., et al. Improving a newly developed patient-reported outcome for thyroid patients, using cognitive interviewing. Qual Life Res. 2008; 17: 1009-17. Weng L.J. Impact of the number of response categories and anchor labels on coefficient alpha and test-retest reliability. Educ Psychol Meas. 2004; 64: 956-72.

Willis G.B., Artino A.R. What do our respondents think we’re asking? Using cognitive interviewing to improve medical education surveys. J Grad Med Educ. 2013; 5 (3): 353-6.

Willis G.B. Cognitive interviewing: a tool for improving questionnaire design. Thousand Oaks, CA: Sage, 2005.

Источник

Если вы решили провести полевое исследование самостоятельно, не забудьте о таком важном инструменте, как анкета. Этот небольшой документ может серьезно повлиять на результаты опроса. Почитайте в нашей статье о правилах составления анкет, которыми пользуются в GMK.

Статья обновлена 1.01.2020 года

#1. Желание «впихнуть» в анкету как можно больше вопросов – это ошибка

Забудьте о фразе: «А давайте заодно спросим у респондентов…». Все вопросы в анкете должны строго соответствовать объекту, предмету и задачам исследования. Все лишнее нагрузит и опрашиваемого, и анализирующего. Если вы не можете соотнести вопрос с задачей, смело вычеркивайте его.

Например, если мы опрашиваем потенциальных покупателей квартир о процессе поиска и факторах выбора, не нужно спрашивать его о проведении досуга, характере потребления товаров повседневного спроса, иных психографических характеристиках. В таком случае лучше провести отдельное исследование по портрету аудитории.

Также важно следить за количество вопросов в анкете. Их не должно быть много. Нет ничего хуже раздраженного респондента, кидающего заполнение анкеты на половине. И нет ничего хуже раздраженного полевого персонала, которые жалуются на таких респондентов.

#2. Любой опрос должен нести анонимный и конфиденциальный характер

Стоит об этом сразу сказать респонденту. Так он будет уверен в том, что его личность не будет связана с предоставленными ответами, а значит – будет больше к вам расположен.

#3. Без мотивации респондента будет тяжело

Помните, что опрос нужен, прежде всего, вам. Поэтому каждого респондента нужно замотивировать: объяснить, чем помогут его ответы, какой вклад он может внести в развитие компании, рынка, страны 🙂

Или сыграть на страхе: поставить перед ним проблему, а далее – сказать что ее решением будет информация, которую он предоставит в результате участия в опросе.

#4. Следите за открытыми и закрытыми вопросами

Распространённой ошибкой при составлении анкеты является неправильное соотношение открытых и закрытых вопросов.

Закрытый вопрос содержит список готовых предполагаемых ответов. Респондент выбирает из предложенного. Открытый вопрос не содержит готовых ответов. Респондент сам формулирует его.

Несомненно, все зависит от поставленных задач, но в количественных исследованиях преобладают закрытые вопросы. Не увлекайтесь открытыми вопросами, это прерогатива качественных исследований. Обилие в анкете открытых опросов «тормозит» респондента, заставляет сомневаться и «выдумывать» развернутые ответы.

Рекомендуем соблюдать пропорцию 70/30.

#5. Протестируйте анкету

Составителю анкеты сложно со стороны понять, насколько логично и правильно она сделана. Мы рекомендуем перед запуском полевого исследования провести небольшой пилотный опрос: проанкетировать коллег, домашних, друзей или знакомых.

Поверьте, сразу станут видны недочеты: непонимание формулировки вопроса, отсутствие логики, необходимость переходов между вопросами.

Источник