Как составить словарь тезаурус

Разработка
информационно-поискового тезауруса
включает несколько этапов:

  • построение
    словаря (словника) ключевых слов;

  • дескрипторизация
    ключевых слов;

  • установление
    парадигматических отношений между
    дескрипторами;

  • оформление
    тезауруса.

Разработка
тезауруса требует исследования системы
и логики знаний тех областей, которые
найдут отражение в нем. Терминология,
которая будет использована в тезаурусе,
должна быть полной, однородной и
охватывать все основные тематические
группы. В свою очередь, тематические
группы могут быть расширены в целях
охвата смежных проблем. При отборе
массива документов необходимо соблюдать:

  • точное
    соответствие документов тематической
    направленности работы;

  • полный
    охват каждой области знаний, а также
    равномерное распределение их по
    отдельным тематическим областям как
    по характеру документов, так и по их
    количеству;

  • терминологическую
    насыщенность информационных документов
    и степень важности содержащейся в них
    информации;

  • освещение
    тематики с учетом различных аспектов
    (материалов исследований, сведений об
    устройстве, применении и т. д.).

Критериями
количественных и качественных параметров
представительного массива документов
и словника являются:

  • скорость
    роста массива документов и словника;

  • дифференцированность
    и устойчивость частотных характеристик
    элементов;

  • процентное
    содержание в словнике специальных,
    общих и смежных терминов;

  • вероятность
    использования элементов словника при
    индексировании и поиске документов.

Процесс
создания тезауруса включает научную
разработку классификационных схем
понятий и выявление терминологического
фонда из представительного фонда
информационных документов. Кроме того,
предполагается дополнение его терминами,
которые позаимствованы из вспомогательных
источников:

  • тезаурусов
    по родственной тематике;

  • терминологических
    и толковых словарей;

  • энциклопедических
    словарей;

  • научно-технических
    словарей и справочников;

  • таблиц
    универсальной десятичной (децимальной)
    классификации (УДК);

  • тематических
    рубрикаторов;

  • библиотечно-библиографической
    классификации (ББК);

  • государственных
    стандартов и других источников

9.3.1 Составление словаря ключевых слов

Составление
словаря ключевых слов происходит путем
отбора из заглавий, аннотаций, рефератов
и текстов документов слов естественного
языка, которые могут использоваться в
поисковых образах документов (ПОД) и
поисковых предписаниях (ПП). Важ­нейшим
требованием к словарю ключевых слов
является полнота охвата терминологии,
так как в тезаурус включают терминологию,
фигурирующую в документах, вводимых в
ИПС. Таким образом, в тезаурусе могут
отсутствовать термины, требующиеся для
описания содержательных или формальных
аспектов вводимых в ИПС текстов. Такой
тезаурус может оказаться недостаточно
полным. Существует прямая зависимость
работоспособности тезауруса от методики
индексирования документов. Процесс
индексирования заключается в следующем:

  • составление
    мысленной аннотации, в которой отражаются
    основные и второстепенные темы документа,
    представляющие интерес для пользователей
    ИПС;

  • выбор
    из этой аннотации ключевых слов.

Составление
поисковых аннотаций считается творческим
процессом, поэтому результат этого
процесса в той или иной мере зависит от
субъективных качеств индексатора.
Результат обработки одного и того же
документа разными индексаторами может
быть различным. Для того чтобы предотвратить
расхождения в индексировании, необходимо
стандартизировать построение поисковых
образов. Для того чтобы отделить ключевые
слова от «неключевых» (не подлежащих
вводу в тезаурус), индексаторы используют
общие методические указания:

  • служебные
    слова (предлоги, союзы, частицы и т. д.)
    следует считать неключевыми;

  • в
    качестве ключевых слов могут выступать
    существительные, прилагательные,
    числительные, причастия и их сочетания,
    наречия, деепричастия и местоимения в
    состав ключевых слов не входят, глаголы
    – очень редко;

  • не
    следует включать в словарь ключевых
    слов термины, которые очень редко
    встречаются в данном документном
    массиве, их можно учесть в отдельном
    списке в роли ключевых слов-кандидатов;

  • часто
    встречающиеся, но общие термины («метод»,
    «система», «описание», «устройство» и
    т. п.) надо либо исключить, либо использовать
    в сочетании с другими словами, которые
    сузили бы их значение;

  • не
    имеет смысла включать в словарь термины,
    не относящиеся к данной терминологической
    области;

  • полисемичные
    термины могут быть включены только в
    тех значениях, в которых они употребляются
    в данной тематической области, с
    соответствующими пояснениями.

После
того как произведен отбор ключевых слов
из текстов, необходимо решить вопрос
об их формулировке.

Существует
два подхода к этой проблеме:

  • ориентироваться
    на ключевые слова – развернутые
    словосочетания. Например: «коммерческие
    информационные службы»;

  • ориентироваться
    на ключевые слова – унитермы (отдельные
    лексические единицы). Например:
    «оформление», «механика», «логика».

В
зависимости от того, какой подход будет
использован при формулировке ключевых
слов, результат будет разным, т. е. будут
получены различные словари ключевых
слов, а значит и различные дескрипторные
языки. «Унитермная» ориентировка через
свободную манипуляцию элементами
поисковых образов обеспечит глубокое
и детальное индексирование и увеличит
количество точек доступа к разыскиваемым
документам. Но разделение устойчивых
словосочетаний, которые соответствуют
определенным научно- техническим
понятиям, грозит потерей информации
при поиске. Суть заключается в том, что
определенные понятия не всегда могут
быть выражены единичным термином. Иными
словами, ключевые слова, включаемые в
словарь, принимают с учетом точки зрения
интересов поиска информации для каждого
ключевого слова отдельно и с учетом их
лексикографической обработки.

Решение
о разделении или сохранении словосочетаний
или сложных слов принимают с учетом
лингвистических и прагматических
критериев. В лингвистике словосочетания
делятся на свободные
и устойчивые
(лексиколизованные) словосочетания.
Свободные словосочетания характерны
устной речи. Устойчивые словосочетания
являются цельными лексическими единицами
языка и по своим функциям эквивалентны
отдельным словам. Для координатного
индексирования рекомендуется вводить
в качестве ключевых слов устойчивые
словосочетания. При формировании
словника ключевых слов руководствуются
лингвистическими критериями. Словосочетание
является устойчивым, если:

  • при
    его образовании одно из слов изменяет
    свое значение – происходит переосмысление
    одного из компонентов словосочетания.
    Например: «легкая музыка», «легкая
    промышленность» (переосмысливается
    прилагательное «легкий»);

  • употребляется
    в единственном или во множественном
    числе. Например: «немецкий язык»,
    «европейские языки»;

  • имеет
    один или несколько синонимов. Например:
    «перспективы» = «будущее» = «перспективы
    развития» = «тенденции».

— при
замене составляющих его слов, изменении
порядка слов в нем или при преобразовании
прилагательного в существительное с
предлогом потеряется его смысл. Например:
«железная дорога».

К
устойчивым словосочетаниям относят
имена собственные или словосочетания,
включающие имена собственные. Например:
«Латинская Америка», «Таблица Менделеева».

Если
словосочетания соответствуют этим
критериям, они считаются устойчивыми.

На
решение о сохранении словосочетаний
влияют и прагматические соображения:

— рекомендуется
сохранять часто встречающиеся
словосочетания;

— рекомендуется
сохранять словосочетания, если их
компоненты не могут использоваться по
отдельности;

— рекомендуется
сохранять словосочетания как способ
устранения информационного шума.

Таким
образом, разработчикам тезауруса следует
ориентироваться на единичные ключевые
слова, сохраняя устойчивые словосочетания,
удовлетворяющие выше приведенным
лингвистическим и прагматическим
критериям.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Каков наилучший способ создать тезаурус, так как письмо всегда является самой сложной частью получения высоких баллов во многих языковых тестах?

Таким образом, многие учащиеся стараются как можно больше практиковаться в письме. Одним из многих советов по улучшению качества письма является использование тезауруса. Но что вы знаете о тезаурусе и о том, как эффективно создавать тезаурус?

В этой статье вы узнаете новое понимание тезауруса и полезные советы по созданию тезауруса, чтобы играть со словами как в формальном, так и в неформальном языковом употреблении.

Дополнительные советы с AhaSlides

  • Живой генератор облака слов
  • Генератор прилагательных
  • Случайные английские слова
generate thesaurus
Как создать тезаурус?

Содержание

  • Что такое тезаурус?
  • Список способов создания тезауруса
  • №1. AhaSlides — инструмент создания тезауруса
  • № 2. Thesaurus.com – инструмент для создания тезауруса
  • №3. Monkeylearn — инструмент для создания тезауруса
  • № 4. Synonyms.com – инструмент создания тезауруса
  • № 5. Word Hippos — инструмент для создания тезауруса
  • № 6. Визуальный тезаурус — инструмент создания тезауруса
  • № 7. WordArt.com — инструмент создания тезауруса
  • 4 альтернативы облаку слов AhaSlides
  • №1. Только одно слово
  • № 2. Синоним скремблировать
  • №3. Генератор прилагательных
  • № 4. Генератор синонимов имени
  • Преимущества «Создать тезаурус»
  • Заключение

Что такое тезаурус?

Если вы давно пользуетесь словарем, возможно, вы уже слышали о слове «тезаурус». Понятие тезауруса происходит от особого способа использования более функционального словаря, в котором люди могут искать ряд слов. синонимов и соответствующие концепции, а иногда антонимы слов в группе слов.

Слово тезаурус происходит от греческого слова «сокровище»; упрощенно, это также означает книгу. В 1852 году слово «тезаурус» стало популярным благодаря вкладу Питера Марка Роже, который использовал его в своем «Тезаурусе Роже». В современной жизни тезаурус является официальным словом в свете словаря синонимов. Кроме того, интересен тот факт, что Соединенные Штаты являются первой страной, отметившей «День национального тезауруса», который ежегодно отмечается 18 января. 

Список способов создания тезауруса

Есть много способов создать тезаурус с помощью генератора слов тезауруса. В эпоху цифровых технологий люди слишком привыкли использовать онлайн-словарь вместо печатного словаря, поскольку это более удобно и экономит время, некоторые из них бесплатны и переносимы на ваш мобильный телефон. Здесь мы даем вам 7 лучших онлайн-сайтов, создающих тезаурусы, чтобы найти похожие слова, на которые вы должны обратить внимание:

generate thesaurus
Эффективный тезаурус – Генератор синонимов – Synonym.com

№1. AhaSlides — инструмент создания тезауруса

Почему AhaSlides? Учебное программное обеспечение AhaSlides подходит для создания тезаурусов классами с помощью функции Word Cloud и может использоваться в любой точке взаимодействия в системах Android и iOS. Использование AhaSlides — это идеальный способ вовлечь учащихся в занятия в классе. Вы можете настроить различные игры и викторины на тематическом фоне, чтобы сделать генератор тезауруса более привлекательным и интересным. 

№ 2. Thesaurus.com – инструмент для создания тезауруса

Лучшим генератором синонимов, который можно упомянуть, является Thesaurus.com. Это полезная платформа для поиска синонимов со многими удобными функциями. Вы можете искать синоним к слову или фразе. Его впечатляющие функции, генератор слов дня, публикация одного синонима и кроссворд ежедневно — вот что этот веб-сайт показывает вам вместе с грамматикой и советами по написанию стратегии обучения навыкам написания. Он также предлагает различные игры, такие как Scrabble Word Finder, Outspell, Word Wipe Game и другие, которые помогут вам более эффективно создавать список тезауруса. 

№3. Monkeylearn — инструмент для создания тезауруса

Вдохновленное технологией искусственного интеллекта MonkeyLearn, сложное программное обеспечение для электронного обучения, его функция облака слов может использоваться в качестве генератора случайных слов-синонимов. Его чистый UX и пользовательский интерфейс позволяют пользователям удобно работать со своими приложениями, не отвлекаясь на рекламу.

Введя релевантные и целенаправленные ключевые слова в поле, автоматическое обнаружение сгенерирует необходимые синонимы и связанные термины. Кроме того, есть функция, которая поможет вам настроить цвет и шрифт в соответствии с вашими предпочтениями, а также настроить количество слов, чтобы упростить получение результатов. 

№ 4. Synonyms.com – инструмент создания тезауруса

Еще один онлайн-словарь для создания тезауруса — Synonyms.com, который работает очень похоже на Thesaurus.com, например, ежедневное скремблирование слов и считывание словарных карточек. После проведения исследования слова веб-сайт представит вам группу похожих слов, ряд определений, его историю и некоторые антонимы, а также гиперссылки с другими соответствующими понятиями. 

№ 5. Word Hippos — инструмент для создания тезауруса

Если вы хотите найти синоним напрямую, вы можете найти Word Hipps для вас. Простой в использовании пользовательский интерфейс поможет вам самым разумным образом. Помимо представления вам синонимов, он выделяет различные контексты использования рассматриваемого слова и синонимов более подходящим образом. Вы можете попробовать игру под названием «Слова из 5 букв, начинающиеся с буквы А», которую предлагает Word Hipps в качестве ледокола. 

№ 6. Визуальный тезаурус — инструмент создания тезауруса

Знаете ли вы, что изучение слова с помощью визуальных эффектов более эффективно? Инновационный генератор синонимов, такой как визуальный тезаурус, предназначен для максимального получения информации и поощряет исследование и обучение. Вы можете найти любой из необходимых вам тезаурусов, даже самый редкий, поскольку он предлагает 145,000 115,000 английских слов и XNUMX XNUMX значений. Например, генератор существительных слов, генератор старых английских слов и генератор причудливых слов с картами слов, разветвленными друг на друга.

№ 7. WordArt.com — инструмент создания тезауруса

Иногда сочетание генератора облака слов для тезауруса с формальным словарем синонимов является эффективным способом обучения новому языку в классе. WordArt.com может стать для вас хорошим учебным пособием. WordArt, ранее известный как Tagul, считается самым многофункциональным генератором облаков слов с потрясающими изображениями слов.

Альтернативы облаку слов AhaSlides

generate thesaurus
Генератор случайных словарных слов с помощью AhaSlides Wordcloud

Кажется, пришло время создать собственный генератор тезауруса с Облако слов AhaSlides. Итак, как создать генератор облака слов синонимов с АгаСлайды, вот несколько важных советов:

  • Представляем облако слов на AhaSlides, а затем пересылаем ссылку в верхней части облака вашей аудитории.
  • Получив ответы, отправленные аудиторией, вы можете транслировать вызов облака слов в прямом эфире на своем экране вместе с другими.
  • Настройте вопросы и типы вопросов в соответствии с общим дизайном вашей игры.

Alternative Text

Начните за секунды.

Узнайте, как использовать AhaSlides Live Word Cloud Generator для большего удовольствия на работе, в классе или просто для использования в сообществе!

🚀 Что такое облако слов?

Игры со словами — это интригующие занятия, которые повышают умственные способности, а также проверяют способность использовать словарный запас и другие языковые навыки. Поэтому мы даем вам несколько лучших идей для игр с генератором тезаурусов для повышения продуктивности вашего обучения в классе.

№1. Всего одно слово — сгенерируйте идею игры тезауруса

Это самое легкое и простое правило игры, которое вы когда-либо могли себе представить. Однако стать победителем в этой игре совсем не просто. Люди могут играть в группе или индивидуально с таким количеством раундов, сколько необходимо. Ключ к успеху — произнести слово как можно быстрее и сосредоточиться, избегая повторения рассматриваемого слова, если вы не хотите, чтобы вас уволили. Однако нет никакой гарантии, что у вас будет достаточно слов для победы. Вот почему мы должны учить новые слова из этой удивительной игры.

№ 2. Synonym scramble — Генерация идеи игры тезауруса

Вы легко можете встретить такой сложный тест во многих учебниках по языковой практике. Перепутать все буквы — лучший способ потренировать мозг в запоминании новой работы за ограниченное время. С помощью Word Cloud вы можете скремблировать один и тот же набор списков слов или антонимов, чтобы учащиеся могли быстро расширять свой словарный запас.

№3. Генератор прилагательных — сгенерируйте идею игры тезауруса

Вы когда-нибудь играли в MadLibs, одну из самых захватывающих онлайн-игр в слова? Существует задача повествования, когда вам нужно придумать кучу случайных прилагательных, чтобы они соответствовали сюжетной линии, которую вы создаете. Вы можете играть в подобные игры в своем классе с помощью Word Cloud. Например, вы можете создать историю, а учащиеся должны придумать персонажей с одной и той же сюжетной линией. Каждая команда должна использовать ряд синонимов, чтобы их история звучала разумно, но не может повторять чужие прилагательные.

№ 4. Генератор синонимов имен — сгенерируйте идею игры тезауруса

Когда вы хотите назвать своих новорожденных, вы хотите выбрать самое красивое, оно должно нести в себе особый смысл. Для того же значения существует множество имен, которые могут вас запутать. Прежде чем перейти к последнему, вам может понадобиться Word Cloud, чтобы помочь вам создать как можно больше имен синонимов. Вы можете быть удивлены тем, что есть еще имена, о которых вы никогда раньше не думали, но они звучат точно так же, как то, что предназначено вашему ребенку.

№ 5. Создатель необычных заголовков — сгенерируйте идею игры тезауруса

Генератор синонимов имени немного отличается от генератора причудливых заголовков. Вы хотите назвать свой новый бренд уникальным, но уже существуют тысячи причудливых названий? Трудно найти тот, который имеет соответствующее значение для вашего фаворита. Так что использование тезауруса может вам как-то помочь. Вы можете создать игру, чтобы побудить участников придумать причудливые названия для названия вашего бренда или книги или чего-то еще, не теряя ее духа.

generate thesaurus
Красивый синоним – Облако слов AhaSlides

Преимущества создания тезауруса

«Создать тезаурус» — это распространенный способ показать свою языковую компетентность по четырем навыкам в разных контекстах. Понимание сути намеренного создания тезауруса полезно для вашего прогресса в обучении и других связанных с языком действий. Цель «создать тезаурус» состоит в том, чтобы помочь вам избежать пустых слов и повысить эффективность и точность вашего выражения. 

Кроме того, частое повторение одних и тех же фраз или слов является табу, что может сделать письмо скучным, особенно в творческом письме. Вместо того, чтобы говорить «Я очень устал», вы можете сказать, например, «Я устал».

Кроме того, вы можете создать генератор тезаурусных фраз с такой фразой, как «ваша одежда выглядит очень красиво», эксперт с динамическим списком синонимов может сделать ее более увлекательной во многих отношениях, например: «ваш костюм такой потрясающий» или « твой наряд необыкновенный»… 

В некоторых конкретных контекстах, таких как тесты на знание языка, копирайтинг, классные занятия и т. д., шаг «создать тезаурус» может быть огромным подспорьем, как показано ниже:

Практика тестирования на знание языка: возьмем, к примеру, IELTS. Существует тест высокого стандарта для изучающих иностранный язык, который они должны пройти, если хотят поехать за границу для учебы, работы или иммиграции. Подготовка к IELTS — долгий путь, так как чем выше целевая группа, тем сложнее.

Изучение синонимов и антонимов — лучший способ увеличить словарный запас. Для многих людей «создание тезауруса» является обязательным действием для создания конечного списка словарного запаса для использования в письменной и устной речи, чтобы учащиеся могли более активно и эффективно играть со словами в течение ограниченного времени для любого вопроса. 

Преимущества создания тезауруса в копирайтинге

В последние годы быть фрилансером в области копирайтинга — многообещающая карьера, поскольку это гибридная работа, в которой вы можете оставаться дома и писать текст в любое время, не беспокоясь о скучных 9-5 рабочих часах. Быть хорошим писателем требовало отличных навыков письменного общения и убедительного, повествовательного, пояснительного или описательного стиля письма.

Улучшение вашего стиля общения и письма путем создания собственного генератора слов важно, поскольку вы используете слова более гибко, а не застреваете, пытаясь найти идеальный способ выразить свою инициативу. Воспользовавшись преимуществами живого тезауруса в ваших предложениях, ваше письмо может быть намного более очаровательным.

Преимущества создания тезауруса в занятиях класса

Умение свободно пользоваться языком является обязательным для всех стран как на их национальном, так и на втором языке. Кроме того, есть много компаний, которые также пытаются внедрить курсы английского языка для своих сотрудников в качестве основного развивающего обучения.

Преподавание и изучение языка, особенно новой лексики, может быть более продуктивным процессом, в то же время получая огромное удовольствие от генераторов слов для игр. Некоторые словесные игры, такие как «Кроссворды» и «Эрудит», являются одними из любимых ледоколов класса, которые будут стимулировать участие учащихся в учебе.

Выводы

Если вы любите играть со словами или просто хотите улучшить свои навыки письма, не забывайте часто обновлять свой тезаурус и писать по одной статье каждый день.

Теперь, когда вы узнали о тезаурусе и о некоторых идеях по использованию Word Cloud для создания тезауруса, давайте приступим к созданию собственного тезауруса и игр Word Cloud с помощью Облако слов AhaSlides правильный путь.

ФИЛОЛОГИЯ И ИСКУССТВОВЕДЕНИЕ

УДК 378.016:81

И. А. Баринова, А. О. Вайсман

О СТРУКТУРЕ СЛОВАРЯ ТЕЗАУРУСНОГО ТИПА

В статье обсуждается проблема эффективного обучения иностранным языкам и подготовки специалистов-переводчиков посредством составления и использования словаря-тезауруса. Рассматривается структура словаря-тезауруса, в качестве иллюстраций представлены разделы составленного авторами трехъязычного словаря тезауруса по теме «Управление твердыми бытовыми отходами».

The article deals with the problem of the effective foreign language teaching and profession al training of interpreters and translators by making and using a thesaurus dictionary. The structure of a thesaurus dictionary is investigated. Some units of the multilingual (Russian, English, French) thesaurus in Solid Waste Management are presented.

Ключевые слова: тезаурус, ключевые слова, логико-семантическая структура темы, экология, управление отходами.

Keywords: thesaurus, key words, logical and semantic theme structure, ecology, waste man agement.

В условиях глобализации возрастает необходимость в специалистах, владеющих иностранными языками для развития и поддержания международных связей. Поэтому актуальной становится проблема качественной подготовки специалистов-переводчиков.

На наш взгляд, тезаурусный подход к изучению языка является одним из наиболее эффективных методов изучения языка и профессиональной подготовки специалистов-переводчиков, работающих в различных областях.

Необходимо отметить, что понятие «тезаурус» имеет три значения:

1. Тезаурус — это некий семантический словарь как способ организации лексики, в явном виде фиксирующий все «семантические отношения между составляющими его единицами».

2. Тезаурус — это семантический словарь как издание, представляющее собой упорядоченный набор терминов, содержащее перечень понятий вместе с их интерпретацией и отношениями.

© Баринова И. А., Вайсман А. О., 2014 58

3. Тезаурус — это модель мира, отраженный и упорядоченный в сознании «лексикон», «идеальная картина мира» [1].

Говоря о словаре-тезаурусе, необходимо подчеркнуть, что он неслучайно используется как адекватный способ систематизации знаний. Г. А. Брутян указал на то, что «значение имеет языковой характер не только в том смысле, что язык выступает как способ осуществления знания, но и в том, что язык оставляет свой специфический след на знании» [2]. Именно в таком направлении Ю. Н. Караулов развивал свою мысль об известном отражении в идеографическом словаре (тезаурусе) «картины мира», «языковой модели мира» в своей работе «Общая и русская идеография». Сам термин «тезаурус» постепенно эволюционировал в современном научном употреблении, поэтому теперь можно встретить трактовку этого термина в расширенном понимании, которое, на взгляд многих исследователей, достаточно верно отражает существо дела и свидетельствует о развитии нового, третьего по счету, значения у термина «тезаурус» [3]. Такого понимания термина «тезаурус» придерживается Г. Г. Воробьев: «Стратегия общения определяется тезаурусами людей, которые по принципу разноаспектного сходства входят в разные социально-демографические группы и в своей совокупности образуют тезаурус человечества как глобальной информационной системы» [4]. Тезаурус может расти или сокращаться в объеме в процессе жизнедеятельности динамической системы, а также он может перемещаться в информационном пространстве. Исследователь обращает наше внимание на очень интересный феномен — вырождение тезауруса, он пишет, что это явление «проявляется в таких личностных свойствах человека, как нелюбознательность, рутинность мышления, педантизм, плохая приспосабливаемость к меняющимся условиям, ксенофобия, скептицизм, мнительность, повышенный самоконтроль. И тогда информативными чаще считаются сообщения, подтверждающие известные идеи, а не опровергающие их» [5].

Исходя из этого Ю. Н. Караулов делает заключение о том, что «тезаурус-словарь если и не моделирует лексикон человека (т. е. тезаурус в третьем значении), то в сильной степени коррелирует с ним» [6].

Рассмотрим структуру словаря тезауруса, в которой выделяют следующие части:

1) классификационная часть;

2) контекстная часть;

3) идеографическая часть;

4) алфавитный указатель слов [7].

В первой, классификационной, части тезауруса содержатся логико-семантические структуры тем (ЛССТ) как на иностранном, так и на родном языках. В них определены границы предметного содержания той или иной области знаний. В основу построения, прежде всего, кладутся характеристики классификации.

ЛССТ играет огромную роль в развитии зрительного смыслового вербального восприятия, особенно в формировании таких качеств, как предметность, целостность и константность, важных для изучения материалов по любой дисциплине. Она становится информационной основой для понимания и надежным внутренним ориентиром для вероятностного прогнозирования обучаемого.

Ключевые слова первой зоны выражают обычно наиболее широкие понятия исследуемой темы или проблемы. Слова второй зоны охватывают второй и третий уровни подтем и представляют собой уже более конкретные обозначения данной предметной области, детализируют предмет, его аспекты.

Во второй, контекстной, части тезауруса содержатся определения ведущих ключевых слов-понятий. В данном случае дефиниция играет роль микроконтекста для каждого ключевого слова, она позволяет представить его в речи с разной соотнесенностью и в тесной взаимосвязи с другими словами.

Третья часть тезауруса — идеографическая. Она представляет собой набор словарно-поня-тийных статей, которые представлены в словаре

на иностранном и русском языках. Они являются центральной и самой важной частью словаря тезаурусного типа. В их основу положен принцип систематизации лексики вокруг ведущих ключевых слов, которые отражают основные понятия темы и являются заголовками словарно-по-нятийных статей. В словарно-понятийной статье лексика представляет собой определенное множество, содержательно характеризующее ключевое слово-заголовок на основе логико-семантических отношений, которые отражают реальные отношения между предметами и явлениями, существующими в объективной действительности. В процессе отбора и группировки лексики в словарно-понятийные статьи учитываются наиболее существенные отношения, обусловленные смысловым содержанием понятий, которые стоят за ведущим ключевым словом.

Четвертой частью словаря-тезауруса является алфавитный указатель слов, в который заносятся следующие группы:

1) все ведущие и подчиненные ключевые слова и словосочетания словарных понятийных статей, что составляет основную часть алфавитного списка;

2) устойчивые словосочетания;

3) предлоги, союзы, местоимения, местоименные наречия;

4) речевые клише и средства смысловой связности [8].

Практической целью нашего исследования является составление структурированного лексикона-тезауруса по специальности «Экология» на русском, английском и французских языках по теме «Управление твердыми бытовыми отходами». В качестве иллюстрации приведем некоторые разделы по теме «Стратегии управления отходами» составленного авторами тезауруса на французском и русском языках.

I. Классификационная часть с логико-семантическими структурами тем

Управление отходами

Экологически безопасный выброс

Утилизация

Оптимизация производства

Хранение

Прекращение выпуска продукции

Gestion des déchets

Rejet Eco-compatible

Valorisation

Optimisation

Stockage

Arrêt de la production

II. Контекстная часть с дефинициями ключевых понятий темы «Стратегии управления отходами»

Русский язык Английский язык Французский язык

Твердые бытовые отходы: отходы, образующиеся в результате жизнедеятельности населения (приготовление пищи, упаковка товаров, уборка и текущий ремонт жилых помещений, крупногабаритные предметы домашнего обихода, фекальные отходы нецентрализованной канализации и др.) Municipal Solid Waste (MSW): «Regular» garbage from non-industrial sources, such as residential homes, restaurants, retail centers, and office buildings. Typical MSW includes paper, discarded food items, and other general discards. Green waste is considered MSW and includes yard clippings, leaves, trees, etc Déchets solides municipaux: Ensemble des déchets solides dont l’élimination (au sens donné par les textes législatifs) relnve de la compétence des communes

Управление твердыми бытовыми отходами: 1.Часть общего управления веществами, подчиняющаяся естественнонаучным закономерностям сохранения и вторичного использования любого вещества. 2. Методы и мероприятия по утилизации отходов Waste management: The collection, transportation, and disposal of garbage, sewage, and other waste products. Waste management encompasses management of all processes and resources for proper handling of waste materials, from maintenance of waste transport trucks and dumping facilities to compliance with health codes and environmental regulations La gestion des déchets ou rudologie: La collecte, le transport, le traitement (le traitement de rebut), la réutilisation ou l’élimination des déchets, habituellement ceux produits par l’activité humaine, afin de réduire leurs effets sur la santé humaine, l’environnement, l’esthétique ou l’agrément local

III. Идеографическая часть со словарно-понятийными статьями ведущих слов-понятий темы.

Отходы

Деятели

Объекты

Действия

Владелец; человек; производитель отходов; потребитель/приемщик; поставщик; собственник; фирма; занимающаяся удалением отходов; законодатель; фауна; флора; организмы; промышленность; индустриальное общество; производство энергии…

Воздух; земля; вода; человек; животные; растения; почва; условия жизни; реки; окружающая среда; леса

Уничтожать, увозить, защищать экраном, покрывать, поднимать, забирать, сваливать, складировать, давать осадок, смывать, вывозить, накапливать, поставлять, предполагать, обрабатывать…

Следствия

Цели

Место

Эпидемии, проблемы окружающей среды (ОС), болезни, загрязнение ОС

Производство энергии, получение биогаза, компост, вторичное сырье

Свалка/полигон, мешки, мешки для мусора, биржа отходов, компостная установка, место сбора

Качества

Твердые, жидкие, газообразные, инертные, нейтральные, бытовые отходы, биоразлагаемые, первичные

Owner; man; waste generator; consumer/receiver; supplier; holder; disposal contractor (waste treatment company); legislator; fauna; flora; organisms; industry; industrial society; energy generation (production)

Epidemics, green issues (environmental problems, illnesses, environmental pollution

Consequences

Agents

Energy production, recouping waste stream biogas, compost, recyclable materials/processed raw materials

Air; land; water; man; animals; trees; soil; living environment; rivers; environment; forests

Waste

Objects

Goals

Eliminate, remove, screen, overspread, elevate, take(capture), dump[the refuse], stock, leave a sediment, wash of, carry outwards, gather, deliver, suppose, condition

Landfill, sacks, refuse bag/sack (garbage disposal bag), waste exchange, compost processor, refuse receptacle

Actions

Place

Qualities

Solid, liquid, gaseous, inert, neutral, household waste, biodegradable (compostable), primary

В заключение необходимо еще раз подчеркнуть преимущества словаря тезаурусного типа как формы подачи и способа запоминания лексики в процессе подготовки будущих специалистов как языковых, так и неязыковых вузов, поскольку, на наш взгляд, организация лексики в таком словаре существенно облегчает и ускоряет процесс запоминания новой терминологии на иностранном и родном языках.

Примечания

1. Серова Т. С., Шишкина Л. П. Экологический немецко-русский лексикон тезаурус: словарь. Пермь: Изд-во Перм. гос. тех. ун-та, 2009.

2. Брутян Г. А. Языковая картина мира и ее роль в познании // Методологические проблемы анализа языка. Ереван, 1976. С. 57-58.

3. Караулов Ю. Н. Лингвистическое конструирование и тезаурус литературного языка. М.: Наука, 1981.

4. Воробьев Г. Г. Теория тезаурусов в анализе коммуникаций // Семантика и информатика. М., 1979. Вып. 11. С. 3.

5. Там же. С. 4, 33.

6. Караулов Ю. Н. Указ. соч. С. 190.

7. Серова Т. С., Шишкина Л. П. Указ. соч.

8. Там же.

Гендина Н.И.,

доктор пед. наук, профессор

кафедры ТАОИ КемГУКИ

Информационно-поисковые тезаурусы:

структура, назначение и порядок разработки

План

1.  Тезаурус как способ систематизированного представления знаний и

разновидность идеографического словаря.

2.  Информационно-поисковые тезаурусы: сущность и назначение

3.  Структура ИПТ

4.  Порядок разработки, экспертизы, регистрации и ведения ИПТ.

Список литературы

1.  ГОСТ 7.74 – 96. Информационно-поисковые языки. Термины и определения [Текст]. – Введ. 1997-07-01. – Минск: Межгосударственный совет по стандартизации, метрологии и сертификации, 1997. – 34 с. (Система стандартов по информации библиотечному и издательскому делу) ТК 191.

2.  ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления [Текст]. – Взамен ГОСТ 7.25-80; Введ. 2002-07-01. – М.: ИПК Изд-во стандартов, 2001. – 16 с. МТК 191.

3.  ГОСТ 7.24-2007 Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению. – Взамен ГОСТ 7.24-90; введ. 2008-07-01. / Межгосударственный совет по стандартизации, метрологии и сертификации. – М.: Стандартинформ, 2008. – 7 с. (Система стандартов по информации, библиотечному и издательскому делу)

4.  Баранов, О. С. Идеографический словарь русского языка [Текст] / О. С. Баранов. – М.:Издательство ЭТС, 1995. – 820 c

5.  Жмайло, С. В. К вопросу об определении тезауруса [Текст] / С. В. Жмайло // НТИ. Сер. 1 Организация и методика информационной работы. – 2003. – №12. – С.20 – 25.

6.  Жмайло, С. В. К разработке современных информационно-поисковых тезаурусов [Текст] / С. В. Жмайло // НТИ. Сер. 1 Организация и методика информационной работы. –2004. – №1. – С.23 – 31.

7.  Пробст, М. А. Тезаурус и информационный поиск [Текст] / М. А. Пробст // НТИ. Сер. 2. Информационные процессы и системы – 1979. – №9. – С. 14 – 20.

1.  Тезаурус как способ систематизированного представления знаний и разновидность идеографического словаря

Тезаурус (от греч. Thesauros – клад, сокровище, сокровищница) – многозначное слово, имеющее, как минимум, два значения:

1) тезаурус как идеальный объект – это «совокупность знаний, накопленных человеком или некоторым коллективом. Это упорядоченный и отраженный в сознании человека «лексикон», «мир» отдельной личности. В русском языке наиболее адекватный перевод слова «тезаурус» – это «мир знаний и интересов». Например, «мир знаний и интересов ребенка – тезаурус ребенка» и «мир знаний и интересов взрослого – тезаурус взрослого»; «мир знаний и интересов художника – тезаурус художника», «мир знаний и интересов бизнесмена – тезаурус бизнесмена» и т.п. В теории информации тезаурусом называют запас знаний (понятий, суждений), размещенных в памяти воспринимающего информацию субъекта. Это структурированное знание в виде понятий и смысловых отношений между ними,

2) тезаурус как материально существующий объект – словарь. Тезаурус – это словарь особого типа или идеографический словарь, в котором слова располагаются не по алфавиту, а по степени смысловой близости. Лексика языка представлена в них в виде систематизированных групп слов, в той или иной степени близких в смысловом отношении (синонимы, гиперонимы, гипонимы, антонимы, паронимы и др.). Тезаурус представляет собой упорядоченную совокупность лексических единиц, в которой в явном виде с помощью специальных помет отражены смысловые отношения (синонимические, родовидовые и ассоциативные) между лексическими единицами. Иными словами, упорядочение лексики в тезаурусе осуществляется не по алфавитному или другому формальному признаку, а по смысловому (семантическому).

В основе построения идеографических словарей лежит логическая классификация всего понятийного содержания лексики. Систематизация слов в таких словарях основана на психологических ассоциациях предметов и понятий, называемых какой-либо лексической единицей. Лексические единицы группируются в поля, в центре каждого из которых стоит слово, объединяющее другие слова, в той или иной степени близкие ему по значению или ассоциирующиеся с ним по смыслу (например: насекомое – муха, пчела, муравей, бабочка; ползать, летать, прыгать…). Как правило, слова и словосочетания внутри поля кратко толкуются таким образом, чтобы было видно, чем каждое из них отличается от всех других членов поля. Слова или словосочетания группируются на основании общности обозначаемых ими явлений действительности по определённым темам, например, «Животные», «Насекомые», «Дом», «Театр», «Улица», «Транспорт» и т. д.

Так, в идеографическом словаре русского языка О. С. Баранова (4) выделены 12 высших разделов идеографического словаря, среди которых: «порядок, природа, человек, деятельность, общество, культура» и др., каждый из которых делится на группы, подгруппы, отделы, разделы. Все слова в этом словаре собраны в гнезда по смыслу и группируются вокруг некоторого понятия, с которым они связаны чаще всего видовыми отношениями. Гнезда в свою очередь группируются в подразделы и т.д. На данный момент в словаре 5923 гнезд, 7 уровней деления (по данным www.rifmovnik.ru/thesaurus.htm на 16.02.2010 г.). Приведем пример словарной статьи из этого словаря:

178.4.7 аромат
▲ запах
↑ ароматный
аромат - приятный запах (например, запах цветов, травы, сена. нежный #. пьянящий #).
 ароматизация
благоухание. благоухать.
благовоние.
амбре. фимиам.

Код слова «аромат» отражает принятую в данном словаре идеографическую классификацию, в частности, соотнесенность данного слова с категорией «178- Ощущения».

Таким образом, термины «тезаурус», «идеографический словарь», «словарь типа тезаурус», в первую очередь означают, что совокупность слов языка в них представлена таким образом, что в одну группу слов входят слова, близкие по смыслу. Основное назначение идеографических словарей — описать совокупности лексических единиц, объединённых общим понятием; это облегчает читателю выбор наиболее подходящих средств для адекватного выражения мысли и способствует активному владению языком.

Из истории тезаурусов

История появления и развития тезаурусов рассматривается в работах (5,7). В них отмечается, что история возникновения тезаурусов восходит к великим мыслителям древности и, прежде всего, к Аристотелю. Ему принадлежат слова, возраст которых 2,5 тыс. лет: «Из слов, высказываемых без какой-либо связи, каждое означает или сущность, или качество, или количество, или отношение, или обладание, или действие, или страдание» (Аристотель, Аналитики. – М.:Госполитиздат, 1952. – 438 с.).

Одной из наиболее древних попыток идеографических классификаций является труд Аристофана Византийского (директор Александрийской библиотеки, умер в 180 г. до н.э.). Во 11 в. н.э. появляется работа Юлия Поллукса «Ономастикон», составленная на материале греческого языка. Это словарь, состоящий из 10 книг. Каждая книга содержала слова, относящиеся к определенной теме. Например, в первой – слова, относящиеся к богам и царям; в седьмой – к теме «торговля», в десятой – к теме «утварь». Слова в этом словаре сопровождались краткими толкованиями.

Между II и III в н.э. появляется санскритский словарь «Амарокоша», который содержал около 10 тыс. слов и состоял из трех книг, каждая из которых делилась на главы, главы – на секции. Так, первая книга была посвящена небу, богам и всему тому, что с ними связано. В ней имелись секции «времена года», «небесный свод» и т.п. Вторая книга содержала слова, относящиеся к земле, растительному и животному миру и человеку. Для лучшего запоминания толкования давались в стихотворной форме.

Сам термин «тезаурус» был применен впервые в ХIII в. флорентийским ученым Брунето Латини, который использовал его в заголовке своего труда – систематизированной энциклопедии, назвав ее «Книга о сокровище». Это вполне соответствовало семантике употребленного слова «Thesauros», т.е. «сокровище», «богатство», «запас».

Современный этап истории идеографических словарей открывается работой П.М.Роже «Тезаурус английских слов и выражений» (1852 г.) Его тезаурус – это глубоко структурированная система, восходящая к самым общим категориям: абстрактные отношения, пространство, материя, дух. Всю понятийную область английского языка Роже разбивает на 4 класса: абстрактные отношения, пространство, материя и дух (разум, воля, чувства). Далее эти категории делятся на 24 класса, классы – на подклассы и т.д. Классы распадаются на категории, категории – на секции, секции – на группы. Всего у Роже 1000 понятийных групп, в каждую из которых он собирает слова, близкие по смыслу. Так, есть понятийные группы «рождение», «житель», «помещение», «удовлетворение».

Почти в то же время (1862 г.) появился «Аналогический словарь французского языка» Буасьера. Отобрав две тысячи слов французского языка, которые составляют активный словарь (слова повседневного употребления), и, взяв каждое такое слово за основу, Буасьер собирает все слова, семантически с ним связанные.

Следует подчеркнуть, что первые тезаурусы составлялись без всякой связи с особенностями информационной деятельности, они были органически связаны с фундаментальными проблемами познания, отображая представление о мире в целом и закономерностях его постижения средствами естественного языка. В дальнейшем, при проникновении идей тезауруса в автоматизированные ИПС, тезаурус стал рассматриваться как словарь для построения поисковых образов документов и запросов, качество которых существенно влияло на качество поиска информации.

2. Информационно-поисковые тезаурусы: сущность и назначение

Среди тезаурусов, понимаемых как идеографические словари, в особую группу выделяются информационно-поисковые тезаурусы (ИПТ), появление и развитие которых связано с автоматизацией информационного поиска в середине ХХ в.

ГОСТ 7.74-96 «Информационно-поисковые языки. Термины и определения» определяет ИПТ следующим образом: «Информационно-поисковый тезаурус (ИПТ) – нормативный словарь дескрипторного ИПЯ с зафиксированными в нем парадигматическими отношениями».

ИПТ не следует путать с дескрипторным словарем. ГОСТ 7.74-96 «Информационно-поисковые языки. Термины и определения» дает следующее разграничение этих понятий: «Дескрипторный словарь – словарь дескрипторного ИПЯ, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы без указания других отношений лексических единиц. Дескрипторный словарь является упрощенным вариантом ИПТ, в котором зафиксированы преимущественно или только синонимические связи».

Таким образом, термин «информационно-поисковый тезаурус» используется для обозначения словаря-справочника, в котором перечислены все лексические единицы дескрипторного ИПЯ с указанием их синонимов, а также явно выражены важнейшие смысловые отношения между дескрипторами».

Следует подчеркнуть, что на практике, в инструктивно-методической литературе существует большая путаница в понятийном аппарате. Тезаурусом подчас называют любую классификацию, любой рубрикатор или даже список. Тем не менее, следует отличать ИПТ от словарей синонимов, антонимов и ассоциативных; от компьютерных словарных списков взаиморасположения терминов в документах, которые часто в литературе называют автоматизированными тезаурусами; от списков предметных заголовков и ключевых слов, если в них не выражены семантические отношения между терминами.

ИПТ – это структурированный словарь для контроля лексики, в котором явно и системно определяются основные семантические отношения (эквивалентности, иерархические и ассоциативные) между терминами естественного языка. В соответствии с ГОСТ 7.25-2001 ИПТ ориентированы, прежде всего, на использование в рамках автоматизированных информацион­ных систем и сетей научно-технической информации.

Назначение ИПТ

Появление ИПТ неразрывно связано с развитием автоматизированных информационных систем (АИС). Первоначально целью создания ИПТ являлось повышение показателей качества поиска информации в АИС. В соответствии с этой целью назначение ИПТ заключалось в следующем:

1.  Обеспечивать индексирование документов и запросов средствами дескрипторного языка путем замены ключевых слов соответствующими дескрипторами, а также осуществлять избыточное индексирование документов и/или информационных запросов за счет использования вышестоящих, нижестоящих и ассоциативных понятий;

2.  Отражать парадигматические отношения, существующие между лексическими единицами какой-либо отрасли науки или техники.

3.  Служить средством контроля и нормализации лексики конкретной отрасли знания, обеспечивать единое и формализованное представление информации в ИПС.

Кроме того, ИПТ использовались и используются при традиционном (ручном) информационном поиске как средство терминологического контроля, позволяющее на основе эксплицитного представления парадигматических отношений между дескрипторами сужать или расширять область поиска, уточнять информационные запросы пользователей, осуществлять корректировку поисковых предписаний.

3. Структура ИПТ

В соответствии с ГОСТ 7.25-2001 «Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления» в состав ИПТ входят следующие элементы:

1) вводная часть;

2) основная часть (лексико-семантический указатель);

3)дополнительные части (систематический, пермутационный, иерархический и другие указатели и списки специальных категорий лексических единиц).

Обязательными составными частями являются вводная часть и лексико-семантический указатель.

Допускается в состав ИПТ вводить приложения, содержащие допол­нительные сведения о разработке и использовании ИПТ.

Вводная часть включает титульный лист и введение.

На титульном листе должны быть приведены:

— наименование ИПТ, включающее термин «информационно-поис­ковый тезаурус» и указывающее область его применения;

— наименование организации-разработчика и дополнительные сведения об авторстве ИПТ;

— сведения о переиздании;

— место и год создания или издания ИПТ.

Введение должно содержать:

— цель создания и область применения тезауруса, описанные кодами

и наименованиями рубрик Межгосударственного рубрикатора НТИ;

— ссылки на источники, использованные для сбора лексики ИПТ;

— ссылки на нормативные и методические документы, использован­ные при составлении ИПТ;

— описание порядка составления тезауруса, включая обоснование

представительности использованных источников лексики;

— описание состава и структуры;

— перечень отношений между лексическими единицами и методические основания для их установления;

— перечень всех символов и специальных сокращений, допущенных

для представления;

— порядок алфавитного расположения (расположение букв разных

алфавитов, небуквенных символов и др.);

— количественные характеристики тезауруса (общее число статей, число дескрипторов, аскрипторов и др.);

— описание состава и формы представления дополнительных данных в словарных статьях;

— абзац следующего содержания: «Тезаурус подготовлен в соответствии с ГОСТ 7.25».

Введение к последующим изданиям (версиям) ИПТ дополнительно должно содержать:

— обоснование необходимости составления новой версии тезауруса;

— указание на характер внесенных изменений.

Лексико-семантический указатель – это упорядоченная последовательностью словарных статей ИПТ, сформированная я путем расположения их в алфавитном порядке заглавных лексических единиц. Представляет собой алфавитный перечень всех дескрипторов и аскрипторов с их словарными статьями.

Приведем фрагмент лексико-семантического указателя из ИПТ по швейной промышленности:

КУРТКИ 2302

в Изделия костюмные

Изделия пальтовые

Изделия швейные

н Куртка двубортная

Куртка комбинированная

Куртка спортивная

КУСОК ТКАНИ 2203

с Отрез

в Меры упаковочные

а Выпада межлекальные

Лоскут

Метраж ткани

Остатки материала

Отходы материала

«Полотна красные»

Рулон

ЛАВСАН 2304

в Волокно полиэфирное

Волокна синтетические

ЛАСТИК ЖАККАРДОВЫЙ 2304

в Ткани подкладочные

Ткани

ЛЕКАЛА 2305

с Выкройки

Чертежи кроя

н — Лекала рабочие

— Лекала-эталоны

а Развертка поверхности

Трафареты

Шаблоны

Лекала вспомогательные

см Лекала производные

Дескрипторная статья состоит из заглавного дескриптора, списка дескрипторов и аскрипторов, семантически связанных с ним, с обозначением видов связи. В рамках дескрипторной статьи термины располагают в следующем порядке:

— заглавный дескриптор;

— дополнительные данные;

— лексическое примечание;

— аскрипторы или дескрипторы-синонимы;

— вышестоящие дескрипторы;

— нижестоящие дескрипторы;

— ассоциативные дескрипторы;

— дескрипторы, связанные другими видами отношений.

Внутри каждой группы ЛЕ, связанных с заглавным дескриптором одним видом парадигматических отношений, должен быть алфавитный порядок расположения. Например:

АЛГОРИТМИЧЕСКИЕ ЯЗЫКИ

с языки алгоритмические

машиноориентированные языки

проблемноориентированные языки

в ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ

ФОРМАЛЬНЫЕ ЯЗЫКИ

н АВТОКОДЫ

АЛГОЛ

ИПЛ

КОБОЛ

КОМИТ

ПЛ/1

ФОРТРАН

а АЛГОРИТМЫ

ПРОГРАММИРОВАНИЕ ср искусственные языки

Аскрипторная статья состоит из аскриптора и заменяющих его при обработке и поиске информации дескрипторов или комбинации дескрипторов. Приведем примеры аскрипторных статей:

Алфавитно-цифровые знаки

исп к БУКВЫ

ЦИФРЫ

Языки

исп а ФОРМАЛЬНЫЕ ЯЗЫКИ

ЕСТЕСТВЕННЫЕ ЯЗЫКИ

Языки программирования

см АЛГОРИТМИЧЕСКИЕ ЯЗЫКИ

Словарная статья может также включать:

— частоту использования дескриптора;

— кодовый номер дескриптора;

— код дескриптора по систематическому указателю;

— классификационные индексы;

— дополнительные семантические и лексикографические пометы;

— иноязычные эквиваленты.

Качество лексико-семантического указателя определяется полнотой включенных в него лексических единиц. Полнота понимается как вероятность вхождения в тезаурус любого информативно-значащего слова для данной тематической области. Полнота лексико-семантического указателя, а, следовательно, и всего тезауруса оказывает существенное воздействие на результаты индексирования документов и запросов.

Дополнительные части могут включать в свой состав систематический, пермутационный, иерархический и другие указатели и списки специальных категорий лексических единиц.

Систематический указатель – это указатель, в котором дескрипторы сгруппированы согласно принятой в ИПТ рубрикации. Систематический указатель определяет тематическое направление тезауруса, раскрывает его содержание и отражает те отрасли науки и техники, по которым можно с той или иной глубиной детализации проводить поиск. Необходимость его как составной части ИПТ обусловлена тем, что он дает наглядное представление об общем состоянии терминологии в той или иной области знаний, позволяет построить стройную терминологическую модель и учесть по возможности все термины и понятия, которые должны найти место в тезаурусе. Он предназначен для облегчения поиска терминов при составлении поисковых образов документов и запросов путем упорядочения множества дескрипторов и аскрипторов по предметному признаку.

Например, в ИПТ технологии машиностроения, в лексико-семантическом указателе имеется дескрипторная статья:

ГИСТЕРЕЗИС 1913

н Гистерезис диэлектрический

Гистерезис магнитный

Код заглавного дескриптора 1913 показывает связь лексико-семантического указателя с систематическим указателем ИПТ. Первые две цифры отражают первый уровень иерархии – дескрипторную область «19 Физика», к которой относится данный термин. Вторые две цифры отражают второй уровень иерархии в этой области – дескрипторную группу «1913 Электричество и магнетизм».

Пользуясь систематическим указателем, можно определить, термины каких областей знания используются в данном ИПТ. Так, ИПТ по технологии машиностроения включает термины из таких предметных областей, как «Строительство», «Физика», «Химия», «Электротехника и радиоэлектроника» и др.

Систематический указатель, по существу, представляет собой классификационную схему наполнения тезауруса терминологией, так как он строится путем упорядочения множества дескрипторов по предметно-тематическим областям.

Систематические указатели ИПТ подразделяют на три типа:

— тематические,

— категориальные,

— смешанные.

Такое деление отражает принцип построения классификационной схемы систематического указателя.

Основные функции, выполняемые систематическим указателем ИПТ:

— использование в качестве вспомогательного средства при индексировании, обеспечивающее, прежде всего, возможность поиска дескрипторов для индексирования понятий, не представленных в тезаурусе в явном виде (поисковая функция);

— использование в процессе ведения тезауруса (функция ведения ИПТ);

— использование в качестве структурной основы ИПТ, как средство управления его разработкой (конструктивная функция).

В соответствии с ГОСТ 7.25-2001 (2) при построении систематического указателя тематического и смешанного типов в его тематической части следует использовать рубрики Межгосударственного рубрикатора НТИ или рубрикатора конкретной АСНТИ, совместимого с Межгосударственным рубрикатором НТИ. При построении систематического указателя категориального и смешанного типов в его категориальной части следует использовать следующие общие категории:

— названия дисциплин и отраслей деятельности;

— предметы, материалы;

— методы, процессы, операции, явления;

— свойства, величины, параметры, характеристики;

— отношения, структуры, модели, законы, правила, абстрактные понятия.

Иерархический указатель. Иерархический указатель – указатель, в котором дан перечень списков дескрипторов, причем каждый список начинается с дескриптора, не имеющего вышестоящих. Он отражает полную структуру иерархических отношений в ИПТ. После каждого дескриптора приведе­ны непосредственно дескрипторы с указанием их уровня в иерар­хии путем применения нумерации либо графического обозначения уровня:

Консервирование

•Консервирование антисептиками

• Консервирование инертными газами

• Консервирование продовольствия

•• Вяление

••Квашение

••Копчение

•• Маринование

•• Посол (соление)

Консервирование

1 Консервирование антисептиками

1 Консервирование инертными газами

1 Консервирование продовольствия

2 Вяление

2 Квашение

2 Копчение

2 Маринование

2 Посол (соление)

Необходимость разработки иерархического указателя ИПТ бывает вызвана тем, что в словарных статьях ИПТ не закрепляется вся система подчиненности понятий, т.к. это повлекло бы за собой значительное увеличение лексико-семантического указателя. Отсюда возникает необходимость разработки самостоятельного раздела ИПТ – иерархического указателя, который бы отражал всю иерархическую цепочку подчиненности дескрипторов сверху донизу.

Пермутационный указатель – указатель, в котором в алфавитном порядке перечислены все отдельные слова, входящие в компоненты словосочетаний, обозначающих дескрипторы и для каждого из них указаны все дескрипторы, в состав которых входят эти слова. Следовательно, каждый термин встречается в пермутационном указателе столько раз, сколько значащих слов он содержит. Назначение пермутационного указателя – обеспечивать поиск дескрипторов-словосочетаний по любому слову, входящему в их состав, в том числе и по тем, которые не стоят в начале лексической единицы. Он позволяет группировать в одном месте однокоренные слова.

Как правило, пермутационный указатель составляется автоматизированным способом и имеет обычно вид указателя типа KWIC (Key Word – In Context – «Ключевые слова в контексте»), в котором все значащие слова – элементы терминов – располагаются в алфавитном порядке. Вход в пермутационный указатель находится в центре колонки, которую образуют микроконтексты элементов терминов, а неуместившаяся часть терминов переносится в левую часть той же строки:

оптические квантовые

возбуждения

электрические

с зависимым возбуждением

ГЕНЕРАТОРЫ помех

ГЕНЕРАТОРЫ последовательного

ГЕНЕРАТОРЫ постоянного тока

ГЕНЕРАТОРЫ постоянного тока

Включение в ИПТ пермутационного указателя позволяет устранить повторы, выявить и ликвидировать омонимию, получить высокий уровень накопления терминов, связанных родовидовыми и ассоциативными отношениями, выявить не представленные полностью группы однородных понятий и дополнить их, ввести пропущенные понятия.

Создание пермутационного указателя позволяет решить проблему инверсии прилагательного и существительного. Независимо от того, какое слово использовано для входа в указатель, термин будет найден с принятым для него порядком слов. Кроме того,

весьма важен тот факт, что в пермутационном указателе все термины, содержащие одинаковые слова, собраны вместе, что дает при поиске нить к тем терминам, которые потенциально могут оказаться необходимыми.

4.Порядок разработки, экспертизы, регистрации и ведения ИПТ

В настоящее время порядок разработки, экспертизы и регистрации ИПТ определяется двумя стандартами: ГОСТ 7.25-2001 «Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления» и ГОСТ 7.24-2007 «Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению». В соответствии с этими стандартами функции экспертизы и регистрации ИПТ выполняют национальный и международный депозитарные фонды.

Национальный депозитарный фонд ИПТ на русском языке (включая ИПТ, содержащие эквиваленты дескрипторов на русском языке) находится в Москве, в ВИНИТИ.

Существует также два международных депозитарных фонда ИПТ:

1) международный депозитарный фонд ИПТ на английском языке, включая ИПТ, содержащие эквиваленты дескрипторов на английском языке. Он находится в Канаде, в г. Торонто, в библиотеке факультета информационных наук Университета в Торонто (Thesaurus Clearinghouse – «расчетная палата», The Library, Faculty of Information Studies, University of Toronto, TORONTO, Canada);

2) международный депозитарный фонд ИПТ на всех других языках, кроме английского. Он находится в Польше, в Варшаве, в институте научной и технико-экономической информации (Instytut Informacji Naukowej, Technicznej i Ekonomicznej, Clearinghouse, WARSZAW A, Poland.).

Полные адреса этих организаций приводятся в ГОСТ 7.25-2001.

ГОСТ 7.25-2001 и ГОСТ 7.24-2007 определяют последовательность действий разработчиков ИПТ следующим образом:

1. До начала работ по созданию ИПТ разработчик должен обратиться в соответствующий национальный или международный депозитарный фонд с целью определения наличия зарегистрированных тезаурусов по заданной тематике. При наличии таких тезаурусов проводят оценку возможности внедре­ния их в данной системе. Если такие тезаурусы не обнаружены, разработчик может приступать к созданию ИПТ. При этом вся технология работы по созданию ИПТ должна строго соответствовать ГОСТ 7.25-2001 и ГОСТ 7.24-2007

2. Готовые (разработанные) ИПТ должны пройти экспертизу на соответствие ГОСТ 7.25-2001. Если они соответствуют стандарту, то Национальный депозитарий выдает разработчику сертификат соответствия. После этого ИПТ депонируется (сдается на хранение) в соответствующем национальном или в одном из международных депозитарных фондах (в Торонто или Варшаве).

Национальные депозитарии распространяют информацию о составе фонда депонированных ИПТ и предоставляют их разработчикам новых ИПТ с целью заимствования элементов и обеспечения совместимости лингвистического обеспечения различных информационных систем. Таким образом, они выполняют функции экспертизы, регистрации, хранения ИПТ и информирования об имеющихся ИПТ.

Ведение ИПТ. Следует помнить, что тезаурус никогда не может считаться вполне законченным, так как его содержание, объем и форма постоянно изменяются в связи с развитием науки, техники и производства. Среди причин, требующих периодически корректировать ИПТ, можно назвать:

— количественные и качественные изменения документального потока, поступающего в систему (например, появление нового тематического направления или поступление новых типов документов или, наоборот, прекращение их поступлений);

— изменение режимов поиска в системе; изменение средств реализации АИС (например, внедрение более мощных компьютеров нового поколения, позволяющих автоматизировать многие операции по ведению ИПТ);

— переход АИС от независимого функционирования к работе в режиме сети (при использовании ИПТ в рамках единой информационной сети принципы их ведения должны быть согласованы).

Процедура поддержания ИПТ в рабочем состоянии называется ведением или корректировкой тезауруса. Обычно она включает следующие операции:

— изменение лексического состава ИПТ: внесение новых лексических единиц, их удаление, изменение статуса лексических единиц (перевод ключевого слова в дескрипторы и наоборот);

— изменение парадигматических отношений в ИПТ (усиление, дифференциация, ослабление);

— переиздание ИПТ, которое рекомендуется производить следующим образом: второе и третье издание – через год, а последующие – через два-три года.

Процедура ведения ИПТ предполагает обязательное использование средств автоматизации, позволяющих оперативно производить такие трудоемкие операции, как алфавитная сортировка словника, частотный анализ лексики, проверка взаимности и непротиворечивости ссылок, с помощью которых в ИПТ фиксируются парадигматические отношения и др.

Обновлено: 25.05.2023

В настоящее время в связи с возрастанием объема документальной информации, необходимой для принятия эффективного управленческого решения, и возможностями, предоставляемыми новыми компьютерными технологиями, автоматизированные информационно-поисковые системы стали широко использоваться в различных сферах экономики.

Организация быстрого и эффективного поиска документальной информации становится все более неразрешимой проблемой.

Цель документального поиска — нахождение и выдача соответствующих запросу пользователя документов или их описаний.

Традиционно информационно-поисковые системы (ИПС) применяются для тематического поиска научно-технической информации в крупных библиотеках, научно-технических центрах, архивах, патентных библиотеках.

Таким образом, сфера приложения для технологий информационно-поисковых систем представляется достаточно широкой.

При автоматизации поиска документальной информации важнейшей является задача формализации содержания документа и запроса. При этом поиск происходит по всему тексту документа или по его поисковому образу, а в качестве запроса чаще всего выступают отдельные ключевые слова или их логические комбинации. Именно на этой технологии основано действие информационно-поискового тезауруса (ИПТ). Цель моей работы – дать необходимые определения, определить цели разработки ИПТ, его структуру и построение, а также значение и перспективы развития.

1. И нформационно-поисковые системы

Автоматизированный документальный поиск может быть организован на основе различных технологий: поиска по поисковому образу документа, поиска по полному тексту документа, поиска документов по гипертекстовым ссылкам.

Технология полнотекстового поиска является неотъемлемой составляющей таких современных и перспективных информационных технологий, как: системы управления документами (Documentmanagementsystem, DMS), технологии групповой работы над документами (groupware), технологии поиска в Internet/intranet. На технологии гипертекста базируется самый известный сервис InternetWorldWideWeb (WWW).

Информационно-поисковая система для управленческих документов, как правило, требует раз­работки собственного информационно-поискового языка, адекватного данной предметной области.

В документальных информационно-поисковых системах поиск документа происходит по краткому формализованному описанию его содержания — так называемому поисковому образу документа.

Важнейшей структурной составляющей является информационно-поисковый язык.

Информационно-поисковый язык, ИПЯ (indexinglanguage, retrievallanguage) — искусственный язык для выражения содержания документов или запросов с целью последующего поиска.

Основное назначение ИПЯ — установить принадлежность того или иного документа к определенной группе понятий.

Перевод текстов документов и запросов на ИПЯ называется индексированием.

В результате индексирования содержание документа отображается в поисковый образ документа, а содержание запроса — в поисковое предписание.

Индексирование может быть ручным (когда его производит человек) или автоматическим.

Для общения человека с компьютером разрабатываются специальные искусственные языки, естественный язык (ЕЯ) в этом качестве пока не может быть использован без специального предварительного преобразования. В естественном языке присутствуют: синонимия, омонимия и полисемия, избыточность, субъективность и другие свойства, препятствующие его автоматизированной обработке.

Синонимы — слова, различающиеся по написанию, но совпадающие по смыслу (Россия, РФ, Российская Федерация).

Омонимы — слова, совпадающие по звуковому и графическому составу, но имеющие разные значения (ключ может быть — телеграфный, поисковый, к замку, к шкафу и т.д.).

Полисемия — наличие у одного и того же слова нескольких разных, но связанных между собой значений (например: фамилия — как имя и фамилия — как семья).

Искусственный язык, как правило, разрабатывается на основе ЕЯ. При этом устраняется многозначность слов ЕЯ.

Слова любого языка в процессе отображения предметов реального мира вступают между собой в определенные отношения. Эти отношения можно разделить на парадигматические и синтагматические.

Парадигматические отношения — логические отношения, существующие между лексическими единицами ИПЯ независимо от контекста, в котором эти лексические единицы употребляются. Эти отношения обусловлены предметно-логическими, а не языковыми факторами, т.е. относятся к категории внеязыковых связей. Примеры парадигматических отношений: часть — целое (отдел — организация); род — вид (ценная бумага — акция); причина — следствие; функциональное сходство; ассоциации. Учет парадигматических отношений необходим для правильного выбора и точного употребления слов.

Наиболее часто в качестве основания деления при классификации ИПЯ используют способ организации понятий. По способу организации понятий различают: предкоординируемые (классификационные) ИПЯ; посткоординируемые (дескрипторные) ИПЯ.

Дескрипторные языки семантически более сильны, чем классификационные, но более сложны для формальной обработки.

Дескриптор — ключевое слово или словосочетание, служащее именем класса эквивалентных ключевых слов (синонимов). Как правило, в качестве дескриптора выбирают одно, наиболее употребляемое ключевое слово из класса синонимичных ключевых слов.

Разработка дескрипторного языка фактически сводится к разработке информационно-поискового тезауруса.

2. Информационно-поисковый тезаурус: определение, цель разработки

Тезаурус – термин, широко используемый в информатике как составная часть информационно-поисковых систем.

Можно выделить два определения информационно-поискового тезауруса:

1. Информационно-поисковый тезаурус представляет собой словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка (дескрипторами) и предназначенный для поиска слов по их смысловому содержанию.

2. Информационно-поисковый тезаурус (ИПТ) – контролируемый словарь терминов предметной области, создаваемый для улучшения качества информационного поиска в данной предметной области.

И в том, и в другом случае речь идет о словаре, который призван облегчить поиск необходимой информации.

Возможно два способа расположения слов в словарях: по близости их буквенного состава и по смысловой близости.

По первому способу создаются алфавитные словари. По второму способу — тезаурусы. Алфавитные словари служат для раскрытия значения данного слова. Тезаурусы служат для поиска слов для выражения данного понятия. Т.е., если в обычном словаре по слову ищется его смысл, то в тезаурусе по заданному смыслу ищутся слова, которые этот смысл выражают.

Цели разработки ИПТ:

— перевод языка авторов на контролируемый язык, используемый для индексации и поиска;

— обеспечение последовательности в присваивании индексных терминов;

— обозначение отношений между терминами;

— облегчение информационного поиска.

3. Использование информационно-поисковых тезаурусов

Тезаурусы используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации: переводчики, редакторы, научные работники, референты и др.

Информационно-поисковые тезаурусы используются при индексировании документов и запросов.

Различают безтезаурусное индексирование и индексирование с тезаурусным контролем лексики.

При безтезаурусном индексировании поисковый образ документа представляется в виде списка ключевых слов, выбранных непосредственно из текста документа. Такое индексирование требует меньше времени и менее трудоемко. Однако такой режим индексирования обладает рядом недостатков: возможна синонимия; нельзя отразить парадигматические отношения.

При индексировании с тезаурусным контролем лексики для выражения содержания документа и запроса используют только дескрипторы, входящие в информационно-поисковый тезаурус, что позволяет исключить синонимию и учесть парадигматические связи, и, в конечном счете, повышает эффективность поиска.

Таким образом, информационно-поисковые тезаурусы используются для:

— перевода текста с ЕЯ на дескрипторный ИПЯ путем замены ключевых слов соответствующими дескрипторами, при этом исключается многозначность;

— отображения парадигматических связей между дескрипторами.

4. Структура информационно-поискового тезауруса

Тезаурус имеет вид словаря, в котором в определенном порядке расположены термины и зафиксированы связи между ними.

Как правило, тезаурус состоит из введения, алфавитного указателя (словарная часть) и систематического указателя.

Введение содержит общие характеристики тезауруса — область применения, правила использования, число дескрипторов, ключевых слов и другую справочную информацию.

Алфавитный указатель включает алфавитный перечень дескрипторных статей.

Дескрипторная статья может иметь следующую структуру:

— ключевые слова из класса эквивалентности;

— дескрипторы, подчиняющие заглавный;

— дескрипторы, подчиненные заглавному;

— дескрипторы, ассоциированные с заглавным.

Ассоциации могут быть следующих видов: причина — следствие; сырье — продукт; процесс — объект; процесс — субъект; свойство — носитель свойства; функциональное сходство и др.

Систематический указатель служит для раскрытия, учета и контроля парадигматических отношений между дескрипторами. Для каждого дескриптора ИПЯ должны быть найдены соответствующие родовые и видовые дескрипторы. Причем предварительно необходимо сформулировать критерии, определяющие число уровней иерархии. Определение степени отображения парадигматических отношений зависит от требований, предъявляемых к системе. Чем шире эти отношения отображены, тем выше полнота выдачи, но одновременно происходит увеличение словарного запаса, усложняется система ссылок и может произойти уменьшение точности поиска.

5. Построение информационно-поисковых тезаурусов

Построение тезауруса состоит из нескольких взаимосвязанных этапов.

Первый этап — формирование словника. Словник — первоначальные множества ключевых слов. При этом рассматривается представительный массив наиболее информативных для данной предметной области документов. Например: реферативные журналы, словари, учебники, справочники, нормативные документы и т.д. Выбираются слова, употребляемые в этих источниках, при этом устанавливается частота употребления слов и учитываются все формы, которые могут иметь слова.

Второй этап — формирование множества ключевых слов. Из словника формируется множество ключевых слов. При отборе ключевых слов учитывается информативность слова, которая определяется исходя из частоты встречаемости слова, роли слова в данной предметной области. Процесс выбора ключевых слов достаточно сложно формализовать. Например, такой критерий, как частота встречаемости не может быть абсолютным. Если слово встречается в текстах очень часто, это может означать, что оно выражает чрезмерно широкое понятие, либо недостаточно четко определено, т.е. неинформативно. Если ключевое слово встречается очень редко, это может означать, что оно выражает новое понятие и таким образом является информативным.

Третий этап — формирование классов эквивалентности. Выделение дескрипторов.

Класс эквивалентности — это группа терминов, равнозначных по смыслу в пределах сферы действия данной системы. Одно из слов класса эквивалентности объявляется дескриптором (как правило, наиболее употребляемое). Все слова, включенные в класс эквивалентности, объявляются условными синонимами (условными — так как они равнозначны в пределах данной предметной области, а в ЕЯ эти слова могут не являться синонимами).

В процессе построения тезауруса и выделения множества дескрипторов происходит устранение синонимии, омонимии, полисемии ключевых слов, а также выявление парадигматических связей между дескрипторами.

В ЕЯ многие слова могут быть правильно истолкованы только с учетом контекста. В ИПЯ для правильной трактовки ключевых слов необходимы средства для исключения многозначности трактования слов.

Для устранения многозначности (омонимии и полисемии) ключевое слово, которое можно неоднозначно трактовать, снабжается пометой, в которой указывается в каком значении данное ключевое слово используется в ИПЯ.

Разработка тезауруса без использования компьютерных технологий — достаточно длительный и трудоемкий процесс.

Документы Частота слова в документе
1 2 3 4 5 6 7
D1 D2 D3 D4

Автоматические информационно-поисковые тезаурусы являются составным элементом систем автоматического индексирования документов и запросов. В словарной статье автоматического тезауруса, как правило, зафиксированы отношения условной эквивалентности (синонимии), отношение подчинения и ассоциативные отношения.

6. Сфера применения и перспективы развития информационно-поисковых тезаурусов

В настоящее время происходит расширение сфер применения автоматических тезаурусов. При этом тезаурусы выступают составной частью современных систем подготовки текстов, осуществляя лингвистическую поддержку процесса подготовки и обработки текстов на естественном языке.

Среди наиболее перспективных направлений развития автоматических тезаурусов можно указать следующие:

1. Получение справки по используемому слову. Указав слово, в качестве ключа для запроса, пользователь в ответ получает соответствующий фрагмент словаря, содержащий лингвистическую информацию о данном слове. Например, автоматический тезаурус получает от пользователя некоторое существительное и в ответ выдает совокупность устойчиво сочетающихся с ним глаголов или все наиболее часто сопровождающие его определения. При этом автоматически выполняется процедура нормализации входного слова (т.е. приведение существительного к именительному падежу).

2. Контекстные замены по требованию пользователей. В данном случае тезаурус не только подбирает вместо одного словосочетания другое, которое пользователь счел более соответствующим контексту по смысловым или стилистическим соображениям, но и автоматически переоформляет параметры слов (например, род прилагательного) в соответствии с контекстом. Это означает, что синтаксические операции, производимые тезаурусом, существенно усложняются.

3. Автоматическая оценка стиля. Если слова и словосочетания в тезаурусе снабдить стилистическими пометками, то он может использоваться для стилистической оценки текста с выделением слов и словосочетаний, выпадающих, из общего стиля документа.

В условиях конкурентной борьбы, необходимости постоянного повышения качества работы органа управления и всего предприятия в целом на руководителя обрушивается мощный поток информации, прежде всего документальной, и у него возникают проблемы с ее переработкой. Необходимы специальные методы информационной обработки документов, организации быстрого и эффективного поиска документальной информации. Именно информационно-поисковые тезаурусы служат решению этой проблемы.

Считаю, что в моей работе достаточно подробно и логично изложены способы использования и построения информационно-поискового тезауруса, а также сфера его применения и перспективы развития.

1. Ивасенко А.Г. Информационные технологии в экономике и управлении: учебное пособие / А.Г.Ивасенко, А.Ю.Гридасов, В.А.Павленко.- 2-е изд., стер.- М.: КНОРУС, 2007.- 160с.

2. Информатика для юристов и экономистов / Симонович С.В. и др.- СПб.: Питер, 2001.- 688с.: ил.

3. Информатика: Базовый курс/С.В.Симонович и др.- СПб.: Питер, 2002.- 640с.: ил.

4. Михеева Е.В. Информационные технологии в профессиональной деятельности: учебное пособие.- М.: ТК ВЕЛБИ, Изд-во Проспект, 2007.- 448с.

Часто у студентов возникают проблемы с написанием реферата, особенно это касается внешнего вида работы. Принимаясь за форматирование текста, надо изучить правила оформления и образцы.

Как делать реферат, образец для студента

Реферат – это небольшое исследование, которое подтверждает те или иные знания студента. Первое, с чем придется столкнуться учащемуся – структурный план будущего проекта. Озаглавить разделы и подразделы следует согласно теме реферата. Если тема касается анализа финансового состояния организации, то и названия глав должны быть связаны с данным разделом экономики. Вместе с титульным листом, содержанием и списком литературы максимальный объем текста составляет до 20 листов. Поэтому необходимо определить, сколько страниц будет занимать каждая часть реферата:

Введение – 1 стр.

1 глава – 5-7 стр.

2 глава – 5-7 стр.

Заключение – 1 стр.

Набирая текст на компьютере, исходный материал перепечатывается своими словами. Преподавателю необходимо понять, что студент не просто поработал с источниками, но смог сформировать и свою точку зрения. Помимо грамотного внутреннего содержания, реферат должен быть качественно оформлен.

Реферат по истории.

Реферат по биологии.

Реферат по экономике.

Структура реферата на примере готовых работ

Даже придерживаясь рекомендаций методических пособий и государственных стандартов не всегда получается правильно написать реферат. Намного легче делать задание, когда перед глазами есть хороший пример, ведь у каждой части учебного проекта есть свои определенные правила написания и нормы оформления.

Образец титульного листа

Образец титульного листа реферата поможет более подробно изучить его визуальную составляющую.

Как оформляется вторая страница реферата

Левое поле – 3 см.

Правое поле – 1,5 см.

Верхнее и нижнее поля – 2 см.

В случае, когда составление оглавления дается с трудом, всегда можно воспользоваться шаблонами и образцами .

СОДЕРЖАНИЕ
ВВЕДЕНИЕ . 3
1 ГЛАВА. ЭКСТРЕМАЛЬНАЯ ЖУРНАЛИСТИКА. ОСОБЕННОСТИ И СПЕЦИФИКА . 4
1.1. Появление и становление экстремальной журналистики как профессиональной деятельности . 4
1.2. Правовые и этические аспекты работы журналиста в зоне экстремальных ситуаций . 8
2 ГЛАВА. УЧАСТИЕ РОССИЙСКИХ СРЕДСТВ МАССОВОЙ ИНФОРМАЦИИ В ВОЕННЫХ КОНФЛИКТАХ КОНЦА XX ВЕКА . 11
2.1. История и становление экстремальной журналистики в России . 11
ЗАКЛЮЧЕНИЕ . 14
СПИСОК ЛИТЕРАТУРЫ . 15

Как писать введение

Введение – это краткое изложение всего проекта, с обоснованием актуальности темы и целей исследования. Данная часть работы должна уместиться на одном листе. Чаще всего во введении используются шаблонные фразы. Написать введение можно по следующему плану:

Несколько слов о теме реферата.

Рассказать об актуальности поставленной проблемы.

Определить объект исследования.

Выделить несколько задач, используя слова: исследовать, изучить, рассмотреть.

Рассказать о методологической составляющей работы, описать источники.

Рассказать о структуре работы: сколько глав, объем, количество таблиц и рисунков.

Пример основной части

Проверить правильность разметки.

Выставить шрифт Time New Roman, кегль – 14, с полуторным интервалом.

Заголовки выровнять по центру, основной текст – по ширине листа.

Пример, как делается оформления основной части исследования, можно увидеть в образце.

ГЛАВА 1. ОСНОВНЫЕ ОРГАНИЗАЦИОННО-ПРАВОВЫЕ ФОРМЫ ПРЕДПРИЯТИЯ В РОССИЙСКОЙ ФЕДЕРАЦИИ И ИХ ЗАКОНОДАТЕЛЬНОЕ ОБОСНОВАНИЕ
1.1 Основные организационно-правовые формы предприятия, регистрируемые на территории Российской Федерации

Организационно-правовая форма предприятия – это понятие, которое позволяет определить финансово-экономическую и хозяйственную направленность организации. Вместе с тем это помогает определить отраслевую принадлежность и предприятия.

1.2 Законодательные предпосылки для регистрации предприятия, последствия их нарушения

Все действия граждан нашей страны регулируются конституционным правом. Для создания и ведения бизнеса также существуют определенные законодательные нормы. Данные акты прописаны в Гражданском Кодексе, Кодексе об административных правонарушениях, Федеральном Законе и Уголовном Кодексе Российской Федерации.

ГЛАВА 2. ОСОБЕННОСТИ ВЫБОРА ОРГАНИЗАЦИОННО-ПРАВОВОЙ ФОРМЫ ПРЕДПРИЯТИЯ, В ЗАВИСИМОСТИ ОТ УСЛОВИЙ ВЕДЕНИЯ БИЗНЕСА
2.1. Сравнительная характеристика организационно-правовых форм, их преимущества и недостатки

Для того чтобы наиболее полно раскрыть тематическую составляющую нашего реферата, мы разобрали и сравнили следующие, самые распространенные организационно-правовые формы предприятия:

  • Индивидуальное предпринимательство (ИП).
  • Общество с ограниченной ответственностью (ООО).
  • Акционерное общество (АО).
  • Некоммерческая организация (НКО).

2.2. Основные критерии выбора организационно-правовой формы предприятия на этапе его создания

Выбор той или иной организационно-правовой формы предприятия является важным этапом на пути к ведению прибыльного бизнеса. Первый критерий – это соответствие уровню ответственности. Предприниматель должен отвечать за последствия своей деятельности: ИП – собственным имуществом, ООО – размерами уставного капитала.

Образец заключения

Как оформить список литературы

Каждый источник, который студент использовал в ходе написания реферата, надо отражать в списке литературы. Все нюансы составления библиографии прописаны в ГОСТ 7.1-2003. Важно использовать только актуальные и новые источники, не старше 5 лет на начало написания реферата. Располагать источники необходимо по фамилии авторов в алфавитном порядке, используя арабскую нумерации. Самое оптимальное количество источников – это 10 учебников, монографий, статей и законодательных актов вместе взятых.

Образцы с оформлением готового реферата по ГОСТу

Оформление реферата регламентируется не только методическими рекомендациями учебного заведения, но и требованиями государственных стандартов . При формировании внешнего вида исследования необходимо пользоваться следующими нормами:

Для того, чтобы понять как полностью выглядит структура реферата, сформированная по ГОСТу, ниже представлен образец.

Реферат на книгу, образец

В студенческой практике встречаются ситуации, когда преподаватель дает задание написать реферат по книге. Это аннотация произведения или небольшой доклад. Для данного проекта необходимо прочитать то, о чем студент собирается писать. Дополнительно можно использовать статьи известных критиков, отзывы читателей и авторефераты. Реферировать книгу необходимо в соответствии с последовательностью глав, анализируя процессы и явления, происходящие в произведении.

Все использованные материалы необходимо занести в список литературы, включая интернет-порталы. В зависимости от размера книги и ее жанрового направления, можно разделить текст реферата на несколько логических блоков – подразделов. Написание подобной работы может быть произведено в более свободной форме, нежели стандартный учебный реферат . Не всегда для аннотаций требуется наличие титульного листа. В самом начале текста необходимо указать автора работы, название книги, информацию об издании, год выпуска и количество листов. Завершить реферат следует небольшими выводами или полноценным заключением, а также библиографическим списком. Материал формируется в соответствии со стандартами:

Размер шрифта – 14 кегель.

Цвет текста – черный.

Выравнивание должно быть по ширине листа, заголовки по центру.

Стиль шрифта – Times New Roman.

Интервал между строк – полуторный.

Жирный шрифт используется для выделения заголовков и структурных элементов реферата, возможно написание заголовков заглавными буквами.

Абзацный отступ – 1,25 см.

Размеры полей: левое – 30 мм, правое – 15 мм, верхнее и нижнее – 20 мм.

Главное, в такой работе, чаще высказывать собственное мнение и использовать, в качестве подкрепления точки зрения, цитаты автора произведения. Более наглядно образец оформления реферата на книгу представлено ниже.

Часто задаваемые вопросы

Вопрос. Сколько должно быть разделов в реферате?

Ответ. Обязательными разделами реферата являются: введение, название главы, заключение, список литературы. Сколько будет глав зависит от темы и объема работы. В каждой главе могут быть еще и параграфы.

Вопрос. Что написать в резюме в конце реферата,если преподаватель требует писать его без учета содержания реферата а просто написать об опыте его написания?

Ответ. Преподаватель хочет, чтобы Вы подытожили и сказали, как далось написание работы, с какими трудностями пришлось столкнуться при написании, а какие моменты, наоборот, писались легко.

Что такое тезаурус? В статье рассмотрим общий термин и поговорим о тезаурусе в Ворде. На практике воспользуемся тезаурусом в программе Word. Эта информация может вам пригодится при написании текстов или в процессе замены слов.

Что такое тезаурус, для чего он нужен

Что такое тезаурус

Здравствуйте, друзья! Что такое тезаурус? Это информационный вид словаря или по-другому словарь синонимов. Он хранит в себе различные слова, которые можно использовать для того или иного слова в тексте. То есть, подбирает для слов похожие синонимы или антонимы – противоположные слову.

Для чего нужен тезаурус? Как правило, он нужен для поиска похожих слов и замены старых словосочетаний. Рассмотрим простой пример необходимости использования тезауруса. К примеру, копирайтер написал текст, а он выглядит не уникальным. Чтобы повысить уникальность, можно подобрать слова синонимы для текста. В этом случае, как раз помогает тезаурус.

Вы просто используете набор слов готового словаря и заменяете в тексте слова на другие. Главное подобрать то слово, из-за которого не потеряется смысл текста.

Что такое тезаурус в программе Ворд

Тезаурус в программе Ворд – это словарь синонимов. Данный инструмент встроен в программу. В поздних версиях программы Ворд 2007, 2010, 2013 и так далее, эта функция работает без сбоев.

Так выглядит тезаурус в программе Word (скрин 1).

что такое тезаурус в word

При нажатии данного инструмента, вы увидите список слов, которые будут доступны в справочном материале.

Как пользоваться тезаурусом в Ворде

Рассмотрим инструкцию, с помощью которой вы научитесь пользоваться тезаурусом в Ворде:

Рассмотренную выше инструкцию мы разберем ниже на практике.

Как пользоваться тезаурусом из интерфейсного меню

как пользоваться тезаурусом

Справа в программе будет открыт справочник, откуда вы можете выбрать словосочетание (скрин 3).

тезаурус

Как пользоваться тезаурусом из контекстного меню

Как пользоваться тезаурусом в Ворде

Заключение

В данной статье рассмотрели, что такое тезаурус и как им пользоваться. Применив готовый словарь к своему тексту, вы сможете его улучшить, разбавить новыми словами или повысить уникальность. Измененный текст можно публиковать на ресурсах в Интернете или отправлять работы заказчикам.

4. Порядок разработки, экспертизы, регистрации и ведения ИПТ.

1. ГОСТ 7.74 – 96. Информационно-поисковые языки. Термины и определения [Текст]. – Введ. 1997-07-01. – Минск: Межгосударственный совет по стандартизации, метрологии и сертификации, 1997. – 34 с. (Система стандартов по информации библиотечному и издательскому делу) ТК 191.

2. ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления [Текст]. – Взамен ГОСТ 7.25-80; Введ. 2002-07-01. – М.: ИПК Изд-во стандартов, 2001. – 16 с. МТК 191.

4. Баранов, О. С. Идеографический словарь русского языка [Текст] / О. С. Баранов. – М.:Издательство ЭТС, 1995. – 820 c

5. Жмайло, С. В. К вопросу об определении тезауруса [Текст] / С. В. Жмайло // НТИ. Сер. 1 Организация и методика информационной работы. – 2003. – №12. – С.20 – 25.

6. Жмайло, С. В. К разработке современных информационно-поисковых тезаурусов [Текст] / С. В. Жмайло // НТИ. Сер. 1 Организация и методика информационной работы. –2004. – №1. – С.23 – 31.

7. Пробст, М. А. Тезаурус и информационный поиск [Текст] / М. А. Пробст // НТИ. Сер. 2. Информационные процессы и системы – 1979. – №9. – С. 14 – 20.

1. Тезаурус как способ систематизированного представления знаний и разновидность идеографического словаря

Тезаурус (от греч. Thesauros – клад, сокровище, сокровищница) – многозначное слово, имеющее, как минимум, два значения:

2) тезаурус как материально существующий объект – словарь. Тезаурус – это словарь особого типа или идеографический словарь, в котором слова располагаются не по алфавиту, а по степени смысловой близости. Лексика языка представлена в них в виде систематизированных групп слов, в той или иной степени близких в смысловом отношении (синонимы, гиперонимы, гипонимы, антонимы, паронимы и др.). Тезаурус представляет собой упорядоченную совокупность лексических единиц, в которой в явном виде с помощью специальных помет отражены смысловые отношения (синонимические, родовидовые и ассоциативные) между лексическими единицами. Иными словами, упорядочение лексики в тезаурусе осуществляется не по алфавитному или другому формальному признаку, а по смысловому (семантическому).

Из истории тезаурусов

Следует подчеркнуть, что первые тезаурусы составлялись без всякой связи с особенностями информационной деятельности, они были органически связаны с фундаментальными проблемами познания, отображая представление о мире в целом и закономерностях его постижения средствами естественного языка. В дальнейшем, при проникновении идей тезауруса в автоматизированные ИПС, тезаурус стал рассматриваться как словарь для построения поисковых образов документов и запросов, качество которых существенно влияло на качество поиска информации.

2. Информационно-поисковые тезаурусы: сущность и назначение

Среди тезаурусов, понимаемых как идеографические словари, в особую группу выделяются информационно-поисковые тезаурусы (ИПТ), появление и развитие которых связано с автоматизацией информационного поиска в середине ХХ в.

Следует подчеркнуть, что на практике, в инструктивно-методической литературе существует большая путаница в понятийном аппарате. Тезаурусом подчас называют любую классификацию, любой рубрикатор или даже список. Тем не менее, следует отличать ИПТ от словарей синонимов, антонимов и ассоциативных; от компьютерных словарных списков взаиморасположения терминов в документах, которые часто в литературе называют автоматизированными тезаурусами; от списков предметных заголовков и ключевых слов, если в них не выражены семантические отношения между терминами.

ИПТ – это структурированный словарь для контроля лексики, в котором явно и системно определяются основные семантические отношения (эквивалентности, иерархические и ассоциативные) между терминами естественного языка. В соответствии с ГОСТ 7.25-2001 ИПТ ориентированы, прежде всего, на использование в рамках автоматизированных информацион­ных систем и сетей научно-технической информации.

Появление ИПТ неразрывно связано с развитием автоматизированных информационных систем (АИС). Первоначально целью создания ИПТ являлось повышение показателей качества поиска информации в АИС. В соответствии с этой целью назначение ИПТ заключалось в следующем:

1. Обеспечивать индексирование документов и запросов средствами дескрипторного языка путем замены ключевых слов соответствующими дескрипторами, а также осуществлять избыточное индексирование документов и/или информационных запросов за счет использования вышестоящих, нижестоящих и ассоциативных понятий;

2. Отражать парадигматические отношения, существующие между лексическими единицами какой-либо отрасли науки или техники.

3. Служить средством контроля и нормализации лексики конкретной отрасли знания, обеспечивать единое и формализованное представление информации в ИПС.

Кроме того, ИПТ использовались и используются при традиционном (ручном) информационном поиске как средство терминологического контроля, позволяющее на основе эксплицитного представления парадигматических отношений между дескрипторами сужать или расширять область поиска, уточнять информационные запросы пользователей, осуществлять корректировку поисковых предписаний.

3. Структура ИПТ

1) вводная часть;

2) основная часть (лексико-семантический указатель);

3)дополнительные части (систематический, пермутационный, иерархический и другие указатели и списки специальных категорий лексических единиц).

Обязательными составными частями являются вводная часть и лексико-семантический указатель.

Допускается в состав ИПТ вводить приложения, содержащие допол­нительные сведения о разработке и использовании ИПТ.

Вводная часть включает титульный лист и введение.

На титульном листе должны быть приведены:

— наименование организации-разработчика и дополнительные сведения об авторстве ИПТ;

— сведения о переиздании;

— место и год создания или издания ИПТ.

— цель создания и область применения тезауруса, описанные кодами

и наименованиями рубрик Межгосударственного рубрикатора НТИ;

— ссылки на источники, использованные для сбора лексики ИПТ;

— ссылки на нормативные и методические документы, использован­ные при составлении ИПТ;

— описание порядка составления тезауруса, включая обоснование

представительности использованных источников лексики;

— описание состава и структуры;

— перечень отношений между лексическими единицами и методические основания для их установления;

— перечень всех символов и специальных сокращений, допущенных

— порядок алфавитного расположения (расположение букв разных

алфавитов, небуквенных символов и др.);

— количественные характеристики тезауруса (общее число статей, число дескрипторов, аскрипторов и др.);

— описание состава и формы представления дополнительных данных в словарных статьях;

Введение к последующим изданиям (версиям) ИПТ дополнительно должно содержать:

— обоснование необходимости составления новой версии тезауруса;

— указание на характер внесенных изменений.

Лексико-семантический указатель – это упорядоченная последовательностью словарных статей ИПТ, сформированная я путем расположения их в алфавитном порядке заглавных лексических единиц. Представляет собой алфавитный перечень всех дескрипторов и аскрипторов с их словарными статьями.

Приведем фрагмент лексико-семантического указателя из ИПТ по швейной промышленности:

Читайте также:

      

  • Установление неправильностей записей актов гражданского состояния реферат
  •   

  • Управление памятью в linux реферат
  •   

  • Талғат мұсабаев реферат қазақша
  •   

  • Физическая культура как социальная система реферат
  •   

  • Ксро өнеркәсібінің дамуына қазақстанның қосқан үлесі реферат

Понравилась статья? Поделить с друзьями:
  • Как найти площадь перевернутой трапеции
  • Как составить план маркетинговых мероприятий
  • Шарлотка сухая как исправить
  • Как исправить неаттестацию по физкультуре
  • Как быстро найти девушку на одну ночь