Как найти контекст в предложении

В выше приведенном предложении («все люди смертны, при условии, что нет ни одного человека, который бы жил вечно (и это было бы доказано), и что речь идет только о таком человеке, который обладает свойством «биологическое существо», которое, в свою очередь, обладает уникальным свойством «смертность», т.е. прекращение биологического существования»), все смысловые блоки описывают основную ключевую мысль — «все люди смертны». Описывают, значит, ставят данную мысль в определенную смысловую ситуацию, в которой используемые в ключевой фразе термины и понятия приобретают строго определенное значение, в полном соответствии с решаемой человеком задачей.

Это и называется контекстом предложения, о чем мы уже писали. Если собеседники хорошо знают предмет обсуждения, контекст в явном виде может опускаться, он просто подразумевается. Если собеседники не очень хорошо знакомы, то контекст, как правило, фиксируется в предложении в явном виде — в терминах и аксиоматических понятиях, которые становятся общими и обязательными для каждого из них. Ибо вне контекста, ни о какой сущностной взаимосвязи субъекта и предиката не может быть и речи. Контекст всегда, явно или не явно, но обязательно присутствует в предложении.

Каждый из смысловых блоков строится точно так же, как любое предложение, то есть он содержит субъект и свой предикат. Характер отношений между ними, при необходимости (если данный смысловой блок не выступает аксиомой), устанавливается другими, как правило, последующими, смысловыми блоками, находящимися в предложении.

Получается, что все смысловые блоки, строго или не очень строго, взаимоувязываются между собой, относительно той основной мысли, которую необходимо выразить предельно четко и понятно, что бы она была принята собеседником и стала для него аксиомой. Это первое и необходимое условие для построения серии дальнейших рассуждений, ибо рассуждать можно только исключительно на основе аксиом, т.е. принятого знания как истинного и т.д.

Но содержание каждого такого блока строго функционально, т.е. каждый из них выполняет определенную роль в предложении.

Функции смысловых блоков в предложении могут быть следующими:

• при каких гипотетических условиях может совершиться данное событие: «если, то…»: — гипотетическое, т.е. возможное совершение события.

• при каких причинно-следственных условиях совершается данное событие. «При условии, что нет ни одного человека, который бы жил вечно»;

• что является или принимается за аксиому или постоянную величину. «Нет ни одного человека»;

• каковы временные параметры. «Жил бы вечно»;

• каковы пространственные параметры. «Все люди»;

• что является доминантой: «Смертность, как свойство биологического организма»;

• о каком явлении идет речь: «Все люди смертны»;

• другие объекты, в рамках которых совершается данное событие: «Человек», «биологический организм», «смертность», «ни одного», «все», «жил бы вечно» и др.;

• что предшествовало данному событию: Концептуально-гипотетическое знание, что все люди смертны;

• что должно получиться в конечном результате: Утверждение, истинное знание, что «все люди, в самом деле, смертны».

• Уточнение понятий: «Смертность» — прекращение биологического существования;

Другими словами, смысловые блоки в предложении показывают, о каком явлении идет речь, что было до него и что будет после, в каких пространственно-временных параметрах и смысловых координатах данное явление находится, или где его место среди других каких-то явлений, каково содержание данной ключевой мысли и пр.

А в основном и в самом общем виден контекст предложения, который определяется логикой единства места, времени и действия, уточнением этих фундаментальных основ, применительно к той или иной ситуации и поставленным задачам. Любое действие («все люди смертны») имеет, точнее должно иметь, свои строго определенные координаты и во времени, и в пространстве. И когда мы говорим «при условии», то это означает наличие контекста. Аксиома есть точка отсчета, а доминанта — рамки, которые устанавливаются некими параметрами пространства и времени, что означает, что не может никакое событие совершиться вне точки отсчета и вне каких-то временных и пространственных рамок.

Обратимся к классическому тексту и, конечно, к Сократу, хотя бы потому, что классические тексты чаще всего бывают хорошо построены, в отличие от непрофессиональных писателей, которые, как правило, не строго и весьма вольно обращаются с понятиями и отношениями между ними, с логической структурой предложения и текста. Логики усматривали в текстах Платона только, так называемый, «сократовский метод». На самом деле, он оперировал всей логикой построения предложения. Иначе и не могло быть. А что касается «сократовского метода», то это есть, прежде всего, художественная форма выражения его философских мыслей, не являющаяся доминирующей.

«— И лучше всего мыслит она, [душа] конечно, когда ее не тревожит ничто из того, о чем мы только что говори¬ли, — ни слух, ни зрение, ни боль, ни удовольствие, когда, распростившись с телом, она останется одна, или почти одна, и устремится к [подлинному] бытию, пре¬кратив и пресекши, насколько это возможно, общение с телом.»

Ключевая мысль – «Душа мыслит». Понятие «мыслить» выступает в роли предиката и принадлежит субъекту «душа». Поскольку данная мысль может быть спорной или непонятной, Сократ далее пытается объяснить, при каких условиях душа «мыслит». А «лучше всего» является уточнением ракурса понятия «мыслить», т.е. Сократа интересует не понятие «мыслить», а как она это делает лучше всего. Фактически, содержание ключевого смыслового блока является возможно истинным, которое следует доказать, что и делает Сократ далее.

1. При условии: если «ее не тревожит ничто». Поскольку понятие «ничто» слишком широкое, оно требует уточнения: «ни слух, ни зрение, ни боль, ни удовольствие». Потому что, в противном случае, диалог не мог бы развиваться дальше: если принять понятие «ничто» как абсолютное, то пропадает необходимость в понятии «тревожит».

2. При условии: «когда, распростившись с телом». Опять же усомнившись, что понятие «распростившись» будет понято собеседником, Сократ предлагает его уточнение: душа «останется одна», и еще одно уточнение «или почти одна».

3. При условии: если «устремится к [подлинному] бытию». Далее предлагается уточнение понятия «устремится»: «пре¬кратив и пресекши, насколько это возможно, общение с телом».

Если не учитывать некоторые оговорки и смысловые неточности, которые в силу разных объективных (недостаток общего знания) и субъективных (личное непонимание) причин всегда присутствуют, то приведенные условия достаточно четкие и определенные. В данном случае было предложено три условия, как возможно исчерпывающие. Понятно, что их может быть больше. Так, например, не дано определение понятия, что такое «подлинное бытие», Сократ предлагает его далее в своих рассуждениях. Но нас в данном случае интересует не полнота обоснования и четкость, а смысл и содержание условия, как элемент логической структуры данного предложения.

Ключевая мысль

предложения Условие первого

уровня Условие второго

уровня

А лучше всего

«Душа мыслит», если… «ее не тревожит ничто»

«ни слух, ни зрение, ни боль, ни удовольствие».

«когда, распростившись с телом» «останется одна, или почти одна».

«устремится к [подлинному] бытию». «пре¬кратив и пресекши, насколько это возможно, общение с телом».

Таким образом, мы видим следующую схему построения предложения:

1. Имеется шесть смысловых блоков первого и второго уровня.

2. Содержание блоков как условие существования ключевой мысли.

3. Содержание каждого смыслового блока функционально различно.

4. Логическая структура смыслового блока везде идентична:

S P.

Если условие — это ситуация (синонимы слова-понятия «ситуация»: обстоятельство, обстановка и др.), то она определена какими-то параметрами. Они указаны в смысловых блоках по содержанию, каждый из которых и раскрывает то или иное важное, с точки зрения автора, обстоятельство.

В первом случае – «не тревожит ничто», во втором случае – «распростившись с телом» и в третьем – «устремится к (подлинному) бытию». Все эти условия или ситуации, или обстоятельства связаны с одним коренным положением, как признаком, присущим каждому из этих блоков, выступающим, в данном случае, в роли субъекта – душа должна остаться одна.

Частные условия Общее условие Результат

Если «ее не тревожит ничто»

Душа должна

остаться одна

Тогда душа лучше

всего мыслит

Если «распростившись с телом»

Если «устремится к [подлинному] бытию».

И в самом деле, объект «ее не тревожит ничто», автора интересует только с той точки зрения, что душа должна остаться одна. Объект «распростившись с телом», так же интересует с той точки зрения, что душа должна остаться одна. Соответственно, объект «устремится к [подлинному] бытию» важен с позиции, что душа должна остаться одна. Ибо все эти объекты естественно обладают ограниченным множеством иных признаков или свойств. Таким образом, получается примерно такая же картинка, как и с суждением: Все люди смертны, // Сократ человек,// Сократ смертен – они имеют одну общую точку пресечения (признак, свойство) – «биологическое существо».

Что бы нам однозначно подтвердить единство логической структуры применительно к любому предложению, возьмем еще один пример (предложение) из текста уже другого произведения и опять же классика. Стихи — это особая форма построения предложения, где форма передачи чувства играет едва ли не главную роль. Но донести до читателей чувство во всей полноте и красоте, а так же в соответствии со смыслом, возможно только в строгой логической форме, что мы постараемся и показать на коротком, но таком изумительном, по художественному исполнению и смыслу, четверостишье из «Медного всадника» А.С.Пушкина. Понятно, что с таким же успехом можно было взять и любое другое его произведение.

О, мощный / властелин судьбы! ///

Не так ли ты // над самой бездной ///

На высоте // уздой железной ///

Россию / поднял на дыбы? ///

А.С.Пушкин. Медный всадник

Иллюстрация к «Медному всаднику» работы А. Бенуа.

Сначала мы выделили в данном четверостишье, согласно нашему разумению, смысловые блоки, обозначив их наклонной чертой. Их получилось восемь. Затем, разделили смысловые блоки по содержанию и функциональной роли или принадлежности, во всяком случае, как мы это понимаем и представляем себе, с точки зрения отражения основного содержания предложения.

Данное четверостишье содержит два предложения. Первое: «О, мощный властелин судьбы!» мы ввели только для того, что бы не разрывать общий смысл и было понятно содержание второго предложения. Нас сейчас будет интересовать только второе предложение, которое содержит шесть блоков, где блок «Россию / поднял на дыбы?» является ключевым.

У нас образовалось два типа смысловых блоков. 1. Основной блок, содержащий ключевую мысль. 2. Вспомогательные смысловые блоки, которые описывают состояние, уточняют содержание, доказывают истинность ключевого суждения, определяют пространственно-временные параметры. Тем самым, они, фактически, переводят содержание ключевого блока из концептуально-гипотетического в истинное – как основной итоговой и конечной задачи данного предложения.

Мы выделяем ключевую мысль данного предложения: «Россию поднял на дыбы». Смысловой блок — «Не так ли ты» есть связка с предыдущим предложением и указанием на его свойства, т.е. так же, как «мощный властелин судьбы!». Понятие «поднял на дыбы», безусловно, требует своего смыслового уточнения — о какой «дыбе» идет речь. Ведь, понятие «дыба» и понятийное образование «поднял на дыбы», имеют много разных аспектов. И автор указывает и определяет смысловое значение ключевых понятий.

Речь идет именно о спасении России: поднял «над самой бездной» (над пропастью, пучиной и пр.), в которую Россия готова была свалиться, поднял «на высоте» (возвышении). Этим подчеркивается, что Россия не падает, не сползает, как это подобает потерявшему силу, а остается возвышенной, на высоте, только почему-то перед бездной. Поднял жестко, крепко, твердо, непреклонно, т.е. «уздой железной», когда речь идет именно о критической ситуации в стране, тем более, стране возвышенной.

И все — во имя спасения России от явно неминуемой гибели (упасть в бездну, в пропасть). Иное содержание понятия «дыба» и понятийное образование «поднял на дыбы» (расправиться, уничтожить, пытать и пр.), предполагает иное содержание действия. Впрочем, Пушкин не случайно употребил слово «поднял на дыбы», а не «вздернул на дыбу». Слово «поднял» предполагает (точнее определяет), иной контекст слова «дыба».

Чтобы это было четко и ясно, с первого чтения, понято собеседником, в данном случае, читателем, используются специальные по содержанию смысловые блоки, которые уточняют содержание основного понятия, место того или иного слова-понятия в общей структуре предложения, или иначе, какую роль играют, и какое место они занимают. И если предложение в этом смысле логически правильно построено, то, как правило, трудности в понимании основного содержания не возникает.

О, мощный властелин судьбы.

Не так ли ты

Россию

поднял на дыбы

Предыдущее предложение Связка двух

предложений Основной

объект смысла «над самой бездной»

«на высоте»

«уздой железной»

Что интересно, понятия «над самой бездной», «на высоте», «уздой железной» уже не требуют своего пояснения. Они берутся поэтом как аксиоматические, которые могут быть наверняка поняты и почти однозначно. Этому способствует и весь контекст предложения, и, самое главное, синонимический ряд данного слова-понятия, который принадлежит к одной смысловой группе.

Для сравнения с понятием «дыба», синонимический рад которого распадается на два весьма сильно отличающихся друг от друга групп синонимов. Если бы это было не так, если бы автор почувствовал, что используемые им понятия могут быть не поняты более или менее однозначно, он наверняка бы занялся уточнением их смысла, посредством других смысловых блоков.

Это одно из принципиальных условий использования понятий. Аксиоматическим становится, как правило, то понятие, синонимы которого принадлежат к одной смысловой группе, и которое не требует определения, посредством отдельных специальных смысловых блоков. За исключением тех случаев, когда собеседнику или читающим не известен смысловой синонимический ряд используемых в предложении понятий. Понятие, которое имеет две и более смысловые синонимические группы, требует введения специальных смысловых блоков. Они определяют ту или иную синонимическую группу, в рамках которой применяется используемое понятие.

Но важно еще и другое: как только мы установили последовательность двух слов-понятий, они сразу же приобрели форму субъекта и его признака. А это означает, в свою очередь, что последовательность понятий показывает, что первое слово всегда субъект, а второе — предикат или его признак, свойство. Подобное распределение понятий не случайно, поскольку тем самым устанавливает характер, содержание понятий в рамках соотношений субъект-предикат и сразу же направляет на установление определенного контекста. Другими словами, предикат устанавливает совокупность производных понятий, которые определяют контекст субъекта, т.е. указывают, описывают, называют область действия предиката, а, соответственно, и ключевого смыслового блока.

Понятно, что контекст всего предложения, относительно смыслового блока «поднял на дыбы», был бы разный, если бы мы поменяли местами субъект и предикат: «Дыба была поднята». Таким образом, предикат, как мы уже говорили, фактически определяет ту область понятия, в рамках которой, в дальнейшем, и будет строиться предложение. Получается, что предикат есть краткое, как правило, в одно слово, определение сущности контекста, который уже потом, по мере необходимости, разворачивается в подробное описание, посредством специальных смысловых блоков предложения.

Рубрики: Книги | Дата публикации: 26.07.2010

Курсовые работы на заказ

Комментарии и Отзывы

Что такое контекст и как им пользоваться

Многие люди до сих пор считают, что изучение иностранных языков сводится к заучиванию слов и правил грамматики.  Такой подход был распространен в школах и старых учебниках. Некоторые учителя считали словарный запас основным показателем знания иностранного языка и устраивали диктанты для проверки. Сейчас такой способ выглядит устаревшим. Одна из причин – неэффективность заучивания слов в отрыве от их окружения. Грамотные современные преподаватели языков утверждают, что важно научиться пользоваться контекстом. Эта статья о том, что такое контекст и как его использовать на практике.

Что такое контекст

Термин «контекст» используется во гуманитарных науках, которые так или иначе имеют отношение к языку. Раньше под контекстом понимали только отрывки письменной речи, которые можно использовать для понимания отдельной части текста – например, слова, словосочетания, предложения и так далее. Сейчас контекст – более широкое понятие. Это и устная, и письменная речь, и сама ситуация, которые позволяют уточнить непонятное значение. Это окружение, которое помогает понять незнакомый смысл.

Контекст бывает вербальным и ситуативным. Первый связан с речью – письменной или устной. Это фразы, предложения, абзацы и куски речи, исходя из которых можно понять значение определенного отрывка речи.

Вербальный контекст – это всегда определенный фрагмент речи. Это может быть как стоящее рядом слово или словосочетание, так и целое предложение, абзац и даже весь текст. Главное – чтобы этот отрывок был достаточным для понимания нужного смысла. Например, чтобы понять значение английского слова flat (которое может быть существительным «квартира» или прилагательным «плоский»), достаточно увидеть стоящие рядом слова: a two-bedroom flat. Но чтобы понять фразу из Пушкина «Сильвио продолжал метать», нам нужно прочитать предыдущий отрывок текста, в котором описывается игра в карты.

Ситуативный контекст – это обстановка, ситуация, место, время и другие невербальные признаки, которые помогают понять речь. К ним также относятся участники коммуникации и их отношения друг к другу. Мимика, движения тела, жесты тоже относятся к ситуативному или невербальному контексту. Например, фраза «It’s so hot in here!» может быть констатацией факта или просьбой открыть окно в зависимости от того, где происходит коммуникация, с кем разговаривает человек, какие жесты он использует.

Контекст давно и широко используется в практике перевода с одного языка на другой. Чтобы адекватно передать смысл иностранного текста на другом языке, важно уловить контекст. Более того, мы постоянно пользуемся контекстом, сами того не замечая, когда разговариваем на родном языке. И при обучении английскому языку без контекста не обойтись.

Зачем нужен контекст при изучении английского

  1. Контекст помогает запоминать новую лексику. Контекст создает вокруг незнакомых слов определенное окружение, способствуя появлению ассоциативных связей. Отдельное слово сложно запомнить, потому что с ним не связано никаких ассоциаций, образов, ситуаций. Слово в контексте становится более заметным, понятным и простым для запоминания.
  2. Контекст помогает запоминать, как слова используются с другими словами, как выстраиваются конструкции и образуются коллокации. Изучая слово в контексте, невольно отмечаешь его поведение: если это глагол, то как он сочетается с дополнением и нужен ли ему предлог, если это существительное, то какие определения к нему подходят и с каким артиклем его лучше использовать в таких ситуациях.
  3. Контекст помогает тренировать грамматику. Слова сами по себе лишены грамматики. В контексте они приобретают грамматический смысл, выстраиваясь в определенном порядке и выполняя определенные функции. Если вам встретилось незнакомое слово can, без контекста вы не поймете, какое значение из словаря выбрать – «консервная банка» или «уметь». Но простейшая грамматика может подсказать. В словосочетании a dirty can вы можете не знать, как переводится прилагательное dirty, но по строению фразы определите, что can – это существительное. В предложении I can wait слово can стоит сразу после подлежащего – по правилам английского языка это может быть только сказуемое. Постоянное изучение контекста помогает продвинуться в английской грамматике.

Как пользоваться контекстом при изучении английского

  1. Учите новые слова в контексте. Встретив незнакомое слово, ищите примеры его употребления в словарях, текстах, специальных ресурсах. Если вы выписываете слова в словарик, обязательно дополняйте их примерами. Не заучивайте словарные статьи, особенно это касается многозначных слов. Запоминайте слово с определенным значением в словосочетании или предложении. Если у этого слова есть другое значение – изучайте его отдельно, с другими примерами.

Такой подход изучению незнакомых слов называется лексическим. Lexical approach – это новое, но популярное направление в обучении иностранным языкам. Его разработал Майкл Льюис, а теперь им пользуются многие преподаватели. Его суть в том, что иностранный язык представляется как набор словосочетаний – chunks. Вся работа с языком происходит на уровне фраз, которые запоминаются как единое целое.

  1. Читая тексты на английском или слушая аудиоматериалы, старайтесь не искать все незнакомые слова в словаре. Научитесь пользоваться контекстом. Обращайте внимание на окружение незнакомого слова – на грамматику, соседние слова, все предложение, смысл абзаца и текста. Благодаря контексту вы можете сконструировать большую часть значения слова: например, по описанной в тексте ситуации догадаться, что disgusting означает что-то плохое. Ничего страшного, если вы не поняли точный смысл слова – главное, чтобы был понятен смысл предложения или абзаца. Постарайтесь придерживаться следующего правила – искать значение незнакомого слова в словаре, только если вы встретили его уже в третий раз, а контекст не помог уточнить смысл.
  2. Много читайте и слушайте. Вместо того, чтобы заучивать слова и зубрить грамматику, изучайте аутентичные материалы на английском – книги, газеты, журналы, видео, подкасты. Контекст поможет без усилий запоминать часто встречающуюся лексику и тренировать грамматику.
  3. Пользуйтесь специальными словарями и ресурсами, которые помогают работать с контекстом. Одна из самых известных платформ для перевода слов в контексте – Reverso Context. Эта программа выдает отрывки из текстов, в которых встречаются нужные слова. Это очень полезный инструмент для изучающих английский язык. С его помощью можно уточнить значения многозначных или сложных слов, узнать, как сочетаются слова между собой, найти переводы коллокаций.

Много примеров также можно найти в словаре Cambridge Dictionary. В нем каждое слово сопровождается несколькими предложениями, в которых раскрывается смысл. В Reverso Context встречаются не только профессиональные, но и вольные переводы и неточные примеры. В Кембриджском словаре приводится правильный контекст, но примеров меньше.

2 УРОКА БЕСПЛАТНО!

Исследования и разработки в области новых г. п . .

Е.А. Доренская, Ю.А. Семенов

информационных технологии и их приложении

УДК 004.912

DOI: 10.25559/SITITO.14.201804.896-902

МЕТОД ОПРЕДЕЛЕНИЯ КОНТЕКСТНЫХ ЗНАЧЕНИЙ СЛОВ И ДОКУМЕНТОВ

Е.А. Доренская1, Ю.А. Семенов1,2

1 Институт теоретической и экспериментальной физики имени А.И.Алиханова Национального исследовательского центра «Курчатовский институт», г. Москва, Россия

2 Московский физико-технический институт (национальный исследовательский университет), г. Долгопрудный, Россия

THE DETERMINATION METHOD FOR CONTEXTUAL MEANINGS OF WORDS AND DOCUMENTS

Elizaveta A. Dorenskaya1, Yuri A. Semenov1,2

1 Institute for Theoretical and Experimental Physics named by A.I. Alikhanov of National Research Centre «Kurchatov Institute», Moscow, Russia

2 Moscow Institute of Physics and Technology, Dolgoprudny, Russia

> Доренская Е.А., Семенов Ю.А., 2018

Ключевые слова

Аннотация

Проблема распознавания контекста; контекстное значение; машинный анализ; семантическая сеть; дерево семантических связей; искусственный интеллект; слово-характеристика; метод Монте-Карло.

В данной статье рассматриваются проблемы и методы программного распознавания контекста слов и документов. Даётся краткий обзор существующих методов анализа текстов, рассмотрен простой алгоритм численного определения контекста слов и документов с помощью семантической сети, которая имеет вид графа древовидной формы. Подробно описана структура семантической сети. Данная семантическая сеть необходима для того, чтобы определить контекст корневого слова W1 с помощью, связанных с ним слов-значений W2. Слова W2 представляют собой возможные значения контекста для слова W1. Словам W2 ставятся в соответствие слова-характеристики W3, которые ассоциированы с W2. При расчете контекстного значения учитываются расстояния между словами W2 и W3, измеряемые в словах, размещенных между ними. Словам W3 присваивается метрика, согласно их смысловой близости к тому или иному из слов W2. Приведена таблица слов W1, W2 и W3 и значений метрик. При контекстном анализе текста документа учитываются возможные вариации слов по числам и падежам. Представлена простая формула для расчета контекстного значения слов и документов. Описана методика проверки достоверности контекста с помощью неравенства Чебышева. Проведён анализ полученных результатов моделирования алгоритма с помощью метода Монте Карло, а также способов настройки и оптимизации параметров данного алгоритма. Приведены таблицы результатов исследования предлагаемого метода оценки контекста слов и документов. Исследования показали, что данный метод оценки контекста отдельных слов и документов применим при анализе текстов, при работе с поисковыми системами, а также для других задач, где важно распознавание контекста машинным способом.

|Об авторах:|

Доренская Елизавета Александровна, инженер-программист, Институт теоретической и экспериментальной физики имени А.И.Алиханова Национального исследовательского центра «Курчатовский институт» (117218, Россия, г. Москва, ул. Большая Черемушкинская, д. 25), ORCID: http://orcid.org/0000-0002-4249-5131, dorenskaya@itep.ru

Семёнов Юрий Алексеевич, кандидат физико-математических наук, ведущий научный сотрудник, Институт теоретической и экспериментальной физики имени А.И.Алиханова Национального исследовательского центра «Курчатовский институт» (117218, Россия, г. Москва, ул. Большая Черемушкинская, д. 25); заместитель заведующего кафедрой информатики и вычислительных сетей, Институт нано-, био-, информационных, когнитивных и социогуманитарных наук и технологий, Московский физико-технический институт (национальный исследовательский университет) (141701, Россия, Московская обл., г. Долгопрудный, Институтский пер., д. 9), ORCID: http://orcid.org/0000-0002-3855-3650, semenov@itep.ru

Современные информационные технологии и ИТ-образование

Том 14 № 4 (2018) ISSN 2411-1473 sitito.cs.msu.ru

Elizaveta A. Dorenskaya, Yuri A. Semenov

Research and development in the field of new IT and their applications

897

Keywords

The problem of context recognition; contextual meaning; machine analysis; semantic network; tree of semantic links; artificial intelligence; word characteristics; Monte Carlo method.

Abstract

Problems and methods are considered for program context recognition of words and text documents. Survey of existent text processing methods is provided, simple numeric algorithm is given for determination of words and documents context with a help of semantic net, having a form of tree type graph. Semantic net structure is described in detail. Given semantic net is needed to fix basic word W1 context by means of words-meaning W2 coupled with it. Words W2 represent possible W1 context meanings. For every word W2 correspond some words-characteristics W3. At the context calculation the distances between words W2 and W3 are taken into account. The distances are measured in words between. Every word W3 has metrics, according to the concept proximity to W2. There is a table of words W1,W2 and W3 with their metrics values. At context document analyses there was taken into account case or number words variations. Simple formula for context calculation is presented. Method of results proofing with a help of Chebyshev inequality is also provided. The context analyses method was checked by Monte-Carlo simulations. Tables of investigation results are provided and some recommendation for algorithm parameters tuning and optimization are also given. The analyses showed that proposed method is quite effective for context estimation at text analyses, and for any systems, where one needs computer recognition of context.

Введение

В наше время проблема распознавания контекста слов компьютером весьма актуальна. Она важна для поисковых систем, машинного перевода, интерпретации текста при грамматическом разборе и в машинном анализе содержания документов.

Проблема определения контекста слова, на данный момент, относится к ЛЬполным задачам, требующим сильного искусственного интеллекта. Повышение удобства взаимодействия компьютера и человека в данной области определяет эффективность тех или иных решений.

Благодаря существованию полисемии, одно и то же слово может употребляться в разных значениях. Например, слово «ключ» может иметь значения ключ от замка или ключ родник или криптоключ. Человек может определить контекстное значение слова, анализируя соседние слова в предложении и сам текст в целом.

Одной из причин, почему для описания алгоритма не используется естественный язык, является контекстная многозначность многих слов.

Человек относительно легко определяет контекстные значения слов в тексте. Для решения задачи он использует много критериев, иногда даже достаточно интуитивно

Для распознавания контекста слов с помощью компьютера часто используют семантические сети, онтологии и тезаурусы.

Мы предлагаем упрощённый легко реализуемый метод анализа контекста.

Цель исследования

Главными недостатками существующих методов является сложность их применения, а также то, что они требуют часто больших вычислительных ресурсов [1-8]. Поэтому целью нашего исследования является создание упрощённого метода машинного определения контекстного значения отдельных слов, частей текста и текстовых файлов.

Основная часть

В данном исследовании считалось, что контекстное значение слова зависит от расстояния L между этим словом и другими

словами, задающими контекст. Расстояние между словами определяется числом слов N размещенных между ними ^=N+1). Предполагалось, что контекст конкретного слова можно определить по положению некоторых семантически связанных с ним слов, содержащихся в тексте.

Корневое слово Ш1 может иметь два или более значений, зависящих от контекста и определяемых словами Ш2. Слова Ш2 могут и отсутствовать в тексте документа. Контекстное значение слова Ш1 в этом случае может определяться семантически связанными с ним словами Ш3. Варианты семантических сетей показаны на рис.1. Вариант А предполагает наличие в тексте документа корневого слова Ш1, которое может иметь разные контекстные значения, определяемые словами Ш2. Некоторые слова-значения Ш2 (например, Ш22) могут в документе отсутствовать (рис. Предполагается, что каждому из слов Ш2 соответствует некоторое число слов Ш3 (слова-характеристики), именно они и определяют выбор контекстного значения слова Ш1. Секция рис. 1С иллюстрирует вариант оценки контекста документа в отсутствии слова Ш2.

С

W3 / W3 /

A / / w3

W2, f ‘ W22 W21 t В | 5 W22 3 W2

W1 • W1 é *W1

Рис. 1. Варианты семантических связей в тексте Fig. 1. Variants of semantic links in the text Рассмотрим это на примере разделения контекстных значений слова «программа»: компьютер и обучение. W1= программа; W21 = компьютер; W22= обучение. Если имеется в виду компьютерная программа, то в тексте могут встретиться слова; подпрограмма, цикл, файл, библиотека, прерывание, память,

Vol. 14, no 4. 2018 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

ппп Исследования и разработки в области новых г. п . .

898 , — Е.А. Доренская, Ю.А. Семенов

информационных технологии и их приложении

код, трансляция; цикл; метка; исполнение; исключение; наследование; скрипт; накопитель; синтаксис; присвоение; комментарий; итерация и т.д. Эти слова в таблицу не были включены из-за экономии места. Если имеется в виду программа обучения, в тексте могут встретиться слова: учитель, лектор, студент, тестирование, ЕГЭ, зачет, экзамен и т.д. Эти слова также не

были включены в таблицу из-за экономии места. (см. таблицу 1). Таблица должна быть создана заранее и никак не зависит от исследуемого текста.

Следует иметь в виду, что слова могут встретиться в разных падежах, числах и пр.

Таблица 1. Фрагмент таблицы корневых слов (W1), слов-значений (W2) и слов-характеристик (W3) Table 1. Fragment of the table of root words (W1), word-values (W2) and word-characteristics (W3)

Корневое слово W1 Слова-значения W2 Слова-характеристики 1^3) Метрика [M]

Программа компьютер программирование 70

отладка 60

тестирование 40

подпрограмма^иЬгоШ:те 30

объект 15

файл 26

прерывание 40

Оперативная память 70

переменная 30

константа 20

SSD 30

массив/аггау 50

библиотека (программ) 15

язык (программирования — название) 60

обучение пособие 45

преподаватель 50

учащийся 95

учебник 90

дистанционное 70

В таблицу заносятся только слова, имеющие два или более контекстных значений ^2). Полная таблица даже для отдельной области знаний может быть в сотни раз больше. Содержимое таблицы должно храниться в банке данных, что облегчит доступ к хранящимся в ней словам.

В первой колонке таблицы размешаются слова, которые могут иметь несколько контекстных значений (корневые слова — W1) и могут также определять контекст документа в целом. Во второй колонке ^2) помещаются слова, которые обозначают возможные контекстные значения слов из первой колонки. В третьей колонке ^3) записаны слова, конкретизирующие значения слов из второй и первой колонки. Слова из этих трех колонок образуют древовидный граф. Значения метрики М относятся к словам из третьей колонки таблицы.

Значения метрик может настраиваться с помощью контрольных текстов на стадии отладки системы. Слово в первой колонке является корнем дерева семантических связей. Любое из слов первой колонки ^1), второй ^2 и третьей -^3) может встретиться в документе больше одного раза. Слово из колонки W1 должно присутствовать в документе обязательно, в противном случае не возникает задачи определения его контекстного значения. Слову из второй колонки, если оно встретилось в документе, присваивается метрика М=100. Но это должно учитываться лишь при определении контекстного значения всего документа. Слово из второй колонки, определяющее контекстное значение слова из первой колонки, может и не встречаться в документе вовсе.

При отсутствии в тексте слова из второй колонки, но при наличии слов из третьей колонки, сопряженных с ним семантически, можно однозначно определить контекстное значение

слова из первой колонки ^1).

Можно предположить, что чем ближе слово-характеристика к слову из вышестоящей вершины графа, тем с большей вероятностью оно определяет контекст этого слова. Наличие слова из третьей колонки, размещенного в тексте ближе к слову из второй колонки, должно влиять на выбор контекстного значения слова сильнее, чем в случае слов, размещенных дальше. Одним из возможных методов оценки контекстного значения слова может быть формула [1].

После того как положение слов W1, W2 и W3 определено, производится вычисление суммы С

Гам«/ (Ь,.)); [Ц

где С — мера, определяющая контекстное значение слова W1, L — расстояние между словом, например, «компьютер» и «отладка» (см. табл. 1), М. — метрика слова-характеристики W3 (М=1^100), т — число семантически связанных слов W3 (см. таблицу 1), / (Ь,) — весовая функция от Ь,, , — номер встретившегося слова из колонки 3. В простейшем случае/(Ь.)=1/Ь. , а для небольших документов / (Ь,) =1 . L определяется числом слов N размещенных между словом W2 и одним из слов W3 ^=N+1). Весовая функция/ (Ь) нужна для ослабления влияния удаленных слов на оценку контекстного значения слова W1. Если в тексте присутствует две или более копий слова W2, формула [1] может быть модифицирована.

Для больших документов контекст каждого конкретного слова W1 может оказаться разным для разных областей документа. Размер области может быть настраиваемым, с дискретом в одну страницу (~400 слов). При этом можно варьировать начало и размер области и отслеживать вариации значений С и контекстного значения конкретного слова W1.

Современные информационные технологии и ИТ-образование

Том 14 № 4 (2018) ISSN 2411-1473 sitito.cs.msu.ru

rl. ^ . ~ i x, • . o Research and development in the field

Elizaveta A. Dorenskaya, Yuri A. Semenov

of new IT and their applications

Индекс к для С определяет, к какому из возможных значений относится данная мера (к=1,..п). смотри вторую колонку таблицы 1. п — число возможных значений слова (чаще всего п=2^3). Значение слова Ш2 с большим значением С в контекстном смысле считается предпочтительным.

Значения М. выбираются при настройке с использованием

тестовых документов.

В таблице 2 представлены данные анализа контекста в конкретных файлах. Расчеты контекста были проведены для более чем 10 файлов. Значения С вычислены по формуле [1]. В скобках приведено число слов Ш1, Ш2 и Ш3, обнаруженных в конкретном документе.

Таблица 2. Примеры результатов контекстного анализа Table 2. Examples of context analysis results

URL файла Число слов Корневые слова (W1) Слова- значения (Ш2) Слова-характе-ристики (W3) Значения С

http://book.itep.rU/4/6/blockchain.htm «Технология blockchain» 5180 Программа (7) Компьютер (3) Объект (5) файл (24) код (6) 8,69

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Реализация проекта (9) Этап (1) Инновация (2) 4,04

План (0) Годовой (1) 0,045

http://book.itep.ru/6/i2p.htm «Стек протоколов I2P и немного о TOR» 10812 Программа (5) Компьютер (2) Метка (30) Объект (7) Файл (5) тестирование (9) код (19) html (13) сайт (6) бит (6) 9,51

Реализация проекта (16) Этап (9) 1,58

План (0) Обслуживание (1) 0,022

http://book.itep.ru/4/6/set 66.htm «SET и другие системы осуществления платежей» 40631 Программа (62) Компьютер (0) Объект (33) код (146) бит (14) массив (5) метка (4) переменная (5) исключение (6) 9,12

Реализация проекта (18) Этап (14) Стоимость (12) 2,38

План (0) Обслуживание (9) 0,059

Если бы для таблицы 1 в семантической цепочке слова «программа» среди слов-характеристик присутствовало слово ЫоскЛат (статья «Технология ЫоскЛат»), то значение С для слова-значения «компьютер» было бы равно 32,54, а не 8,69. Из этого следует, что полнота семантической сети (таблицы 1) существенно влияет на результаты оценки контекстного значения слова или документа.

Механизм распознавания контекста моделировался по методу Монте-Карло. Предполагалось, что в документе имеется N слов. При моделировании считалось, что положение слов в документе имеет постоянную плотность вероятности (слова размещены в документе статистически равномерно, что не всегда справедливо).

Для анализа в документ засевались случайным образом слова «программа» и слова-характеристики.

На рис. 2 представлено распределение вероятности значений С при фиксированном положении слова «программа» и случайном распределении положений слов-характеристик (п=213) в документе, содержащем 40000 слов.

По вертикальной оси отложено значение вероятности, а по горизонтальной — значение суммы С. Для выявления статистического распределения С расчет повторяется 10000 раз. Распределение С имеет гауссоподобную форму, но имеет относительно длинный «хвост» в сторону больших значений С.

Рис. 2. Распределение плотности вероятности для значения С Fig. 2. Distribution in frequency for the value of C

Распределение плотности вероятности позволяет оценить эффективность идентификации контекстных значений слов и документов.

Опробовались варианты, где вместо весовой функции 1/L. используется 1/L2 или exp(-aL), где a — постоянный коэффициент <1. Варианты сравнивались по отношению a/C., где C — среднее значение С, вычисленное по формуле [1], а a — средкеквадратичная

Vol. 14, no 4. 2018 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

900

Исследования и разработки в области новых

Е.А. Доренская, Ю.А. Семенов

информационных технологии и их приложении

ошибка определения С. Зависимость отношения а/С от формы весовой функции оказалась слабой. Для определенных классов документов могут использоваться специальные весовые функции, где при малых значениях Ь весовая функция характеризуется константой, а в области больших Ь быстро стремится к нулю.

Полученные результаты

На рис. 3 показана зависимость значения С (ромбики) и его среднеквадратичного отклонения (квадратики — а) от числа слов-характеристик в документе (10^150). Документ содержал 40000 слов.

Рис. 3. Зависимость С (ромбики) и аС (квадратики) от числа слов-характеристик в документе (10-150) Fig. 3. Dependence of C (diamonds) and аС (squares) on the number of word-characteristics in the document (10-150)

Из рисунка видно, что значение среднеквадратичного отклонения C (аС) практически всегда больше C. Для нас важно уметь определить, какова вероятность того, что полученное значение С задает корректно то или иное контекстное значение слова из первой колонки (W1).

Вероятность p, например, получения определенного значения С может быть оценена на основе распределения плотности вероятности. Вероятность P получения С=9,12 (см. рис. 2) равна 0,06, при этом вероятность С=2,38 <0,001.

В случае использования неравенства Чебышева [9] имеем: р(|х-С|£ДС)5(а2/(ДС)2) [2]

Это неравенство определяет верхнюю грани_цу вероятности того, что разность случайной величины х и С превышает определенный порог ДС для произвольного распределения с дисперсией а2 и средним значением С.

Рассмотрим третий пример из таблицы 2. При 62 словах «программа» в документе «SET и другие системы осуществления платежей» можно вычислить значение для слова «компьютер» С = 9,12 и а =14,0. Для слова «реализация» (программы) С = 2,38, а а=4,73.

ДС = 9,12-2,38 = 6,74 (разница между математическими ожиданиями взятых нами распределений.

Неравенство Чебышева для этого случая имеет вид: Р(|Х-2,38|й(9,12-2,38)) 5 4,732/(9,12-2,38)2 Р(|Х-2,38|^6,74) 5 4,732/6,742 Исходя из этого получается что: Р(|Х-2,38|£6,74) 5 0,49

Это вполне согласуется с оценкой по плотности вероятностей при моделировании (рис. 2) и подтверждает корректность распознавания контекста. Во всех полутора десятках документов, подвергнутых программному анализу, контекст был определен корректно.

Неравенство Чебышева удобно использовать, когда число слов W1 в документе достаточно велико.

Заключение

Предложенный метод оценки контекстных значений слов и документов нельзя считать универсальным. В нем, в частности, не учитываются смысловые связи. Но предложенный алгоритм легко реализовать, он не требует сложной программной реализации, серьезных вычислительных ресурсов и в большинстве случаев дает правильную оценку значения контекста.

Список использованных источников

[1] Усталое Д.А. Модели, методы и алгоритмы построения семантической сети слов для задач обработки естественного языка: дис…..канд. физ.-мат.н. Екатеринбург, 2017, 129 с.

[2] БондарчукД.В. Определение семантической близости термов с помощью контекстного множества // Компьютерный анализ изображений: Интеллектуальные решения в промышленных сетях (CAI-2016): сборник научных трудов по материалам I Международной конференции 5-6 мая 2016 г./ Под общ. ред. А.Г. Тягунова. Екатеринбург: Изд-во УМЦ УПИ, 2016. С. 175-179. URL: https://elibrary.ru/ item.asp?id=28549507 (дата обращения: 12.06.2018).

[3] Добрынин В.Ю., Клюев B.B., Некрестьянов И.С. Оценка тематического подобия текстовых документов // Тр. второй всероссийской научной конф. «Электронные библиотеки: Перспективные методы и технологии, электронные коллекции». Протвино, 2000. С. 204-210. URL: http://rcdl. ru/doc/2000/069.pdf (дата обращения: 12.06.2018).

[4] Ильвовский Д.А. Модели, алгоритмы и программные комплексы обработки текстовых данных на основе решеток замкнутых описаний: дис. канд. тех.н. Москва, 2014. 158 с.

[5] Малахов Д.А., Серебряков В.А. Модель семантического поиска на базе тезауруса // CEUR Workshop Proceedings. 2017. Vol. 2022. C. 191-196. URL: http://ceur-ws.org/Vol-2022/paper32.pdf (дата обращения: 12.06.2018).

[6] Воронина И.Е, Кретов А.А., Попова И.В. Алгоритмы определения семантической близости ключевых слов по их окружению в тексте // Вестник ВГУ Серия: Системный анализ и информационные технологии. 2010. № 1. С. 148-153. URL: https://elibrary. ru/item.asp?id=15199663 (дата обращения: 12.06.2018).

[7] Крейнес М.Г. Модели текстов и текстовых коллекций для поиска и анализа информации // Труды Московского физико-технического института. 2017. Том 9, № 3. С. 132142. URL: https://elibrary.ru/item.asp?id=32736043 (дата обращения: 12.06.2018).

[8] Турдаков Д.Ю. Методы и программные средства разрешения лексической многозначности терминов на основе сетей документов: дис…..канд. физ.-мат.н. Москва, 2010. 138 с.

[9] Прохоров Ю.В., Розанов Ю.А. Теория вероятностей. Основные понятия, предельные теоремы, случайные процессы. М.: Наука, 1967. 495 с.

[10] Rishel T., Perkins L.A., Yenduri S., Zand F. Determining the context of text using augmented latent semantic indexing // Journal of the American Society for Information Science and Technology. 2007. Vol. 58, issue 14. Pp. 2197-2204. DOI: 10.1002/asi.20687

[11] Chen J, Scholz U, Zhou R, Lange M. LAILAPS-QSM: A RESTful API and JAVA library for semantic query suggestions // PLoS Computational Biology. 2018. Vol. 14, issue 3. Art. e1006058. DOI: 10.1371/journal.pcbi.1006058

Современные информационные технологии и ИТ-образование

Том 14 № 4 (2018) ISSN 2411-1473 sitito.cs.msu.ru

г|. , „ г, | „ • . 0 Research and development in the field

Elizaveta A. Dorenskaya, Yuri A. Semenov

of new IT and their applications

[12] Yang L., Zhang J. Automatic transfer learning for short text mining // EURASIP Journal on Wireless Communications and Networking. 2017. Vol. 2017, issue 1:42. 8 p. DOI: 10.1186/ s13638-017-0815-5

[13] Yan E., Williams J., Chen Z. Understanding disciplinary vocabularies using a full-text enabled domain-independent term extraction approach // PLoS ONE. 2017. Vol. 12, issue 11. Art. e0187762. DOI: 10.1371/journal.pone.0187762

[14] Arras L., Horn F., Montavon G., Müller K.-R, Samek W. «What is relevant in a text document?»: An interpretable machine learning approach // PLoS ONE. 2017. Vol. 12, issue 8. Art. e0181142. DOI: 10.1371/journal.pone.0181142

[15] Eidlin A.A., Eidlina M.A., Samsonovich A.V. Analyzing weak semantic map of word senses // Procedia Computer Science. 2018. Vol. 123. Pp. 140-148. DOI: 10.1016/j.procs.2018.01.023

[16] Samsonovich A.V. Weak Semantic Map of the Russian Language: Preliminary Results // Procedia Computer Science. 2016. Vol. 88. Pp. 538-543. DOI: 10.1016/j.procs.2016.08.001

[17] Wei T., Lu Y., Chang H., Zhou Q., Bao X. A semantic approach for text clustering using WordNet and lexical chains // Expert Systems with Applications. 2015. Vol. 42, issue 4. Pp. 22642275. DOI: 10.1016/j.eswa.2014.10.023

[18] Zhan J., Dahal B. Using deep learning for short text understanding // Journal of Big Data. 2017. Vol. 4, issue 34. 15 p. DOI: 10.1186/s40537-017-0095-2

[19] Khenner E., Nasraoui O. A bilingual semantic network of computing concepts // Procedia Computer Science. 2016. Vol. 80. Pp. 2392-2396. DOI: 10.1016/j.procs.2016.05.460

[20] Батура Т.В. Семантический анализ и способы представления смысла текста в компьютерной лингвистике // Программные продукты и системы. 2016. № 4. C. 45-57. DOI: 10.15827/0236-235X.116.045-057

[21] Мозговой М.В. Машинный семантический анализ русского языка и его применения: дис…..канд. физ.-мат.н. СПб, 2006. 116 с.

[22] Надеждин Е.Н. Прикладные задачи семантического анализа текстовых документов // Фундаментальные исследования. 2017. № 1. С. 94-100. URL: https://elibrary.ru/ item.asp?id=28307282 (дата обращения: 12.06.2018).

[23] Боярский К.К. Введение в компьютерную лингвистику. СПб: НИУ ИТМО, 2013. 72 с. URL: http://books.ifmo.ru/file/ pdf/1470.pdf (дата обращения: 12.06.2018).

[24] Шелманов А.О. Исследование методов автоматического анализа текстов и разработка интегрированной системы

семантико-синтаксического анализа: дис…..канд. тех.н.

Москва, 2015. 182 с.

[25] Батура Т.В. Математическая лингвистика и автоматическая обработка текстов на естественном языке. Новосибирск: РИЦ НГУ 2016. 166 с. URL: https://www.iis.nsk.su/ files/book/file/Batura_Matlingvistika_i_avtomat._obrabotka_ tekstov.pdf (дата обращения: 12.06.2018).

[26] Марченко А.А., Никоненко А.А. Контекстный семантический анализ текста. Система текстового мониторинга и качественного оценивания фокусного объекта // Искусственный интеллект. 2008. № 3. С. 808-813. URL: http:// dspace.nbuv.gov.ua/bitstream/handle/12 345 6 789/ 7155/02-Marchenko.pdf?sequence=1 (дата обращения: 12.06.2018).

[27] Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышин-скийЭ.С.,Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и анализ данных.

Москва: Изд-во НИУ ВШЭ, 2017. 269 с. URL: https://www. hse.ru/data/2017/08/12/1174382135/NLP_and_DA.pdf (дата обращения: 12.06.2018).

[28] Орлова Ю.А. Автоматизация семантического анализа текста технического задания: дис…..канд. тех.н. Волгоград,

2008. 228 с. URL: https://elibrary.ru/item.asp?id=16191917 (дата обращения: 12.06.2018).

[29] Святогор Л., Гладун В. Семантический анализ текстов естественного языка: цели и средства // International Book Series «Information Science and Computing». Knowledge — Dialogue — Solution. Supplement to International Journal «Information Technologies and Knowledge». 2009. Vol. 3. С. 9-18. URL: http://www.foibg.com/ibs_isc/ibs-15/ ibs-15-p01.pdf (дата обращения: 12.06.2018).

Поступила 12.06.2018; принята в печать 10.09.2018; опубликована онлайн 10.12.2018.

References

[1] Ustalov D.A. Modeli, metody i algoritmy postroeniya seman-ticheskoj seti slov dlya zadach obrabotki estestvennogo yazy-ka. Diss. kand. fiz.-mat. nauk [Models, methods and algorithms for constructing a semantic network of words for natural language processing problems]. Ekaterinburg, 2017. 129 p. (In Russian)

[2] Bondarchuk D.V. Calculating the semantic relatedness of terms with the context set. Proceedings of the First Computer Image Analysis; Intelligent Solutions in Industrial Networks. Ekaterinburg. 2016, pp. 175-179. Available at: https://elibrary.ru/item. asp?id=28549507 (accessed 12.06.2018). (In Russian)

[3] Dobrynin V.Yu., Klyuev B.B., Nekrestyanov I.S. Evaluation of the thematic similarity of text documents. Digital Libraries; Advanced Methods and Technologies. Protvino, 2000, pp. 204210. Available at: http://rcdl.ru/doc/2000/069.pdf (accessed 12.06.2018). (In Russian)

[4] Ilvovski D.A. Modeli, algoritmy i programmnye kompleksy obrabotki tekstovyh dannyh na osnove reshetok zamknutyh opisanij. Diss. kand. tekh. nauk [Models, algorithms and software systems for processing text data based on lattices of closed descriptions]. Moscow, 2014. 158 p. (In Russian)

[5] Malakhov D.A., Serebryakov V.A. The Semantic Search Model Based on the Thesaurus. CEUR Workshop Proceedings. 2017; 2022:191-196. Available at: http://ceur-ws.org/Vol-2022/ paper32.pdf (accessed 12.06.2018). (In Russian)

[6] Voronina E.I., Kretov A.A., Popova I.V. Algorithms of semantic proximity assessment based on the lexical environment of the keywords in a text. Proceedings of Voronezh State University. Series; Systems analysis and information technologies. 2010; 1:148-153. Available at: https://elibrary.ru/item.as-p?id=15199663 (accessed 12.06.2018). (In Russian)

[7] Kreines M.G. Text and text corpora models for information retrieval and analysis. Proceedings of MIPT. 2017; 9(3):132-142. Available at: https://elibrary.ru/item.asp?id=32736043 (accessed 12.06.2018). (In Russian)

[8] Turdakov D.Y. Metody i programmnye sredstva razresheniya leksicheskoj mnogoznachnosti terminov na osnove setej do-kumentov. Diss. kand. fiz.-mat. nauk [Methods and software tools for the resolution of lexical ambiguity of terms based on networks of documents]. Moscow, 2010. 138 p. (In Russian)

Vol. 14, no 4. 2018 ISSN 2411-1473 sitito.cs.msu.ru

Modern Information Technologies and IT-Education

Исследования и разработки в области новых г. п . .

902 , — Е.А. Доренская, Ю.А. Семенов

информационных технологий и их приложений

[9] Prokhorov U.V., Rozanov U.A. Teoriya veroyatnostey. Os-novnye ponyatiya, predel’nye teoremy, sluchajnye process [Theory of probabilities. Basic concepts, limit theorems, random processes]. 2nd ed. Moscow: Nauka, 1973. 494 p. (In Russian)

[10] Rishel T., Perkins L.A., Yenduri S., Zand F. Determining the context of text using augmented latent semantic indexing. Journal of the American Society for Information Science and Technology. 2007; 58(14):2197-2204. DOI: 10.1002/asi.20687

[11] Chen J., Scholz U., Zhou R., Lange M. LAILAPS-QSM: A RESTful API and JAVA library for semantic query suggestions. PLoS Computational Biology. 2018; 14(3):e1006058. DOI: 10.1371/ journal.pcbi.1006058

[12] Yang L., Zhang J. Automatic transfer learning for short text mining. EURASIP Journal on Wireless Communications and Networking. 2017; 2017(1):42. 8 p. DOI: 10.1186/s13638-017-0815-5

[13] Yan E., Williams J., Chen Z. Understanding disciplinary vocabularies using a full-text enabled domain-independent term extraction approach. PLoS ONE. 2017; 12(11):e0187762. DOI: 10.1371/journal.pone.0187762

[14] Arras L., Horn F., Montavon G., Müller K.-R., Samek W. «What is relevant in a text document?»: An interpretable machine learning approach. PLoS ONE. 2017; 12(8):e0181142. DOI: 10.1371/journal.pone.0181142

[15] Eidlin A.A., Eidlina M.A., Samsonovich A.V. Analyzing weak semantic map of word senses. Procedia Computer Science. 2018; 123:140-148. DOI: 10.1016/j.procs.2018.01.023

[16] Samsonovich A.V. Weak Semantic Map of the Russian Language: Preliminary Results. Procedia Computer Science. 2016; 88:538-543. DOI: 10.1016/j.procs.2016.08.001

[17] Wei T., Lu Y, Chang H., Zhou Q., Bao X. A semantic approach for text clustering using WordNet and lexical chains. Expert Systems with Applications. 2015; 42(4):2264-2275. DOI: 10.1016/j.eswa.2014.10.023

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[18] Zhan J., Dahal B. Using deep learning for short text understanding. Journal of Big Data. 2017; 4(34). 15 p. DOI: 10.1186/ s40537-017-0095-2

[19] Khenner E., Nasraoui O. A bilingual semantic network of computing concepts. Procedia Computer Science. 2016; 80:23922396. DOI: 10.1016/j.procs.2016.05.460

[20] Batura T.V. Semantic analysis and methods of text meaning representation in computer linguistics. Programmnye produk-ty i sistemy = Software & Systems. 2016; 4:45-57. (In Russian) DOI: 10.15827/0236-235X.116.045-057

[21] Mozgovoy M.V. Mashinnyj semanticheskij analiz russkogo ya-zyka i ego primeneniya. Diss. kand. fiz.-mat. nauk [Machine

semantic analysis and its applications of the Russian language]. St. Petersburg, 2006. 116 p. (In Russian)

[22] Nadezhdin E.N. Applied problems of semantic analysis of text documents. Fundamental research. 2017; 1:94-100. Available at: https://elibrary.ru/item.asp?id=28307282 (accessed 12.06.2018). (In Russian)

[23] Boyarsky K.K. Introduction to Computer Linguistics. St. Petersburg, ITMO University. 2013, 73 p. Available at: http:// books.ifmo.ru/file/pdf/1470.pdf (accessed 12.06.2018). (In Russian)

[24] Shelmanov A.O. Issledovanie metodov avtomaticheskogo analiza tekstov i razrabotka integrirovannoj sistemy seman-tiko-sintaksicheskogo analiza. Diss. kand. tekh. nauk [Research of methods of automatic text analysis and development of an integrated system of semantic and syntactic analysis]. Moscow, 2015. 182 p. (In Russian)

[25] Batura T.V. Mathematical linguistics and automatic processing of natural language texts. Novosibirsk, NSU, 2016. 166 p. Available at: https://www.iis.nsk.su/files/book/file/Batura_ Matlingvistika_i_avtomat._obrabotka_tekstov.pdf (accessed 12.06.2018). (In Russian)

[26] Marchenko O.O., Nikonenko A.A. The Contextual Semantic Analysis of Natural Language Text. System of Text Monitoring and Qualitative Estimation of the Focus Object. Artificial intelligence. 2008; 3:808-813. Available at: http://dspace.nbuv. gov.ua/bitstream/handle/123456789/7155/02-Marchenko. pdf?sequence=1 (accessed 12.06.2018). (In Russian)

[27] Bolshakova E.I., Vorontsov K.V., Efremova N.E., Klyshinsky E.S., Lukashevich N.V. Sayapin A.S. Automatic text processing in natural language and data analysis. Moscow, HSE, 2017. 269 p. Available at: https://www.hse.ru/data/2017/08/12 /1174382135/ NLP_and_DA.pdf (accessed 12.06.2018). (In Russian)

[28] Orlova Yu.A. Avtomatizaciya semanticheskogo analiza teksta tekhnicheskogo zadaniya. Diss. kand. tekh. nauk [Automation of semantic analysis of the text of the technical task]. Volgograd, 2008. 228 p. Available at: https://elibrary.ru/item.as-p?id=16191917 (accessed 12.06.2018). (In Russian)

[29] Svyatogor L., Gladun V. Semantic analysis of natural language texts: goals and instruments International. Book Series «Information Science and Computing». Knowledge — Dialogue — Solution. Supplement to International Journal «Information Technologies and Knowledge». 2009; 3:9-18. Available at: http:// www.foibg.com/ibs_isc/ibs-15/ibs-15-p01.pdf (accessed 12.06.2018). (In Russian)

Submitted 12.06.2018; revised 10.09.2018; published online 10.12.2018.

bout the authors:

Elizaveta A. Dorenskaya, software engineer, Institute for Theoretical and Experimental Physics named by A.I. Alikhanov of National Research Centre «Kurchatov Institute» (25 Bolshaya Cheremushkinskaya Str., Moscow 117218, Russia), ORCID: http://orcid.org/0000-0002-4249-5131, dorenskaya@ itep.ru

Yuri A. Semenov, Candidate of Physical and Mathematical Sciences, Lead Researcher, Institute for Theoretical and Experimental Physics named by A.I. Alikhanov of National Research Centre «Kurchatov Institute» (25 Bolshaya Cheremushkinskaya Str., Moscow 117218, Russia); Deputy Head of the Department of Informatics and Computer Networks, Institute of Nano-, Bio-, Information, Cognitive and Socio-humanistic Sciences and Technologies, Moscow Institute of Physics and Technology (9 Institutskij per., Dolgoprudny 141701, Moscow region, Russia), ORCID: http://orcid.org/0000-0002-3855-3650, semenov@itep.ru

This is an Open Access article distributed under the terms ofthe Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0), which permits unrestricted reuse, distribution, and reproduction in any medium provided the original work is properly cited.

Современные информационные технологии и ИТ-образование

Том 14 № 4 (2018) ISSN 2411-1473 sitito.cs.msu.ru

Что такое примеры контекста речи?

Что такое речевой контекст ваших собственных слов? Что такое речевой контекст своими словами? Речевой контекст относится к ситуации или среде и обстоятельствам, в которых происходит общение. Различают три типа речевого контекста: внутриличностный, межличностный и публичный. Внутриличностное общение — это просто общение внутри себя.

Что такое контекст своими словами? Контекст означает установку слова или события. Контекст происходит от латинского слова «как что-то делается». Впервые оно использовалось, чтобы говорить о письме, например, «красивая фраза появляется в контексте заключительного абзаца». Мы используем его сейчас, чтобы говорить о любых обстоятельствах, при которых что-то происходит.

Что является примером контекста? непосредственно рядом с указанным словом или отрывком или вокруг него и определяя его точное значение. Примером контекста являются слова, окружающие слово «читать», которые помогают читателю определить время слова. Примером контекста является история, связанная с историей шекспировского короля Генриха IV.

Какой самый простой речевой контекст? Ответ: Конечно, внутриличностный речевой контекст — это самый простой речевой контекст, потому что мы начинаем говорить с самим собой перед зеркалом, тогда как публичный — самый сложный, потому что требуется много мужества, чтобы говорить перед большой толпой.

Что такое примеры контекста речи? — Дополнительный вопрос

Какие типы речевого контекста легко практиковать?

Объяснение: Конечно, внутриличностный речевой контекст — это самый простой речевой контекст, потому что мы начинаем говорить с самим собой перед зеркалом, тогда как публичный — самый сложный, потому что требуется много мужества, чтобы говорить перед большой толпой.

Почему важно изучать типы речевого контекста?

Ответ: Важно изучить различные типы речевого контекста, потому что это поможет нам полностью понять, почему нам нужно общаться с собой, а также с другими людьми и как мы должны действовать и реагировать перед ними.

Какой тип речевого контекста требует от вас доставки или передачи?

Общедоступный. Этот тип относится к общению, которое требует, чтобы вы доставили или отправили сообщение до или перед группой.

Каков правильный контекст речи?

Ситуационный контекст относится к причине, по которой вы говорите. Думайте о ситуационном контексте как о самом событии. Окружающий контекст относится к физическому пространству и времени, в котором вы говорите. Подумайте об экологическом контексте как о времени и месте проведения мероприятия.

Какое значение имеет контекст речи?

Мы помещаем это сообщение в контекст. Контекст имеет решающее значение, потому что он говорит вам, получателю, какое значение придавать чему-то, какие предположения делать (или нет) о том, что сообщается, и, что наиболее важно, он придает смысл сообщению.

Каково ваше собственное определение речи?

1а: общение или выражение мыслей в устной речи. б : обмен произнесенными словами : разговор. 2а: то, о чем говорится: высказывание. б : обычно публичный дискурс : адрес.

Что такое контекст простыми словами?

1: части дискурса, которые окружают слово или отрывок и могут пролить свет на его значение. 2: взаимосвязанные условия, в которых что-то существует или происходит: окружающая среда, задающая исторический контекст войны.

Как объяснить контекст?

Контекст — это фон, среда, обстановка, структура или окружение событий или явлений. Проще говоря, контекст означает обстоятельства, формирующие фон события, идеи или утверждения таким образом, чтобы читатели могли понять повествование или литературное произведение.

Как вы используете контекст в предложении?

«Это делается только в определенном контексте». «Фильм снят в современном контексте». «Это легче понять в нынешнем контексте». «Это было рассмотрено в контексте бизнеса».

Что такое контекстное предложение?

Контекстное предложение — это предложение, в котором слово и его значение представлены в одном предложении. Пример: Сообщение автоответчика было настолько бессмысленным, что я не мог понять его смысла. Глупое это слово; не мог получить никакого смысла, это смысл. Не очень хорошие примеры контекстных предложений: • Бессмысленное означает не иметь никакого значения.

Какие 3 типа речей?

Подводя итог, можно сказать, что существует три основных типа речей, которые ораторы используют для воздействия на свою аудиторию. Информационная речь передает информацию, убедительная речь является призывом к действию, а речь для особого случая произносится в память о человеке или событии.

Какие 3 основные части речи?

Речи и презентации состоят из трех основных частей: введения, основной части и заключения. Эти три части скреплены переходами, которые позволяют говорящему плавно переходить от вступления к основной части и от основной части к заключению.

Как речевой контекст влияет на языковую форму?

Когда мы меняем любой из четырех факторов: стиль речи, речевой контекст, речевой акт и коммуникативную стратегию, это сильно влияет на язык. Это производит совершенно другое впечатление на слушателя и значительно меняет продолжительность взаимодействия.

Каковы примеры внутриличностного речевого контекста?

Каковы примеры внутриличностного речевого контекста?

Почему важно знать три типа речевого контекста?

Контекст имеет решающее значение, потому что он говорит вам, получателю, какое значение придавать чему-то, какие предположения делать (или нет) о том, что сообщается, и, что наиболее важно, он придает смысл сообщению. Самое сложное в эффективном общении — это знать, как «установить контекст».

В чем важность контекста?

Определение контекста — это обстановка, в которой находится произведение письма. Контекст придает смысл и ясность предполагаемому сообщению. Подсказки контекста в литературном произведении создают отношения между писателем и читателем, давая более глубокое понимание замысла и направления письма.

Как бы вы описали социальный контекст?

Социальный контекст относится к конкретной обстановке, в которой происходит социальное взаимодействие. Другими словами, значение конкретного действия или поведения следует понимать в связи с обстановкой и системой, частью которой оно является.

Что такое внутриличностное и пример?

Определение внутриличностного — это то, что существует внутри одного человека. Примером внутриличностного является тот, кто осознает, как он влияет на окружающий мир. Существующее или происходящее в уме или я одного человека.

Каковы примеры коммуникативных стратегий?

Стратегии вербального общения можно разделить на две категории письменного и устного общения. Письменные стратегии состоят из таких средств, как электронная почта, текстовые сообщения и чат. Примерами, которые попадают в устную категорию, являются телефонные звонки, видеочаты и личные беседы.

Каково значение речевого контекста Brainly?

Речевой контекст важен, потому что он помогает вам установить связь и установить отношения с читателем. это помогает вам четко излагать свою точку зрения, облегчая ее понимание. это позволяет вам и другим быть более творческими.

  • Конте́кст (от лат. contextus — «соединение», «связь») — законченный отрывок письменной или устной речи (текста), общий смысл которого позволяет уточнить значение входящих в него отдельных слов, предложений, и т. п. Контекстуальность (обусловленность контекстом) — это условие осмысленного употребления той или иной конкретной языковой единицы в речи (письменной или устной), с учётом её языкового окружения и ситуации речевого общения.

    Говорить, опираясь на контекст, — значит придерживаться установившегося в разговоре уровня абстракции и использовать понятия заданного в нём семантического поля. Потерять контекст в разговоре — это перестать понимать то, на что опирается собеседник, или интерпретировать его мысль в ином смысле, нежели тот, который подразумевает собеседник, исходя из заданного в разговоре семантического поля понятий.

    В более широком значении контекст — среда, в которой существует объект (например, «в контексте эстетических представлений XIX века творчество Тернера было новаторским»).

    С формальной точки зрения контекст представляет собой определённую систему отсчета, пространство имён.

    Любое событие, происходящее в жизни субъекта, интерпретируется исходя из контекста ситуации, отражённой в памяти субъекта.

    Контекстуальный (от фр. contextue) — обусловленный контекстом. Например: Контекстуальные связи слова.

    Согласно новому стандарту ISO 9001 версии 2015 года пункт 4.1. требуется чтобы организация понимала, отслеживала и анализировала контекст, в котором она работает. Под контекстом в стандарте понимаются внешние и внутренние факторы, а также сопутствующие им риски, которые существенны с точки зрения целей и стратегического направления организации и которые влияют на способность системы менеджмента качества организации достигать ожидаемого результата(ов). В официальном переводе ГОСТ Р ИСО 9001-2015 англоязычный термин «Сontext» переведён как «Среда организации».

  • Понравилась статья? Поделить с друзьями:
  • Как найти завещание умершего родственника
  • Как найти интернет провайдеры санкт петербурга
  • Как составить анкету для опроса магазина
  • Как найти земельный участок если нет межевания
  • Как найти сколько кубов песка