Форум  

Вернуться   Форум "Солнечногорской газеты"-для думающих людей > Внутренняя политика > Путин итоги

 
 
Опции темы Опции просмотра
  #1  
Старый 19.12.2013, 12:52
Аватар для Друг истины и Платона
Друг истины и Платона Друг истины и Платона вне форума
Местный
 
Регистрация: 20.09.2010
Сообщений: 1,481
Сказал(а) спасибо: 1
Поблагодарили 0 раз(а) в 0 сообщениях
Вес репутации: 15
Друг истины и Платона на пути к лучшему
По умолчанию *891. Контент-анализ текстов Посланий Президента Федеральному собранию РФ 2001-2006гг.

http://www.i-u.ru/biblio/archive/ave...ontent/06.aspx

Глава шестая
Предметный анализ текста (Контент-анализ текстов Посланий Президента Федеральному собранию РФ 2001-2006гг.)

Ранее, в предыдущих главах, мы рассмотрели некоторые общие методологические и методические основы исследования текста, постарались показать его онтологическую и гносеологическую природу. Не мало внимания уделили и логической основе построения и анализа текста и его составных частей, в частности, предложения. Надеюсь, представленный теоретический материал был достаточно убедителен.

Теперь необходимо продемонстрировать на практике, каким же образом представленная нами методология и, соответственно, методики работают на практике, т.е. в процессе анализа текста, способны ли они решать поставленные задачи и каким образом это делается. Ведь как известно теория и практика весьма разные вещи: то что хорошо выглядит в теории, оказывается совершенно не работает на практике и наоборот, и расстояние между ними нередко оказывается очень большим и трудно преодолимым.

Понятно, что в качестве такого демонстрационного материала можно взять любой хороший текст. Но все-таки хотелось бы иметь такой, который был бы не только интересным по содержанию, но и по результатам контент-анализа.

Но что может быть самым интересным и злободневным в наше непростое время в России как не политика. Поэтому мы остановили свой выбор на политическом тексте и не просто политическом, (их также предостаточно и весьма интересных), а на таком политическом тексте, который является важным, значимым и в какой-то степени определяющим для страны.

В качестве такого текста мы и выбрали послания Президента РФ Федеральному собранию РФ. Но кроме того, что Послание [1] является значимым для сегодняшней России политическим текстом, он еще, с нашей точки зрения, обладает рядом специальных характеристиками важных для проведения контент-анализа.

Во-первых это выверенный со всех точек зрения материал, десятки раз апробированный и вычитанный. Да и работало над текстом, наверняка не один десяток специалистов в разных областях. В этом плане случайных спонтанных слов нет, так же как нет, точнее не должно быть и спонтанных смыслов, случайного, т.е. не отражающей известной ситуации, содержания.

Во-вторых, текст послания имеет хорошо выверенную смысловую структуру, где каждый из элементов текста имеет содержательное и логическое обоснование. При этом послание охватывает большое смысловое поле, подчиненное нескольким доминантам, (задачам), то что называется основным содержанием. Это то, что видно невооруженным взглядом, и что в первую очередь подвергается интуитивному анализу. Но имеется еще и второй и третий смысловой ряд, который можно выявить только специальными методами, в частности, с помощью контент-анализа.

В-третьих, текст послания хорошо отражает основную идею, содержание того, что хотели донести до читателей власти. Причем не только для узкой правящей элиты, а для широких кругов общественности. Послание интеллектуальный материал и в этом его основное достоинство. Текст послания хорошо «сбит», понятен образованным людям и в первую очередь интеллигенции. И это еще одно достоинство данного текста: добиться выражения основных смыслов простым, понятным и в тоже время емким языком.

Послание достаточно полно отражает современную идеологию и политику власти относительно субъектов общества и косвенно, идеологию и политику общества относительно власти. Текст определяет основных субъектов как власти, так и общества, достаточно четко устанавливает на какие социально-профессиональные группы власть опирается, чьи и какие интересы отстаивает и пр.

Важное значение имеет и то, что Послание есть официальный документ. Мало того, что он соответственно логически грамотно построен, он так же хорошо, именно в силу того, что правильно построен, отражает основную официальную позиции тех кругов общества, которые осуществляют в настоящее время власть в стране и будут осуществлять ее, во всяком случае, в ближайшем будущем.

Это важно с той точки зрения, что каждый день функционирования власти может закладывать, (хотя не обязательно), основание будущего страны, ее главные принципы и постулаты, определять идеологию государства в самом широком смысле слова. Важно это особенно в переходный период к новым социально-экономическим и политическим отношениям, становления политической, экономической и социальной стабильности в обществе, а соответственно, устойчивости и стабильности самой власти, что так же предельно важно для существования общества.

Понимание того, какие принципы своего функционирования и сохранения власть используют, какой смысл и идеологию исповедует и пр., в конечном итоге, так или иначе, будет определять и содержание деятельности всего общества и его отдельных слоев и групп на ближайшее будущее. А может быть даже и на длительный срок. Ибо воля власти есть закон для народа. Услышать истинный голос власти - грандиозная задача.

Но понятно, что рассмотрение официальных документов, (текстов), посредством контент-анализа есть только один из инструментов анализа деятельности власти. Имеется множество иных средств и методов исследования особенностей функционирования власти, позволяющие в совокупности иметь объективное представление о сущности власти, содержании ее деятельности, истинных целей и пр. Исходя из этого необходимо подчеркнуть, что результат контент-анализа, могут рассматриваться только как один из возможных и не более того.

Кроме того, в силу самопроизвольности и, можно сказать, определенной хаотичности развития событий, (как это имеет место в переходный период), которые очень трудно, а точнее не возможно, контролировать из какого-либо центра, (как этот пытались делать совсем недавно), спонтанные процессы очень хорошо могут проявиться именно в хорошо отработанных текстах. Этим тоже может быть интересным именно официальный текст и, в частности, настоящие послания.

Мы взяли послания за 2001-2006 год, содержащие примерно 220 страниц стандартного текста. С нашей точки зрения этого вполне достаточно для статистического анализа текста, хотя, понятно, что отдельные блоки текста могут иметь и небольшое статистическое наполнение, но в принципе приемлемое для обоснованности вводов. Как получилось по процедуре и самое главное по результатам - судить уже читателя м.
Общий статистический анализ текста

Любой частотный анализ начинается с общих количественных характеристик. Поэтому и мы сначала проведем и представим общие количественные распределения слов в тексте. Количество слов, которое содержит анализируемый нами текст, равно примерно 40 000. Но каждое слово может употребляться в тексте от 1 раза и больше.

Здесь можно выделить две группы слов: одинаковые слова по смыслу и по написанию и слова одинаковые по содержанию, но имеющие свои словоформы и производные. И тех и других из 40 000 набирается 9500 слов. После того, как словоформы были сгруппированы по общему для них признаку получилось 2600 слов.

Поскольку основания для группировок всегда в кокой-то степени субъективны, (так же как в какой-то степени и объективны), количество оригинальных слов не может быть абсолютно точным. Но колебания в 5-10% в принципе не меняет общей картины и может быть приемлемо для статистического анализа.

Таким образом мы с полным основанием можем оперировать в дальнейшем анализе цифрой в 2600 слов. Это то общее количество оригинальных слов, включая словоформы, которые использовали авторы посланий. Мы сейчас не имеем возможности говорить много это или мало, поскольку в данном случае, для этого нет никаких сравнительных материалов.

Но в научной литературе отмечают, что среднее количество слов современного образованного человека составляет примерно 3000 слов. Может быть и так, но в любом случае это число всех слов: от обыденного повседневного языка до профессионального словаря. По всей видимости данного количества слов в принципе достаточно для решения не только повседневных, но и разнообразных профессиональных задач. Тем более, что узкопрофессиональный словарь, как правило, бывает не большим по количеству слов. Авторы посланий пользовались в основном профессиональным словарем.

Но для нас больший интерес представляет структура текста, которая определяется составом оригинальных слов, т.е. примерно 2600 слов для нашего текста. Структура текста, в свою очередь, содержит разные блоки слов, и соответственно, выполняющих разнообразные функции. Можно выделить в самом общем виде четыре блока: слова-доминанты, ключевые слова, обслуживающие слова и слова, выполняющие роль связки слов.

Мы начнем анализ с последнего блока – со слов-связок. В разных текстах их может быть больше или меньше, но всегда ограниченное количество. Это происходит в силу того и только того, что функции их весьма ограниченные - осуществление смысловой связи отдельных слов и предложений или частей предложений в тексте.

В данном тексте слов-связок немного, всего 51, но вот их общее количество употреблений довольно большое, примерно – 3500 раз. Другими словами, 51 слово было использовано в тексте три с половиной тысячи раз, что составляет около 30% от общего количества оригинальных слов со словоформами, (9500), или 8,9% от общего числа слов, (40 000). Ниже приводится таблица общей численности слов-связок и частоты их употребления в тексте. [2]

1.эта, это - 600

2.не, нет, ни - 498

3. для - 229

4. по - 166

5.за - 146

6. только - 115

7. из - 103

8.от - 104

9. уже - 87

10.еще - 84

11.которая - 83

12. при - 81

13. так - 71

14. всем – 73

15. также - 65

16. такие - 65

17. будет - 65

18. кроме того - 61

19. бы - 61

20. очень - 56

21. то - 51

22. была - 50

23. между - 50

24. чтобы - 47

25. тем - 46

26. чем - 38

27. том - 38

28. без - 38

29. когда-либо- 47

30. или - 36

31. может - 36

32. другие - 35

33. если - 35

34. же - 34

35. однако - 32

36. кто - 32

37. где - 25

38. лишь - 24

39. даже - 23

40. хотя - 23

41.некоторые- 21

42.до сих пор- 20

43. почти - 19

44. тех - 19

45. поэтому - 18

46. самой - 17

47. пока - 16

48. потому - 16

49. те - 14

50. под - 12

51. через - 10.

Итого: 3500

Как видно из таблицы, чаще всего употребляется частицы: «эта», «это» – 600; отрицание «не», «нет», «ни» - 498; «для» - 229; «за» - 146 и др. Всего восемь слов, (частота употреблений до ста), использовались - 1961 раз или 56%. Можно предположить, что и в других текстах, (скорее всего во всех текстах), они употребляются так же часто, поскольку являются, в силу разных причин, самыми расхожими словами-связками. [3]

Каждое из этих (и других) слов-связок и их производных выполняет, как правило, одну устойчивую функцию: «это» – указание на что-то, («это было не эффективно»); «не», «ни», «нет» - отрицание чего-либо, («у нас нет другого выхода»); «для» - принадлежность чему-либо, («для принятия решения»); «по» - по направлению, («по порядку»); «за» - за чем-то, («за неимением иного»); «только» - ограничение, («и только от нас зависит»), «из» - извлечение, («некоторые из приоритетов»); «от» - отказ, отделение, точка отсчета и пр. («это от нас не уйдет»).

Имеет смысл выделить в отдельный блок обслуживающие слова из группы местоимений. Это особые слова, и выполнять они могут разные функции, чаще всего роль слов-связок. Нередко местоимения, например, «я», «мы», «они» и пр. становятся доминантами или ключевыми словами. Но чаще всего они выполняют функцию связки слов в блоке вспомогательных или основных слов-признаков. Более четкое их разделение или точнее определение содержание по функциям зависит уже от поставленной задачи.

• мы - 218

• их - 105

• все - 92

• нас - 80

• нам - 77

• я - 76

• наших - 74

• они - 61

• ее - 55

• нашей - 50

• его - 38

• наша - 33

• она - 33

• он - 26

• многие - 25

• вместе - 24

• нашего - 21

• вами - 18

• них - 18

• себя - 15

• им - 16

• одним - 16

• своих - 16

• своей - 16

• себе - 13

• свои - 12

• нами - 12

• вы - 11

• наш - 11

• оно - 11

• ним - 10

Всего: 1259

Как видно из приведенной выше таблице всего таких слов набирается 31 с общим количеством использований – 1259 слов. Это составляет от общего количества слов – 14,8%. Чаще всего употребляется слово «мы» - 218 раз, и слово «их» - 105 раз. Множественное число употребляется намного чаще - 899 раз и 360 раз единственное число. Слово «я» употребляется 76 раз. Мы сейчас не даем никакой содержательной оценки, а только определяем группы слов, как оригинальные структурные элементы текста.

Следующий блок – это слова, которые в тексте употребляются чаще всего, минимум 10 раз. Всего их набирается 233 слов. Фактически это те слова, которые составляют основной словарный состав данного текста. Они и содержат наибольшее количество употреблений – 6455, (включая и некоторые важные словоформы). Среди них много обслуживающих и ключевых слов, но об этом мы поговорим ниже.

В повседневной жизни и профессиональной занятости, при решении частных задач, каждый из нас пользуется не всем запасом слов, а их ограниченном количеством. В литературе пишут 300-500 слов, при решении простых задачи и больше, если задачи сложные. Словарь индивидуального пользования вполне укладывается в некую усредненную норму.

Но вот только 14 слов используются от 100 и выше раз, и в общей численности они набирают 2103 применения. Чаще всего использовались такие слова как: Россия – 296; государство – 252; экономика – 222; должны – 218; год – 149; нужно -140; власть – 135; граждан - 121; страна – 120; политика – 120; работа – 120; фактически – 107; сегодня - 103; будем -101. То, что эти слова набрали самое большое число употреблений может свидетельствовать, но только свидетельствовать, о том, что они выступают основными, ключевыми и может быть даже смысловыми словами. Но это можно однозначно определить только в контексте.

То, что слово Россия используется чаще всего – 296 раз, еще не говорит о том, что оно является ключевым, так же как, например, и слово государство, которое так же использовалось довольно много - 252 раза. В равной степени это относится и к другим словам, набравших большое число использований. Но то, что эти и другие слова применяются часто, уже говорит о том, что они могут быть значимыми.

И еще один блок, слова которого используются так же часто - от 99 до 50 раз. Таких слов набирается – 20, и использовали их 1430 раз. Вот эти слова: решать – 93; система – 91; задача – 88; люди - 81; развитие – 81; правительство – 73; более – 70; жизнь - 70; мир – 70; социальное – 68; проблемы – 67; рынок – 66; рост – 63; хотел – 62; органами – 60; является – 57; всего – 56; надо – 56; права – 55; обеспечение – 52; условия – 51.

Данный ряд слов так же без сомнения можно отнести к разряду ключевых, основных и возможно смысловых. Все-таки частота использования определяется и таким важным фактором как его важность, значимость в тексте. Правда, еще раз отметим, их значение и роль в тексте можно определить только исходя из контекста употребления.

Визуально видно, что эти два ряда частотного распределения слов отличаются друг от друга. Если в первом частотном блоке используются, так скажем, глобальные слова, или, точнее, наиболее общие понятия, применительно к задачам данного текста, то во втором частотном ряду, используются понятия уже ниже рангом, меньшей общности, во всяком случае, так нам представляется.

В первом ряду используются такие общие понятия как: Россия, государство, власть, экономика, политика, граждане, страна, работа. Во втором частотном ряду: система, задачи, люди, развитие, правительство, жизнь, рынок, социальное, органы, права . Можно не соглашаться с предложенным разделением этих групп слов по уровню понятийной общности, но что таковое понятийное разделение всегда присутствует в текстах, вряд ли требует доказательства.

Разница или общность данных частотных блоков можно продемонстрировать более точно, если вычислить средневзвешенный коэффициент. [4] Как и ожидалось первый блок, получил больший коэффициент - 5,29; второй – 4,80. Это означает, что первый блок по значимости оказывается выше второго блока. Но в данном случае значимость показателя определялась, как мы уже говорили, только частотой их использования в тексте. Но можно предположить: как выстраивали авторы данного текста значимость этих блоков, так оно и получилось.

Весовой

коэффициент

показателя

V ( 1-8)

Показатели

Количество употреблений

Y ( 1-8)

Весовое значение

Sz( 1-8)

Средне взвешенный коэффициент

G

8

7

6

5

4

3

2

1

Россия

государство

экономика

власть

граждане

страна

политика

работа

296

252

222

135

121

120

120

120

2368

1764

1332

675

484

360

240

120

(Sz)

(S Y )

Средняя: 7343

Средняя: 1386

( Sy) Средняя: 1386

(Sz) Средняя: 7343

5.29

Весовой коэффициент показателя V( 1-8)

Показатели

Количество употреблений

Y( 1-8)

Весовое значение

Sz( 1-8)

Средневзвешенный коэффициент

G

8

7

6

5

4

3

2

1

система

люди

правительство

жизнь

мир

социальное рынок

права

91

81

73

70

70

68

66

55

728

567

438

350

280

204

132

55

Sz)

(S Y )

Средняя: 2757

Средняя: 574

(S Y ) Средняя: 574

(Sz) Средняя:

2757

4,80

Но если мы придадим весовое значение показателя не по количеству употребления, а по весовому значению самого показателя, (предложенный исследователем), то разница может быть несколько иной. У нас получилось 4,78 и 4,46. В первом случае по критерию частоты использования слов первая группа оказалась более весомее чем вторая, (разница 0,49 балла). По второму критерию,(весовой коэффициент показателя), первая группа, хотя и сохранила свое весовое преимущество, но уже не намного, по сравнению со второй группой (разница - 0,30).

Понятно, что субъективный показатель весового значения, приписываемый исследователем, весьма уязвим для критики, но при определенных ситуациях его вполне успешно можно использовать. Другими словами, его можно использовать с большой уверенностью тогда, когда показатели и их весовые значения получили одобрение в некой конвенциальной группе, например, со стороны участников данного исследования или какой-либо экспертной группы.

При строгом научном подходе обычно так и делается, который безусловно обеспечивает с большой долей вероятности, что полученные данные имеют объективное звучание, в обязательном порядке для решения поставленной задачи. Но только для данной задачи, вне которой любые результаты исследования теряют всякий смысл. Потому он и называется «смысл», что имеет всегда конкретное выражение.

Весовой коэффициент показателя

V ( 1-8)

Показатели

Количество употреблений

Y ( 1-8)

Весовое значение

Sz( 1-8)

Средне-взвешенный коэффициент

G

8

7

6

5

4

3

2

1

Россия

страна

граждане

работа

государство

экономика

власть

политика

296

120

121

120

252

222

135

120

2368

840

726

600

1008

666

270

120

(Sz)

(S Y )

Средняя: 6598

Средняя: 1386

( Sy) Средняя:

1386

(Sz) Средняя:

6598

4,76

Весовой коэффициент показателя V( 1-8)

Показатели

Количество употреблений

Y( 1-8)

Весовое значение

Sz( 1-8)

Средне-взвешенный коэффициент

G

8

7

6

5

4

3

2

1

люди

жизнь

мир

социальное права

правительство

рынок

система

81

70

70

68

55

73

66

91

648

490

420

340

220

219

132

91

Sz)

(S Y )

Средняя: 2560

Средняя: 574

(S Y ) Средняя: 574

(Sz) Средняя:

2560

4,46

Можно провести анализ слов, которые употребляются от 49 до 25 раз. Таких слов уже набирается 40 и используются они 1453 раза. В среднем каждое слово использовалось 36 раз. Но и по важности, с нашей точки зрения, их можно отнести к третьему ряду, но не все. Из общего числа (40), 32 слова можно отнести к обслуживающим, например, уважаемые, здесь, часто, необходимо и пр. Но 9 слов можно отнести к весьма важным, с нашей точки зрения, словам: закон - 48; региональный - 47; качество - 41; общество - 40; образование - 38; население – 32; организации - 26; человек - 26; доход - 25. Так же как и в списке 20-ти последних слов, которые использовались в тексте по 10 раз, имеются слова, которые, с нашей точки зрения, являются весьма важными, например: финансовые – 10, президент – 10, конституция – 10, партии – 10, институты – 10.

В целом среди 233-х наиболее употребительных слов, только 67 являются, с нашей торчки зрения, значимыми, исходя из некоторого наиболее общего контекста. Эти слова и в самом деле использовались больше всего - 3258 раз, что составило ровно половину 50,4% от числа всех слов, набравших более десяти использования. В среднем каждое слово использовалось 49 раз.

• Россия 296

• государство 252

• экономика 253

• властей 135

• граждан 121

• страны 120

• политика 120

• работа 120

• система 91

• задач 88

• людей 81

• развитие 81

• правительства 80

• жизни 70

• мира 70

• социально 68

• проблем 67

• рынка 66

• рост 63

• органами 60

• прав 55

• обеспечение 52

• условий 51

• закон 48

• региональных 47

• качества 41

• общества 40

• образование 38

• населения 32

• человек 26

• доходов 25

• самоуправления 24

• ответственности 22

• собственности 21

• свободы 20

• безопасности 24

• налогов 20

• международного 20

• реформы 19

• исполнительной 19

• депутаты 18

• порядок 18

• предприятий 17

• деятельности 17

• думы 16

• управления 16

• народа 14

• бизнеса 14

• внешней 14

• ВТО 14

• стабильность 14

• бюджета 13

• информации 13

• армии 12

• сообщества 12

• финансирования12

• инфраструктуры 11

• конкуренции 11

• медицинской 11

• угрозу 10

• финансовых 10

• цель 10

• президента 10

• массовой 10

• конституции 10

• институтов 10

• партии 10

Итого: 3258

По всей видимости и в самом деле частота использования того или иного слова имеет хорошую связь со его текстовой значимостью. Если не мудрствовать лукаво над текстом и не прятать какие-либо тайные мысли, то частотное распределения слов-понятий может отражать смысл текста, или хотя бы его границы. Но, в зависимости от поставленных задач, частотное наполнение даже значимых слов может и не отражать, во всяком случае в полном объеме, смысл текста. И это всегда надо иметь ввиду.
Группировки и сочетания слов-понятий.

Далее, мы выделим несколько больших смысловых блоков, которые, по нашему мнению, отражают основные области внимания авторов посланий. Понятно, что в этом случае мы будем пользоваться субъективным предпочтениями , определяя важность того иного слова-понятия, исходя из наших задач и не более того. Все, ниже приведенные группировки - чистый «субъективизм» исследователя. При этом количественный критерий не будет столь активно использоваться.

Но никакого другого подхода или способа нет и не может быть. Количественный или статистический аппарата, нужен только для того, что бы подтвердить или не подтвердить, (но ни как не опровергнуть), субъективные гипотезы исследователя. Другое дело, что некоторые математические зависимости, тесная корреляция каких-либо явлений, неожиданно появившаяся в ходе анализа, могут подтолкнуть к новому направлению исследования и соответственно, разработки новых гипотезы, в несколько или принципиально иную область бытия. Но это уже другая тема.

Поэтому, сначала, из общего списка использованных слов (2600), исключим слова–связки и местоимения как не важные для решения наших задач. И выберем те слова, которые являются, с нашей точки зрения, и только с нашей точки зрения, ключевыми, важными, имеющие, по нашему мнению, большую смысловую значимость в рамках данного текста. При этом их частотное использование нами практически не будет учитываться. То или иное слово вообще может использоваться только один раз, тем не менее, значимость его, в рамках данного текста, может быть весьма высокая.

Необходимо отметить, что смысловая значимость слов определяется в данном случае, неким наиболее общим контекстуальным представлением о значимости того или иного слова и без привязки к тексту, который выступает конкретным, частным контекстом. Так слова Россия, президент, конституция, армия, правительство, дума, общество, экономика, русский и пр. являются для нас как бы априори значимыми словами, имеющие определенный общий смысл. И мы можем их в таком качестве рассматривать, предполагаю, вполне обосновано, что авторы посланий так же оперирует этими же словами в неком общем контекстуальном поле как значимыми и содержащие примерно такой же смысл.

Мы можем быть уверенны в этом только потому, что и я, как автор данного текста и авторы посланий живем и работаем в одной и той же общей смысловой парадигме, в едином пространстве и времени, т.е. на одной территории, в одном месте и в одно и тоже время. Для них вышеприведенные слова так же являются значимыми, (должны быть значимыми), как и для меня в рамках решения своих частных и общих задач.

Иначе наверное и быть не может, в противном случае мы просто бы не понимали друг друга, хотя такое и случается нередко со стороны власти и других субъектов общества. Понятно, что те же самые слова в какой-то иной стране возможно не были бы столь значимыми и имели бы иной смысл. Все это дает право, воспринимать многие слова посланий в рамках некой общей смысловой парадигмы как значимых и смыслообразующих слов.

Таких слов у нас набралось 264. Возможно их несколько больше, может быть некоторые слова мы не приняли как значимые. Но может быть и меньше, поскольку наверняка отдельные слова мы напрасно приняли как важные. Только контекст может показать истинное значение слова в структуре предложения. Но в целом, надо полагать, основных ключевых слов насчитываться именно такое количество, примерно 10%, что в целом соответствует их возможному количеству для любого текста. И вот почему.

C структура предложения всегда содержит основные смыслообразующие и вспомогательные слова, (в том числе слова-связки). Первые составляют до трех слов, остальные, т.е. вспомогательные слова, составляют в среднем 10-12 слов в предложении. Так, если всего предложений в тексте насчитывается немногим больше 2500 и если каждое предложение содержит от одного до трех ключевых слова, то получается, примерно, 240-260 слов или те же 10%.

Как видно, имеется определенная зависимость между частями предложений и структурными блоками текста в целом, которые и определяют устойчивость количественных выражений блоков практически любого текста. Примерно одинаковое количество оригинальных и эксклюзивных, значимых слов и вспомогательных слов, слов-связок и их примерно одинаковое процентное выражение.

И так, анализируемый текст, – послания, представляет собой следующее количественное распределение.

Всего слов в тексте, примерно, - 40 000.

Оригинальных слов,(со словоформами и производными) - 9 500 или 23,8%.

Эксклюзивных слов (без словоформ и производных) - 2600 или 6,5% от общего числа или 27,4% от общего числа оригинальных слов.

Значимых слов, примерно, 264 или 10% от общего числа эксклюзивных слов или 0,65% от общего числа слов.

Вспомогательных слов, вместе со словами-связками - 2340.

Ключевых слов – 19.

Доминанта – чаще всего одна, но может быть несколько.

Как видно оригинальных слов со словоформами не много, (9500) еще меньше эксклюзивных слов,(2500) т.е. с учетом словоформ, который выступает, еще раз напомним, основным словарным составом авторов посланий. Совсем не много значимых слов, (264), которые авторы употребляют чаще всего. Немного и ключевых слов, (19) описывающие блоки текста, фактически это доминанты. Больше всего вспомогательных слов различной конфигураций, например, слов-связок, (2340). Так всегда и бывает.
Редактировать/удалить сообщение

Последний раз редактировалось Ульпиан; 14.05.2022 в 14:20.
Ответить с цитированием
 


Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Текущее время: 16:01. Часовой пояс GMT +4.


Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot
Template-Modifications by TMS