Применение случайных величин и их характеристик к изучению массивов информации, включая массивы естественнонаучной информации

Если при достаточно больших значениях объема выборки п значения случайной величины не повторяются, а возможными значениями данной случайной величины являются все действительные числа из некоторого промежутка, то изучаемая величина относится к непрерывным величинам. При этом число вариант не отличается от достаточно большого объема выборки п. Например, непрерывными величинами могут считаться температура, вес, длина, если они принимают много неповторяющихся значений в данном эксперименте. К какому типу величин следует отнести возраст, зависит от того, в каких единицах возраст измеряется. Если возраст измеряют в целых годах, то возраст может быть отнесен к смешанным или дискретным случайным величинам.

Если при достаточно большом объеме выборки п среди большого количества различных значений есть несколько повторяющихся, то такую величину относят к смешанным величинам. При этом число вариант достаточно близко к объему выборки п, а частоты, с которыми встречаются варианты в массиве, малы и мало отличаются друг от друга.

Если даже при большом объеме выборки число вариант мало, то рассматриваемая величина относится к дискретным величинам.

Определение типа случайной величины важно для выбора того или иного алгоритма описания и первичной обработки опытных данных. Описание значений случайной величины любых типов и их отличие основыва- ется на учете того, как часто встречаются в массиве опытных данных одинаковые значения. При обработке значений дискретной случайной величины и в случае малого объема (меньше 25) выборки анализируются прежде всего частоты вариант из изучаемого массива опытных данных. Различают абсолютные и относительные частоты.

Определение 6.9. Абсолютная частота — число повторений варианты.

Определение 6.10. Относительная частота — отношение абсолютной частоты варианты к объему выборки.

Для организации вычислений удобно использовать частотную таблицу (табл. 6.1).

Таблица 6.1

Частотная таблица

Варианты X- Абсолютная частота а Относительная частота
     
     
Итого и м II

 

Числовые характеристики выборки разделяют на два вида: характеристики положения (выборочное среднее, медиана, мода) и характеристики рассеяния (размах варьирования, дисперсия, среднее квадратичное отклонение, коэффициент вариации).

Пользуясь частотной таблицей, удобно находить максимальную варианту хшах и минимальную варианту хтт. Эти варианты используются при вычислении такой числовой характеристики случайных величин всех типов, как размах варьирования.

Размахом варьирования R называется разность между максимальной и минимальной вариантой Имея частотную таблицу, можно легко и с меньшим количеством ошибок упорядочить исходный массив значений.

Упорядоченный массив удобно использовать при определении числовых характеристик положения.

Используя первые два столбца частотной таблицы, удобно сформировать статистический ряд.

Статистическим рядом называется способ описания массива значений случайной величины, при котором указываются варианты и их абсолютные частоты.

Статистический ряд удобно использовать при определении такой средней числовой характеристики положения случайной величины, как мода. Первый и третий столбцы частотной таблицы представляют собой дискретный вариационный ряд.

Определение 6.13. Дискретным вариационным рядом называется способ описания массива значений дискретной случайной величины, при котором указываются варианты и их относительные частоты.

Графическое представление дискретного вариационного ряда в виде полигона частот дает наглядную, компактную информацию для анализа случайной величины

Для построения полигона частот в прямоугольной системе координат на оси абсцисс отмечают варианты в порядке возрастания с соблюдением масштаба, а по оси ординат — соответствующие относительные частоты. Цена деления на разных осях может быть разная для наглядности.

Использование дискретных вариационных рядов предпочтительнее по сравнению со статистическими рядами при сравнении выборок разных объемов. В таких случаях сравнивать абсолютные частоты невыгодно, так как они могут иметь сходные соотношения, и тогда трудно сделать вывод, отличаются ли результаты эксперимента, а если отличаются, то за счет какого именно показателя.

При большом количестве вариант в массиве опытных данных строить частотную таблицу даже на 25 строчек неэффективно, как и полигон частот для большого количества вариант трудно обозрим, а значит, не нагляден. В случае непрерывных и смешанных случайных величин имеет смысл близлежащие варианты объединить в промежуток и уже всему промежутку ставить в соответствие среднюю числовую характеристику всех вариант, туда попавших, воспринимая промежуток как одно число нового меньшего массива чисел. Описание массива будет приблизительным, но зато обозримым. Исходя из этих соображений в качестве наглядного изображения вариационного ряда используют не полигон частот, а плоскую столбчатую диаграмму — гистограмму.

Для того чтобы уменьшить погрешность приближения и грамотно разбить массив числовых данных на промежутки, чтобы результаты описания массива были удобны для анализа, прежде всего надо ответить на три вопроса.

  • 1. На сколько промежутков разбить ряд, чтобы их было не слишком много, не слишком мало?
  • 2. Каковы должны быть длина каждого промежутка и, соответственно, ширина столбца гистограммы?
  • 3. С чего начинать, т.е. от какого числа начать откладывать шаги промежутков, чтобы все поместилось и в то же время чтобы фланги не были слишком пусты?

В статистике эти вопросы решены, соответствующие формулы выведены.

Обозначим количество промежутков заглавной буквой К. Промежутки могут быть равные и неравные, в зависимости от области исследования и конкретной ситуации. Например, в экономике используют прогрессивно возрастающие интервалы. Мы будем рассматривать разбиение массива данных на равные промежутки. При этом можно использовать формулу Стерджесса:

Окончательного количества промежутков эта формула может не дать, поскольку k может получиться дробным числом, а количество промежутков никак дробным быть не может. Для окончательного решения вопроса об оптимальном количестве промежутков для данного массива опытных данных воспользуемся формулой

где квадратные скобки обозначают целую часть числа. Часто путают нахождение целой части с округлением до целых. Это может привести к ошибочным результатам. В данном случае надо просто отбросить любую дробную часть числа k. Например, 11,9991 = 1.

РУССКИЙ ЛИТЕРАТУРНЫЙ ЯЗЫК КАК ВЫСШАЯ ФОРМА НАЦИОНАЛЬНОГО ЯЗЫКА. ПОНЯТИЕ О НОРМАХ СОВРЕМЕННОГО РУССКОГО ЛИТЕРАТУРНОГО ЯЗЫКА. ВЛАДЕНИЕ НОРМАМИ ЛИТЕРАТУРНОГО ЯЗЫКА КАК ПОКАЗАТЕЛЬ ОБЩЕЙ КУЛЬТУРЫ ЧЕЛОВЕКА

Литературный язык составляет высшую форму национального языка. Это язык культуры, литературы, образования, средств массовой информации.

Он обслуживает разные сферы человеческой деятельности: политику, науку, законодательство, официально-деловое общение, бытовое общение, межнациональное общение.

Среди разновидностей национального языка (просторечие, территориальные и социальные диалекты, жаргоны) литературный язык играет ведущую роль.

Языковая норма (норма литературная) - это правила использования речевых средств в определенный период развития литературного языка, то есть правила произношения, словоупотребления, использования традиционно сложившихся грамматических, стилистических и других языковых средств, принятых в общественно-языковой практике. Это единообразное, образцовое, общепризнанное употребление элементов языка (слов, словосочетаний, предложений).

Норма обязательна как для устной, так и для письменной речи и охватывает все стороны языка. Различают нормы: орфоэпические, орфографические, лексические, морфологические, синтаксические, пунктуационные. Признаки нормы литературного языка: относительная устойчивость, общеупотребительность, общеобязательность, соответствие употреблению, обычаю и возможностям языковой системы.

В результате анализа всего перечисленного материала были выявлены наиболее распространенные варианты, используемые в равной степени; редко встречающиеся или совсем исчезнувшие. Это позволило ученым определить, что считать нормой, как она изменилась. Показатели различных нормативных словарей дают основание говорить о трех степенях нормативности:

- норма I степени - строгая, жесткая, не допускающая вариантов;

- норма II степени - нейтральная, допускает равнозначные варианты;

-норма III степени - более подвижная, допускает использование разговорных, а также устаревших форм.

Нормы литературного языка отражают самобытность русского национального языка, способствуют сохранению языковой традиции, культурного наследия прошлого. Они защищают литературный язык от потока диалектной речи, социальных и профессиональных жаргонов, просторечия. Это позволяет литературному языку оставаться целостным, общепонятным, выполнять свою основную функцию - культурную. Литературный язык - система элементов языка, речевых средств, отобранных из национального языка и обработанных мастерами слова, общественными деятелями, выдающимися учеными. Эти средства воспринимаются как образцовые и общеупотребительные. Для носителей языка литературный язык — это высшая форма национального языка.

Он обслуживает разные сферы человеческой деятельности: политику, науку, культуру, образование, радио, телевидение.

К нормам, общим для устной и письменной речи, относятся:

- лексические нормы;

- грамматические нормы;

- стилистические нормы.

Лексические нормы, или нормы словоупотребления, — это нормы, определяющие правильность выбора слова из ряда единиц, близких ему по значению или по форме, а также употребление его в тех значениях, которые оно имеет в литературном языке.

Лексические нормы отражаются в толковых словарях, словарях иностранных слов, терминологических словарях и справочниках.

Синтаксические нормы предписывают правильное построение основных синтаксических единиц - словосочетаний и предложений.
Стилистические нормы определяют употребление языковых средств в соответствии с законами жанра, особенностями функционального стиля и - шире - с целью и условиями общения.

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: