<<
>>

Как описать данные

В этой книге мы встретимся с двумя типами задач. Первый тип задач, — как сжато, описать данные. Этими задачами занимается так называемая описательная статистика. Задачи второго типа связаны с оценкой статистической значимости различий и вообще с проверкой гипотез.

В этой главе мы рассмотрим задачи первого типа — как наилучшим образом описать данные.

Если значения интересующего нас признака у большинства объектов близки к их среднему и с равной вероятностью отклоняются от него в большую или меньшую сторону, лучшими характеристиками совокупности будут само среднее значение и стандартное отклонение. Напротив, когда значения признака распределены несимметрично относительно среднего, совокупность лучше описать с помощью медианы и процентилей.

Возможно, сказанное давно вам известно. Тогда смело переходите к следующей главе. Тех же, для кого термины вроде про- центиля звучат туманно, мы приглашаем приступить к изучению марсиан.

Поначалу займемся, каким-нибудь количественным признаком, например ростом. Чтобы попусту не фантазировать слетаем на Марс и измерим всех марсиан благо их всего две сотни. Результаты приведены на рис. 2.1 (мы округлили рост до целого числа сантиметров). Каждому марсианину соответствует кружок так, что, например два кружка над числом 30 означают, что имеются два марсианина ростом 30 см. Рис 2.1 это распределение марсиан по росту. Мы видим, что рост большинства марсиан — от 35 до 45 см. Коротышек (ниже 30 см) совсем немного — всего трое, и столько же великанов (выше 50 см).

Окрыленные успехом марсианского проекта мы решаем измерить венецианцев. Легко находим деньги на путешествие и, вооружившись линейками, измеряем всех 150 обитателей Венеры. Научный отчет об экспедиции будет звучать так: «Редко встретишь венерианца ниже 10 см или выше 20 см, а чаше попадаются 15-сантиметровые, см. рис. 2.2».

Но вот остались позади нелегкие межпланетные перелеты. Настала пора скрупулезного анализа данных. Сравним рис. 2.1 и 2.2. Мы видим, что венерианцы ниже марсиан и что интервал, в

о о о Марсиане
С) о о о о N = 200
С) о о о о
о о о о о о о
о о о о о о о о о
о о о о о о о о о
С) о о о о о о о о о о
С) о о о о о о о о о о
о с.) о о о о о о о о о о о
о С) о о о о о о о о о о о
о о с.) о о о о о о о о о о о о
о о о о о о о о о о о о о о о
о о о о о о о о о о о о о о о о о
о С) о С) о 2.1 и 2.2 имеют схожую форму и приближенно определяются одной и той же формулой.

Раз существует множество похожих распределений, значит, для характеристики одного из них достаточно указать чем оно отличается от других ему подобных, то есть всю собранную информацию мы можем свести к нескольким числам, которые называются параметрами распределения.

Это среднее значение и стандартное отклонение.
п П о
о о о N = 150
о о о
о о о
о о о
о о о о о
с с :> о
о о о о о
о о о о о
о о о о о
о о о о о о о
о п 1 '■> п п 1 1
о и и и о о и
о о О о о о Cl
о о о о о о Cl
о о о о и о о
о о о о о о о Cl Cl
о П о о о о о о Cl
с- О о с :> о п '■ :> о о о П
о о о U и и U о о о о
и о о о о о о о о о о 1C о
о о о о о о о о о о о с> о о
10 15 20
Рис. 2.2. Распределение венерианцев по росту. Венерианцы ниже марсиан, разброс значений меньше. Однако по форме распределения, напоминающей колокол, венерианцы и марсиане схожи друг с другом.



Расположив мысленно распределения марсиан и венерианцев на одной шкале роста, мы увидим, что распределение венерианцев находится ниже, чем распределение марсиан. Характеристика положения распределения на числовой оси называется средним. Среднее по совокупности обозначают греческой буквой р (читается "мю") и вычисляют по формуле:

Сумма значений признака

для всех членов совокупности Среднее по совокупности = .

Число членов совокупности

Эквивалентное математическое выражение имеет вид .1 *

N где X — значение признака, N — число членов совокупности. Как всегда, большая греческая буква X (читается «сигма») обозначает сумму. Подставив в формулу добытые нами данные, получим ценное дополнение к научному отчету: средний рост марсиан 40 см, а венерианцев — 15 см.

<< | >>

Еще по теме Как описать данные:

  1. Глава 2 Как описать данные
  2. Физикальные данные
  3. Физикальные данные
  4. Лабораторные данные
  5. Лабораторные данные
  6. Лабораторные данные
  7. Физикальные данные
  8. Физикадьные данные
  9. Физикадьные данные
  10. Физикальные данные
  11. Физикальные данные
  12. Физикальные данные
  13. Физикальные данные
  14. физикальные данные
  15. ЛАБОРАТОРНЫЕ ДАННЫЕ