Описательная статистика - Descriptive statistics - Wikipedia

А описательная статистикасчитать имя существительное смысл) является сводная статистика который количественно описывает или суммирует функции из набора Информация,[1] пока описательная статистикамассовое существительное sense) - это процесс использования и анализа этой статистики. Описательная статистика отличается от выведенный статистика (или индуктивной статистики) по своей цели суммировать образец, а не использовать данные, чтобы узнать о численность населения что, как предполагается, представляет собой образец данных. Как правило, это означает, что описательная статистика, в отличие от статистических выводов, не разрабатывается на основе теория вероятности, и часто непараметрическая статистика.[2] Даже когда анализ данных делает свои основные выводы с использованием статистических выводов, обычно также представлена ​​описательная статистика. Например, в статьи, посвященные людям, обычно включается таблица с указанием общего размер образца, размеры выборки в важных подгруппах (например, для каждой группы лечения или воздействия) и демографический или клинические характеристики, такие как средний возраст, доля субъектов каждого пола, доля субъектов с родственными сопутствующие заболевания, так далее.

Некоторые меры, которые обычно используются для описания набора данных, представляют собой меры основная тенденция и меры изменчивости или разброс. Меры центральной тенденции включают иметь в виду, медиана и Режим, а меры изменчивости включают стандартное отклонение (или же отклонение ) минимальное и максимальное значения переменных, эксцесс и перекос.[3]

Использование в статистическом анализе

Описательная статистика предоставляет простые сводки об образце и о сделанных наблюдениях. Такие резюме могут быть либо количественный, т.е. сводные статистические данные, или визуальные, то есть простые для понимания графики. Эти сводки могут либо лечь в основу первоначального описания данных в рамках более обширного статистического анализа, либо их самих может хватить для конкретного исследования.

Например, стрельба процент в баскетбол это описательная статистика, которая суммирует результаты игрока или команды. Это число представляет собой количество сделанных снимков, деленное на количество сделанных снимков. Например, игрок, который забивает 33%, делает примерно один бросок из каждых трех. Процент суммирует или описывает несколько дискретных событий. Рассмотрим также средний балл. Это единственное число описывает общую успеваемость студента по всему спектру курсов.[4]

Использование описательной и сводной статистики имеет обширную историю, и, действительно, простое табулирование населения и экономических данных было первым способом обсуждения темы. статистика появившийся. Совсем недавно набор методов реферирования был сформулирован под заголовком разведочный анализ данных: примером такой техники является коробчатый сюжет.

В деловом мире описательная статистика предоставляет полезную сводку многих типов данных. Например, инвесторы и брокеры могут использовать исторический учет поведения доходности, выполняя эмпирический и аналитический анализ своих инвестиций, чтобы принимать более обоснованные инвестиционные решения в будущем.

Одномерный анализ

Одномерный анализ включает описание распределение одной переменной, включая ее центральную тенденцию (включая иметь в виду, медиана, и Режим ) и дисперсия (включая классифицировать и квартили набора данных и меры распространения, такие как отклонение и стандартное отклонение ). Форму распределения также можно описать с помощью таких индексов, как перекос и эксцесс. Характеристики распределения переменной также могут быть изображены в графическом или табличном формате, включая гистограммы и стебле-листовая демонстрация.

Двумерный и многомерный анализ

Когда выборка состоит из более чем одной переменной, описательная статистика может использоваться для описания взаимосвязи между парами переменных. В этом случае описательная статистика включает:

Основная причина разграничения одномерного и двумерного анализа заключается в том, что двумерный анализ - это не только простой описательный анализ, но также он описывает взаимосвязь между двумя разными переменными.[5] Количественные показатели зависимости включают корреляцию (например, Пирсона r когда обе переменные непрерывны, или Ро копейщика если один или оба нет) и ковариация (который отражает масштабные переменные, на которых измеряются). Наклон в регрессионном анализе также отражает взаимосвязь между переменными. Нестандартизованный наклон указывает на единицу изменения критериальной переменной для изменения на одну единицу в предсказатель. Стандартизированный наклон указывает на это изменение в стандартизованном (z-оценка ) единицы. Сильно искаженные данные часто преобразуются путем логарифмирования. Использование логарифмов делает графики более симметричными и более похожими на нормальное распределение, что упрощает их интуитивную интерпретацию.[6]:47

Рекомендации

  1. ^ Манн, Прем С. (1995). Вводная статистика (2-е изд.). Вайли. ISBN  0-471-31009-3.
  2. ^ Додж, Ю. (2003). Оксфордский словарь статистических терминов. ОУП. ISBN  0-19-850994-4.
  3. ^ Инвестопедия, Термины описательной статистики
  4. ^ Трохим, Уильям М. К. (2006). "Описательная статистика". База знаний о методах исследования. Получено 14 марта 2011.
  5. ^ Бэбби, Эрл Р. (2009). Практика социальных исследований (12-е изд.). Уодсворт. стр.436–440. ISBN  0-495-59841-0.
  6. ^ Ник, Тодд Г. (2007). "Описательная статистика". Темы биостатистики. Методы молекулярной биологии. 404. Нью-Йорк: Спрингер. С. 33–52. Дои:10.1007/978-1-59745-530-5_3. ISBN  978-1-58829-531-6.

внешняя ссылка