Одномерный (статистика) - Univariate (statistics)

Одномерный - термин, обычно используемый в статистике для описания типа данных, состоящих из наблюдений только по одной характеристике или атрибуту. Простым примером одномерных данных может служить заработная плата рабочих в промышленности.[1] Как и все другие данные, одномерные данные можно визуализировать с помощью графиков, изображений или других инструментов анализа после того, как данные будут измерены, собраны, составлены и проанализированы.[2]

Одномерные типы данных

Некоторые одномерные данные состоят из чисел (например, рост 65 дюймов или вес 100 фунтов), тогда как другие не являются числовыми (например, цвета глаз коричневого или синего). Как правило, условия категоричный одномерные данные и числовой для различения этих типов используются одномерные данные.

Категориальные одномерные данные

Категориальные одномерные данные состоят не из числа наблюдения которые могут быть помещены в категории. Он включает метки или имена, используемые для идентификации атрибута каждого элемента. Категориальные одномерные данные обычно используют либо номинальный или же порядковый шкала измерения.[3]

Числовые одномерные данные

Числовые одномерные данные состоят из наблюдений, которые являются числами. Их можно получить либо интервал или же соотношение шкала измерения. Этот тип одномерных данных можно разделить еще дальше на две подкатегории: дискретный и непрерывный.[4] Числовые одномерные данные являются дискретными, если набор всех возможных значений конечный или счетно бесконечный. Дискретные одномерные данные обычно связаны со счетом (например, количество книг, прочитанных человеком). Числовые одномерные данные являются непрерывными, если набор всех возможных значений представляет собой интервал чисел. Непрерывные одномерные данные обычно связаны с измерением (например, веса людей).

Анализ данных и приложения

Одномерный анализ - это простейшая форма анализа данных. Uni средства один, другими словами, данные содержат только одну переменную.[5] Одномерные данные требуют анализа каждого Переменная раздельно. Данные собираются для ответа на вопрос или, более конкретно, вопрос исследования. Одномерные данные не отвечают на исследовательские вопросы о взаимосвязях между переменными, а скорее используются для описания одной характеристики или атрибута, которые варьируются от наблюдения к наблюдению.[6] Обычно исследователь может искать две цели. Первый - ответить на исследовательский вопрос с помощью описательного изучения, а второй - получить знания о том, как атрибут варьируется в зависимости от индивидуального эффекта переменной в Регрессивный анализ. Есть несколько способов описания закономерностей, обнаруживаемых в одномерных данных, которые включают графические методы, меры центральной тенденции и меры изменчивости.[7]

Графические методы

Наиболее часто используемые графические иллюстрации для одномерных данных:

Таблицы частотного распределения

Частота - это сколько раз встречается число. Частота наблюдения в статистике говорит нам, сколько раз наблюдение встречается в данных. Например, в следующем списке чисел {1, 2, 3, 4, 6, 9, 9, 8, 5, 1, 1, 9, 9, 0, 6, 9} частота числа 9 равна 5 (потому что оно встречается 5 раз).

Гистограммы

Это пример штрихового графика.

Гистограмма - это график состоящий из прямоугольный бары. Полоски на самом деле представляют номер или процент наблюдений существующих категорий в переменной. В длина или же высота Количество полосок дает визуальное представление о пропорциональных различиях между категориями.

Гистограммы

гистограмма

Гистограммы используются для оценки распределения данных с частотой значений, присвоенных диапазону значений, называемому мусорное ведро.[8]

Круговые диаграммы

Круговая диаграмма представляет собой круг, разделенный на части, которые представляют относительные частоты или процентные доли населения или выборки, принадлежащих к разным категориям.

Меры центральной тенденции

Центральная тенденция - один из наиболее распространенных числовых описательных показателей. Он используется для оценки центрального расположения одномерных данных путем вычисления иметь в виду, медиана и Режим.[9] Каждый из этих расчетов имеет свои преимущества и ограничения. Среднее значение имеет то преимущество, что его вычисление включает каждое значение набора данных, но оно особенно чувствительно к влиянию выбросы. Медиана является лучшим показателем, когда набор данных содержит выбросы. Режим легко найти. Важно то, что это не ограничивается использованием только одной из этих мер центральной тенденции. Если анализируемые данные являются категориальными, то единственной мерой центральной тенденции, которую можно использовать, является режим. Однако, если данные имеют числовой характер (порядковый или же интервал /соотношение ), то для описания данных можно использовать режим, медиану или среднее значение. Использование более чем одного из этих показателей дает более точное описательное резюме центральной тенденции для одномерной.[10]

Меры изменчивости

Мера изменчивость или же разброс (отклонение от среднего) одномерного набора данных может более полно выявить форму одномерного распределения данных. Он предоставит некоторую информацию о различиях между значениями данных. Меры изменчивости вместе с мерами центральной тенденции дают лучшую картину данных, чем меры одной только центральной тенденции.[11] Три наиболее часто используемых показателя изменчивости: классифицировать, отклонение и стандартное отклонение.[12] Приемлемость каждой меры будет зависеть от типа данных, формы распределения данных и того, какая мера центральной тенденции используется. Если данные категориальные, то нет никакой меры изменчивости, которую нужно сообщить. Для числовых данных возможны все три показателя. Если распределение данных симметрично, то показателями изменчивости обычно являются дисперсия и стандартное отклонение. Однако если данные перекошенный, то мерой изменчивости, подходящей для этого набора данных, является диапазон.[13]

Одномерные распределения

Одномерное распределение представляет собой тип дисперсии единственной случайной величины, описываемой либо функция массы вероятности (pmf) для дискретное распределение вероятностей, или же функция плотности вероятности (pdf) для непрерывное распределение вероятностей.[14] Не следует путать с многомерное распределение.

Общие дискретные распределения

Равномерное распределение (дискретное)
Распределение Бернулли
Биномиальное распределение
Геометрическое распределение
Отрицательное биномиальное распределение
распределение Пуассона
Гипергеометрическое распределение
Дзета-распределение

Общие непрерывные распределения

Равномерное распределение (непрерывное)
Нормальное распределение
Гамма-распределение
Экспоненциальное распределение
Распределение Вейбулла
Распределение Коши
Бета-распределение

Смотрите также

Рекомендации

  1. ^ Качиган, Сэм Кэш (1986). Статистический анализ: междисциплинарное введение в одномерные и многомерные методы. Нью-Йорк: Радиус Пресс. ISBN  0-942154-99-1.
  2. ^ Лаке, Прем С. Манн; с помощью Кристофера Джея (2010). Вводная статистика (7-е изд.). Хобокен, Нью-Джерси: Джон Уайли и сыновья. ISBN  978-0-470-44466-5.
  3. ^ Андерсон, Дэвид Р .; Суини, Деннис Дж .; Уильямс, Томас А. Статистика для бизнеса и экономики (Десятое изд.). Cengage Learning. п. 1018. ISBN  978-0-324-80926-8.
  4. ^ Лаке, Прем С. Манн; с помощью Кристофера Джея (2010). Вводная статистика (7-е изд.). Хобокен, Нью-Джерси: Джон Уайли и сыновья. ISBN  978-0-470-44466-5.
  5. ^ «Одномерный анализ». stathow.
  6. ^ «Одномерные данные». study.com.
  7. ^ Трохим, Уильям. "Описательная статистика". Интернет-центр методов социальных исследований. Получено 15 февраля 2017.
  8. ^ Diez, Дэвид М .; Барр, Кристофер Д.; Четинкая-Рундель, Шахта (2015). Статистика OpenIntro (3-е изд.). OpenIntro, Inc. стр. 30. ISBN  978-1-9434-5003-9.
  9. ^ Степански, Норм О'Рурк, Ларри Хэтчер, Эдвард Дж. (2005). Пошаговый подход к использованию SAS для одномерной и многомерной статистики (2-е изд.). Нью-Йорк: Wiley-Interscience. ISBN  1-59047-417-1.
  10. ^ Лонгнекер, Р. Лайман Отт, Майкл (2009). Введение в статистические методы и анализ данных (6-е изд., Международное изд.). Пасифик Гроув, Калифорния: Брукс / Коул. ISBN  978-0-495-10914-3.
  11. ^ Мелоун, Милан; Милитки, Иржи (2011). Статистический анализ данных Практическое руководство. Нью-Дели: Woodhead Pub Ltd. ISBN  978-0-85709-109-3.
  12. ^ Первес, Дэвид Фридман; Роберт Пизани; Роджер (2007). Статистика (4-е изд.). Нью-Йорк [u.a.]: Norton. ISBN  0-393-92972-8.
  13. ^ Андерсон, Дэвид Р .; Суини, Деннис Дж .; Уильямс, Томас А. Статистика для бизнеса и экономики (Десятое изд.). Cengage Learning. п. 1018. ISBN  978-0-324-80926-8.
  14. ^ Саманьего, Франсиско Дж. (2014). Стохастическое моделирование и математическая статистика: текст для статистиков и ученых-количественников. Бока-Ратон: CRC Press. п. 167. ISBN  978-1-4665-6046-8.