Выборка расстояния - Distance sampling

Выборка расстояния - это широко используемая группа тесно связанных методов оценки плотность и / или избыток из население. Основные методы основаны на линейном трансекты или же точечные трансекты.[1][2] В этом методе выборки собираемые данные представляют собой расстояния до исследуемых объектов от этих случайно расположенных линий или точек, и цель состоит в том, чтобы оценить среднюю плотность объектов в пределах региона.[3]

Методология базового линейного трансекта

Базовый подход к дистанционной съемке с использованием линейных разрезов. Полевой наблюдатель обнаруживает объект и записывает расстояние р и угол θ до линии трансекты. Это позволяет рассчитать расстояние объекта до трансекты (Икс). Все Икс данные съемки используются для моделирования того, как обнаруживаемость уменьшается с удалением от разреза, что позволяет оценить общую плотность населения на исследуемой территории.

Распространенным подходом к дистанционному отбору проб является использование линейных разрезов. Наблюдатель пересекает прямую линию (размещенную случайным образом или следуя некоторому запланированному распределению). Каждый раз, когда они наблюдают интересующий объект (например, животное исследуемого типа), они записывают расстояние от своего текущего местоположения до объекта (р), а также угол обнаружения к линии трансекты (θ). Затем расстояние от объекта до трансекты можно рассчитать как Икс = р * грех (θ). Эти расстояния Икс - это расстояния обнаружения, которые будут проанализированы при дальнейшем моделировании.

Объекты обнаруживаются на заранее определенной максимальной дистанции обнаружения ш. Не все объекты внутри ш будут обнаружены, но фундаментальное предположение состоит в том, что все объекты на нулевом расстоянии (то есть на самой линии) обнаруживаются. Таким образом, ожидается, что общая вероятность обнаружения на линии будет равна 1 и будет уменьшаться с увеличением расстояния от линии. Распределение наблюдаемых расстояний используется для оценки «функции обнаружения», которая описывает вероятность обнаружения объекта на заданном расстоянии. Учитывая, что выполняются различные базовые предположения, эта функция позволяет оценить среднюю вероятность п обнаружения объекта, находящегося в пределах ширины ш линии. Тогда плотность объекта можно оценить как D = п / (п*а), куда п количество обнаруженных объектов и а - размер покрываемой области (общая длина трансекты (L) умноженное на 2ш).

Таким образом, моделирование того, как обнаруживаемость снижается с увеличением расстояния от разреза, позволяет оценить, сколько всего объектов находится в интересующей области, на основе количества, которое фактически наблюдалось.[2]

Методология обследования для точечные трансекты немного отличается. В этом случае наблюдатель остается неподвижным, съемка заканчивается не по достижении конца разреза, а по прошествии заранее определенного времени, и измеренные расстояния до наблюдателя используются напрямую без преобразования в поперечные расстояния. Типы функций обнаружения и приспособления также в некоторой степени различаются.[2]

Функция обнаружения

Функция полунормального обнаружения (красная линия) приспособлена к PDF данных обнаружения. Данные были сопоставлены по диапазонам расстояний (либо собраны как таковые, либо объединены после сбора для улучшения подгонки модели). Вероятность обнаружения уменьшается с удалением от центральной линии (у = 0).

Падение обнаруживаемости с увеличением расстояния от линии разреза моделируется с помощью функция обнаружения грамм(у) (здесь у расстояние от линии). Эта функция приспособлена к распределению дальностей обнаружения, представленному как функция плотности вероятности (PDF). PDF - это гистограмма собранных расстояний и описывает вероятность того, что объект на расстоянии у будет обнаружен наблюдателем на центральной линии, с обнаружением на самой линии (у = 0) предполагается достоверным (п = 1).

Предпочтительно g (у) это крепкий функция, которая может представлять данные с нечеткими или слабо определенными характеристиками распределения, как это часто бывает с полевыми данными. Обычно используются несколько типов функций, в зависимости от общей формы PDF-файла данных обнаружения:

Функция обнаруженияФорма
Униформа1/ш
Половина нормальныйехр (-у2/2σ2)
Степень опасности1-ехр (- (у/σ)-b)
Отрицательная экспонентаехр (-ай)

Здесь ш общее расстояние усечения обнаружения и а, б и σ являются параметрами, зависящими от функции. Полунормальные функции и функции степени опасности обычно считаются наиболее вероятными для представления полевых данных, собранных в хорошо контролируемых условиях. Вероятность обнаружения увеличивается или остается постоянной по мере удаления от линии разреза, что может указывать на проблемы со сбором данных или планом исследования.[2]

Ковариаты

Расширения серии

Часто используемый метод улучшения соответствия функции обнаружения данным - это использование расширений в ряд. Здесь функция разделена на «ключевую» часть (описанного выше типа) и «серийную» часть; т.е. g (у) = ключ (у) [1 + серия (у)]. Сериал обычно имеет форму многочлен (например, Многочлен Эрмита ) и предназначен для добавления гибкости в форму ключевой функции, позволяя ей более точно соответствовать данным PDF. Хотя это может улучшить точность оценок плотности / численности, его использование оправдано только в том случае, если набор данных имеет достаточный размер и качество для представления надежной оценки распределения расстояний обнаружения. В противном случае существует опасность переоснащение данные и разрешение нерепрезентативных характеристик набора данных смещать процесс подбора.[2][4]

Предположения и источники предвзятости

Поскольку дистанционная выборка - сравнительно сложный метод исследования, надежность результатов модели зависит от выполнения ряда основных предположений. Наиболее фундаментальные из них перечислены ниже. Данные, полученные в результате опросов, которые нарушают одно или несколько из этих предположений, могут часто, но не всегда, корректироваться до некоторой степени до или во время анализа.[1][2]

Основные допущения дистанционной выборки
ПредположениеНарушениеПрофилактика / апостериорная коррекцияПример данных
Обнаруживаются все животные на самой линии трансекты (т. Е. П (0) = 1)Это часто предполагается при наземных съемках, но может быть проблематичным при съемках с борта. Нарушение может привести к сильному смещению оценок модели.При съемках с двумя наблюдателями одному наблюдателю может быть поручено «охранять осевую линию».

Иногда возможны апостериорные исправления, но они могут быть сложными.[1] Таким образом, стоит избегать любых нарушений этого предположения.

Животные распределены случайным образом и равномерно по исследуемой территории.Основные источники предвзятости:

а) сгруппированные группы населения (стая и т. д.), но отдельные обнаружения рассматриваются как независимые

б) трансекты не размещаются независимо от градиенты плотности (дороги, водотоки и т. д.)

в) трансекты слишком близко друг к другу

a) записывать не отдельные лица, а кластеры + размер кластера, а затем включать оценку размера кластера в функцию обнаружения

б) размещать трансекты либо случайным образом, либо через известные градиенты плотности

в) убедитесь, что максимальная дальность обнаружения (ш) не перекрывается между трансектами

Животные не двигаются до обнаруженияРезультирующая систематическая ошибка незначительна, если движение случайное. Движение в ответ на наблюдателя (избегание / привлечение) повлечет за собой отрицательное / положительное смещение в обнаруживаемости.Избегающее поведение является обычным явлением, и его трудно предотвратить в полевых условиях. Эффективным апостериорным средством является усреднение данных путем разделения обнаружений на интервалы и использования функций обнаружения с уступом (например, степень опасности)
Указание на поведение избегания в данных - обнаружение первоначально увеличивается, а не уменьшается с увеличением расстояния до линии разреза
Измерения (углы и расстояния) точныеСлучайные ошибки незначительны, но систематические ошибки могут вносить систематические ошибки. Это часто случается с округлением углов или расстояний до предпочтительных («круглых») значений, что приводит к скоплению определенных значений. Особенно распространено округление углов до нуля.Избегать счисление в поле с помощью дальномеры и угловые доски. Апостериорное сглаживание данных путем разделения на интервалы обнаружения эффективно при устранении незначительных ошибок.
Индикация округления угла до нуля в данных - обнаружений больше, чем ожидалось в самом первом интервале данных

Программные реализации

Рекомендации

  1. ^ а б c Бакленд, С. Т., Андерсон, Д. Р., Бернем, К. П. и Лаке, Дж. Л. (1993). Дистанционный отбор проб: оценка численности биологических популяций. Лондон: Чепмен и Холл. ISBN  0-412-42660-9
  2. ^ а б c d е ж Бакленд, Стивен Т .; Андерсон, Дэвид Р .; Бернхэм, Кеннет Пол; Лааке, Джеффри Ли; Борчерс, Дэвид Луи; Томас, Леонард (2001). Введение в дистанционный отбор проб: оценка численности биологических популяций. Оксфорд: Издательство Оксфордского университета.
  3. ^ Эверит, Б. С. (2002) Кембриджский статистический словарь, 2-е издание. ЧАШКА ISBN  0-521-81099-X (запись для дистанционной выборки)
  4. ^ Бакленд, С. Т. (2004). Расширенная дистанционная выборка. Издательство Оксфордского университета.

дальнейшее чтение

  • Эль-Шаарави (редактор) «Энциклопедия окружающей среды», Wiley-Blackwell, 2012 г. ISBN  978-0-47097-388-2, шесть комплектов томов.

внешняя ссылка