Подмножество - Subsetting
В исследовательских сообществах (например, науки о Земле, астрономия, бизнес, и правительство ), подмножество это процесс извлечения только тех частей больших файлов, которые представляют интерес для конкретной цели. Обычно это происходит в настройке клиент-сервер, когда извлечение интересующих частей происходит на сервере до того, как данные будут отправлены клиенту по сети. Основная цель подмножества - сэкономить полосу пропускания в сети и дисковое пространство на клиентском компьютере.
Подмножество может быть благоприятным по следующим причинам:[1]
- ограничить или разделить временной диапазон
- Выбрать поперечные сечения данных
- выбрать конкретные виды Временные ряды
- исключить отдельные наблюдения
Подмножество внутри программ
Вы можете выполнить подмножество в статистических программах, чтобы при необходимости ускорить процесс подмножества. Однако существует множество различных типов подмножества, которые могут создавать проблемы при использовании программного обеспечения.
Вот некоторые типы подмножества:
- Атомные векторы
- Списки
- Матрицы и массивы
- Фреймы данных
- Объекты S3
- Объекты S4
Если мы возьмем программу R в качестве примера, есть разные типы кода, помогающие с каждым типом подмножества.
Рекомендации
- ^ Институт SAS (1 августа 2012 г.). Руководство пользователя SAS / ETS 12.1. Институт САС. п. 70. ISBN 978-1-61290-379-8.
Этот статистика -связанная статья является заглушка. Вы можете помочь Википедии расширяя это. |