Психометрия - Psychometrics

Психометрия это область исследования, связанная с теорией и техникой психологический измерение. По определению США Национальный совет по измерениям в образовании (NCME), психометрия относится к психологическим измерениям. Как правило, это относится к области психологии и образования, которая посвящена тестированию, измерению, оценке и связанной с ними деятельности.[1]

Поле связано с целью измерение навыков и знаний, способностей, взглядов, черты характера, и образовательные достижения. Некоторые исследователи психометрии сосредотачиваются на создании и проверке инструментов оценки, таких как анкеты, тесты, суждения оценщиков, шкалы психологических симптомов и личностные тесты. Другие сосредоточены на исследованиях, касающихся теории измерений (например, теория ответа элемента; внутриклассовая корреляция ).

Практикующих называют психометристами. Психометрики обычно обладают определенной квалификацией, и большинство из них психологи с повышением квалификации в аспирантуре. Помимо традиционных академических институтов, многие психометристы работают на правительство или в человеческие ресурсы отделы. Другие специализируются как Обучение и развитие профессионалы.

Исторический фундамент

Психологическое тестирование возникло на основе двух направлений мысли: первое - от Дарвин, Гальтон, и Cattell по измерению индивидуальных различий, а второй - от Гербарт, Вебер, Фехнер, и Вундт и их психофизические измерения аналогичной конструкции. Вторая группа людей и их исследования - вот что привело к развитию экспериментальная психология, и стандартизированное тестирование.[2]

Викторианский ручей

Чарльз Дарвин был вдохновителем сэра Фрэнсиса Гальтона, который привел к созданию психометрии. В 1859 году Дарвин опубликовал свою книгу О происхождении видов, который был посвящен роли естественного отбора в возникновении с течением времени различных популяций видов растений и животных. В книге рассказывается, как отдельные члены разновидность различаются и как они обладают характеристиками, более или менее адаптивными к окружающей среде. Те, кто обладает более адаптивными характеристиками, с большей вероятностью произведут потомство и дадут начало следующему поколению. Те, у кого менее адаптивные характеристики, менее склонны к деторождению. Эта идея стимулировала интерес Гальтона к изучению людей и того, чем они отличаются друг от друга, и, что более важно, как измерить эти различия.

Гальтон написал книгу под названием Потомственный гений о различных характеристиках, которыми обладают люди, и о том, как эти характеристики делают их более «подходящими», чем другие. Сегодня эти различия, такие как сенсорное и двигательное функционирование (время реакции, острота зрения и физическая сила), являются важными областями научной психологии. Большая часть ранних теоретических и прикладных работ в области психометрии была предпринята в попытке измерить интеллект. Гальтон, которого часто называют «отцом психометрии», разработал и включил ментальные тесты в свои антропометрический меры. Джеймс Маккин Кеттелл, который считается пионером психометрии, продолжил работу Гальтона. Кеттелл также ввел термин ментальный тест, и отвечает за исследования и знания, которые в конечном итоге привели к разработке современных тестов.[3]

Немецкий поток

Происхождение психометрии также связано со смежной областью психофизика. Примерно в то же время, когда Дарвин, Гальтон и Кеттелл делали свои открытия, Гербарт также был заинтересован в «раскрытии тайн человеческого сознания» с помощью научного метода.[3] Гербарт отвечал за создание математических моделей сознания, которые в последующие годы сыграли важную роль в образовательной практике.

E.H. Вебер опирался на работу Гербарта и пытался доказать существование психологического порога, говоря, что для активации сенсорной системы необходим минимальный стимул. После Вебера Г. Фехнер расширил знания, которые он почерпнул у Гербарта и Вебера, чтобы разработать закон, согласно которому сила ощущения растет как логарифм интенсивности раздражителя. Последователь Вебера и Фехнера, Вильгельм Вундт считается основоположником психологии. Именно влияние Вундта открыло другим путь к развитию психологического тестирования.[3]

20 век

В 1936 году врач-психометр Л. Л. Терстон, основатель и первый президент Психометрического общества, разработал и применил теоретический подход к измерению, получивший название закон сравнительного суждения, подход, тесно связанный с психофизической теорией Эрнст Генрих Вебер и Густав Фехнер. Кроме того, Спирмен и Терстон внесли важный вклад в теорию и применение факторный анализ, статистический метод, разработанный и широко используемый в психометрии.[нужна цитата ] В конце 1950-х гг. Леопольд Сонди провели историческую и эпистемологическую оценку воздействия статистического мышления на психологию в течение предыдущих нескольких десятилетий: «в последние десятилетия специфическое психологическое мышление было почти полностью подавлено и удалено и заменено статистическим мышлением. Именно здесь мы видим рак тестологии и тестомании сегодняшнего дня ".[4]

Совсем недавно психометрическая теория была применена для измерения личность, отношения, и верования, и академическая успеваемость. Измерение этих ненаблюдаемых явлений затруднено, и большая часть исследований и накопленных научных знаний в этой дисциплине была разработана в попытке правильно определить и количественно оценить такие явления. Критики, в том числе практики физические науки и общественные деятели, утверждали, что такое определение и количественная оценка невозможно, и что такие измерения часто используются неправильно, например, с психометрическими личностными тестами, используемыми в процедурах приема на работу:

«Например, работодатель, который хочет, чтобы кто-то занимал должность, требующую постоянного внимания к повторяющимся деталям, вероятно, не захочет отдавать эту работу тому, кто очень креативен и быстро устает».[5]

Фигуры, которые внесли значительный вклад в психометрию, включают: Карл Пирсон, Генри Ф. Кайзер, Карл Бригам, Л. Л. Терстон, Э. Л. Торндайк, Георг Раш, Юджин Галантер, Джонсон О'Коннор, Фредерик М. Лорд, Ледьярд Такер, и Джейн Лёвингер.

Определение измерения в социальных науках

Определение измерения в социальных науках имеет долгую историю. Широко распространенное в настоящее время определение, предложенное Стэнли Смит Стивенс (1946), заключается в том, что измерение - это «присвоение чисел объектам или событиям согласно некоторому правилу». Это определение было введено в статье, в которой Стивенс предложил четыре уровни измерения. Несмотря на широкое распространение, это определение во многом отличается от более классического определения измерения, принятого в физических науках, а именно, что научное измерение влечет за собой «оценку или открытие отношения некоторой величины количественного атрибута к единице того же атрибута. "(стр. 358)[6]

Действительно, определение измерения Стивенса было предложено британским комитетом Фергюсона, председатель которого А. Фергюсон был физиком. Комитет был назначен в 1932 году Британской ассоциацией развития науки для исследования возможности количественной оценки сенсорных событий. Хотя его председатель и другие члены были физиками, в комитет также входили несколько психологов. В отчете комитета подчеркивается важность определения измерения. Хотя в ответ Стивенс предложил новое определение, оказавшее значительное влияние в данной области, это ни в коем случае не было единственным ответом на отчет. Другой, заметно отличающийся, ответ заключался в том, чтобы принять классическое определение, которое отражено в следующем утверждении:

Измерения в психологии и физике ничем не отличаются. Физики могут измерить, когда они могут найти операции, с помощью которых они могут соответствовать необходимым критериям; психологи должны делать то же самое. Им не нужно беспокоиться о таинственных различиях между значением измерения в двух науках (Reese, 1943, стр. 49).[7]

Эти расходящиеся ответы отражены в альтернативных подходах к измерению. Например, методы, основанные на ковариационные матрицы обычно используются на том основании, что числа, такие как исходные баллы, полученные на основе оценок, являются измерениями. Такие подходы неявно влекут за собой определение измерения Стивенсом, которое требует только, чтобы числа были назначенный по какому-то правилу. Таким образом, основной задачей исследования обычно считается обнаружение ассоциаций между оценками и факторов, лежащих в основе таких ассоциаций.[8]

С другой стороны, когда модели измерения, такие как Модель раша работают, номера не присваиваются на основании правила. Вместо этого, в соответствии с заявлением Риза, приведенным выше, устанавливаются конкретные критерии для измерения, а цель состоит в том, чтобы создать процедуры или операции, которые предоставляют данные, соответствующие соответствующим критериям. Измерения оцениваются на основе моделей, и проводятся тесты, чтобы убедиться, что соответствующие критерии соблюдены.[нужна цитата ]

Инструменты и процедуры

Первый[нужна цитата ]психометрические инструменты были разработаны для измерения концепции интеллект.[9] Один исторический подход включал Стэнфорд-Бине IQ тест, первоначально разработанная французским психологом Альфред Бине. Альтернативная концепция интеллекта состоит в том, что познавательные способности людей являются проявлением общего компонента или фактор общего интеллекта, а также когнитивные способности, характерные для данной области.[нужна цитата ]

Еще один важный аспект психометрии был сделан на тестирование личности. Существует ряд теоретических подходов к концептуализации и измерению личности. Некоторые из наиболее известных инструментов включают Миннесотский многофазный опросник личности, то Пятифакторная модель (или "Большая пятерка") и такие инструменты, как Инвентаризация личности и предпочтений и Индикатор типа Майерс-Бриггс. Отношения также широко изучались с использованием психометрических подходов.[нужна цитата ] Распространенным методом измерения отношения является использование Шкала Лайкерта. Альтернативный метод предполагает применение развернутых моделей измерения, наиболее распространенной из которых является модель гиперболического косинуса (Andrich & Luo, 1993).[10]

Теоретические подходы

Психометристы разработали ряд различных теорий измерения. К ним относятся классическая теория тестирования (CTT) и теория ответа элемента (IRT).[11][12] Подход, который математически кажется похожим на IRT, но при этом весьма отличительным с точки зрения его происхождения и особенностей, представлен Модель раша для измерения. Развитие модели Раша и более широкого класса моделей, к которому она принадлежит, было явно основано на требованиях измерения в физических науках.[13]

Психометры также разработали методы работы с большими матрицами корреляций и ковариаций. Методы этой общей традиции включают: факторный анализ,[14] метод определения основных размеров данных. Одной из основных проблем, с которыми сталкиваются пользователи факторного анализа, является отсутствие консенсуса в отношении соответствующих процедур для определение количества скрытых факторов.[15] Обычная процедура - прекратить факторинг, когда собственные значения опуститься ниже единицы, потому что исходная сфера сжимается. Отсутствие точек отсечения касается и других многомерных методов.[нужна цитата ]

Многомерное масштабирование[16] - это метод поиска простого представления данных с большим количеством скрытых измерений. Кластерный анализ это подход к поиску объектов, похожих друг на друга. Факторный анализ, многомерное масштабирование и кластерный анализ - все это многомерные описательные методы, используемые для выделения из больших объемов данных более простых структур.

В последнее время, структурное моделирование уравнение[17] и анализ пути представляют собой более сложные подходы к работе с большими ковариационные матрицы. Эти методы позволяют подобрать статистически сложные модели к данным и протестировать их, чтобы определить, являются ли они адекватными. Поскольку на детальном уровне психометрические исследования касаются степени и природы многомерности каждого из интересующих элементов, существует относительно новая процедура, известная как двухфакторный анализ.[18][19][20] может быть полезным. Двухфакторный анализ может разложить «систематическую дисперсию элемента, в идеале, с точки зрения двух источников, общего фактора и одного источника дополнительной систематической дисперсии».[21]

Ключевые идеи

Ключевые понятия классической теории тестирования: надежность и срок действия. Надежный показатель - это показатель, который последовательно измеряет конструкт в зависимости от времени, отдельных людей и ситуаций. Действительный показатель - это показатель того, что он предназначен для измерения. Надежность необходима, но недостаточна для действительности.

И надежность, и валидность можно оценить статистически. Согласованность повторных измерений одного и того же теста можно оценить с помощью коэффициента корреляции Пирсона, который часто называют тест-ретест надежность.[22] Точно так же эквивалентность разных версий одной и той же меры может быть проиндексирована Корреляции Пирсона, и называется эквивалентные формы надежности или аналогичный термин.[22]

Внутренняя согласованность, которая касается однородности одной формы теста, может быть оценена путем сопоставления характеристик двух половин теста, что называется надежность на половину; ценность этого Коэффициент корреляции продукт-момент Пирсона для двух полутестов настраивается Формула предсказания Спирмена – Брауна чтобы соответствовать корреляции между двумя полнометражными тестами.[22] Возможно, наиболее часто используемый показатель надежности - это Кронбаха α, что эквивалентно иметь в виду всех возможных коэффициентов разделения половин. Другие подходы включают внутриклассовая корреляция, который представляет собой отношение дисперсии измерений данной цели к дисперсии всех целей.

Есть несколько различных форм действительности. Связанная с критерием валидность относится к степени, в которой тест или шкала предсказывают образец поведения, то есть критерий, который является «внешним по отношению к самому измерительному прибору».[23] Этот внешний образец поведения может быть множеством вещей, включая еще один тест; средний балл в колледже, как если бы SAT старшей школы использовался для прогнозирования успеваемости в колледже; и даже поведение, которое имело место в прошлом, например, когда тест на текущие психологические симптомы используется для прогнозирования возникновения прошлой виктимизации (что точно отражает постдикт). Когда критерий измерения собирается одновременно с измерением, которое проверяется, цель состоит в том, чтобы установить одновременное действие; когда критерий собирается позже, цель состоит в том, чтобы установить прогностическая достоверность. Мера имеет конструировать действительность если это связано с мерами других конструкций, как того требует теория. Содержание действия это демонстрация того, что элементы теста адекватно покрывают измеряемую область. В примере отбора персонала содержание теста основано на определенном утверждении или наборе утверждений о знаниях, навыках, способностях или других характеристиках, полученных от Анализ работы.

Теория отклика предмета моделирует отношения между скрытые черты и ответы на тестовые задания. Помимо других преимуществ, IRT обеспечивает основу для получения оценки местоположения испытуемого по заданному скрытому признаку, а также стандартной ошибки измерения этого местоположения. Например, знания студента университета по истории можно вывести из его или ее баллов за университетский тест, а затем надежно сравнить со знаниями старшеклассника, полученными в результате менее трудного теста. Баллы, полученные с помощью классической теории тестирования, не имеют этой характеристики, и оценка фактических способностей (а не способностей по сравнению с другими тестируемыми) должна оцениваться путем сравнения баллов с баллами «нормальной группы», случайно выбранной из совокупности. Фактически, все показатели, полученные из классической теории тестирования, зависят от тестируемой выборки, в то время как, в принципе, меры, полученные из теории ответов на вопросы, не зависят.

Многие психометристы также озабочены поиском и отменой тестов. предвзятость из их психологических тестов. Ошибка теста - это форма систематической (т. Е. Неслучайной) ошибки, которая приводит к тому, что испытуемые из одной демографической группы имеют неоправданное преимущество перед испытуемыми из другой демографической группы.[24] По мнению ведущих экспертов, смещение теста может вызывать различия в средних баллах по демографическим группам, но различия в баллах групп не являются достаточным доказательством того, что смещение теста действительно присутствует, поскольку тест может измерять реальные различия между группами.[25][24] Психометры используют сложные научные методы для поиска и устранения предвзятости теста. Исследования показывают, что люди, читающие элемент теста, обычно не могут точно определить, является оно предвзятым или нет.[26]

Стандарты качества

Соображения срок действия и надежность обычно рассматриваются как важные элементы для определения качественный любого теста. Однако профессиональные ассоциации и ассоциации практиков часто помещают эти проблемы в более широкий контекст при разработке стандарты и вынесение общих суждений о качестве любого теста в целом в заданном контексте. Во многих прикладных исследованиях вызывает беспокойство вопрос о том, является ли показатель данного психологического инвентаря значимым или произвольным.[27]

Стандарты тестирования

В 2014 году Американская ассоциация исследований в области образования (AERA), Американская психологическая ассоциация (APA) и Национальный совет по измерениям в образовании (NCME) опубликовали пересмотренный вариант Стандарты образовательного и психологического тестирования,[28] в котором описаны стандарты разработки, оценки и использования тестов. В Стандарты охватывают основные темы тестирования, включая валидность, надежность / ошибки измерения и справедливость в тестировании. Книга также устанавливает стандарты, связанные с операциями тестирования, включая дизайн и разработку тестов, оценки, шкалы, нормы, привязку оценок, сокращение оценок, администрирование тестов, выставление оценок, отчетность, интерпретацию оценок, документацию по тестированию, а также права и обязанности участников тестирования и пользователей теста. . Наконец, Стандарты охватывают темы, связанные с тестированием приложений, в том числе психологическое тестирование и оценка, тестирование на рабочем месте и удостоверение личности, образовательное тестирование и оценка, и тестирование в оценка программы и государственная политика.

Стандарты оценки

В области оценка, и в частности образовательная оценка, то Объединенный комитет по стандартам оценки образования[29] опубликовал три набора стандартов оценки. Стандарты оценки персонала[30] был опубликован в 1988 г., Стандарты оценки программ (2-е издание)[31] был опубликован в 1994 г. Стандарты оценки студентов[32] был опубликован в 2003 году.

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат руководящие указания по разработке, внедрению, оценке и совершенствованию определенной формы оценки.[33] Каждый из стандартов был помещен в одну из четырех основных категорий, чтобы способствовать правильности, полезности, выполнимости и точности образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в разделе «Точность». Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

Нечеловеческие: животные и машины

Адреса психометрии человек способности, отношения, черты характера и образовательная эволюция. В частности, изучение поведения, психических процессов и способностей нечеловеческих животные обычно рассматривается сравнительная психология, или с континуумом между нечеловеческими животными и остальными животными эволюционная психология. Тем не менее, есть некоторые сторонники более постепенного перехода от подхода, применяемого для людей, к подходу, применяемому для (нечеловеческих) животных.[34][35][36][37]

Оценка способностей, черт и эволюции обучения машины в основном не имеет отношения к человеку и животным, не относящимся к человеку, с конкретными подходами в области искусственный интеллект. Также был предложен более комплексный подход под названием универсальная психометрия.[38]

Смотрите также

Рекомендации

Библиография

  • Андрич Д. и Луо Г. (1993). «Модель гиперболического косинуса для развертывания дихотомических ответов на один стимул» (PDF). Прикладное психологическое измерение. 17 (3): 253–276. CiteSeerX  10.1.1.1003.8107. Дои:10.1177/014662169301700307. S2CID  120745971.
  • Мичелл, Дж. (1999). Измерение в психологии. Кембридж: Издательство Кембриджского университета. DOI: 10.1017 / CBO9780511490040
  • Раш, Г. (1960/1980). Вероятностные модели для некоторых тестов интеллекта и достижений. Копенгаген, Датский институт исследований в области образования), расширенное издание (1980 г.) с предисловием и послесловием Б.Д. Райт. Чикаго: Издательство Чикагского университета.
  • Риз, Т. (1943). Применение теории физического измерения к измерению психологических величин с тремя экспериментальными примерами. Психологические монографии, 55, 1–89. DOI: 10,1037 / h0061367
  • Стивенс, С. С. (1946). «К теории шкал измерения». Наука. 103 (2684): 677–80. Bibcode:1946Научный ... 103..677С. Дои:10.1126 / science.103.2684.677. PMID  17750512.
  • Терстон, Л.Л. (1927). «Закон сравнительного суждения». Психологический обзор. 34 (4): 278–286. Дои:10,1037 / ч 0070288.
  • Терстон, Л.Л. (1929). Измерение психологической ценности. В T.V. Smith and W.K. Райт (ред.), Очерки философии семнадцати докторов философии Чикагского университета. Чикаго: Открытый суд.
  • Терстон, Л.Л. (1959). Измерение ценностей. Чикаго: Издательство Чикагского университета.
  • С.Ф. Blinkhorn (1997). «Прошлое несовершенное, будущее условное: пятьдесят лет теории тестирования». Br. J. Math. Статист. Психол. 50 (2): 175–185. Дои:10.1111 / j.2044-8317.1997.tb01139.x.
  • Сэнфорд, Дэвид (18 ноября 2017 г.). «Кембридж только что сказал мне, что большие данные еще не работают». LinkedIn.

Примечания

  1. ^ Национальный совет по измерениям в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorP В архиве 2017-07-22 в Wayback Machine
  2. ^ Каплан, Р.М., Саккуццо, Д.П. (2010). Психологическое тестирование: принципы, применение и проблемы. (8-е изд.). Белмонт, Калифорния: Уодсворт, Cengage Learning.
  3. ^ а б c Каплан, Р.М., Саккуццо, Д.П. (2010). Психологический трестинг: принципы, применение и проблемы (8-е изд.). Белмонт, Калифорния: Уодсворт, Cengage Learning.
  4. ^ Леопольд Сонди (1960) Das zweite Buch: Lehrbuch der Experimentellen Triebdiagnostik. Хубер, Берн и Штутгарт, 2-е издание. Гл.27, Из испанского перевода, B) II Las condiciones estadisticas, с.396. Цитата:

    el pensamiento psicologico especifico, en las ultima decadas, fue suprimido y excludingado casi totalmente, siendo sustituido por un pensamiento estadistico. Precisamente aqui vemos el cáncer de la testología y testomania de hoy.

  5. ^ Психометрические оценки. Психометрические оценки. Мельбурнский университет.
  6. ^ Мичелл, Джоэл (август 1997 г.). «Количественная наука и определение измерения в психологии». Британский журнал психологии. 88 (3): 355–383. Дои:10.1111 / j.2044-8295.1997.tb02641.x.
  7. ^ Риз, Т. (1943). Применение теории физического измерения к измерению психологических величин с тремя экспериментальными примерами. Психологические монографии, 55, 1–89. DOI: 10,1037 / h0061367
  8. ^ http://www.assessmentpsychology.com/psychometrics.htm
  9. ^ "Los diferentes tipos de tests psicometricos - examen psicometrico". examenpsicometrico.com.
  10. ^ Андрич Д. и Луо Г. (1993). Модель скрытых признаков гиперболического косинуса для разворачивания дихотомический одиночные стимулы. Прикладное психологическое измерение, 17, 253-276.
  11. ^ Embretson, S.E., & Reise, S.P. (2000). Теория отклика на предмет для психологов. Махва, Нью-Джерси: Эрлбаум.
  12. ^ Hambleton, R.K., & Swaminathan, H. (1985). Пункт Теория отклика: принципы и приложения. Бостон: Клувер-Нийхофф.
  13. ^ Раш, Г. (1960/1980). Вероятностные модели для некоторых тестов интеллекта и достижений. Копенгаген, Датский институт исследований в области образования, расширенное издание (1980 г.) с предисловием и послесловием Б.Д. Райт. Чикаго: Издательство Чикагского университета.
  14. ^ Томпсон, Б. (2004). Исследовательский и подтверждающий факторный анализ: понимание концепций и приложений. Американская психологическая ассоциация.
  15. ^ Цвик, Уильям Р .; Велисер, Уэйн Ф. (1986). «Сравнение пяти правил определения количества компонентов, которые необходимо сохранить». Психологический бюллетень. 99 (3): 432–442. Дои:10.1037//0033-2909.99.3.432.
  16. ^ Дэвисон, М. (1992). Многомерное масштабирование. Кригер.
  17. ^ Каплан Д. (2008). Моделирование структурными уравнениями: основы и расширения, 2-е изд. Мудрец.
  18. ^ ДеМарс, К. Э. (2013). Учебное пособие по интерпретации оценок двухфакторной модели.Международный журнал тестирования, 13, 354–378. http://dx.doi.org/10.1080/15305058.2013.799067
  19. ^ Райз, С. П. (2012). Новое открытие двухфакторного моделирования. Мультивариантные поведенческие исследования, 47, 667–696. http://dx.doi.org/10.1080/00273171.2012.715555
  20. ^ Родригес, А., Рейз, С. П., и Хэвиланд, М. Г. (2016). Оценка бифакторных моделей: расчет и интерпретация статистических показателей. Психологические методы, 21, 137–150. http://dx.doi.org/10.1037/met0000045
  21. ^ Шонфельд, И.С., Веркуилен, Дж. И Бианки, Р. (2019). Исследовательское структурное уравнение, моделирующее двухфакторный аналитический подход к раскрытию того, что измеряют шкалы выгорания, депрессии и тревоги. Психологическая оценка, 31, 1073-1079. http://dx.doi.org/10.1037/pas0000721 п. 1075
  22. ^ а б c "Домашняя страница - Основы образовательных исследований Дель Сигл". www.gifted.uconn.edu.
  23. ^ Наннэлли, Дж. К. (1978). Психометрическая теория (2-е изд.). Нью-Йорк: Макгроу-Хилл.
  24. ^ а б Warne, Russell T .; Юн, Мёнсун; Цена, Крис Дж. (2014). "Изучение различных интерпретаций" смещения теста"". Культурное разнообразие и психология этнических меньшинств. 20 (4): 570–582. Дои:10.1037 / a0036503. PMID  25313435.
  25. ^ Рейнольдс, К. Р. (2000). Почему психометрические исследования систематических ошибок при ментальном тестировании так часто игнорируются? Психология, государственная политика и право, 6, 144-150. Дои:10.1037/1076-8971.6.1.144
  26. ^ Решли, Д. Дж. (1980) Психологические доказательства в Ларри П. Мнение: Случай правильной проблемы - неправильного решения? Обзор школьной психологии, 9, 123-125.
  27. ^ Блэнтон, Х. и Жаккар, Дж. (2006). Произвольные метрики в психологии. В архиве 2006-05-10 на Wayback Machine Американский психолог, 61 год.(1), 27-41.
  28. ^ «Стандарты педагогического и психологического тестирования». http://www.apa.org. Внешняя ссылка в | сайт = (помощь)
  29. ^ Объединенный комитет по стандартам оценки образования В архиве 2009-10-15 на Wayback Machine
  30. ^ Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы оценки педагогов. В архиве 2005-12-12 в Wayback Machine Ньюбери-Парк, Калифорния: Sage Publications.
  31. ^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. В архиве 2006-02-22 в Wayback Machine Ньюбери-Парк, Калифорния: Sage Publications.
  32. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов. В архиве 2006-05-24 на Wayback Machine Ньюбери-Парк, Калифорния: Corwin Press.
  33. ^ [Э. Кабрера-Нгуен. «Руководство для авторов по сообщению результатов разработки и проверки шкалы в Журнале Общества социальной работы и исследований]». Academia.edu. 1 (2): 99–103.
  34. ^ Хамфрис, Л. (1987). «Психометрические соображения при оценке внутривидовых различий в интеллекте». Behav Brain Sci. 10 (4): 668–669. Дои:10.1017 / s0140525x0005514x.
  35. ^ Айзенк, HJ (1987). «Несколько значений интеллекта». Behav Brain Sci. 10 (4): 663. Дои:10.1017 / с0140525x00055060.
  36. ^ Локурто, К. и Скэнлон, К. (1987). «Индивидуальные различия и фактор пространственного обучения у двух линий мышей». Behav Brain Sci. 112: 344–352.
  37. ^ Кинг, Джеймс Э. и Фигередо, Аурелио Хосе (1997). «Пятифакторная модель плюс доминирование в личности шимпанзе». Журнал исследований личности. 31 (2): 257–271. Дои:10.1006 / jrpe.1997.2179.
  38. ^ Х. Эрнандес-Оралло; D.L. Доу; М.В. Эрнандес-Льореда (2013). «Универсальная психометрия: измерение когнитивных способностей в машинном царстве» (PDF). Исследование когнитивных систем. 27: 50–74. Дои:10.1016 / j.cogsys.2013.06.001. HDL:10251/50244. S2CID  26440282.

дальнейшее чтение

внешняя ссылка