Оценка индивидуальных различий

MedBookAide - путеводитель в мире медицинской литературы
Разделы сайта	Авторы	Поиск	Контакты	Консультации	☺
Поиск по сайту: О сайте Библиотеки					☺
					☺
					☺

Аткинсон Р. и др. - Введение в психологию

70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90

<<< Назад

Содержание

Дальше >>>

Рассмотрим идентичных близнецов. Поскольку их генотипы идентичны, они реагируют на ситуации (реактивное взаимодействие) также аналогично; они вызывают у других сходные реакции (вызванное взаимодействие); и их сходные, генетически направляемые таланты, интересы и мотивы ведут их к поиску и построению сходного окружения (проактивное взаимодействие). Важно то, что все эти процессы действуют независимо от того, воспитываются ли близнецы совместно или порознь. Например, к двум идентичным близнецам, разделенным при рождении, отношение других людей будет сходным, поскольку они независимо будут вызывать у других сходные реакции.

Проактивное взаимодействие протекает аналогично. Личность каждого близнеца подталкивает его к выбору друзей и окружения, которые окажутся сходными с выбранными другим близнецом. Но сходные друзья и окружение будут обращаться с каждым из этих близнецов сходным образом. И так далее. Поскольку у обоих близнецов некоторые черты личности, определяемые генами, с самого начала идентичны, все процессы их взаимодействия с окружением одновременно способствуют продолжению их сходства во времени и поддерживают его, даже если они так и не встретятся после рождения.

Среда родственных близнецов и обычных братьев и сестер, наоборот, все более дифференцирует их, даже если они растут в одном доме. Они очень похожи в раннем детстве, когда родители создают им общее окружение (хотя даже здесь обычные братья и сестры будут реагировать несколько по-разному и вызывать у родителей разные реакции). Но как только они начинают выбирать и строить свое окружение вне дома, их слегка неодинаковые таланты, интересы и мотивы поведут их все более расходящимися путями, формируя тем самым все более непохожие личности.

<�Рис. Поскольку генотипы идентичных близнецов одинаковы, процессы взаимодействия их личностей с окружением будут способствовать их сходству и поддерживать его в дальнейшем, даже если они растут в разных окружениях.> Общее и раздельное окружение. Исследования близнецов позволяют оценить не только то, насколько индивидуальные различия обусловлены генетическими вариациями, но и то, насколько эти различия обусловлены или общими для членов семьи аспектами окружения (например, социоэкономическим положением семьи), или теми его аспектами, которые у членов семьи различны (например, круг друзей вне семьи). Удивительно, но различия, обусловленные общими аспектами окружения, не объясняют почти ни одного различия, связанного с окружением в целом: за вычетом генетического сходства, двое детей из одной семьи одинаковы не более, чем двое детей, взятых случайно из выборочной группы (Plomin & Daniels, 1987). Это означает, что те переменные, которые, как правило, изучаются психологами (особенности воспитания, социоэкономическое положение семьи, образование родителей), фактически не вносят вклада в индивидуальные различия. Как это может быть?

Одно из возможных объяснений состоит в том, что реактивные, вызванные и проактивные процессы направлены на уменьшение различий, обусловленных разным окружением, пока это окружение допускает некоторую гибкость реагирования. Одаренный ребенок, живущий в семье, где им совсем не занимаются, или в совсем бедной семье, скорее, чем его менее одаренный брат или сестра, усвоит много сведений из телепрограмм (реактивное взаимодействие), привлечет внимание сочувствующего ему учителя (вызванное взаимодействие) и самостоятельно отправится в библиотеку (проактивное взаимодействие). Генотип такого ребенка действует в противовес отупляющим влияниям его домашней среды, и поэтому он развивается иначе, чем менее одаренные брат или сестра. Этим направляемым личностью процессам могут воспрепятствовать только суровые ограничения со стороны окружения (Scarr, 1988; Scarr & McCartney, 1983). В пользу этого говорят данные, что самыми несхожими были те пары воспитывавшихся порознь идентичных близнецов, в которых кто-то один воспитывался в среде с жесткими ограничениями.

Хотя это объяснение и выглядит правдоподобным, прямых подтверждений ему нет. Во всяком случае, представляется, что исследователям придется перейти от обычного сравнения детей из разных семей к сравнению детей из одной семьи и особое внимание уделить взаимодействию личности и окружения внутри таких семей.

Аналогично, большее внимание должно уделяться влияниям, источники которых находятся за пределами семьи; один автор высказывает предположение, что группа сверстников представляет собой намного более значимый источник личностных различий между детьми, чем семья (Harris, 1995).

Оценка индивидуальных различий

Во многих промышленно-развитых странах широко используется объективная оценка индивидуальных различий, особенно различий в когнитивных и интеллектуальных способностях. В начальных школах детей часто распределяют по классам в зависимости от достигнутого ими успеха при прохождении тестов. Тесты на одаренность или способности являются частью процедуры поступления во многие колледжи и большинство профессиональных и высших учебных заведений. Кроме того, многие промышленные и правительственные агентства подбирают кадры, назначают и продвигают сотрудников по службе на основе данных тестирования.

Тесты для оценки интересов, склонностей и личных качеств также знакомы большинству из нас. Помогая учащимся выбрать профессию, консультанты смогут предложить лучший выбор, если им что-то известно об учащемся помимо его академической успеваемости. Отбирая кандидатов на высокие посты, наниматели часто хотят знать их стиль общения, способность справляться со стрессом и т. д. Какое лечение будет наиболее успешным для человека с эмоциональными нарушениями, или как помочь реабилитации освобожденного уголовника — для всего этого нужна объективная оценка индивидуальных различий. Помимо практических применений, эти методы оценки существенны для теории и исследований индивидуальных различий. Действительно, некоторые ученые, изучающие личность (см. гл. 13), разработали методы оценки, отвечающие особенностям их подходов.

Характеристики хорошего теста?

Поскольку тесты и другие средства анализа играют важную практическую и научную роль, необходимо, чтобы они точно измеряли то, для чего предназначены, а именно они должны обладать надежностью и валидностью.

Тесты также должны быть стандартизированы; под этим понимается, что условия прохождения теста должны быть одинаковыми для всех тестируемых. Например, инструкции, сопровождающие тест, должны быть одинаковыми для всех тестируемых лиц.

Надежность. Если тест или метод оценки надежен, он должен давать воспроизводимые и согласованные результаты. Если тест дает разные результаты при применении его в разных случаях или при выполнении подсчетов разными людьми, значит, он ненадежен. Простая аналогия — резиновая линейка. Если неизвестно, насколько она растягивается при каждом измерении, то результаты будут ненадежны, независимо от того, насколько аккуратно проводилось каждое измерение.

Как правило, надежность оценивается путем соотнесения двух групп показателей. Например, один и тот же тест можно дать той же группе испытуемых дважды. Если тест надежный, то показатели испытуемых в первом случае должны высоко коррелировать с показателями во втором. Если это так, то говорят, что этот тест обладает повторяемой надежностью или временной стабильностью.

Конечно, в реальной практике мало кто захочет давать один и тот же тест тем же людям дважды. Но есть много ситуаций, когда возникает желание провести аналогичные виды того же теста — например, когда учащиеся выпускного класса средней школы, намерившиеся поступить в колледж, хотят дважды пройти Тест школьной успеваемости (Тест Академических Способностей) (Scholastic Assessment Test, SAT). Чтобы убедиться, что две формы того же теста дают эквивалентные показатели, обе они предлагаются той же группе людей и затем сопоставляются. Если получена высокая корреляция между ними, то говорят, что этот тест обладает надежностью при изменении формы. Некоторые из вопросов, входящих в SAT, на самом деле не связаны с показателями учащегося, но они оцениваются статистически, чтобы их можно было использовать в будущем в аналогичных формах этого же теста.

Другой общей мерой надежности является внутренняя согласованность теста — то, в какой степени разные его вопросы или пункты измеряют одно и то же. Это можно оценить путем вычисления корреляции между показателями, полученными группой индивидов по каждому пункту и всему тесту в целом. Всякий пункт, не коррелирующий с общим показателем, является ненадежным; он не вносит вклад в измеряемый тестом параметр. Отбрасывание ненадежных пунктов «очищает» тест, повышая его внутреннюю согласованность. С увеличением числа надежных элементов в тесте растет и надежность общего показателя теста.

Результаты большинства тестов и анализов обрабатываются объективно, чаще всего компьютером. Но иногда требуется оценить умственную деятельность или социальное поведение субъективно. Знакомый пример этому — экзаменационные испытания. Чтобы оценить надежность таких субъективных суждений, с помощью независимых судей получают две или более групп данных, которые сопоставляются друг с другом. Например, два наблюдателя могут независимо оценивать группу детсадовских детей на агрессию; или двух или более судей могут попросить прочитать прошлые инаугурационные обращения президента и оценить их с точки зрения оптимистичности или количества негативных ссылок на Ирак. Если корреляция между оценками судей высока, то говорят, что данный метод обладает межэкспертным согласием или межоценочной надежностью.

Вообще, хорошо построенный, объективно обработанный тест способности должен обеспечивать надежность не менее 0,90. Для тестов личности и субъективных суждений, применяемых в исследовательских целях, приемлемым иногда может быть коэффициент 0,70, но при этом заключения о конкретном человеке следует делать с большой осторожностью. Как отмечалось выше, надежность общего показателя теста возрастает с ростом числа надежных пунктов теста. Это же рассуждение можно применить к субъективным оценкам и повысить надежность метода, добавив больше судей, оценщиков или наблюдателей. Например, если корреляция оценок двух наблюдателей составляет только 0,50, то исследователь может добавить третьего аналогичного наблюдателя и тем самым повысить межоценочную надежность их суммарных оценок до 0,75; с добавлением четвертого оценщика надежность возрастет до 0,80.

Валидность. Надежность показывает, насколько тест способен измерять что-то, но высокая надежность не гарантирует, что этот тест измеряет именно то, что требуется; она не гарантирует валидности (адекватности) теста. Например, если в последнем экзамене вашего курса психологии встречается слишком много трудных слов или заковыристых вопросов, то он может оказаться тестом ваших вербальных способностей или вашей изощренности, а не усвоения материала курса. Такой экзамен может быть надежным: при повторном прохождении учащиеся получат те же оценки и отдельные компоненты экзамена будут измерять одно и то же, — но это не будет валидным тестом достижений в данном курсе.

Иногда валидность теста можно оценить, сопоставив показатель теста с некоторым внешним критерием. Такая корреляция называется коэффициентом валидности. Например, относительно сильная положительная корреляция между показателями в SAT и успехами первокурсника в колледже показывает, что у этого теста приемлемая валидность. Валидность такого рода называется критериальной, или эмпирической, валидностью. Учитывая чувствительность тестов к расовым и половым различиям, суды все чаще требуют от компаний и правительственных агентств, применяющих тесты для отбора персонала, чтобы эти тесты коррелировали с показателями работы человека, то есть чтобы они обладали критериальной, или эмпирической, валидностью.

Валидность особого рода, относящаяся особенно к тестам, применяемым в исследованиях личности, называется конструктивной валидностью. Если исследователь создает тест для измерения некоторого понятия или концепции, являющихся частью теории, не всегда можно вычислить единый коэффициент, который показывал бы его критериальную валидность, поскольку неизвестен внешний критерий. Например, как исследователю оценить валидность теста на мотивацию к достижению успеха? Здесь может быть несколько возможностей. Можно дать этот тест ответственным исполнителям фирм и посмотреть, коррелирует ли он с их зарплатой. Возможно, этот тест будет коррелировать с оценкой учителями честолюбия своих учеников. Проблема в том, что нет единого критерия, который исследователь готов был бы принять за окончательный «истинный» ответ. Если тест коррелировал с зарплатой ответственных исполнителей, это выглядело бы убедительным, но если нет, исследователь не был бы склонен оценить этот тест как невалидный. В психологии личности это известно как проблема критерия: не существует меры «истины», позволяющей признать тест валидным. Соответственно, исследователь вместо этого пытается установить его конструктивную валидность.

Это осуществляется в самом процессе исследования. Ученый использует свою теорию и для построения теста, и для прогнозирования вытекающих из нее следствий. Затем проводятся исследования с использованием этого теста, чтобы проверить прогноз. В той степени, в которой результаты нескольких конвергирующих исследований подтверждают предсказания теории, и эта теория, и сам тест одновременно приобретает валидность. Чаще оказывается, что смешанные результаты указывают на то, в каком направлении должны быть модифицированы и теория и тест.

В частности, Мак-Клелланд (McClelland, 1987) предложил теорию мотивации к достижениям, которая, по его замыслу, должна была выявлять честолюбивых высокорезультативных индивидуумов в любой сфере деятельности и объяснять их высокую мотивацию. Для проверки этих теоретических предположений был разработан тест, оценивающий уровень мотивации к достижениям. Результаты нескольких исследований показывают, что предсказания, согласно данной теории, подтверждаются для мужчин, занимающихся предпринимательской деятельностью, но не для женщин или индивидуумов, занимающихся другими видами деятельности, например научными исследованиями. Соответственно, теория была модифицирована для использования преимущественно по отношению к достижениям в области предпринимательства, а тест был модифицирован таким образом, чтобы он являлся более валидным и для женщин.

Оценка интеллектуальных способностей

Первую попытку создать тесты интеллектуальных способностей предпринял сэр Фрэнсис Гальтон столетие назад. У натуралиста и математика Гальтона интерес к индивидуальным различиям возник под влиянием эволюционной теории его двоюродного брата Чарльза Дарвина. Гальтон полагал, что некоторые семьи обладают биологическим превосходством — они сильнее и умнее других. Интеллект, рассуждал он, это вопрос исключительно сенсорных и перцептивных навыков, передающихся от одного поколения к следующему. Поскольку вся информация приобретается посредством органов чувств, то чем чувствительнее и точнее перцептивный аппарат индивида, тем он умнее.

Вера Гальтона в наследуемость интеллекта привела его к предположению, что умственные способности человечества можно повысить с помощью евгеники, или селективного производства потомства. К счастью, он более известен благодаря применению статистики в исследованиях интеллекта, чем проповедованию евгеники.

В 1884 году Гальтон применил набор тестов (для измерения таких переменных, как размер черепной коробки, время реакции, острота зрения, слуховой порог и память на зрительные формы) для обследования более 9000 посетителей Лондонской выставки. К своему разочарованию, он обнаружил, что выдающиеся британские ученые не отличаются от обыкновенных граждан размером черепа и что такие показатели, как скорость реакции, не особенно связаны с другими мерами интеллекта. Хотя его тест оказался не очень удачным, Гальтон все же изобрел коэффициент корреляции, который, как мы уже видели, играет важную роль в психологии.

Первые тесты, приближающиеся к современным тестам интеллекта, разработал французский психолог Альфред Бине. В 1881 году французское правительство утвердило закон, по которому посещение школы стало обязательным для всех детей. Раньше те, кто не справлялся с учебой, оставались дома; теперь учителям пришлось справляться с широким диапазоном индивидуальных различий. Чтобы извлечь пользу из принятой школьной программы, правительство попросило Бине создать тест, позволяющий обнаруживать детей, которые слишком медленно соображали.

Бине предположил, что интеллект следует измерять при помощи задач, требующих рассуждения и способностей к решению задач, а не перцептивно-моторных навыков. В сотрудничестве с другим французским психологом Теофилом Симоном в 1905 году Бине опубликовал шкалу, которую он пересмотрел в 1908 году и еще раз в 1911-м.

Бине рассуждал, что медленно соображающие или тупые дети похожи на нормальных детей с задержкой умственного развития. Медленно соображающий ребенок должен справляться с тестами аналогично нормальному ребенку меньшего возраста, тогда как умственные способности одаренного ребенка будут соответствовать более старшему возрасту. Бине разработал шкалу тестов, включающую компоненты возрастающей сложности и позволяющую измерять такие изменения в интеллекте, которые обычно связываются с увеличением возраста. Чем выше по шкале поднимается ребенок, правильно отвечая на вопросы теста, тем выше его умственный возраст (УВ). Понятие умственного возраста было главным в методе Бине; с помощью этого метода можно было сравнивать УВ ребенка с его хронологическим возрастом (ХВ), определяемым по дате рождения.

Шкала интеллекта Стэнфорд—Бине. Льюис Терман из Стенфордского университета адаптировал пункты теста, предложенные первоначально Бине, для американских школьников. Он стандартизировал применение теста и разработал возрастные нормы, предъявляя этот тест тысячам детей. В 1916 году он опубликовал Стэнфордскую версию тестов Бине, известную теперь как шкала интеллекта Стэнфорд—Бине (Stanford—Binet Intelligence Scale); она пересматривалась в 1937, 1960, 1972 и последний раз — в 1986 году. Несмотря на свой возраст, тест Стэнфорд-Бине — один из наиболее часто применяемых.

Терман сохранил понятие умственного возраста, предложенное Бине. Каждый пункт теста был нормирован но возрастам, то есть он соответствовал возрасту, при котором его проходит существенное большинство детей. Умственный возраст ребенка определяется путем суммирования количества пунктов, пройденных на каждом возрастном уровне. Кроме того, Терман принял удобный индекс интеллекта, предложенный немецким психологом Вильямом Штерном. Этот индекс называется коэффициентом интеллекта, широко известным как IQ (Intelligence Quotient). Он выражает интеллект как отношение умственного возраста (УВ) к хронологическому (ХВ):

Число 100 используется как множитель, так что когда УВ равен ХВ, IQ будет равен 100. Если УВ меньше ХВ, IQ будет меньше 100; если УВ больше ХВ, то IQ будет больше 100.

В последней версии теста Стэнфорд—Бине вместо показателя IQ используются оценки возрастных стандартов. Их можно выражать в перцентилях, показывающих, сколько процентов испытуемых в стандартизируемой группе попадают выше или ниже данного показателя (Thorndike, Hage & Satter, 1986). И хотя концепция IQ все еще используется в тестировании интеллекта, последний уже не вычисляется по приведенной формуле. Вместо этого используются таблицы перевода исходных показателей теста в стандартные показатели, которые подобраны так, что в каждом возрасте средний показатель равен 100.

В соответствии с современным взглядом на интеллект как состоящий из различных способностей, в версии 1986 года все задания Теста Стэнфорд—Бине разбиты на 4 большие группы в соответствии с областями интеллекта: вербальное мышление, абстрактное/визуальное мышление, количественное мышление и кратковременная память (Scatter, 1988). Для каждой группы существует отдельный показатель; в табл. 12.2 приведены некоторые примеры пунктов теста, сгруппированные по областям.

<<< Назад

Содержание

Дальше >>>