Под надежностью теста понимают степень точности, с которой он оценивает определенную двигательную способность независимо от требований того, кто ее оценивает. Надежность проявляется в степени совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях; это стабильность или устойчивость результата теста индивида при повторном проведении контрольного упражнения.
Под надежностью теста понимается способность давать неизменные результаты при повторном измерении одних и тех же лиц, находящихся в одном и том же состоянии. По ряду причин ни один тест не может дать абсолютного совпадения результатов при повторном измерении.
Причины, снижающие надежность теста, следующие:
изменение состояния испытуемых (утомление);
неконтролируемые изменения внешних условий и аппаратуры (изменение температуры, влажности воздуха, скорости ветра, атмосферного давления, колебание напряжения в сети измерительных приборов и др.);
изменение состояния лица, проводящего измерение (или замена его другим лицом);
несовершенство самого теста (например, броски мяча в баскетбольную корзину до первого промаха).
На практике все перечисленные причины могут действовать совместно, но доля их влияния в каждом конкретном случае может быть различной. Без специальных приемов оценить раздельно влияние каждой из причин невозможно. Следовательно, невозможно с достаточной для принятия практического решения вероятностью вынести суждение о том, чем вызвано несовпадение результатов двух или более выполненных подряд измерений, изменением состояния испытуемого или влиянием второй, третьей или четвертой причин. Аналогичная ситуация возникает, если необходимо сопоставить результаты теста у разных испытуемых, если при повторных измерениях их результаты изменяются.
Естественно, что не все тесты обладают достаточной надежностью, более того, один и тот же тест в разных условиях и на разном контингенте испытуемых может иметь различную надежность. Таким образом, понятие "надежность теста" может относиться к различным аспектам и в зависимости от того, какая из причин, снижающих надежность теста, является основной, его можно разделить на несколько разновидностей: воспроизводимость, стабильность и согласованность.
Одной из разновидностей надежности теста является его стабильность. Под стабильностью понимают воспроизводимость результатов при повторном тестировании, проводимом одним и тем же лицом в одних и тех же условиях, когда первое и повторное измерения проводятся не подряд, а разделены определенным временным интервалом. Не трудно заметить, что стабильность теста отличается от обычной воспроизводимости только наличием более продолжительного интервала между тестом и ретестом. Таким образом, речь идет в основном о влиянии длительности временного интервала на воспроизводимость теста.
Стабильность теста зависит от:
вида теста;
контингента испытуемых;
временного интервала между тестом и ретестом;
Исследователя могут интересовать два вопроса:
в какой мере сохраняется уровень показателя;
в какой мере совпадают порядковые места, занимаемые испытуемыми по результату теста и ретеста.
Надежность тестов определяют также по сопоставлению средних оценок четных и нечетных попыток, входящих в тест. Например, среднюю точность бросков в цель из 1, 3, 5, 7 и 9 попыток сравнивают со средней точностью бросков из 2, 4, 6, 8 и 10 попыток. Такой метод оценки надежности называется методом удвоения, или расщеплением.
Под объективностью (согласованностью) теста понимают степень согласованности результатов, получаемых на одних и тех же испытуемых разными экспериментаторами (учителями, судьями, экспертами).
Для повышения объективности тестирования необходимо соблюдение стандартных условий проведения теста:
- время тестирования, место, погодные условия;
- единое материальное и аппаратурное обеспечение;
- психофизиологические факторы (объем и интенсивность нагрузки, мотивация);
- подача информации (точная словесная постановка задачи теста, объяснение и демонстрация).
Информативность теста - это степень точности, с какой он измеряет оцениваемую двигательную способность или навык. Информативность чаще всего на практике определяется эмпирически, в этом случае результаты теста сравнивают с некоторыми критериями. Чаще всего критериями служат:
Характеристика музыкальной жизни Челябинского Урала в новейшее время
В начале XX века музыкальная жизнь в Челябинском Урале не носила централизованного характера. При клубах, заводах, театрах проводились музыкальные вечера. Их проводили любительские музыкальные коллективы.
После 1917 года в ряде городов Челябинской области были открыты музыкальные учреждения, впос ...
Создание и редактирование векторного изображения. Сохранение и загрузка
векторного изображения
Данная тема является самой масштабной в рамках изучения графики в восьмом классе. Включает в себя три параграфа и на её изучение отводится три часа времени, за которые учащиеся должны освоить: объекты CorelDRAW, инструменты рисования. Познакомиться с такими понятиями, как заливка и абрис, научится ...
Возрастные особенности учащихся в 5-6 классах
Исследования Л.С. Выготского, А.Н. Леонтьева, Д.Б. Эльконина позволили систематизировать огромный фактический материал, накопленный в области детской психологии. Л.С. Выготский ввел новую единицу анализа детского развития. Ею являются не отдельные психические процессы, которые изучает общая, генет ...