Wprowadzenie najnowszych technologii uczenia się, opartych na nowych podejściach do prezentacji i pozyskiwania wiedzy, wymaga nowych, nowoczesnych metod pomiaru i oceny

Poszukiwanie doskonałych metod pomiaru poziomu wiedzy studentów na obecnym etapie rozwoju informatyki jest niezwykle ważne, ponieważ obiektywizacja procesu pomiarowego, dostarczanie informacji zwrotnej, umożliwia koordynację tego rozwoju. Tym samym obiektywne i dokładne metody pomiaru i oceny wiedzy stają się jedną z sił napędowych postępu naukowego.

Analiza porównawcza metod pomiaru poziomu wiedzy stosowanych we współczesnej pedagogice: wywiadów ustnych, prac pisemnych, wywiadów i testów, pokazuje, że ta ostatnia metoda bardziej niż inne spełnia kryteria jakościowe w określaniu poziomu wiedzy teoretycznej, umiejętności i zdolności .

Stosowanie testów w procesie edukacyjnym stało się niezawodną częścią światowej praktyki pedagogicznej. Na Ukrainie również ten proces nabiera siły: rozwijają się nasze wyobrażenia na temat celu i możliwości pedagogicznych testów, formularzy testów, formatów pytań, metod przetwarzania wyników testów i ich interpretacji.

W latach dwudziestych XX wieku, kiedy pod kierownictwem Bolonsky’ego stworzono pierwsze ogólnokrajowe standardy i testy szkolne. A dziś panuje mityczna opinia, że do skompilowania narzędzia testowego nie jest wymagana żadna specjalna wiedza. Dowodem na to jest ogromna liczba zeszytów testowych, z których większość nie podlega krytyce.

Oczywiście tylko odpowiednio skomponowany test pozwala w pełni spełnić współczesne cele nauki i edukacji. Wielu nauczycieli ma pewne trudności z opracowaniem takich testów i ich właściwym zastosowaniem metodologicznym.

Można zatem stwierdzić, że w tym zakresie potrzebne są pewne zalecenia. Podstawowe badania nad testowaniem jako metodą diagnostyki pedagogicznej zawarte są w pracach S. Avanesova, V. Bespalko, K. Ingenkampa, Paula Kleina, A. Mayorova, L. Dolinera i innych.

Słowo „test” ma pochodzenie angielskie. Klasyczną definicją w pedagogice jest K. Ingekamp: „Testowanie jest metodą diagnozy pedagogicznej, za pomocą której wybór zachowania, który przedstawia przesłanki lub wyniki procesu edukacyjnego trafność pomiarów, musi być przetwarzane i interpretowane oraz dopuszczone do stosowania w praktyce pedagogicznej”[9, 255].

Autorzy Burlachuk LF i Morozov SM podają nieco inną definicję terminu „test” i uważają, że jest to test czasowy, mający na celu ustalenie ilościowych (i jakościowych) indywidualnych cech psychologicznych [3, 325-326].

Podobną definicję testu wprowadza psycholog Paul Klein. Test psychologiczny (a uznaje testy pedagogiczne za podtyp psychologiczny) jest standaryzowanym, często ograniczonym w czasie testem, przeznaczonym do ustalenia ilościowych (i jakościowych) indywidualnych cech psychologicznych [5, 15].

V. Avanesov uważa, że test jest naukowo uzasadnioną metodą pomiaru badanych cech osobowości. Pomimo uogólnionej koncepcji testu, często wprowadzane jest pojęcie testu pedagogicznego. Tak więc V. Avanesov uważa, że test pedagogiczny to zestaw powiązanych ze sobą zadań o coraz większej złożoności i specyficznej formie, który pozwala jakościowo ocenić strukturę i zmierzyć poziom wiedzy [10].

Każda z tych definicji ma swoje wady i zalety. Dlatego po przeanalizowaniu tych definicji i biorąc pod uwagę cel artykułu, oparliśmy się na takim zrozumieniu istoty pojęć „test” i „testowanie” w badaniu tego problemu.

Testowanie – naukowo uzasadniony proces pomiaru (za pomocą testów) jakości cech osobowości.

Test – narzędzie składające się ze zweryfikowanego jakościowo systemu zadań testowych, standaryzowanej procedury, wstępnie zaprojektowanej technologii przetwarzania i analizy wyników.

Jak widać z powyższych definicji, ważnymi kryteriami diagnostycznych testów uczenia się są skuteczność (ważność), skuteczność i wiarygodność ich wyników.

Trafność metody jest cechą złożoną, o której decydują zarówno parametry narzędzia i procedury pomiarowej, jak i właściwości badanej cechy. Zatem ważność metody jest zgodnością z tym, co jest mierzone tą metodą, ponieważ musi ona mierzyć. Kryterium to ustala sferę rzeczywistości, dla której metoda daje statystycznie prawdopodobne wyniki. Jeżeli chodzi o testowanie aktywności określonego poziomu, zadania kwalifikacyjne oferowane w teście powinny odpowiadać takiemu poziomowi złożoności, tzn. nie mogą być wykonane za pomocą aktywności niższego poziomu. Jednocześnie mów o funkcjonalnej ważności testu.

Trafność metody w mierzeniu sukcesu można zróżnicować według następujących kryteriów:

  • aktualność treści,
  • ważność zgodności,
  • trafność prognozy [8, 18-19].

Ważność według L. Dolinera [4, 49-51 :.

  • Oczywiste (wewnętrzne): Test jest ważny, jeśli wydaje się, że mierzy dokładnie to, co jest potrzebne. Oczywista zasadność nie ma nic wspólnego z prawdziwą zasadnością, a jedynie pomaga stworzyć atmosferę współpracy z podmiotem.
  • Znaczący. Termin ten określa, czy zadanie testowe odpowiada wszystkim aspektom pytania badawczego (temacie, sekcji itp.).
  • Funkcjonalne: zgodność zadania kontrolnego z testowanym działaniem poznawczym.

Ważność według Paula Kleina:

  • oczywiste: test jest ważny, jeśli respondenci uważają, że mierzy dokładnie to, co jest potrzebne;
  • konkurencyjne: oceniane przez korelację wyników tego testu z wynikami innych testów;
  • prognostyczne: badane są korelacje między wskaźnikami testowymi a pewnym kryterium charakteryzującym mierzoną właściwość, ale po pewnym czasie;
  • sensowne: jeśli możliwe jest wykazanie, że zadania odzwierciedlają wszystkie aspekty obszaru badawczego, pod warunkiem, że instrukcje do niego są jasno sformułowane;
  • konstruktywny: obejmuje wszystkie wymienione powyżej podejścia do ustalania trafności [5, 25-29].

Wiarygodność metody pomiarowej jest miarą stabilności wyników, która wpływa na dokładność, z jaką można zmierzyć daną cechę. Sprawdzenie rzetelności metody dotyczy przede wszystkim odtworzenia wyników pomiarów powtarzanych.

Stopień niezawodności metody zależy od:

  • obiektywność metody;
  • parametry przyrządu pomiarowego;
  • stabilność mierzonej charakterystyki [8, 17-18].

Niezawodność zadania kontrolnego rozumiana jest jako stopień dokładności, z jaką można określić tę lub inną cechę. Oznacza to, że określa się, na ile możesz ufać wynikom tego testu. Rzetelność testów bywa wnioskowana z tego, że: jeżeli we wszystkich przypadkach testowania testu lub jego wariantów okaże się, że uczniowie w rozkładzie wskaźników wydajności zajmą te same miejsca, to taki test można uznać za rzetelny.

Wiarygodność testu zależy od liczby zadań testowych. Dlatego, aby zapewnić wystarczającą wiarygodność końcowej kontroli wystarczająco dużych odcinków kursu, test powinien zawierać co najmniej 40 zadań [2, 50-55].

Paul Klein uważa, że w psychometrii termin „rzetelność” ma dwa znaczenia. Mówi się, że test jest wiarygodny, jeśli jest wewnętrznie spójny. Test jest również nazywany wiarygodnym, jeśli daje takie same wyniki dla każdego przedmiotu (pod warunkiem, że przedmiot się nie zmienił), gdy jest ponownie testowany. Rzetelność w ponownym testowaniu po określonym czasie nazywana jest rzetelnością retestową [5, 22-25].

Awanasow VS Uważa, że wraz z pojawieniem się nowej teorii testów zaczyna odczuwać potrzebę rozszerzenia liczby kryteriów do co najmniej trzech. Jako trzeci nauczyciel podaje kryterium efektywności.

Wydajność to kryterium porównawcze, które pozwala na porównanie testów. Skuteczny test to taki, który lepiej niż inne mierzy wiedzę uczniów o wymaganym poziomie przygotowania, przy mniejszej liczbie zadań, lepiej, szybciej, taniej i to wszystko – jeśli to możliwe w tym samym czasie.

Jeśli porównamy pojęcie efektywności z pojęciami rzetelności i trafności, najistotniejszą różnicą między nową koncepcją a dwoma tradycyjnymi jest przejście od średniej do zróżnicowanej. Wystarczy przypomnieć, że rzetelność dotyczy testu, który składa się z ustalonej liczby zadań przedstawionych wszystkim badanym; dopiero wtedy można określić czynnik wiarygodności testu jako średnią miarę dokładności pomiaru. Ważność testu jest podobna. Skuteczny test natomiast pozwala na odejście od uśredniania i od ustalonej liczby zadań dla wszystkich badanych.

Psychologowie Burlachuk LF i Morozov SM skutecznym testom stawiamy jeszcze jeden, naszym zdaniem istotny, wymóg – złożoność zadania testu.

Złożoność zadania testowego – cecha zadania testowego, która odzwierciedla statystyczny poziom rozwiązalności w tej próbie standaryzacji. Wskaźnikiem złożoności zadania testowego jest odsetek osób w próbie, które rozwiązały lub nie rozwiązały tego problemu. Na przykład, jeśli tylko 20% badanych wykonało zadanie, można je uznać za trudne dla danej próby, jeśli 80% – za łatwe [3, 349-351].

Wybór zadań według wskaźników złożoności jest ważny dla pomyślnego wykorzystania testów. Zatem przy wyborze zbyt złożonych zadań testowych trafność i wiarygodność testu gwałtownie spada. Zbyt proste zadania testowe doprowadzą do jednolitości testu i jego nieskuteczności.

Inną cechą skutecznych testów, według Paula Kleina, jest dyskryminacja. Osiągnięcie zadowalającego rozkładu wskaźników jest jednym z celów autora testów. Nie trzeba dodawać, że oczywista jest wartość testu, w którym wszyscy badani wykazali ten sam wynik? Dzięki starannemu zaprojektowaniu testu można zapewnić odpowiedni poziom dyskryminacji i właśnie to zyskują testy w porównaniu z innymi formami testowania [5, 29-30].

Jak widać, wymagania testologów dotyczące skutecznych testów są nieco inne. Celem pomiarów jest zawsze uzyskanie informacji o charakterystyce obiektów lub zdarzeń. Mierzonym nie jest sam przedmiot, ale tylko właściwości lub charakterystyczne cechy przedmiotu.

W diagnostyce pedagogicznej starają się określić jakość wyników pomiarów (w naszym przypadku – pomiaru wydajności). Należy zauważyć, że wszystkie powyższe kryteria mają na celu jeden ogólny wymóg: test powinien dostarczyć najdokładniejszych informacji o badanym zjawisku. Określają tylko to wymaganie i charakteryzują go z różnych punktów widzenia.

Bibliografia

  • Anastasi A., Urbina S. Testy psychologiczne. – 7 wyd. – СПб.: Питер, 2005. – 688 с.
  • Bezpalko wiceprezes Kształcenie i szkolenie z udziałem komputerów (pedagogika III tysiąclecia). – М.: Воронеж: Изд. Moskiewski Instytut Psychologiczno-Społeczny, 2002. – 352 s.
  • Burlachuk LF, Morozov SM Poradnik słownikowy dotyczący psychodiagnostyki. – SPb.: Piotr, 1999. – 528p.
  • Doliner LI Komputerowe testy sukcesu jako sposób optymalizacji procesu uczenia się // Biuletyn Uniwersytetu Moskiewskiego. -2004. – №1.
  • Klein Paul. Przewodnik dotyczący projektowania testów. Przetłumaczone przez EP Savchenko. – M .: „PAN Sp. z oo”, 1994r. – 283 s.
  • Mayorov AN Teoria i praktyka tworzenia testów dla systemu edukacji. – M., Edukacja publiczna, 2000 – 352p.
  • Malykhin A. Testy w procesie edukacyjnym współczesnej szkoły // Rodzima szkoła – 2001 – №8.
  • Zalecenia metodyczne dotyczące organizacji kontroli testowej kształcenia i doskonalenia zawodowego nauczycieli. – Tarnopol: V. Hnatyuk Wydawnictwo TNPU, 2004. – 100p.
  • Diagnostyka pedagogiczna. Wyd. K. Ingenkamp. Tłumaczenie z nim. – M., 1991. – 525 s.

Autor: Kowalczuk Angela Nikołajewna

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.