4-8. BİR ÖLÇME ARACINDA BULUNMASI GEREKEN PSİKOMETRİK NİTELİKLER (5 video)

 BİR ÖLÇME ARACINDA BULUNMASI GEREKEN PSİKOMETRİK NİTELİKLER

Hazırlayan: (Sevim Yeşilpınar)



  Psikolojik özelliklerin ölçülmesinde genellikle ölçme araçları kullanılır ve bu araçlardan elde edilen puanların hatasız ya da az hatalı olması ve bu araçların belirli psikometrik niteliklere sahip olması gerekir. Bunlar:


Geçerlilik ölçmek istenilen özelliğin, başka özelliklerle karıştırılmadan, doğru ve tam olarak ölçülebilmesidir. Diğer bir ifadeyle ölçme aracından elde edilen puanın amaca hizmet etme derecesidir.


Güvenilirlik ölçme işleminden elde edilen puanların tesadüfi hatalardan arınık olma derecesidir. Diğer bir ifadeyle puanların kararlı, tutarlı ve duyarlı olmasıdır.


Kullanışlılık ise ölçme aracının geliştirilmesinin, uygulanmasının ve puanlanmasının kolay ve ekonomik (zaman, para, emek, araç gereç vb. açıdan) olması ile ilgilidir.


 Bir ölçme aracından elde edilen puanların hatasız ya da az hatalı olması geçerli ve güvenilir ölçme yapmanın tek koşuludur.

 

HATA: Ölçmede gözlenen bir özelliğin gerçek değeri (sayı, sembol ya da sıfat) bulunmak istenir. Ancak ölçmeye karışan çeşitli hatalar nedeniyle gerçek değer (puan) ölçme yoluyla doğrudan elde edilemez. Psikometride gerçek puan kuramı olarak ele alınan bu kavram basit bireşitlik ile gösterilir9.

Bu çerçevede hatalar; kaynağı, yönü ve miktarı göz önünde tutularak sabit, sistematik ve tesadüfi olmak üzere üç türde incelenebilir:

A.  Sabit Hata: Miktarı ölçmeden ölçmeye değişmeyen, diğer bir deyişle her ölçme işlemine aynı miktarda karışan hatalardır. Örneğin Bir öğretmen, sınavında herkese 10 puan fazla veriyorsa yine karışan hata sabit olacaktır.

B.   Sistematik HataÖlçülen büyüklüğe, öğretmene ya da ölçme koşullarına göre miktarı değişen hatalardır. Örneğin marketteki terazi, her bir kilogramda 120 g eksik tartıyorsa üzerine konulan nesnenin ağırlığı arttıkça hata miktarı da artacaktır. Bir öğretmen, sınavında yazısı kötü olandan puan kırıyorsa yine karışan hata sistematik olacaktır.

Gerek sistematik gerekse sabit hatalarda ölçme sonuçlarına karışan hata miktarı, yönü ve kaynağı bellidir. Bu nedenle bu tür hataların ölçme sonuçlarına karışmasını engellemek ya da bu tür hataları düzeltmek görece daha kolaydır.

 C.  Tesadüfi (Rastlantısal) Hata:

Şansla ortaya çıkan ne yönde ve ne ölçüde karıştığı genellikle bilinemeyen hatalardır. Ölçmelere tek yönlü olarak karışmaz, ölçme sonuçlarına bazen pozitif bazense negatif yönde etki eder. Tesadüfi hataların genellikle dört kaynağı olduğu kabul edilir. Bunlar:

1.  Ölçme işlemini yapan kişiden / öğretmenden kaynaklanan hata:  Öğretmenin test etme sürecine ilişkin davranışlarını iki aşamada ele alabiliriz:

Ölçme işlemi sürecinde:Test katılımcısının dikkatini dağıtacak davranışlar vb.

Ölçme işlemi sonrasında: Puanlamadaki dikkat ve titizliğin zamandan zamana değişmesi, yorgunluk, öncelik-sonralık yanılgısı, maddi hata vb.

 Ölçme aracından kaynaklanan hata


  Ø Ölçme araçları hazırlanırken maddelerin iyi ifade edilmemesi, test katılımcılarının yanlış anlamalarına ve dolayısıyla hataya neden olacaktır.

  Ø Ölçtüğü özellik ve kapsam bakımından homojen (benzeşik) maddelerden oluşan bir araç, heterojen (ayrışık) maddelerden oluşan bir testten daha güvenilirdir.

 Ø  Ölçme aracının yapısıyla ilgili diğer bir konu ise aracın uzunluğudur.

 Ø  Ölçme aracıyla ilgili diğer bir faktör ise bilişsel özellikleri ölçen testlerde eğer seçenek verilmişse şans   ,başarısı karışma olasılığıdır.

 

2. Bireyden / öğrenciden kaynaklanan hata: Bireylerin ölçme işlemi sürecinde içinde bulundukları fiziksel, fizyolojik ve psikolojik durumlar test puanına etki eder. Uykusuzluk, açlık, hastalık, ağrı, motivasyon eksikliği, kaygı vb. faktörler

 

3. Fiziksel ortamdan kaynaklanan hata: Sıcaklık, ışık, ses, koku, görsel vb. etmenler hata miktarını artırabilir.

 

GEÇERLİLİK, GÜVENİLİRLİK VE HATA İLİŞKİSİ

 

Geçerlilik tüm hata kaynaklarından etkilenirken klasik test kuramına göre güvenilirlik yalnızca tesadüfi hatalardan etkilenir.



Şekil 1: Geçerlilik, güvenilirlik ve hata ilişkisi


 Bir testin güvenilir olması onun geçerli olacağı anlamına gelmez ancak bir test geçerli ise büyük olasılıkla güvenilirdir.

Ölçme araçlarının psikometrik nitelikleri şu durumlara göre değişebilir:

a. Ölçme amacının değişmesi,

b.  Uygulama grubunun değişmesi,

c.  Dilin eskimesi / değişmesi,

d.  Maddelerde ve/veya alt ölçeklerde yapılan değişiklikler,

e.  Farklı kültürler,

f.  Kuramsal bilgi birikiminde değişiklikler.


Bir testin şöhretli olması onun geçerli olduğu anlamına gelmez. Modern test kuramına göre geliştirilen ölçekler eleştiriye açıktır. Böylece testlerin niteliği ve test bilgisi gelişir.

KORELASYON: Korelasyon (co-relation), en az iki değişken arasında karşılıklı bir ilişki bulunup bulunmadığı, eğer ilişki varsa bu ilişkinin yönü ve miktarı hakkında bilgi veren istatistik bir tekniktir. “r” ile sembolize edilir. Örneğin

·         Öğrencilerin derse ilişkin tutumları ile ders başarıları arasında bir ilişki var mıdır?

·         Saç uzunluğu ile zekâ arasında bir ilişki var mıdır?

 Korelasyon -1 ile 1 arasında değer alır..

Pozitif korelasyon iki değişken arasında doğru orantılı ilişki anlamına gelir. Örneğin ders çalışma süresi ile sınav notu ya da gelir ile tüketim arasında pozitif bir korelasyonun elde edilmesi beklenir.

Negatif korelasyon, iki değişken arasında ters orantılı ilişki anlamına gelir. Örneğin ders süresi ile dikkat ya da yükseklik ile sıcaklık arasında negatif bir korelasyonun elde edilmesi beklenir.

1 mükemmel korelasyon anlamına gelir ancak 1 mükemmel doğru orantılı ilişki anlamına gelirken, -1 ise mükemmel ters orantılı ilişki anlamına gelir.

 Diğer taraftan sıfır korelasyon iki değişken arasında sistematik bir ilişkinin olmadığı anlamına gelir. Bu duruma mükemmel ilişkisizlik de denir. Örneğin öğretmenlerin boyları ile aylık ücretleri arasındaki korelasyonun sıfır olması beklenen bir durumdur.

Korelasyon katsayısı hakkında. Yön, negatif ya da pozitif olarak değerlendirilirken miktar, kabaca düşük, orta ya da yüksek olarak nitelendirilir. Miktar için kesin sınırlar olmamakla birlikte alanyazında genellikle kabul gören aralıklar Şekil 3’te gösterilmiştir

Korelasyon mutlak değer olarak değerlendirilmelidir. Bir korelasyon katsayısının negatif ya da pozitif olması büyüklük-küçüklük belirtmez, yön bildirir.

Korelasyon katsayısı ile neden-sonuç ilişkisi kurulamaz.

Şekil 2: Korelasyonun temel kavramları










Şekil 3: Korelasyonun miktar








GEÇERLİLİK SORGULAMA YÖNTEMLERİ



 

A.  KAPSAM GEÇERLİLİĞİ:

Kapsam geçerliliği özellikle başarı testlerinde aranan bir geçerlilik sorgulamasıdır

Kapsam geçerliliği bir testin ölçülmek istenen davranışları ne derece kapsadığıyla ilgilidir.

Bir testin kapsam geçerliliğinin yüksek olduğunun söylenebilmesi için:

1.   Testteki soruların / maddelerin ölçülecek özellikler evrenini (konu kapsamını / içeriği) yeterli ve dengeli bir biçimde ölçüyor olması ve

2.    Her bir sorunun / maddenin ölçmek istediği özelliği doğrudan ölçmesi, diğer bir deyişle kazanımla doğrudan ilgili olması gerekir.

 

Kapsam geçerliliği sorgulama yöntemleri:

 Mantıksal / rasyonel yöntemler: Bu yöntemler belirtke tablosu hazırlanması ve uzman görüşünebaşvurulmasıdır.

Belirtke tablosunun hazırlanması: Öğretmen satırda davranışları, sütunda hedefleri yazar; belirlediği madde sayısı doğrultusunda davranış ve hedefleri yeterli ve dengeli bir biçimde temsil eden alanları seçer.

Uzman görüşüne başvurulması: Uzmana belirtke tablosu ve maddeler sunulur, uzmandan soruların / maddelerin kazanımlarla doğrudan ilgili olma durumunu değerlendirmesi istenir

istatistiksel yöntemler: Uzmanlardan alınan dönütler betimsel / muhakemeye dayalı bir yolla çözümlenebilir ya da uzmanların “uygundur / uygun değildir” vb. biçimde değerlendirme yapması istenebilir


Tablo 3. Belirtke tablosu örneği


B.  ÖLÇÜT  DAYANAKLI GEÇERLİLİK:

Ölçme aracından elde edilen puanların ölçüt bir puanla (testin tahmin etmeye çalıştığı ve geçerliliği yüksek bir puan) karşılaştırılarak geliştirilen ölçme aracının geçerliliğine ilişkin nitelendirme yapılır.

Ölçüt dayanaklı geçerlik 2'ye ayrılır:

1.    Yordama Geçerliliği:

2.    Zamandaş Geçerlilik:


1. Yordama Geçerliliği:

 Ölçme araçlarının çoğunda bireylerin gelecekteki davranışlarının kestirilmesi söz konusudur. Yordama geçerliliği, ölçme aracının bu kestirim işini ne ölçüde doğru ve isabetli yaptığı ile ilgili bir sorgulamadır.

Özellikle iki amaçla uygulanan ölçme araçlarının yordama geçerliliğinin yüksek olması istenir. Bunlar seçme ya da yönlendirme amaçlı kullanılan testlerdir. Seçme amaçlı testlere YKS, KPSS, LGS vb. araçlar; diğer taraftan yönlendirme amaçlı testlere ise alan seçiminde ve/veya bir üst öğretim kurumuna yönlendirmek için uygulanan yetenek testleri, ilgi envanterleri, mesleki kişilik envanterleri vb. örnek olarak gösterilebilir.

Yordama geçerliliğinde ölçme aracından elde edilen puanlar, ölçme aracının tahmin ettiği puanla (ölçüt puan) karşılaştırılır ve tahminin ne ölçüde doğru olduğu belirlenmeye çalışılır. Yordama geçerliliğinde ölçüt puan gelecekte belli olacağından beklemek gerekmektedir. Yordama geçerliliğinde geçerlilik katsayısının 0 ile 1 arasında değişmesi beklenir.



Şekil 5: Bir yordama geçerliliği çalışma örneği



Yordama geçerliliğinde en zor ve önemli nokta ölçütün doğru bir biçimde belirlenmesidir.

Ölçütün belirlenmesinde şu noktalar dikkate alınmalıdır: Ölçüt(ün);

1.      Ölçme aracının yordamaya çalıştığı değişkenle doğrudan ilgili olmalı,

2.      Kararlı olmalı, günden güne değişmemelidir.

3.      Bireylerin özelliğini gerçekten yansıtan nesnel ve güvenilir bir ölçüt olmalıdır.

4.      Elde edilmesi kolay ve ekonomik olmalıdır.


2. Zamandaş Geçerlilik:


Zamandaş geçerlilik sorgulamalarında ölçüt puan eş zamanlı olarak elde edilebilir.

Geliştirilen ölçme aracı ile ilişkili olabilecek nitelikleri ölçen ve geçerliliği yüksek bir aracın

puanı ölçüt puan olarak ele alınabilir. Daha sonra geliştirilen ölçme aracı ve ölçüt araç aynı

zamanda uygulanıp iki araçtan elde edilen puanlar arasındaki ilişki incelenir.


Şekil 6: Bir zamandaş geçerlilik çalışma örneği





Şekil 7: Geçerlilik katsayısı




  Zamandaş geçerlilikte de en zor ve önemli nokta ölçütün doğru bir biçimde belirlenmesidir.

Ölçütün belirlenmesinde şu noktalar dikkate alınmalıdır: Ölçüt(ün);

  • .     Ölçme aracının ölçmeye yöneldiği özellikle doğrudan ilişkili olmalıdır.
  •        Geçerliliği yüksek olmalıdır.

 

c. YAPI GEÇERLİLİĞİ:

Yapı geçerliliği, bir testin dayandığı kuramsal temelleri ne derece iyi örneklediğiyle ilgilidir. Yapı geçerliliği bir yandan testin ölçtüğü niteliklerin neler olduğunu araştırma, diğer yandan testi alan kişilerin elde ettikleri puanların ne anlama geldiğini açıklama çabalarıyla ilgilidir. Örneğin bir kişi, geleneksel aile biçimi ile çocuk yetiştirme biçimi arasındaki ilişkiyi incelemek amacıyla bir ölçek geliştirip bu ölçeğin yapı geçerliliğini ortaya koymak istediğinde, geleneksel aile yapısı ve çocuk yetiştirme kavramlarının ne anlamlara geldiğini, ölçme aracındaki maddelerin bu anlamlara uygunluğunu araştırarak yapı geçerliliği konusunda karar verebilir.

 

GÜVENİLİRLİK

 Güvenilir bir ölçme aracı, aynı özellikle ilgili olarak arka arkaya yapılan ölçmelerde yaklaşık olarak aynı sayısal sonucu verir; diğer bir ifadeyle bir test, aynı gruba iki ya da üç kez uygulandığında gruptaki her bir kişi bütün uygulamalarda yaklaşık olarak aynı puanı almalıdır.

Geleneksel olarak hataların varlığı gözlenen puanın gerçek puandan yüksek ya da düşük olmasına neden olur.

 

 Yarışlara hazırlanan bir koşucu, bir mesafeyi farklı zamanlarda 23.7, 24.0, 24.2,   25.1, 25.2 saniyelerde koşmuş olsun. Bu ölçümlerin ortalaması 24.7 ise gerçek puanı 24.7’dir. Koşucu bu puana daha önce 23.7 saniyede koştuğu ölçümü göstererek itiraz edebilir. Bu durumda koşucuya 23.7 ve 25.2 saniyede koştuğu durumlara birçok faktörün etkisinin olabileceği ve 23.7 saniyede tekrar koşmasının belki de hiç olanaklı olamayacağını, gerçek puanının 24.7 olduğunu söyleyebiliriz. Bu söylem gerçek puan kuramına dayanır.

 

 Ölçme işleminde hata miktarı arttıkça gözlenen puanın gerçek puana olan farkı artmaya başlar.

Ölçmenin standart hatası







 formülü ile bulunur.

Sh= Ölçmenin standart hatası= Standart sapmarx= Güvenilirlik katsayısı

 

Bir ölçme işleminde standart hatanın düşük olması, formülden de anlaşılacağı üzere, güvenilirlik katsayısının yüksek, standart sapmanın görece düşük olmasına bağlıdır. Örnek: Bir ölçme işleminde s=8 ve rx=.75 ise Sh=81  .75=4. Bu sonuç bireylerin puanlarına –/+ 4 puan hata karıştığı anlamına  gelir?


 Gerçek puanın tahmin edilmesinde genellikle üç olasılık değeri kullanılır. Bunlar yaklaşık %68, %95 ve%99’dur. %68 olasılık için bireyin puanından bir standart hata çıkarılır ve puanına eklenirken %95 olasılık için bireyin puanından iki standart hata çıkarılır ve puanına eklenir, son olarak %99 olasılık için bireyin puanından üç standart hata çıkarılır ve puanına eklenir.

%68 olasılık için X  1×Sh

%95 olasılık için X  2×Sh

%99 olasılık için X  3×Sh

 Dolayısıyla bir kişi 100 üstünden 50 puan almış ve Sh=4 ise



%68 olasılık: X1×Sh 501×4=         Bireyin gerçek puanı %68 olasılıkla 46-54 arasında değişir.

%95 olasılık için X2×Sh 502×4=   Bireyin gerçek puanı %95 olasılıkla 42-58 arasında değişir.

%99 olasılık için X3×Sh 503×4=   Bireyin gerçek puanı %99 olasılıkla 38-62 arasında değişir.

 Ölçmenin standart hatası yükseldikçe ölçme işlemi bireylere rastgele puan vermekten farklı olmayacaktır. Bu nedenle ölçme işlemlerinde güvenilirliğin kestirilmesi çok önemlidir.

Güvenilirlik katsayısı 0 ile 1 arasında değişir. Genel yetenek gibi bilişsel özellikleri ölçen testlerde güvenilirlik katsayısının 0.90 ve üzerinde olması arzu edilir.

Şekil 8: Güvenilirlik katsayısı




Şekil 9: Güvenilirlik kestirim yöntemleri




A.  TEST-TEKRAR TEST YÖNTEMİ: Bu yöntem ile test güvenilirliğini test etmek için bir test, aynı gruba, belli bir zaman aralığıyla iki kez uygulanır. Daha sonra bireylerin birinci uygulamadan aldıkları puanlarla ikinci uygulamadan aldıkları puanlar arasındaki korelasyon hesaplanır. Elde edilen korelasyon katsayısına kararlılık (devamlılık / istikrarlılık) katsayısı adı verilir.



Şekil 10: Test-tekrar test yöntemi çalışma örneği



    Bir ölçme aracının güvenilirliğine ilişkin kanıt toplamak isteyen bir kişi kararlılığın yanı sıra tutarlılığa ve duyarlılığa ilişkin sorgulamaları yapmak durumundadır.

   Bu yöntem, ölçülen özelliğin kararlı olduğu durumlarda uygulanması gereken bir yöntemdir. Testin ölçtüğüözellik sürekli değişkenlik gösteriyorsa bu yöntemle testin güvenirliği hesaplanmamalıdır. Örneğin genel zihin yetenekleri, kişilik testleri, ilgi envanterleri, vb. gibi testlerin kararlılık bağlamında güvenilirlikleri buyöntemle hesaplanabilir.

   Bu yolla test güvenilirliğini kestirmede karşılaşılan önemli bir sorun, testin iki uygulanışı arasındaki zaman aralığının ne kadar olması gerektiğidir. Birinci uygulamada maddeleri hatırlamayacak kadar uzun, ölçülen özellikte köklü değişimler oluşmayacak kadar kısa olmalıdır

   Aradaki zamanın belirlenmesinde dikkat edilmesi gereken bir başka nokta, özelliğin değişim hızıdır. (genel yetenek düzeylerinin kısa bir zamanda değişmesi gibi)


Ayrıca özelliklerin değişimi yaşla da ilişkilidir.

Test-tekrar test yöntemi, başarı testleri için çok tercih edilmemektedir. Çünkü kısa vadede başarı kolay değişebilen, kararsızlık gösterebilen bir özelliktir.

   Güvenilirliğin bir boyutu da testin tutarlılığıdır. ( tutarlılık katsayısı)


B.  TEST YARILAMA (EŞDEĞER YARILAR / İKİ YARI GÜVENİLİRLİĞİ) YÖNTEMİ:


Bu yöntemle güvenilirliği tahmin etmede uygulanmış bir test iki eşdeğer yarıya bölünür ve bireylerin iki yarıdan aldıkları puanlar arasındaki tutarlılık incelenir. Buradaki en temel sorunlardan biri testin iki eşdeğer yarıya nasıl bölünmesi gerektiği ile ilgilidir. En sık başvurulan yöntemler:

a)  ilk yarı ve son yarı      b) tek ve çift ve                   c) rastlantısaldır.

Testteki

·         maddeler basitten zora doğru sıralanmış ise

·        maddeler konu içeriklerine ya da faktörlere göre kümelenerek yerleştirilmiş ise

·        madde sayısı çok fazla ise İlk ve son yarı yöntemi için uygun değildir.

 

   Testin tümüne ilişkin bir güvenilirlik katsayısı Spearman-Brown formülü aracılığıyla hesaplanır. Elde edilen katsayı testin tamamına ilişkin  tutarlılık bağlamındaki güvenilirlik katsayısı olarak kabul edilir.


Şekil 11: Test yarılama yöntemi çalışma örneği



C- KUDER-RICHARDSON 20 VE 21 YÖNTEMLERİ: KR-20 ve KR-21, testin kendi içinde tutarlı birbütün oluşturup oluşturmadığı ile ilgili bilgi verir. Bu nedenle her iki yöntemle de testin iç tutarlılığı değerlendirildiğinden bu yöntemlerden elde edilen katsayıya  tutarlılık katsayısı adı verilir.


Ø KR-20 ve KR-21 ile güvenilirlik kestirimi, puanlamanın kategorik olduğu ölçme araçları için uygundur.


Ø Puanlamanın kategorik olması, doğru yanıtlara 1 puan, yanlış ve boş bırakılan maddelere 0 puan vererek puanlamanın yapıldığı ya da maddenin yanıtının iki seçenekliverildiği durumlardır.


Ø Eğer testteki maddeler farklı ağırlıklarla puanlanmışsa ya da test puanları şans başarısı için düzeltilmişse bu formüller kullanılmaz.

 

D- CRONBACH ALFA YÖNTEMİEğer ölçme aracının puanlaması çok kategorili ise KR- 20 ile aynı mantık üzerine kurulu Cronbach alfa hesaplanır. Elde edilen katsayının ismi yine iç tutarlılık katsayısıdır. Derecelendirme ölçekleri puanlamanın çok kategorili olduğu araçlara örnek verilebilir. 


GÜVENİLİRLİĞİ VE GEÇERLİLİĞİ ARTIRMA YOLLARI

1.      Bir testteki madde sayısı arttıkça birimler küçüldüğünden duyarlılık artar, bu nedenle hata miktarı azalacağından güvenilirlik artar.


2.      Bir ölçme işleminde genel bir ilke olarak puanlayıcı sayısı arttıkça güvenilirlik artar.


3.      Puanlama nesnelliği, güvenilirliği büyük ölçüde etkiler. Bir testin farklı kişiler tarafından puanlanması yada aynı kişinin farklı zamanlarda verdiği puanlar arasındaki tutarlılığa puanlama güvenilirliği adı verilir.


4.      Testteki maddeler açısından homojenlik arttıkça güvenilirliğin artması, diğer taraftan heterojenlik arttıkça güvenilirliğin düşmesi beklenen bir durumdur.


5.      Veri elde edilecek grubun (örneklem) büyüklüğü arttıkça güvenilirlik artar.


6.      Maksimum  performansı  ölçen  testlerd ortalam güçlüğ yakltıkç (𝑃  =  .50 grup heterojenleşir ve dolayısıyla güvenilirlik artar.


7.      Maddelerin dil bilgisi kurallarına uygun, açık ve anlaşılır yazılması güvenilirliği eartıran etmenlerden biridir.


8.      Öğrencilere test uygulaması öncesinde ve gerekliyse süreçte yönerge verilmesi güvenirliği arttırır.


9.      Fiziksel ortamın ses, sıcaklık, ışık, koku, dikkat dağıtıcı uyarıcılar vb. etmenler açısından uygun hâlegetirilmesi güvenirliği arttırır.


10.  Testin süresinin yeterli olması güvenirliği arttırır.

11.  Uygulamada bireylerin dikkatini dağıtacak davranışlardan kaçınılması güvenirliği arttırır.

12.  Maddelerin teste düzgün yerleştirilmesi, okumayı güçleştirecek bir unsurun bulunmaması; test katılımcısının yaşına, gelişim düzeyine uygun bir punto büyüklüğü kullanılması; baskı hataları bulunmaması vb. etmenler güvenilirliği artırır.

NOT: Güvenilirliği artıran faktörler geçerliliği de artırır. Ancak geçerlilik yalnızca tesadüfi hatalardan değil, aynı zamanda sabit ve sistematik hatalardan da etkilenir. O nedenle öğretmenin tesadüfi hataların yanı sıra sabit ve sistematik hatalardan arındırmaya yönelik alacağı tüm tedbirler geçerliliği de artıracaktır.