17. ULUSAL EĞĠTĠM BĠLĠMLERĠ KONGRESĠ 01-03 EYLÜL 2008 SAKARYA ÜNĠVERSĠTESĠ EĞĠTĠM FAKÜLTESĠ SAKARYA/TÜRKĠYE
Program Değerlendirme Modellerinin KarĢılaĢtırmalı Ġncelenmesi ArĢ. Gör. Pınar BĠLASA ArĢ. Gör. Subhan EKġĠOĞLU Gazi Üniversitesi/Endüstriyel Sanatlar Eğitim Fakültesi Gazi Üniversitesi/Gazi Eğitim Fakültesi
[email protected] [email protected] Özet Bu çalıĢmada çeĢitli program değerlendirme modelleri üzerinde durulmuĢ ve değerlendirme modellerinin birbirleriyle olan benzerlikleri ve farklılıkları karĢılaĢtırılmıĢtır. ÇalıĢmada ele alınan değerlendirme modelleri: Tyler Değerlendirme Modeli, Metfessel- Michael Değerlendirme Modeli, Stake’in Uygunluk Modeli, Malcolm Provus tarafından geliĢtirilen “Farklılıklar Modeli”, Stufflebeam tarafından geliĢtirilen CIPP Modeli ve Eisner’ın Eğitsel Uzmanlık /EleĢtiri Modeli’dir. Modeller öncelikle yaklaĢım açısından incelenmiĢ, benzerlik ve farklılıklarına göre gruplandırılmıĢlardır. Ġki ana baĢlık altında amaç yönelimli ve bütüncül yaklaĢımlı olarak sınıflandırılan modeller daha sonra öğeleri ve değerlendirme aĢamaları açısından incelenmiĢlerdir. Öğeler açısından incelendiğinde ise Tyler ve Metfessel-Michael’ın amaç yaklaĢımlı değerlendirme modellerinin Provus, Stake ve Stufflebeam’in değerlendirme öğelerinin ilk basamağından farklılık gösterdiği belirlenmiĢtir. Ele alınan modeller değerlendirme aĢamaları açısından karĢılaĢtırıldığında amaca ulaĢma (Tyler), ürünü vurgulama (Stake), karar verme (Provus, Stufflebeam), naturalistik (Stake, Eisner) olarak birbirlerinden farklılık göstermektedirler. Sonuç olarak incelenen değerlendirme modellerinin bir program değerlendirme çalıĢması için gerekli ve yeterli olduğu bununla birlikte birbirleriyle bağlantılı olarak bütünleĢtirilmiĢ bir Ģekilde de kullanılabileceği söylenebilir. Anahtar Sözcük: Eğitim programı, Program değerlendirme, Program değerlendirme modelleri. Abstract This study mentions about different curriculum evaluation models and compares these models’ differences and similarities. In this research; Tyler’s Evaluation Model, MetfesselMichael Evaluation Model, Stake’s Congruence- Contingency Model, Discrepancy Model developed by Malcolm Provus, Stufflebeam’s CIPP Model, and Eisner’s Educational Connoisseurship and Criticism Model. Firstly, the models are examined in terms of the approaches, and grouped according to their similarities and differences. The models are classified in two main groups as Objective- Oriented and Holistic (bütüncül), and then examined in terms of their components and evaluation process. When these models are considered in terms of their components, it is seen that Tyler’s and Metfessel- Michael’s objective- oriented evaluation models are different than Provus, Stake, and Stufflebeam’s evaluation components’ first stages. It is clearly seen that while these models are compared in terms of their evaluation stages; there are some differences in such situations as reaching the goals (Tyler), emphasizing the products (Stake), decision- making (Provus, Stufflebeam), naturalistic (Stake, Eisner). Finally, it can be said that models reviewed in this research are not only necessary and sufficient but also can be combined and unified to be used for further curriculum evaluation studies. Key Words: Curriculum, Curriculum evaluation, Curriculum evaluation models.
1
GĠRĠġ Değerlendirme ölçme sonuçlarını bir ölçütle kıyaslayarak ölçülen nitelik hakkında bir karara varma sürecidir (Turgut, 1987). Değerlendirme yapılırken neyin, kimler tarafından, hangi yöntemlerle ve hangi ölçme araçları kullanılarak değerlendirileceği önem taĢımaktadır. Eğitimle ilgili olan tüm süreçte değerlendirme üzerinde önemle durulması gereken bir konu olarak karĢımıza çıkmaktadır. Eğitim programı açısından baktığımızda ise değerlendirme ile ilgili pek çok tanım karĢımıza çıkmaktadır. Ertürk (1998), değerlendirmeyi “yetiĢeğin son ve tamamlayıcı halkası olarak eğitim hedeflerinin gerçekleĢme derecesini tayin etme süreci” Ģeklinde tanımlamıĢtır. Erden (1998) ise değerlendirmeyi “gözlem ve çeĢitli ölçme araçları ile eğitim programlarının etkililiği hakkında veri toplama, elde edilen verileri programın etkililiğinin iĢaretçileri olan ölçütlerle karĢılaĢtırıp, yorumlama ve programın etkililiği hakkında karar verme süreci” olarak tanımlamaktadır. Tyler ise değerlendirmeyi “eğitim programı ve öğretim programında hangi amaçların gerçekleĢtiğini belirleme süreci” olarak tanımlamıĢtır (Marsh ve Willis, 2007). Eğitim programı sonunda hedeflerin gerçekleĢme derecesinin belirlenmesi için program değerlendirme modellerinin kullanılması değerlendirme açısından oldukça önemli görülmektedir. PROGRAM DEĞERLENDĠRME MODELLERĠ Bir eğitim programının değerlendirilmesinde farklı değerlendirme modelleri kullanılabilir. Bu çalıĢmada eğitimciler tarafından kullanılabilecek çeĢitli program değerlendirme modelleri üzerinde durulmuĢ ve değerlendirme modellerinin birbirleriyle olan benzerlikleri ve farklılıkları karĢılaĢtırma yapılarak analiz edilmiĢtir. ÇalıĢmaya altı program değerlendirme modeli dâhil edilmiĢtir. Seçilen program değerlendirme modelleri ve içerikleri Ģöyledir: 1. Tyler Hedefe Dayalı Değerlendirme Modeli: Tyler değerlendirme modeli, Ralph Tyler’ın eğitim kurumlarını değerlendirme yaklaĢımı ile ilgilidir (The International Encyclopedia of Curriculum,1991). Tyler program değerlendirmeye akılcıdeneysel bir yaklaĢım getirmiĢtir ve değerlendirmeyi Ģu Ģekilde tanımlamaktadır: Değerlendirme eğitim programı ve öğretim programında hangi amaçların gerçekleĢtiğini belirleme sürecidir. Bu amaçlarla öğrencilerin davranıĢ örüntülerinde istenen değiĢiklikler oluĢturmak amaçlanmaktadır. Öyleyse değerlendirme, bu davranıĢ değiĢikliklerinin hangisinin ne derecede yer aldığını belirleme sürecidir (Tyler, 1949).
Bu yaklaĢımda iki temel düĢünce ifade edilmektedir. Bunların birincisi; bir eğitim programının amaçlarının baĢarının nasıl değerlendirileceğine dair temel standartları oluĢturduğudur. Ġkincisi ise değerlendirmenin eğitim sürecinin bir parçası olduğu ve ondan ayrı düĢünülemeyeceğidir. Tyler değerlendirmeyi, bir programın gerçekte ulaĢmak istediği amaçların derecesinin belirlenmesi süreci olarak açıklamıĢtır. Buna göre Tyler’ın program değerlendirme modeli üç ana öğeyi içermektedir: a) amaçlar, b) öğrenme yaĢantıları, c) değerlendirme (The International Encyclopedia of Curriculum,1991). Amaçlar; öğrencilerin program süreci sonunda edinmesi istenen kazanımları ve davranıĢları açıklar. Tyler amaçların öğrencilerden, çağdaĢ toplumdan ve konu uzmanları tarafından belirlenebileceğini ve eğitim felsefesi ve öğrenme psikolojisi süzgeçlerinden geçirilmesi gerektiğini savunur. Öğrenme yaşantıları; programın amaçlarına ulaĢmak için tasarlanan, sınıf içinde ve dıĢında devam eden bireysel ve grup etkinliklerini içeren geniĢ bir terimdir. Değerlendirme ise programdan kazanılmıĢ olan amaçların derecesini belirlemek için yapılan etkinliklerdir (The International Encyclopedia of Curriculum,1991; Marsh ve Willis, 2007; Worthen, Sanders ve Fitzpatrick, 1997).
2
Tyler’ın değerlendirme modelinin ayırt edici özelliği bazı etkinliklerin amaçlarının belirlenmiĢ olması ve değerlendirmenin bu belirlenmiĢ amaçların baĢarılmıĢ olma derecesine odaklanmasıdır (Worthen, Sanders ve Fitzpatrick, 1997). 2. Metfessel- Michael Değerlendirme Modeli: Bu modelde eğitimin içindeki tüm bireylerin doğrudan veya dolaylı olarak değerlendirmeye katılmaları sağlanır ve genelden özele doğru hedeflerin değerler dizisi geliĢtirilir. OluĢan özel hedefler uygulanabilir Ģekle dönüĢtürülerek buna uygun ölçme araçları geliĢtirilir ve süreç üzerinde gözlemler yapıldıktan sonra toplanan bilgiler analiz edilir. Programla ilgili standartlar açıklanır ve ileriye yönelik uygulanabilirliği konusunda öneriler geliĢtirilir (Demirel, 2003). Metfessel- Michael modeline göre değerlendirme sürecinin sekiz aĢaması Ģöyledir (Michael ve Metfessel, 1967): 1. 2. 3. 4. 5. 6. 7. 8.
Tüm okul toplumunun üyelerinin (öğrenciler, okul personeli ve diğer bireyler) programın değerlendirilmesine katılımcı ya da kolaylaĢtırıcı olarak dahil edilmesi. Genel sonuçlardan özel sonuçlara doğru hiyerarĢik bir biçimde düzenlenmiĢ olan geniĢ kapsamlı hedefler ve özel hedeflerin bağlantılı bir dizisinin oluĢturulması. Okul ortamında uygulanabilir davranıĢların ifade edilmesi. Programın etkinliği ile ilgili ölçümleri yapabilmek için gerekli olan ölçme araçlarının geliĢtirilmesi DavranıĢ değiĢikliklerinin testler ve ölçekler kullanılarak dönemsel olarak gözlenmesi. Elde edilen verilerin analiz edilmesi. Ölçüm sonuçlarının yorumlanması. GeniĢ kapsamlı hedefle ve özel hedeflerde değiĢiklik yapılması ve daha ileri uygulamalara temel oluĢturacak biçimde tavsiyelerin oluĢturulması.
3. Stake Uygunluk Modeli: Stake’e göre program değerlendirmenin ana konusu eğitim çıktısı değil programın kendisidir. Çünkü ürünün değeri programın kullanılıĢına bağlı olarak değiĢmektedir. Stake değerlendirmeyi iki ana baĢlık altında toplamıĢtır. Bunlar tanımlama ve hüküm vermedir. Tanımlama aĢamasında niyetler ve gözlemler arasındaki olası bağlar ve uygunluk incelenir. Hüküm verme aĢamasında ise bu niyet ve gözlemlerin standartlarla karĢılaĢtırılması ve yargıya varılması söz konusudur (Stake, 1967). Stake’e göre değerlendirmenin iki ana iĢlemi ya da özelliği vardır. Bunlar programın tam olarak tanımlanması ve yargıya varılmasıdır. Stake değerlendirmeciye bu amaçla yardımcı olacak nitel ve nicel verilerin toplanması, organizesi ve yorumu konusunda bir değerlendirme sistemi geliĢtirmiĢtir (Worthen, Sanders ve Fitzpatrick, 1997). Stake program değerlendirme sürecinde değerlendirmecilerin önemli olduğunu savunmaktadır. Çünkü program değerlendirmede eğitimci ile program değerlendirme uzmanının program değerlendirmeye bakıĢ açısı birbirinden farklıdır. Uzman kendini “tanımlayıcı” olarak görür, baĢarı ve çevreyi tanımlar. Öğretmen ve okul yöneticisi ise değerlendirmecinin bir sınıflandırma veya derecelendirme yapmasını beklerler. Bu modele göre ise değerlendirme uzmanı hem tanımlama hem de karar verme unsurlarına sahip olmalıdır. Tanımlama aĢamasında program değerlendirme uzmanı amaç, gözlem ve olasılıklar üzerinde dururken, karar verme aĢamasında ise standartlar, karĢılaĢtırma ve yargıya varma üzerinde yoğunlaĢmalıdır (Stake, 1967). Stake’in uygunluk modelinde dikkat çektiği bir diğer nokta ise değerlendirme amaçları ve iĢlemlerinin durumdan duruma değiĢiklik gösterdiğidir. Değerlendirme amaçları ve iĢlemleri bir yerde uygulanabilir ancak baĢka bir yerde istenen sonucu vermeyebilir. Örneğin bir yerde maliyet çok önemli iken, diğer yerde önemli olmayabilir (Stake, 1967). Program değerlendirme iĢlemini bir bütün olarak ele alıp çerçevesini çizen Stake’in modelinde toplanan veriler değerlendirmeciye programın baĢında, program devam ederken ve program sonunda sürekli dönüt sağlar (Popham, 1993).
3
4. Provus Farklılıklar Modeli: Malcolm Provus tarafından geliĢtirilen model var olan performans ve varsayılan standartlar arasındaki farklılıklara odaklandığından “Farklılıklar Modeli” olarak tanımlanmıĢtır. Bu değerlendirme yaklaĢımında, değerlendirmenin performans ve standartlarla karĢılaĢtırılması söz konusudur. Provus’a göre program değerlendirme: Program standartlarını tanımlama, Program performansının bazı yönleri ve programın o yönünü düzenleyen standartlar arasında bir fark olup olmadığına karar verme, Var olan farklılık bilgisini programın performansını ya da standartlarını değiĢtirmek için kullanma sürecidir (Popham, 1993: 37-38). Farklılıklar modeli beĢ aĢamadan oluĢur. Ġlk aĢama tasarımdır. Bu aĢamada programın kazanımları, öğrenciler, personel ve diğer kaynaklar ile bu kazanımları sağlayacağı tahmin edilen öğretim etkinlikleri yer alır. Ġkinci aĢama ise oluĢturma aĢamasıdır. Bu aĢamada programın karĢılaĢtırıldığı standartlar sunulur ve bunun sonrasında programı sonlandırmak, devam etmek ya da standartları değiĢtirmek yönünde karar seçenekle ortaya çıkar. Süreç aĢamasında ise değerlendirmeyi yapan değerlendirmeci kazanımların gerçekleĢip gerçekleĢmediği sorusuna yanıt arar. Ürün aĢamasında ise programın nihai amacına ulaĢıp ulaĢmadığı sorusuna yanıt aranır. Tüm bu aĢamalardan sonra program diğer yürürlükte olan programlarla karĢılaĢtırılarak maliyet fayda analizi yapılır (Popham, 1993; Alkin ve Christie, 2004). 5. Stufflebeam CIPP Değerlendirme Modeli: CIPP model proje, program, personel, ürün, kurum ve sistemlerin değerlendirilmelerini yönlendirmek için kapsamlı bir çerçeve programıdır. Bu modelin çekirdek kavramları çevre, girdi, süreç ve üründür. Çevre değerlendirmeleri karar vericilere yardım etmek için ihtiyaçların belirlenmesi, hedef ve önceliklerin tanımlanması ve geniĢ kullanıcı kitlerine yardımcı olmak için hedefler, öncelikler ve sonuçlar hakkında karar verilmesini içerir. Girdi değerlendirmeleri amaçlara ulaĢmak ve hedeflenenleri karĢılamak için çeĢitli yaklaĢımları, eylem planlarını ve bunların yapılabilirlik düzeyleri ile bütçelerini belirler ve değerlendirir. Süreç değerlendirmesi ise çalıĢanların etkinliklerine yardımcı olacak ve iĢlerini kolaylaĢtıracak olan planların uygulanmasını değerlendirerek programın performansı hakkında karar verilmesini ve sonuçların yorumlanmasını içerir. Ürün değerlendirme ile ise kurumu önemli sonuçlara yoğunlaĢtırmak ve kısa ve uzun vadeli sonuçları belirlemek ve değerlendirmek söz konusudur. CIPP modeline göre değerlendirmeyi yapanlar öncelikli sorunlara dikkat etmeli, çevre, girdiler, süreç ve ürünlerini ele alarak bir sonuca ulaĢmalıdır (Guba ve Stufflebeam, 1970; Stufflebeam, 2000). 6. Eisner Eğitsel EleĢtiri/Uzmanlık Modeli: Eisner’ın yaklaĢımı iki ana esasa dayanmaktadır. Bunlar eğitsel uzmanlık ve eğitsel eleĢtiridir (Popham, 1993). Eisner eğitsel uzmanlığı “eğitim açısından anlam taĢıyan değerlendirme sanatı” olarak tanımlamaktadır ve değerlendirme yaklaĢımında bilimsel geçerliğin yerine yapısal doğrulama ve kastedilen uygunluğa dayanır (Ornstein, ve Hunkins, 1988). Eisner (1979) eğitsel eleĢtiriyi ise uzmanın algıladığı olaylar ya da nesnelerin niteliklerini açığa çıkarma sanatı olarak tanımlar. Bu birbiriyle iliĢkili üç aĢamadan oluĢur: tanımlama, yorumlama ve değer biçme. Tanımlama; değerlendirmecinin sınıftaki deneyimlerinin okuyuculara yardımı dokunacak Ģekilde sınıfın betimlenmesidir ve tanımlama genellikle yazılıdır. Yorumlama; sınıfa özgü Ģeylere anlam yüklemektir. Eisner modelinin bu basamağı yapılandırmacılık yaklaĢımının hem öncüsü hem de bir örneğidir. Değer biçme ise araĢtırmacının, değerlendirmecinin deneyimlerine yön veren olayların niteliklerini değerlendirilmesidir (Marsh ve Willis, 2007). Değer biçerken değerlendirmeci sınıfta gerçekleĢen durumların değeri ve erdemleri hakkında sürekli olarak iki soruyu cevaplamaya çalıĢır: Yapmaya değdi mi? En iyi Ģekilde yapıldı mı? Yani öğretmen sınıfta yaptıklarının farkında
4
olmalı ve neyi niçin yapmıĢ olduğunu tam olarak anlamalıdır. Eisner burada değerlendirmeci olan kiĢi ister öğretmen olsun, isterse uzman kiĢi olsun üç temel soruyu kendine sormalıdır demektedir. Bunlar; 1. Bu sınıfta ne görüyorum? 2. Deneyimlerime dair ne yansıtabilirim? 3. Fikirlerimi diğerlerine nasıl iletebilirim? Bu soruların yanıtlarını aramaya baĢlayan değerlendirmeci algıladığı olaylar ve nesnelerin niteliklerini ortaya çıkarmaya baĢlar. Böylelikle eğitsel eleĢtirilerde bulunmuĢ olur. DEĞERLENDĠRME MODELLERĠNĠN KARġILAġTIRILMASI Yukarıda değinilen program değerlendirme modellerinin birbirleriyle karĢılıklı analizine fırsat tanıyan iki önemli nokta aĢağıdaki tabloda modellerin öğeleri ve değerlendirme aĢamaları ayrımıyla ayrı ayrı verilmiĢtir. Tablo 1. Program Değerlendirme Modellerinin KarĢılaĢtırılması TYLER Amaç YaklaĢımlı
METFESSELMICHAEL Amaç YaklaĢımlı
Hedefler Öğrenme yaĢantıları Değerlendirme
Hedef Ġçerik Süreç Değerlendirme
1. Hedefleri saptamak 2. Hedefleri sınırlandırmak 3. Hedefleri davranıĢsal terimlerle anlatmak 4. Ölçme tekniklerini geliĢtirmek/ seçmek 5. Kazanım bilgisini toplamak 6. Hedeflerle kazanım bilgisini karĢılaĢtırmak
1. Okulun katılımının sağlanması 2. Amaçlar modelinin oluĢturulması 3. Amaçların uygulanabilir biçime dönüĢtürülmesi 4. Ölçme araçlarının geliĢtirilmesi 5. DavranıĢların dönemsel olarak gözlemlenmesi 6. Verilerin analizi 7. Verilerin yorumlanması 8. Önerilerde bulunma
PROVUS Amaç YaklaĢımlı
STAKE Bütüncül YaklaĢımlı Öğeleri
EISNER
STUFFLEBEAM
Bütüncül YaklaĢımlı
Bütüncül YaklaĢımlı
Standart Önceki Program yaĢantılar performansı ĠĢlem Standart ve Ürünler performansın karĢılaĢtırılması Ortaya çıkan farklılık Sonlandırma DeğiĢtirme
Çevre Girdi Süreç Ürün
Değerlendirme AĢamaları 1. Tasarım 2. OluĢturma 3. Süreç 4. Ürün 5. Programların karĢılaĢtırılması ve maliyet fayda analizi
1. Tanıma Niyetler Gözlemler 2.Değerlendirme Standartlar Yargılar
1. Betimleme 2. Yorumlama 3. Değerlendirme
1. Standartların belirlenmesi 2. PaydaĢların katılımının sağlanması 3. Değerlendirmenin kurumsallaĢtırılması 4. Değerlendirme yönteminin kullanılması 5. Öğelerin tasarlanması 6. Ara raporların verilmesi 7. Değerlendirme bulgularının özetlenmesi ve rapor haline getirilmesi
Modeller incelendiğinde öncelikle yaklaĢım açısından bir benzerlik ve farklılığın olduğu görülmektedir. Tyler, Metfessel-Michael ve Provus’un değerlendirme modelleri amaç yaklaĢımlı olmaları açısından benzerdirler. Stake, Eisner ve Stufflebeam’in değerlendirme modelleri ise bütüncül yaklaĢımlı olmaları açısından benzerlik göstermektedirler. Bununla birlikte Stake’in daha çok ürüne, Stufflebeam’in ise karar vermeye odaklı olduğu söylenebilir. Bu aynı zamanda Stake ve Stufflebeam
5
değerlendirme modellerinin Tyler, Metfessel- Michael ve Provus’un değerlendirme modellerinden farkını da ortaya koymaktadır. Yani modeller amaç yaklaĢımlı olma ve bütüncül yaklaĢımlı olma açısından birbirinden farklılık göstermektedir. Öğeler açısından incelendiğinde ise Tyler ve Metfessel-Michael’ın amaç yaklaĢımlı değerlendirme modellerinin ilk basamağını “hedefler” oluĢturmaktadır. Her iki modelde de özel hedefler istenilen kazanımları ve davranıĢları belirlemeye dönüktür. Bu hedefler aĢaması Provus, Stake ve Stufflebeam’in değerlendirme öğelerinin ilk basamağından farklılık göstermektedir. Provus Farklılıklar Modeli, Tyler ve Metfessel Michael’ın değerlendirme modeli gibi amaç yaklaĢımlı olmasına karĢın öğeleri açısından standartların belirlenmesi aĢaması ile baĢlar. Burada standartlar hedefler gibi düĢünülebilir ancak daha farklıdır. Çünkü standartlar aynı zamanda kazanım sağlayacağı tahmin edilen öğrenciler, personel ve öğretim etkinliklerini de içerir. Stake’in bütüncül yaklaĢımlı değerlendirme modelinde ilk basamağı önceki yaĢantılar oluĢtururken Stufflebeam’in modelinde çevre oluĢturmaktadır. Stake, bu ilk basamakta önceden var olanlara dikkat çekmektedir. Yani öğrencilerin özellikleri, statüleri, yetenekleri, önceki baĢarı puanları, psikolojik durumlarına iliĢkin değerlendirme sonuçları ve disiplin kayıtları girdileri nitelemekte önemli bir yer tutmaktadır (Gözütok,1999:168). Stufflebeam’in CIPP Değerlendirme modelinde ise önceki yaĢantılar yerine çevre üzerinde durulmaktadır. Burada çevre, amaçların seçilmesi, sıralanması, gerekli araçların belirlenmesi için rehberlik etmektedir. Öğelerin ikinci basamağı olarak Tyler “öğrenme yaşantılar”nı, Metfessel-Michael “içeriği”, Stake “işlem”i, Stufflebeam ise “girdi”yi ele almıĢlardır. Tyler’in öğrenme yaĢantıları basamağı Metfessel-Michael’ın içerik ve süreç, Stake’in iĢlem, Stufflebeam’in süreç basamağına benzemektedir. Ancak Tyler’ın öğrenme yaĢantıları diğerlerine göre daha kapsamlıdır. Son basamak olarak “değerlendirme” Stake ve Stufflebeam’de “ürün” olarak ele alınsa da bu basamağın var oluĢ amacı amacı aynıdır. Ele alınan modeller değerlendirme aĢamaları açısından karĢılaĢtırıldığında amaca ulaĢma (Tyler), ürünü vurgulama (Stake), karar verme (Provus, Stufflebeam), naturalistik (Stake, Eisner) olarak birbirlerinden farklılık göstermektedir. Tyler’ın amaç yaklaĢımlı değerlendirme modeli diğer modellerden farklı olarak hedeflerin saptanması ile baĢlamaktadır. Hedeflerin saptanması öğrenciler, toplum ve konu uzmanlarının iĢe dâhil edilmesiyle olmaktadır. Bu açıdan baktığımızda MetfesselMichael’da ilk değerlendirme aĢamasının ilk basamağı olan “okulun katılımının sağlanması” ve Stufflebeam’deki “standartların belirlenmesi” ve “paydaĢların katılımının sağlanması” aĢamalarıyla benzerlik gösterdiği söylenebilir. Tyler’ın diğer bir basamağı olan “hedefleri sınırlandırmak” aĢaması da Metfessel-Michael’ın “amaçlar modelinin oluĢturulması” ve Provus’un “oluĢturma” aĢamaları ile benzerlik göstermektedir. Stake ise bu aĢamaları “tanıma” baĢlığı altında “niyetler ve gözlemler” ile ifade etmektedir. Metfessel-Michael’daki “amaçların uygulanabilir biçime dönüĢtürülmesi” aĢaması anlam olarak Tyler tarafından ortaya konan “hedeflerin davranıĢsal terimlerle anlatılması aĢaması” ile benzerdir. Bu aĢamalar diğer değerlendirme modellerinden farklılık göstermektedir. “Hedeflerin oluĢturulması” aĢamasından sonra Provus “süreç” aĢamasına yer vermiĢtir. Provus tarafından ortaya konan “süreç” aĢaması Eisner’da “yorumlama” aĢamasında karĢımıza çıkmaktadır. Tyler’da “ölçme tekniklerini geliĢtirmek” ya da seçmek” olarak adlandırılan aĢama, Metfessel-Michael’da “ölçme araçlarının geliĢtirilmesi”, Stake’de “gözlemler” olarak ifade edilmektedir. Kullanılan ölçme teknikleriyle elde edilen bilgiler Tyler’da “kazanım bilgisini toplamak”, Metfessel-Michael’da “davranıĢların dönemsel olarak gözlenmesi”, Stufflebeam’de ise “değerlendirme yönteminin kullanılması” aĢaması ile ortaya konulmaktadır. Değerlendirme verilerinin analizi aĢamasına geçmeden önce ara raporların hazırlanmıĢ olması CIPP modelini diğer değerlendirme modellerinden ayıran diğer bir farklılıktır. Değerlendirme aĢamasının en son basamağı tüm değerlendirme modellerinde benzerlik göstermektedir.
6
SONUÇ Sonuç olarak, öğeler ve değerlendirme aĢamaları açısından analiz edilen altı değerlendirme modelinin farklılık ve benzerliklerinin ele alındığı bu çalıĢmada, değerlendirme modellerinin eğitim programları içerisindeki önemi bir kez daha gözler önüne serilmiĢtir. Gerek amaç yaklaĢımlı gerekse bütüncül yaklaĢımlı tüm değerlendirme modellerinin amaçlarının, programın etkililiğini ortaya koymaya yönelik olduğu söylenebilir. Bununla birlikte modeller arasındaki farklılığın değerlendirmeye yönelik bakıĢ açısından ve değerlendirmede izlenen yöntemden kaynaklandığı görülmüĢtür. Ġncelenen değerlendirme modellerinin bir program değerlendirme çalıĢması için gerekli ve yeterli olduğu bununla birlikte birbirleriyle bağlantılı olarak bütünleĢtirilmiĢ bir Ģekilde de kullanılabileceği söylenebilir. Ortaya çıkan farklılık ve benzerlikler bir program değerlendirme çalıĢmasında bütüncül bir yaklaĢımla değerlendirilerek ele alınabilir. Böylece bir program hakkında daha ayrıntılı bilgilere ulaĢılmasını sağlayacak yeni bir program değerlendirme modeli geliĢtirilebilir.
7
KAYNAKLAR Alkin, M. C. ve Chrıstıe, C. A. (2004). An Evaluation Theory Tree. Evaluation Roots: Tracing Theorists’ Views and Influences. (Ed. Marvin C. Alkin). USA, CA: Sage Publications. Demirel, Ö. (2002). Kuramdan PegemA Yayıncılık.
Uygulamaya
Eğitimde
Program
GeliĢtirme.
Ankara:
Eisner, Eliot W. (1976) “Educational Connoisseurship And Criticism: Their Form and Functions in Educational Evaluation.” Journal of Aesthetic Education, nos. 3-4, 10 (July-October 1976), 135-50. Copyright 1976 Universty of Illinois Prss, Champaing, Illinois. s.335-347 Erden, M. (1998).Eğitimde Program Değerlendirme. Ankara: Anı Yayıncılık. Ertürk, S.(1998).Eğitimde Program GeliĢtirme. Ankara: Meteksan. Gözütok, F.D..(1999). “Cumhuriyet Döneminde Eğitim.” Program Değerlendirme. Yayınları.
Ankara: MEB
Guba, E.G. ve Stufflebeam, D.L. (1970). Evaluation: The Process of Stimulating, Aiding, and Abetting Insightful Action. Bloomington, Indiana: Indiana University Press. Marsh, C. ve Willis, G. (2003). Curriculum: Alternative Approaches, Ongoing Issues. New Jersey: Prentice-Hall.
USA,
Michael, W. B. ve Metfessel, N.S. (1967). “A Paradigm For Developing Valid Measurable Objectives In The Evaluation Of Educational Programs In Colleges And Universities”. Educatıonal And Psychologıcal Measurement. 27. 373- 383. Ornstein, A. C. ve Hunkins, F. P. (1988). Curriculum: Foundations, Principles and Issues. N.J.: Prentice-Hall.
USA,
Popham, J. W. (1993). Educational Evaluation (Third Edition). USA: Allyn and Bacon.net. Stake, R. E. (1967). “The Countenance of Educational Evaluation”. Teachers College Record. April. 68, 7. Stufflebeam, D.L. (2000).”The CIPP Model For Evaluation”. Evaluation Models (2nd ed.). Boston: Kluwer Academic Publishers.
USA,
The International Encyclopedia of Curriculum. (1991). Turgut, F. (1987). Eğitimde ölçme ve değerlendirme metotları. Saydam Matbaacılık (5. Basım). Ankara. Tyler, R.W. (1942). “General Statements on Evaluation”. Journal Of Educational Research. 492–501. Worthen, B. R.; Sanders, J. R. ve Fitzpatrick, J. L. (1997). Program Evaluation: Approaches and Practical Guidelines. U.S.A: Pearson Education Inc.
35,
Alternative
8