التخطى الى المحتوى الأساسى

Loading...

Background Image
  1. المقالات/

مغالطة التقييم: هل نقيس التعلم أم الذاكرة فقط؟

الناشر
الدكتورة مي قطاش
حاصلة على شهادتي دكتوراه في الفلسفة وعلم النفس وعلم النفس التربوي. تتمتع بخبرة تزيد عن عقد من الزمان في التقييمات النفسية، والتقييمات المعرفية، والتدخلات القائمة على الأدلة للعملاء العالميين.
محتوى المقال

مقدمة: مفارقة الأداء العالي
#

لنتخيل سيناريو مألوفاً للعديد من كبار القادة: مدير تمت ترقيته حديثاً، ولنسمِّه “أليكس”، تفوق في كل وحدات التطوير القيادي. أحرز “أليكس” أكثر من 95% في جميع تقييمات ما بعد الدورات التدريبية، مظهراً فهماً نموذجياً ونظرياً لحل النزاعات، والتخطيط الاستراتيجي، ونظريات التحفيز. وقد صنفه نظام إدارة التعلم في المؤسسة كموهبة عالية الإمكانات، واعتُبر قصة نجاح لبرنامج التدريب المؤسسي. ومع ذلك، وبعد ثلاثة أشهر فقط في منصبه الجديد، أصبح فريق “أليكس” فاقداً للشغف والمشاركة، وباتت المشاريع الرئيسية متعثرة، ووجد “أليكس” نفسه عاجزاً عن اتخاذ قرارات حاسمة تحت الضغط. لقد فشلت تلك “المعرفة” التي ظهرت ببراعة في التقييمات في التحول إلى أداء فعلي ومؤثر.

هذا الانفصال بين المعرفة والأداء ليس حالة شاذة؛ بل هو نتيجة متوقعة ومكلفة لخطأ معرفي منهجي متجذر في معظم برامج التطوير المؤسسي، وهو ما نطلق عليه “مغالطة التقييم”. تتمثل هذه المغالطة في الخلط الخطير بين الذاكرة (القدرة على استرجاع المعلومات) وبين التعلم (تغيير دائم في القدرة والسلوك). تستثمر المنظمات مليارات الدولارات سنوياً في التدريب، إلا أن جزءاً هائلاً من هذا الاستثمار يضيع سُدى لأن الأساليب المستخدمة للتحقق من جدواه معيبة من الأساس. إنهم يقيسون “صدى” الدرس، وليس اكتساب المهارة. ومن خلال تحسين الأنظمة لقياس الذاكرة والحفظ، تقوم المنظمات -دون قصد- بالتصميم لعدم الكفاءة، مما يخنق المرونة، والأداء المعرفي، وقدرة اتخاذ القرار التي يسعون جاهدين لبنائها.

يفكك هذا التقرير “مغالطة التقييم"، بدءاً من العلوم المعرفية الأساسية التي تميز بوضوح بين التعلم والذاكرة. ومن ثم سيحلل كيف أن أساليب التدريب والتقييم المؤسسي التقليدية غالباً ما تكون مُهندسة للفشل، متجاهلة بشكل منهجي كيفية اكتساب الدماغ البشري للمهارات والاحتفاظ بها. وعلاوة على ذلك، سيحدد التقرير التكاليف الخفية والشديدة لهذه المغالطة على نتائج الأعمال الحاسمة، حيث تؤدي إلى تآكل القدرة على التكيف، وتغذية “إرهاق اتخاذ القرار”، وتقويض المرونة القيادية. وأخيراً، سيقدم التقرير إطاراً قوياً قائماً على الأدلة للانتقال من هذا النموذج المعيب إلى نموذج للتقييم الحقيقي القائم على الأداء، راسماً مساراً واضحاً للانتقال من قياس الذاكرة إلى تنمية الإتقان.

الفجوة المعرفية: لماذا لا يقتصر التعلم على مجرد التذكر؟
#

لتفكيك “مغالطة التقييم”، يتحتم علينا أولاً استيعاب التمييز الجوهري بين التعلم والذاكرة من منظورين: معرفي وعصبي. فبرغم أنهما مرتبطان ارتباطاً عضوياً لا ينفصم، إلا أنه لا يمكن استبدال أحدهما بالآخر. ويُعد سوء الفهم هذا هو الأساس الذي شُيدت عليه استراتيجيات التقييم المعيبة.

تعريفات تأسيسية
#

يُعرف علم النفس المعرفي “التعلم” بأنه اكتساب معلومات أو سلوكيات أو قدرات جديدة من خلال الممارسة، أو الملاحظة، أو غيرها من التجارب. وبشكل جوهري، يُستدل على التعلم من خلال حدوث تغيير ملموس وقابل للإثبات في السلوك، أو المعرفة، أو وظائف الدماغ.

على المستوى العصبي، يُعد التعلم عملية تشكيل وتقوية الروابط المشبكية بين خلايا الدماغ العصبية البالغ عددها 86 مليار خلية. إنها عملية نشطة تتطلب الانتباه للمعلومات الجديدة، وتنظيمها في تمثيل ذهني متماسك، ودمجها مع المعرفة الحالية الموجودة مسبقاً.

في المقابل، تُعرف “الذاكرة” بأنها القدرة على الاحتفاظ بالمعلومات واسترجاعها، أو استحضار تمثيل لتجارب سابقة. الذاكرة هي نتيجة أو حصيلة للتعلم، لكنها ليست عملية التعلم بحد ذاتها. وبينما قد يعتبر علم الأعصاب أن التعلم هو عملية اكتساب أو تقوية المعلومات داخل الذاكرة، فإن الفرق الجوهري يكمن في التطبيق؛ فالمرء لا يكون قد تعلم شيئاً حقاً إلا عندما يتمكن من استرجاعه واستخدامه كمهارة عملية في المستقبل.

تفكيك نظام “الأرشفة” في الدماغ
#

تستمد “مغالطة التقييم” قوتها من نظرة مفرطة في التبسيط للذاكرة، حيث تعتبرها كياناً واحداً، “صمّاً”، ومتجانساً. لكن في الواقع، يستخدم الدماغ أنظمة ذاكرة متعددة ومتميزة، لكل منها وظائفها الفريدة وركائزها العصبية الخاصة. ويكشف فهم هذه الأنظمة السبب وراء استهداف معظم التقييمات المؤسسية للنظام الخطأ.

يتمثل التمييز الأساسي في الفرق بين الذاكرة العاملة (Working Memory) والذاكرة طويلة المدى (Long-term Memory). تُعد الذاكرة العاملة مساحة المعالجة الواعية في الدماغ، وهي بمثابة “منصة عمل” مؤقتة ذات سعة محدودة للغاية، حيث نحتفظ بالمعلومات الجديدة ونعالجها. إنها “عنق الزجاجة” الذي يجب أن يمر عبره كل تعلم واعٍ. في المقابل، تُعد الذاكرة طويلة المدى مستودعاً هائلاً وغير محدود تقريباً للبيانات المخزنة التي يمكن استرجاعها في المستقبل.

والأكثر أهمية بالنسبة لـ “مغالطة التقييم” هو التقسيم داخل الذاكرة طويلة المدى بين الذاكرة التصريحية (الصريحة) والذاكرة الإجرائية (الضمنية):

  • الذاكرة التصريحية (Declarative Memory): هي ذاكرة الحقائق، والمفاهيم، والأحداث التي يمكن استرجاعها بشكل واعٍ ولفظي. إنها مستودع “المعرفة بأن” (knowing that). ينقسم هذا النظام أيضاً إلى ذاكرة دلالية (المعرفة العامة، مثل عاصمة فرنسا) و ذاكرة عرضية (التجارب الشخصية، مثل ماذا تناول المرء في الإفطار). عندما تطلب برامج التدريب المؤسسي من الموظفين حفظ لائحة امتثال جديدة أو خطوات نموذج مبيعات، فإنها تستهدف نظام الذاكرة التصريحية. وصُممت التقييمات التقليدية، مثل اختبارات الاختيار من متعدد أو الإجابات القصيرة، بشكل أساسي لتحفيز استرجاع هذه المعرفة التصريحية.
  • الذاكرة الإجرائية (Procedural Memory): هي ذاكرة المهارات وكيفية أداء الأفعال، وغالباً ما يتم تنفيذها دون وعي مباشر. إنها أساس “المعرفة الكيفية” (knowing how). يُكتسب هذا النوع من الذاكرة من خلال التكرار والممارسة، وليس من خلال الحفظ البسيط للحقائق. فمهارات مثل ركوب الدراجة، أو الكتابة على لوحة المفاتيح، أو التعامل مع موقف اجتماعي معقد، كلها مشفرة ومحفوظة في الذاكرة الإجرائية.

تجلت الاستقلالية العميقة لهذين النظامين بقوة في الحالة الفارقة للمريض هنري مولايسون (المعروف اختصاراً بـ H.M.). بعد خضوعه لجراحة لعلاج الصرع، والتي استأصلت أجزاء من الفص الصدغي الأوسط، بما في ذلك “الحصين” (Hippocampus)، أصبح H.M. غير قادر على تكوين ذكريات تصريحية جديدة. لم يكن يستطيع تذكر حقائق، أو وجوه، أو أحداث جديدة لأكثر من بضع لحظات.

ومع ذلك، وبشكل لافت ومثير للدهشة، بقيت ذاكرته الإجرائية سليمة تماماً. قام الباحثون بتعليمه رسم شكل ما أثناء النظر فقط إلى انعكاسه في المرآة، وهي مهمة حركية معقدة. وفي كل يوم، كان أداء H.M. يتحسن بشكل ملحوظ، ومع ذلك لم يكن لديه أي ذكرى واعية بأنه قام بهذه المهمة من قبل على الإطلاق.

تقدم حالة H.M. دليلاً عصبياً دامغاً على أن أنظمة الدماغ المسؤولة عن “المعرفة بأن” (التصريحية) و"المعرفة الكيفية” (الإجرائية) منفصلة تماماً. هذا ليس تمييزاً أكاديمياً دقيقاً فحسب؛ بل هو مبدأ أساسي في تنظيم الدماغ.

يكمن الخطأ الجوهري في التعلم والتطوير المؤسسي في تصميم تدريب يقدم المعلومات الواقعية في المقام الأول للنظام التصريحي (مثلاً: محاضرات عن نظريات القيادة) ثم يقوم بتقييم النظام نفسه (مثلاً: اختبار قصير حول النظريات). وفي الوقت نفسه، فإن نتيجة العمل المرجوة - كقائد يدير أزمة فريقه بمهارة - تعتمد كلياً على النظام الإجرائي، الذي لم يتم تفعيله أو إشراكه بشكل كافٍ من خلال الممارسة. إنها استراتيجية تعاني من اختلال عميق في التوافق العصبي البيولوجي، وهي أشبه بتعليم شخص ما فيزياء الدراجة الهوائية، ثم إبداء الدهشة عندما يعجز عن ركوبها في سباق.

سراب التدريب المؤسسي: كيف نُهندس للنسيان
#

إن البنية الهندسية للتدريب المؤسسي التقليدي تعزز بشكل منهجي عدم التوافق العصبي البيولوجي الذي حددناه سابقاً. فبدلاً من التصميم من أجل تعلم راسخ ودائم، نجد أن معظم البرامج “مُحسّنة” - دون قصد - لتحقيق النسيان السريع. هذا الفشل ليس لغزاً؛ بل هو نتيجة متوقعة تستند إلى مبادئ راسخة في علم النفس المعرفي، والتي يتم تجاهلها بشكل روتيني في البيئات التنظيمية.

منحنى النسيان لإبنجهاوس في بيئة العمل
#

منذ أكثر من قرن، كان عالم النفس هيرمان إبنجهاوس رائداً في الدراسة العلمية للذاكرة، واكتشف مبدأً لا يزال يمثل إدانة قاسية لواقع التدريب المؤسسي الحديث: “منحنى النسيان”. أثبتت أبحاثه أنه بدون تعزيز ومراجعة، تُفقد المعلومات بمعدل أسي (متسارع). وقد أكدت الدراسات الحديثة باستمرار صحة هذه الظاهرة في السياقات المؤسسية، حيث أظهرت أن المتعلمين ينسون حوالي 50% من المعلومات الجديدة في غضون ساعة واحدة، و70% خلال 24 ساعة، ونسبة مذهلة تصل إلى 90% خلال أسبوع واحد فقط.

يُعد هذا التلاشي السريع للمعرفة وظيفة طبيعية وفعالة للدماغ، الذي يقوم بعملية “تشذيب” للمعلومات غير المعززة لإفساح المجال لما هو وثيق الصلة وذو قيمة فعلية. ولذلك، فإن نموذج ورش العمل التقليدية بنمط “المرة الواحدة وانتهى الأمر” (One-and-done)، الذي يكدس يوماً كاملاً من العروض التقديمية والمناقشات والتمارين في حدث واحد، يتعارض بشكل مباشر مع بنيتنا المعرفية. هذا النموذج يتعامل مع التعلم كـ حدث عابر وليس كـ عملية مستمرة، مما يضمن عملياً ضياع الغالبية العظمى من الاستثمار في الوقت والموارد.

علم العبء المعرفي
#

يُفسر “السبب” الكامن وراء منحنى النسيان بشكل أساسي من خلال مفهوم نظرية العبء المعرفي (Cognitive Load Theory)، التي طورها جون سويلر. تفترض النظرية أن ذاكرتنا العاملة - وهي المعالج النشط للمعلومات الجديدة في الدماغ - تمتلك سعة محدودة للغاية، حيث يمكنها التعامل مع حوالي ثلاث إلى خمس قطع جديدة من المعلومات فقط في المرة الواحدة. وعندما يتم تجاوز هذا الحد، تحدث حالة من العبء المعرفي الزائد، وتتوقف قدرة الدماغ على معالجة المعلومات بفعالية ونقلها إلى الذاكرة طويلة المدى.

تُعد دورات التدريب التقليدية، بشرائح العرض الطويلة والمكثفة بالمعلومات والمحاضرات السردية، مولدات قوية للحمل المعرفي الزائد. في بداية الجلسة، تمتلك الذاكرة العاملة للموظف سعة شاغرة، ومن المحتمل أن يتم تشفير (حفظ) المعلومات الأولية. ومع ذلك، ومع تقدم الجلسة وتشبع الذاكرة العاملة، يُتوقع فقدان أي معلومات إضافية أو الاحتفاظ بها جزئياً فقط. هذه التجربة مألوفة جداً لأي شخص شعر بأنه “احترق ذهنياً” أو “وصل لطريق مسدود” خلال يوم تدريبي طويل. هذا ليس فشلاً في الانتباه أو التحفيز من جانب المتعلم؛ بل هو استجابة عصبية متوقعة لسوء التصميم التعليمي.

العوامل الخمسة القاتلة للاحتفاظ بالمعرفة
#

يكشف تجميع هذه المبادئ عن نمط واضح للفشل المنهجي. هناك خمسة “قتلة خفيين” يقوضون باستمرار عملية الاحتفاظ بالمعرفة في بيئات التدريب المؤسسي:

  • التعلم السلبي (Passive Learning): الدماغ ليس وعاءً سلبياً للمعلومات. الأساليب مثل المحاضرات والفيديوهات الطويلة، رغم سهولة تقديمها على نطاق واسع، إلا أنها غير فعالة عصبياً. يحتفظ الدماغ بالمعلومات عن طريق فعل شيء بها، سواء كان حلاً لمشكلة، أو انخراطاً في نقاش، أو تطبيقاً لسيناريو معين. التعلم النشط يُشرك المزيد من الدوائر العصبية ويخلق آثاراً أقوى وأكثر ديمومة في الذاكرة.
  • غياب التعزيز (No Reinforcement): منحنى النسيان لا يرحم. بدون متابعة منظمة تتضمن التكرار المتباعد (إعادة زيارة المفاهيم على فترات متباعدة) والاسترجاع النشط (إجبار الدماغ على استحضار المعلومات)، فإن تلاشي المعرفة ليس مجرد خطر محتمل، بل هو حتمية مؤكدة.
  • العبء المعرفي الزائد (Cognitive Overload): من خلال تجاهل السعة المحدودة للذاكرة العاملة وحشو ساعات من المحتوى في جلسات فردية، تضمن المنظمات أن الغالبية العظمى من المعلومات المقدمة لن يتم تشفيرها (حفظها) بشكل صحيح أبداً.
  • غياب الارتباط العاطفي (Lack of Emotional Connection): العاطفة هي محفز قوي للذاكرة. إن إطلاق النواقل العصبية، مثل الدوبامين، أثناء التجارب التي تحمل معنى، أو تحدياً، أو تثير الفضول، يعزز تكوين الذاكرة بشكل كبير. التدريب الذي يُنظر إليه على أنه جاف، أو مجرد، أو غير ذي صلة يفشل في خلق هذا “الخطاف” العاطفي، مما يجعل المحتوى قابلاً للنسيان بسهولة تامة.
  • الانفصال عن العالم الواقعي (Disconnection from the Real World): يعطي الدماغ الأولوية ويحتفظ بما يمارسه ويطبقه. عندما يكون التدريب منفصلاً عن مهام الموظف اليومية ولا توجد فرصة فورية لاستخدام المعرفة الجديدة، يقوم الدماغ بتصنيفها بشكل صحيح على أنها “غير مهمة” ويتخلص منها. تُعد “فجوة التعلم والعمل” هذه سبباً رئيسياً لفقدان المعرفة.

تُنشئ هذه العيوب التصميمية حلقة مفرغة. تستثمر إحدى المنظمات في ورشة عمل سلبية مكثفة بالمعلومات، تستمر ليوم كامل. يُسبب هذا التصميم حتمًا عبئًا معرفيًا زائدًا، مما يضمن، بسبب منحنى النسيان، أن يحتفظ الموظفون بقدر ضئيل جدًا من المحتوى على المدى الطويل. لتبرير هذا الاستثمار و"إثبات" عائد الاستثمار، يُجري قسم التعلم والتطوير اختبارًا بسيطًا قائمًا على الذاكرة فور انتهاء الجلسة. في الوقت نفسه، تظل بعض الحقائق الرئيسية قابلة للوصول إليها في الذاكرة قصيرة المدى للموظفين. ينجح الموظفون، ويُسجل التدريب على أنه “ناجح”. ومع ذلك، نظرًا لعدم ترميز المعرفة أو ممارستها أو نقلها إلى نظام الذاكرة الإجرائية بعمق، فإنها لا تُطبق أبدًا في العمل وتختفي في غضون أسبوع. لا ترى المؤسسة أي تحسن ملموس في الأداء، لكنها تستمر في الاعتقاد بأن تدريبها عملي لأن التقييم الخاطئ “أثبت” ذلك. وهكذا، تُخفي مغالطة التقييم فشل تصميم التدريب، مما يُديم دورة مكلفة من الاستثمار غير الفعال والركود التنظيمي.

فخ “الاختيار من متعدد”: تقييم “التعرف” وليس الكفاءة
#

إذا كان تصميم التدريب غير الفعال هو الركن الأول لـ “مغالطة التقييم”، فإن أساليب التقييم المعيبة هي الركن الثاني. يُعد سؤال “الاختيار من متعدد” (MCQ)، وهو أداة واسعة الانتشار في التعليم الإلكتروني المؤسسي وتقييمات ما بعد ورش العمل، الأداة الأساسية لهذه المغالطة.

إن استمرار هيمنة هذا النوع من الأسئلة لا يُعزى إلى قيمته التربوية، بل إلى “السهولة الإدارية” التي يوفرها. ويأتي استخدامه بثمن باهظ يتمثل في قياس المهارات المعرفية الخاطئة، بل إنه في بعض الحالات يعمل بنشاط على تقويض عملية التعلم ذاتها.

الخلل الجوهري: “التعرف” مقابل “الاسترجاع”
#

يتمثل العيب الأكثر أهمية في أسئلة الاختيار من متعدد (MCQs) في أنها تقيّم بشكل أساسي مهارة معرفية من رتبة أدنى: وهي التعرف (Recognition). فهي تختبر قدرة المتعلم على تحديد الإجابة الصحيحة من قائمة محددة مسبقاً. يختلف هذا جوهرياً، وهو أقل تطلباً من الناحية المعرفية، عن الاسترجاع (Recall)، الذي يمثل القدرة على استحضار المعلومات من الذاكرة دون وجود تلميحات خارجية، كما هو مطلوب في الأسئلة المقالية أو ذات الإجابات القصيرة.

ونظراً لأن أسئلة الاختيار من متعدد تتطلب “التعرف” فقط، فإنها تشجع على استراتيجيات تعلم سطحية مثل “الحشو” والحفظ التلقيني. غالباً ما يتمكن المتعلم من اجتياز اختبار الاختيار من متعدد بذاكرة غامضة ومجتزأة للمادة، مستخدماً الخيارات نفسها كتلميحات أو معتمداً على أسلوب “الاستبعاد” دون الحاجة لأي فهم مفاهيمي عميق. هذا التركيز على مجرد التعرف يجعل صيغة الاختيار من متعدد غير مناسبة بشكل أساسي لتقييم المهارات المعقدة التي تحظى بأعلى قيمة في مكان العمل الحديث.

ما بعد الاسترجاع: الفشل في قياس مهارات التفكير العليا
#

يتطلب الاقتصاد الحديث مهارات تمتد إلى ما هو أبعد بكثير من مجرد الحفظ. وتُعد الكفاءات الحيوية مثل التحليل، والتركيب، والتقييم، وحل المشكلات الإبداعي ذات أهمية قصوى للتعامل مع التعقيد وقيادة الابتكار. وتعتبر أسئلة الاختيار من متعدد (MCQs) بطبيعتها غير مناسبة وقاصرة بشكل عميق عن قياس مهارات التفكير العليا هذه.

لا يمكن لأسئلة الاختيار من متعدد أن تقيس عملية التفكير النقدي بموثوقية. فهي تعجز عن تقييم كيفية تحليل القائد لمشكلة تجارية معقدة، أو كيفية تجميع موظف المبيعات لاحتياجات العملاء في حل مخصص، أو كيفية تقييم المهندس للمفاضلات المتنافسة في التصميم.

يعمل هذا الشكل من الأسئلة على اختزال الاستدلال المعقد والمتعدد الخطوات إلى نتيجة ثنائية واحدة: صحيح أو خطأ. وكما يشير أحد التحليلات، قد ينجح المتعلم في العمل خلال مشكلة معقدة بشكل صحيح تماماً، لكنه يرتكب خطأ حسابياً بسيطاً واحداً في المرحلة النهائية. في اختبار الاختيار من متعدد، سيؤدي ذلك إلى اختيار الإجابة الخاطئة والحصول على درجة صفر، مما يمحو تماماً أي دليل على فهمه المتقن -بخلاف ذلك- للعملية.

تأثير المعلومات المضللة: عندما تُلحق التقييمات الضرر بالتعلم
#

ربما يكون الخطر الأكثر دهاءً والأقل فهماً لأسئلة الاختيار من متعدد هو قدرتها على أن تكون ضارة فعلياً بعملية التعلم. يحدث هذا من خلال انحياز معرفي موثق جيداً يُعرف بـ “تأثير المعلومات المضللة” (The Misinformation Effect).

يتم بناء سؤال الاختيار من متعدد القياسي بإجابة واحدة صحيحة (المفتاح) وعدة خيارات خاطئة ولكنها تبدو معقولة ومنطقية ظاهرياً (تُعرف بـ “المشتتات”). وبالتالي، فإن تصميم السؤال بحد ذاته يُعَرِّض المتعلم عمداً لمعلومات خاطئة.

أظهرت الأبحاث في علم النفس المعرفي أن التعرض لموضوع ما يمكن أن يغير ذاكرة الشخص عنه بشكل طفيف. وقد وجدت الدراسات أن الطلاب الذين خضعوا لاختبار الاختيار من متعدد كانوا أكثر عرضة لاحقاً لتذكر “المشتتات الخاطئة” والتعامل معها كحقائق في الاختبارات اللاحقة. في هذا الضوء، لا تُعد أسئلة الاختيار من متعدد مجرد أداة قياس رديئة فحسب؛ بل هي وسيلة محتملة لـ غرس معرفة زائفة. يكون هذا التأثير السلبي شديداً بشكل خاص عند غياب التغذية الراجعة التصحيحية الفورية، وهو واقع يومي في العديد من وحدات التعليم الإلكتروني المؤسسي المؤتمتة. هنا، يتحول فعل التقييم إلى ممارسة ذات نتائج عكسية تعمل على تعزيز الخطأ.

إن استمرار هيمنة أسئلة الاختيار من متعدد، على الرغم من هذه العيوب الجسيمة، ليس نتاجاً للجهل التربوي، بل هو نتيجة للوقوع في “فخ الراحة المؤسسية”. تحتاج المنظمات إلى تقييم أعداد كبيرة من الموظفين بكفاءة وتكلفة معقولة. وتُنظَر الإدارات إلى التقييمات المفتوحة، أو المحاكاة، أو مهام الأداء على أنها مستهلكة للوقت ويصعب تصحيحها باتساق ودون تحيز.

تقدم أسئلة الاختيار من متعدد بديلاً مغرياً: فهي مؤتمتة، وقابلة للتوسع، وتنتج درجة رقمية نظيفة تخلق ما يسمى بـ “هالة من الموضوعية”. يسهل دمج هذه المخرجات الكمية في التقارير ولوحات المعلومات، مما يخلق وهماً بالقياس الصارم المستند إلى البيانات. ومع ذلك، فهو وهم خطير. تختار المنظمات طريقة التقييم بناءً على كفاءتها الإدارية بدلاً من مصداقيتها العلمية، مضحية بالبصيرة الحقيقية حول كفاءة الموظف من أجل الحصول على بيانات “سهلة الهضم” لكنها مضللة بشكل عميق.

القسم الرابع: التكاليف الخفية للتقييم القائم على الحفظ: تآكل الأداء، والمرونة، واتخاذ القرار
#

تمتد عواقب “مغالطة التقييم” إلى ما هو أبعد بكثير من مجرد هدر ميزانيات التدريب. فمن خلال إعطاء الأولوية بشكل منهجي للحفظ على حساب التطبيق، تقوم المنظمات -دون قصد- بتقويض القدرات المعرفية ذاتها التي تُعد الأكثر حيوية للنجاح في عالم يتسم بالتعقيد، والتقلب، وعدم اليقين.

يستكشف هذا القسم التكاليف الخفية لهذه المغالطة وتأثيرها على ثلاث ركائز أساسية لثقافة الأداء العالي: القدرة على التكيف، واتخاذ القرار، والمرونة القيادية.

كبح جماح القدرة على التكيف والتفكير النقدي
#

تحفز التقييمات القائمة على الذاكرة بشكل طبيعي “التعلم التلقيني” (Rote Learning)، وهي طريقة تتضمن تكرار المعلومات حتى تترسخ في الذاكرة، وغالباً ما يتم ذلك دون فهم عميق للمفاهيم الأساسية الكامنة وراءها. وفي حين أن التعلم التلقيني قد يكون مفيداً في تأسيس المعرفة الأولية، مثل حفظ إجراءات السلامة أو جداول الضرب، إلا أنه يصبح ضاراً عندما يتحول إلى النمط الأساسي لتعلم المهارات المعقدة.

يتمثل الخطر الرئيسي للاعتماد المفرط على التعلم التلقيني في أنه ينتج معرفة سطحية ومجتزأة. قد يكون الموظفون قادرين على ترديد الحقائق، والتعريفات، وخطوات العمليات، لكنهم يعجزون عن نقل هذه المعرفة أو تطبيقها في مواقف جديدة أو غامضة تختلف عن الأمثلة النظرية التي درسوها.

يخلق هذا الوضع قوى عاملة بارعة في اتباع النصوص والإجراءات الحرفية، لكنها “هشة” وغير فعالة عند مواجهة تعقيدات العالم الحقيقي. فهم لا يملكون القدرة على تحليل الأسباب والعواقب وراء الأحداث، أو تشريح القضايا المعقدة، أو بناء حجج متماسكة، وهي السمات المميزة للتفكير النقدي. إن هذا النهج يقمع الفضول الفكري بشكل نشط ويعزز حالة من “الجمود المعرفي” التي تتعارض بشكل جوهري مع متطلبات الاقتصاد الحديث الذي يحتاج إلى مفكرين مبدعين وقادرين على التكيف.

تغذية “إرهاق اتخاذ القرار”
#

تُعد “مغالطة التقييم” مساهماً رئيسياً -وغالباً ما يتم تجاهله- في ظاهرة إرهاق اتخاذ القرار (Decision Fatigue)، وهو التدهور الذي يطرأ على جودة القرارات بعد جلسة مطولة من صنع القرار. تعمل هذه العلاقة من خلال آليتين متميزتين:

أولاً: يُعد التدريب غير الفعال الذي يسبق التقييمات القائمة على الذاكرة سبباً مباشراً لـ العبء المعرفي الزائد الذي يستنزف الوظائف التنفيذية (Executive Functions). عندما تغمر المعلوماتُ الكثيفة وسيئة التصميم الذاكرةَ العاملة للموظف باستمرار، تُستنفد موارده الذهنية حتى قبل أن يبدأ يوم عمله الفعلي. يضعف هذا الاستنزاف القدرة على الحكم السليم ويؤدي إلى مجموعة من السلوكيات الوظيفية المختلة: زيادة الاندفاعية، والميل لتجنب اتخاذ الخيارات تماماً، أو اللجوء الافتراضي إلى الخيار الأسهل بدلاً من الخيار الأفضل.

ثانياً: يمكن لعملية التقييم نفسها أن تكون مصدراً لـ الإجهاد المعرفي. فالاختبارات عالية المخاطر التي تتطلب حفظاً واسترجاعاً مكثفاً هي مهام شاقة معرفياً تستهلك طاقة ذهنية كبيرة. ويصدق هذا بشكل خاص في البيئات التي يكون فيها الاختبار المتكرر ضرورياً للامتثال أو الاعتماد المهني. يؤدي الأثر التراكمي لهذا الإرهاق الناجم عن التقييم إلى المزيد من استنزاف الاحتياطيات المعرفية الضرورية لاتخاذ قرارات مدروسة وسليمة في الأدوار التشغيلية ذات الضغوط العالية.

تقويض المرونة القيادية
#

المرونة القيادية هي القدرة على الحفاظ على الطاقة تحت الضغط، والتكيف بفعالية مع التغيير، والحفاظ على التفاؤل في مواجهة النكسات. وهي ليست سمة فطرية بل قدرة مكتسبة، تُصقل من خلال التعرض لتعقيدات العالم الحقيقي وغموضه والتعامل معها.

التقييمات التقليدية القائمة على الذاكرة عاجزة جوهرياً عن قياس أو تعزيز هذه الكفاءة القيادية الحاسمة. فهي، بحكم تصميمها، تعمل في “عالم من اليقين”، بإجابات قاطعة ومحددة مسبقاً (صحيح أو خطأ). وهذا هو نقيض البيئة التي يجب أن يعمل فيها القادة، والتي تتسم بمعلومات غير مكتملة، وأولويات متضاربة، ومفاضلات عالية المخاطر. تفشل هذه التقييمات في قياس المكونات الأساسية للمرونة -وبالتالي تفشل في تحفيز تطويرها- وهي: التنظيم الذاتي العاطفي، وحل المشكلات تحت الضغط، والقدرة على إصدار أحكام سليمة في ظروف غير مؤكدة.

علاوة على ذلك، تعتمد العديد من الأدوات المصممة لقياس المرونة على استبيانات التقرير الذاتي، والتي تشتهر بأنها عرضة للتحيز والافتقار إلى الوعي الذاتي. يتطلب التقييم الأكثر موضوعية وصلاحية للمرونة مراقبة سلوك القائد في مواقف الضغط العالي، وهو بالضبط ما صُممت التقييمات القائمة على الأداء (مثل المحاكاة) للقيام به.

لا توجد هذه التكاليف الفردية بمعزل عن غيرها؛ بل تُسهم في دوامة سلبية من الكفاءة يمكن أن تؤدي إلى تآكل قدرة المنظمة بمرور الوقت. تبدأ العملية عندما يشجع اعتماد المنظمة على التقييمات القائمة على الذاكرة “التعلم التلقيني”، مما يخنق التفكير النقدي والقدرة على التكيف. ينتج هذا النهج موظفين بارعين في اجتياز الاختبارات لكنهم غير متمرسين في حل مشكلات العالم الحقيقي، مما يجعلهم أكثر عرضة لـ “إرهاق اتخاذ القرار”.

ولأن هذه التقييمات لا تستطيع قياس المرونة، فإن هذه القدرة الحاسمة لا يتم تطويرها ولا تحديدها. ومن ثم يتم منح الترقيات، جزئياً على الأقل، بناءً على هذه المقاييس المعيبة لـ “المعرفة”. وهكذا يتم خلق جيل جديد من القادة الذين يعانون من “هشاشة معرفية” (Cognitively Brittle)، وغير مجهزين للتعامل مع الغموض، وعرضة لاتخاذ قرارات سيئة تحت الضغط.

وعندما يُكلف هؤلاء القادة غير المرنين بتطوير فرقهم الخاصة، فإنهم يميلون بشكل طبيعي نحو المقاييس البسيطة و"الموضوعية" لأنظمة الذاكرة التي شكلتهم، حيث يقلل ذلك من حملهم المعرفي الخاص ويوفر شعوراً مريحاً -وإن كان زائفاً- بالسيطرة. تتكرر هذه الدورة، مما يؤدي إلى ترسيخ “مغالطة التقييم” بشكل أعمق في الثقافة التنظيمية، والعمل بشكل منهجي على تآكل الأداء المعرفي، والمرونة، وقدرة اتخاذ القرار للقوى العاملة بأكملها.

مسار الكفاءة الحقيقية: تبني التقييم القائم على الأداء
#

يتطلب الإفلات من “مغالطة التقييم” تحولاً جوهرياً في النموذج الفكري: الانتقال من قياس ما يعرفه الموظفون إلى تقييم ما يمكنهم فعله.

يستمد هذا التحول قوته من منهجيات التقييم القائم على الأداء التي تمنح الأولوية لتطبيق المعرفة، وإظهار المهارات، وعمليات الاستدلال المنطقي ضمن سياقات واقعية. ومن بين أقوى الأساليب في هذا النموذج: التقييم القائم على السيناريو والتقييم الواقعي.

من النظرية إلى التطبيق: التقييم القائم على السيناريو (SBA)
#

يُعد التقييم القائم على السيناريو (SBA) استراتيجية للتعلم والتقييم النشط، تعمل على “غمر” المتعلمين في مواقف تفاعلية وواقعية تدفعهم لحل المشكلات والتفكير النقدي. فبدلاً من مطالبة المتعلم بتذكر “الخطوات الخمس” للتعامل مع شكوى العميل، يضعه التقييم القائم على السيناريو في تفاعل مُحاكى مع عميل غاضب ويطلب منه إدارة المحادثة وتوجيه دفتها. يخلق هذا النهج بيئة آمنة لممارسة المهارات، واتخاذ القرارات، وتجربة العواقب، والتعلم من الأخطاء دون التعرض لمخاطر الفشل في العالم الحقيقي.

إن تصميم السيناريوهات العملية هو عملية مدروسة ومقصودة. تبدأ بتحديد أهداف تعليمية واضحة والكفاءات المحددة المراد تقييمها. يجب أن تستند السيناريوهات إلى تحديات عمل حقيقية (أصيلة) لضمان الملاءمة والمشاركة.

السيناريوهات الأكثر قوة وتأثيراً ليست خطية، بل “متشعبة” (Branching)، حيث تقدم للمتعلمين خيارات تؤدي إلى عواقب واقعية وذات مغزى، مما يكشف عن عملية اتخاذ القرار لديهم. وبشكل حاسم، يجب أن توفر هذه السيناريوهات تغذية راجعة فورية وقابلة للتنفيذ تشرح نتائج كل خيار، مما يعزز الإجراءات الصحيحة ويصحح الأخطاء في اللحظة نفسها.

إن التطبيقات في السياق المؤسسي واسعة النطاق وشديدة التأثير:

  • التدريب القيادي (Leadership Training): يمكن وضع مدير جديد أمام سيناريو يتضمن نزاعاً بين عضوين من ذوي الأداء العالي في الفريق. ستقوم خياراته في كيفية التوسط في النزاع بتقييم مهاراته في التواصل، والتعاطف، وحل المشكلات بفعالية تفوق بكثير مجرد اختبار نظري حول “نظريات حل النزاعات”.
  • تدريب المبيعات (Sales Training): يمكن لموظف المبيعات الانخراط في مفاوضات مُحاكاة مع “عميل” افتراضي مدعوم بالذكاء الاصطناعي يطرح اعتراضات شائعة. سيقيس التقييم قدرته على تطبيق المعرفة بالمنتج، والتعامل مع الاعتراضات بذكاء، وتوجيه المحادثة نحو إتمام الصفقة (Closing).
  • تدريب الامتثال والسلامة (Compliance and Safety Training): يمكن للموظف التعامل مع سيناريو يتضمن انتهاكاً أخلاقياً محتملاً أو انسكاباً لمواد خطرة، مما يتطلب منه اتباع الإجراءات الصحيحة تحت ضغط مُحاكى. وهذا يُقيِّم قدرته على التصرف الصحيح فعلياً، وليس مجرد قدرته على استرجاع القواعد نظرياً.

بناء “محفظة الإثبات”: قوة التقييم الواقعي

يأخذ التقييم الواقعي (Authentic Assessment) مبدأ الواقعية خطوة إضافية إلى الأمام، حيث يتطلب من المتعلمين إنجاز مهام معقدة لا يكاد يمكن تمييزها عن مسؤوليات الوظيفة الفعلية. وتستند معايير التقييم هنا إلى معايير الممارسة المهنية، مما يضمن أن النجاح في التقييم يترجم بشكل مباشر إلى فعالية في الوظيفة.

وبدلاً من الاعتماد على اختبار واحد، يبني التقييم الواقعي “محفظة من الأدلة” عبر مصادر متنوعة. ومن الأمثلة على ذلك في البيئة المؤسسية:

  • المراجعات القائمة على المشاريع (Project-Based Reviews): بدلاً من اختبار نظري حول إدارة المشاريع، يُكلف الموظف بقيادة مشروع صغير في العالم الحقيقي. لا يُقيِّم هذا التقييم النتائج النهائية فحسب، بل يُقيِّم العملية أيضاً، بما في ذلك وثائق التخطيط، ومراسلات أصحاب المصلحة، واستراتيجيات تخفيف المخاطر، وجلسة مراجعة تأملية حول الدروس المستفادة.
  • المحاكاة (Simulations): بالنسبة للأدوار عالية المخاطر، توفر المحاكاة المعقدة الشكل الأكثر متانة وقوة للتقييم. قد يشمل ذلك طياراً يدير عطلاً في المحرك داخل جهاز محاكاة الطيران، أو متداولاً مالياً يتعامل مع سوق متقلب، أو فريقاً جراحياً يجري عملية على دمية طبية عالية الدقة.
  • محافظ العمل (Work Portfolios): يقوم الموظفون بتجميع وتنظيم مجموعة من نتاجات عملهم الفعلية بمرور الوقت. سواء كانت محفظة لمصمم جرافيك، أو مستودع أكواد برمجية لمطور برمجيات على “GitHub”، أو مجموعة من مقترحات العملاء ودراسات الحالة لمستشار، فإن هذه المحافظ تقدم أدلة ملموسة لا تقبل الجدل على قدراتهم.
  • تغذية راجعة 360 درجة (360-Degree Feedback): يوفر دمج التغذية الراجعة المنظمة من المديرين، والزملاء، والمرؤوسين المباشرين حول السلوكيات القابلة للملاحظة نظرة شمولية ومتعددة الجوانب لكفاءة الفرد. وهذا مفيد بشكل خاص في مجالات مثل التعاون والقيادة، التي يصعب تقييمها من خلال الوسائل الأخرى.

يمكن تلخيص الفروقات الأساسية بين النموذج القائم على الذاكرة والنموذج القائم على الأداء فيما يلي:

المعيار / الخاصية النموذج القائم على الذاكرة (المغالطة) النموذج القائم على الأداء (الحل)
الهدف الأساسي استرجاع المعلومات والتعرف عليها تطبيق المهارات وحل المشكلات
المهارة المعرفية المقاسة مهارات دنيا (الحفظ والتذكر) مهارات عليا (التحليل، التركيب، التقييم)
دور المتعلم متلقٍ سلبي مشارك نشط وصانع قرار
سياق التقييم مجرد ومنزوع السياق (مثل الأسئلة متعددة الخيارات) واقعي وضمن سياق العمل (مثل المحاكاة)
نقل المعرفة للواقع منخفض / هش مرتفع / قابل للتكيف
الأثر على إرهاق اتخاذ القرار يساهم في زيادة الحمل المعرفي والإرهاق يبني القدرة على اتخاذ القرار والمرونة
تركيز التغذية الراجعة صحة أو خطأ الإجابة (تقييم ختامي) العملية والنتيجة (تقييم تكويني وتطويري)

لا يُعد هذا الجدول مجرد ملخص فحسب؛ بل هو أداة تشخيصية. إنه يبلور الحجة المركزية لـ “مغالطة التقييم”، ويوفر إطاراً عملياً للقادة والمستشارين لتدقيق ممارسات التعلم والتطوير في مؤسساتهم، وتحديد موقعهم بدقة على الطيف الممتد من “قياس الذاكرة” إلى “تنمية الكفاءة الحقيقية”.

القوى العاملة الجاهزة للمستقبل: تسخير التكنولوجيا لتقييم أعمق
#

تاريخياً، كان الاعتراض الرئيسي على التبني الواسع للتقييم القائم على الأداء يتعلق بمسألة التكلفة وقابلية التوسع (Scalability).

فقد كان يُنظر إلى عمليات إنشاء، وإدارة، وتقييم المحاكاة المعقدة أو المراجعات القائمة على المشاريع لآلاف الموظفين على أنها تستهلك موارد هائلة بشكل يعوق تنفيذها، وذلك مقارنةً بالسهولة البالغة لنشر اختبار بسيط من نوع “الاختيار من متعدد”.

ومع ذلك، فإن التطورات المتسارعة في التكنولوجيا، وخاصة في مجال الذكاء الاصطناعي (AI)، تعمل الآن على تفكيك هذا العائق، مما يجعل التقييم المتين والواقعي ليس ممكناً وعملياً فحسب، بل أكثر فاعلية من أي وقت مضى.

توليد وتحليل التقييمات المدعوم بالذكاء الاصطناعي
#

يتطور دور التكنولوجيا من مجرد أداة لرفع الكفاءة في تقديم محتوى ثابت، إلى محرك ديناميكي لخلق وتقييم الأداء المعقد. لم يعد الذكاء الاصطناعي مقتصراً على المهمة البسيطة المتمثلة في إنشاء أسئلة الاختيار من متعدد؛ فأنظمة الذكاء الاصطناعي الحديثة قادرة الآن على:

  • إنشاء سيناريوهات ديناميكية (Create Dynamic Scenarios): يمكن للذكاء الاصطناعي التوليدي (Generative AI) تطوير سيناريوهات معقدة ومتشعبة، ومحاكاة مصممة خصيصاً لأدوار وصناعات وفجوات مهارية فردية محددة. يمكن لهذه السيناريوهات التكيف في الوقت الفعلي (Real-time) بناءً على قرارات المتعلم، مما يخلق تجربة تقييم شخصية حقاً ومليئة بالتحدي.
  • تحليل الأداء المعقد (Analyze Complex Performance): تتزايد قدرة الذكاء الاصطناعي على تحليل البيانات غير المهيكلة (Unstructured data) التي كانت سابقاً حكراً على المقيمين البشريين. فهو قادر على تقييم جودة الإجابات الكتابية المفتوحة، وتقييم المنطق في الأكواد البرمجية، وحتى تحليل المشاعر، والنبرة، واختيار الكلمات في النصوص المفرغة لتمارين لعب الأدوار. يسمح هذا بتقديم تغذية راجعة دقيقة وقابلة للتوسع حول “المهارات الناعمة” التي تُعد الأكثر أهمية للنجاح.

مسارات التعلم والتقييم المخصصة
#

يُحيل دمج الذكاء الاصطناعي التقييم من حدث ختامي(Summative) يتم لمرة واحدة، إلى عملية تكوينية (Formative) مستمرة ومدمجة في صلب سير العمل.

يمكن لمنصات تجربة التعلم (LXPs) المدعومة بالذكاء الاصطناعي تحليل تدفق مستمر من بيانات الأداء -بدءاً من نتائج المشاريع، وأنماط الاتصال، وصولاً إلى نتائج المحاكاة- لتحديد فجوات الكفاءة الخاصة بكل فرد بدقة.

وبناءً على هذا التشخيص، يمكن للنظام التوصية بوحدات تعلم مصغر (Micro-learning) مخصصة، أو ربط الموظف بموجه (Mentor)، أو حتى اقتراح مهام عمل داخلية قصيرة (Gig assignments) مصممة لتوفير الممارسة الدقيقة المطلوبة لسد تلك الفجوة. وبهذا، يصبح التقييم والتعلم دورة سلسة ومتكيفة، مما ينقل المنظمة نحو ثقافة التحسين المستمر.

ظهور المؤهلات الرقمية ومحافظ المهارات
#

وأخيراً، توفر التكنولوجيا بنية تحتية جديدة للتعرف على المهارات والتحقق من صحتها. فبدلاً من كشف الدرجات التقليدي الذي يسرد مجرد “إتمام الدورة”، يمكن للمنظمات الآن إصدار اعتمادات رقمية قابلة للتحقق (Verifiable Digital Credentials)، تُعرف أيضاً بـ “الشارات” (Badges)، وذلك عند الإثبات الناجح لمهارات محددة ضمن تقييم أصيل.

يمكن تجميع هذه الاعتمادات في “محفظة مهارات” (Skills Wallet)، مما يخلق سجلاً غنياً، وقابلاً للنقل، ومفصلاً لقدرات الموظف الحقيقية. يوفر هذا صورة أكثر دقة وتفصيلاً لمخزون المواهب الجماعي في المنظمة، مما يتيح تخطيطاً أكثر استراتيجية للقوى العاملة ويسهل الحراك الوظيفي الداخلي.

تأتي هذه النقلة التكنولوجية في “نقطة انعطاف استراتيجية” حرجة. فنفس تقنيات الذكاء الاصطناعي والأتمتة التي تتيح إجراء تقييمات أعمق، تقوم أيضاً بإعادة تشكيل طبيعة العمل بشكل جوهري. تشير تقارير من مؤسسات كبرى مثل (McKinsey) و(Goldman Sachs) إلى أن الذكاء الاصطناعي قد يؤتمت مهاماً تعادل مئات الملايين من الوظائف بدوام كامل، لا سيما تلك التي تنطوي على عمل معرفي روتيني.

وبناءً على ذلك، فإن المهارات البشرية الدائمة وعالية القيمة في هذا الاقتصاد الجديد ستكون بالضبط تلك المهارات التي تعجز التقييمات القائمة على الذاكرة عن قياسها: التفكير النقدي، وحل المشكلات المعقدة، والإبداع، والتعاون، والقدرة على التكيف.

إن المنظمة التي تستمر في الاستثمار في قواها العاملة والتحقق من كفاءتها عبر عدسة “مغالطة التقييم”، تقوم -في الواقع- بتحسين مواهبها لتناسب واقعاً اقتصادياً عفا عليه الزمن. فهي تقيس وتكافئ مهارات تتضاءل قيمتها بسرعة هائلة.

في هذا السياق، لم يعد التحول إلى التقييم الواقعي القائم على الأداء مجرد “ممارسة فضلى” لتحسين العائد على الاستثمار في التدريب؛ بل هو “حتمية استراتيجية” عاجلة وغير قابلة للتفاوض من أجل تحصين القوى العاملة للمستقبل (Future-proofing)، وضمان بقاء المنظمة واستمرار أهميتها في عالم غيّر الذكاء الاصطناعي ملامحه بالكامل.

خاتمة: من قياس الذاكرة إلى تنمية الإتقان
#

تُعد “مغالطة التقييم” خطأً معرفياً واسع الانتشار ومتجذراً بعمق في عالم التطوير المؤسسي. إنها نابعة من سوء فهم جوهري لكيفية تعلم الدماغ البشري، ويتم تكريسها عبر تصاميم تدريبية تمنح الأولوية للسهولة على حساب العلم المعرفي، وتكتسب شرعيتها من أدوات تقييم تقيس “ظل” المعرفة بدلاً من “جوهر” الكفاءة. العواقب وخيمة: قوى عاملة أقل قدرة على التكيف، وقادة أقل مرونة، ومنظمة أكثر عرضة للآثار المُدمّرة لـ “إرهاق اتخاذ القرار”. إن دورة الاستثمار في تدريب مُصمَّم للنسيان، ثم “إثبات” قيمته باختبارات تقيس الشيء الخطأ، هي عبارة عن سراب بمليارات الدولارات يترك المنظمات في حالة ركود وانكشاف.

يتطلب الإفلات من هذه المغالطة فعلاً قيادياً استراتيجياً. إنه يتطلب تجاوز “وهم اليقين” المغري الذي توفره الدرجات الرقمية البسيطة، واحتضان التعقيد المتأصل في القدرة البشرية الحقيقية. يكمن الطريق إلى الأمام في تبني التقييمات القائمة على الأداء والتقييمات الواقعية -مثل المحاكاة، والتقييمات القائمة على المشاريع، وتحديات العالم الحقيقي- التي تقيس ما يهم حقاً: القدرة على تطبيق المعرفة، واتخاذ أحكام سليمة تحت الضغط، وحل المشكلات الجديدة.

لقد قضت التكنولوجيا، وخاصة الذكاء الاصطناعي، على العذر الأخير المتعلق بقابلية التوسع، حيث وفرت الأدوات اللازمة لنشر هذه التقييمات المتطورة بكفاءة وعلى نطاق واسع. لم يعد الخيار بين التقييم العملي والتقييم الفعال؛ بل أصبح الخيار بين التمسك بنموذج فاشل أو بناء قوى عاملة جاهزة للمستقبل.

لا ينبغي أن يكون الهدف النهائي للتطوير التنظيمي هو تخريج موظفين قادرين على اجتياز اختبار؛ بل يجب أن يكون تنمية موظفين قادرين على التفوق في أدوارهم. يجب أن يكون الهدف هو تطوير ثقافة مرنة، ومتكيفة، وعالية الأداء قادرة على الازدهار في عصر التغيير غير المسبوق. وتلك الرحلة لا تبدأ بما نُعَلِّمه، بل بما نختار أن نقيسه.

المراجع
#

  • Brown, P. C., Roediger, H. L. III, & McDaniel, M. A. (2014). Make it stick: The science of successful learning. The Belknap Press of Harvard University Press.
  • Karpicke, J. D., & Blunt, J. R. (2011). Retrieval practice produces more learning than elaborative studying with concept mapping. Science (New York, N.Y.), 331(6018), 772-775.
  • Squire, L. R., & Dede, A. J. (2015). Conscious and unconscious memory systems. Cold Spring Harbor perspectives in biology, 7(3), a021667.
  • Eichenbaum H. (2017). Memory: Organization and Control. Annual review of psychology, 68, 19-45.
  • Sweller, John & Ayres, Paul & Kalyuga, Slava. (2011). Cognitive Load Theory. 10.1007/978-1-4419-8126-4.
  • Cepeda, N. J., Vul, E., Rohrer, D., Wixted, J. T., & Pashler, H. (2008). Spacing effects in learning: a temporal ridgeline of optimal retention. Psychological Science, 19(11), 1095-1102.
  • Bjork, R. A., & Bjork, E. L. (2020). Desirable difficulties in theory and practice. Journal of Applied Research in Memory and Cognition, 9(4), 475-479.
  • Moreno, Roxana & Park, Babette. (2010). Cognitive Load Theory: Historical Development and Relation to Other Theories. 10.1017/CBO9780511844744.003.
  • Sitzmann, T., & Weinhardt, J. M. (2018). Training engagement theory: A multilevel perspective on the effectiveness of work-related training. Journal of Management, 44(2), 732-756.
  • Lilienfeld, Scott & Thames, April. (2009). Correcting Fallacies About Educational and Psychological Testing. Archives of Clinical Neuropsychology - ARCH CLIN NEUROPSYCH. 24. 10.1093/arclin/acp051.
  • Roediger, H. L. III, & Marsh, E. J. (2005). The Positive and Negative Consequences of Multiple-Choice Testing. Journal of Experimental Psychology: Learning, Memory, and Cognition, 31(5), 1155-1159.
  • Butler, Andrew. (2018). Multiple-Choice Testing in Education: Are the Best Practices for Assessment Also Good for Learning? Journal of Applied Research in Memory and Cognition. 7. 323-331. 10.1016/j.jarmac.2018.07.002.
  • Collins, Jannette. (2007). Guidelines for Writing Good Multiple-Choice Questions.
  • Gierl, M. J., Lai, H., & Turner, S. R. (2012). Using automatic item generation to create multiple-choice test items. Medical education, 46(8), 757-765.
  • Sutton, Geoffrey. (2015). WILLPOWER: Rediscovering the Greatest Human Strength. Journal of Psychology and Christianity. 34. 189-190.
  • Danziger, S., & Levav, J. (2011). Extraneous factors in judicial decisions. Proceedings of the National Academy of Sciences, 108(17), 6889-6892.
  • Allen, P. M., Edwards, J. A., Snyder, F. J., Makinson, K. A., & Hamby, D. M. (2014). The effect of cognitive load on decision making with graphically displayed uncertainty information. Risk analysis: an official publication of the Society for Risk Analysis, 34(8), 1495-1505.
  • Southwick, Frederick & Martini, Brenda & Charney, Dennis & Southwick, Steven. (2017). Leadership and Resilience. 10.1007/978-3-319-31036-7_18.
  • Koh, K. (2017, February 27). Authentic Assessment. Oxford Research Encyclopedia of Education.
  • Palm, T. (2008). “Performance Assessment and Authentic Assessment: A Conceptual Analysis of the Literature”, Practical Assessment, Research, and Evaluation 13(1): 4.
  • Shavelson, R.J., Zlatkin‐Troitschanskaia, O., & Mariño, J.P. (2018). International Performance Assessment of Learning in Higher Education (iPAL): Research and Development.
  • Mislevy, R. J., & Haertel, G. (2007). Implications of Evidence‐Centered Design for Educational Testing. Educational Measurement: Issues and Practice, 25(4), 6-20.
  • Greenstein, L. M. (2012). Assessing 21st Century Skills: A Guide to Evaluating Mastery and Authentic Learning. Corwin Press.
  • Chang, C., Kuo, C., & Chang, Y. (2018). An Assessment Tool Predicts Learning Effectiveness for Project-Based Learning in Enhancing Education of Sustainability. Sustainability, 10(10), 3595.
  • Banihashem, S. K., Noroozi, O., Van Ginkel, S., Macfadyen, L. P., & Biemans, H. J. (2022). A systematic review of the role of learning analytics in enhancing feedback practices in higher education. Educational Research Review, 37, 100489.
  • West, D. M. (2018). The Future of Work: Robots, AI, and Automation. Brookings Institution Press.
  • Marín, V. I., Bond, M., & Gouverneur, F. (2019). Systematic review of research on artificial intelligence applications in higher education - where are the educators? International Journal of Educational Technology in Higher Education, 16(1), 39.
  • Oliver, B. (2019). Making Micro-Credentials Work for Learners, Employers and Providers.
  • Kaplan, A., & Haenlein, M. (2018). Siri, Siri, in my hand: Who’s the fairest in the land? On the interpretations, illustrations, and implications of artificial intelligence. Business Horizons, 62(1), 15-25. https://doi.org/10.1016/j.bushor.2018.08.004
  • Sabtıawan, W. B., Yuanıta, L., & Rahayu, Y. S. (2024). Effectiveness of authentic assessment: Performances, attitudes, and prohibitive factors. Journal of Turkish Science Education, 16(2), 156-175.
  • Gulikers, J.T.M., Bastiaens, T.J. & Kirschner, P.A. A five-dimensional framework for authentic assessment. ETR&D 52, 67-86 (2004).

Related

دور "هندسة الاختيار" في عصر "إرهاق اتخاذ القرار"
أثر العبء المعرفي على كفاءة اتخاذ القرار
دور تحليل السلوك التطبيقي في البيئات التعليمية