يختبر العلماء أي دواء جديد قبل الموافقة على استخدامه، وتخضع الإستراتيجيات التعليمية المرتبطة بتحسين العملية التعليمية لاختبارات مماثلة قبل تطبيقها في المؤسسات التعليمية على أرض الواقع.

وفي كثير من الأحيان، يتم رفض العديد من هذه الإستراتيجيات لأن التجارب تشير إلى أنها تؤدي إلى تقدم تعليمي ضئيل أو معدوم، وسط مخاوف من فقدان الدقة فيما يتعلق بتقييم تلك التجارب التعليمية.

لذا، أجرى فريق من الباحثين في جامعتي "كامبريدج" البريطانية و"كارنيجي ميلون" الأمريكية دراسة استهدفت "تحديد إلى أي مدى يمكن أن يؤثر عدم الدقة –سلبًا- على تقييم التجارب التعليمية".

ووفق الدراسة التي نشرتها دورية "سيكولوجيكال ميثودس" (Psychological Methods)، أجرى الباحثون محاكاة حاسوبية واسعة النطاق لأكثر من 11055 تجربةً بحثيةً لفحص مدى تأثير "الدقة" على النتائج، ويُقصد بـ"الدقة" في العلوم الاجتماعية تحديد مدى التزام الاختبارات التي تقيِّم ابتكارًا جديدًا بتصميم التجربة الأصلية التي يعتمد عليها هذا الابتكار.

تقول ميشيل إلفسون -أستاذة العلوم المعرفية بكلية التربية بجامعة كامبريدج، والباحث الرئيسي في الدراسة- في تصريحات لـ"للعلم": غالبًا ما يتم تقييم الإستراتيجيات التعليمية الجديدة بدقة في المدارس أو غيرها من الأماكن قبل طرحها، ويتم رفض العديد من الابتكارات المستحدثة لأن التجارب تشير إلى أنها تؤدي إلى تقدم تعليمي ضئيل أو معدوم، ويثير ذلك القلق من أن الخسائر الناجمة عن عدم الدقة في تقييم هذه البرامج فى بعض الحالات قد تعرض التجربة للخطر، لا سيما وأنه في كثير من الحالات، لا يتم قياس الدقة أو الإبلاغ عنها بشكل منهجي.

تضيف "إلفسون": هناك إذًا قلق متزايد من أن عددًا كبيرًا من النتائج الحقيقية للتدخلات التعليمية يمكن أن يكون راجعًا إلى الافتقار إلى الدقة فى تقييمها، مما يؤدي إلى إلغاء البرامج التي يحتمل أن تكون سليمةً بلا داعٍ.

وتتابع: يتم استثمار كثير من المال في هذه التجارب، ويجب أن ننظر عن كثب في مدى دقة تقييم تلك التجارب، ويكمن الخطر في أننا قد نقضي على إستراتيجيات واعدة بسبب عدم دقة تقييم التجارب التعلمية، مما يخلق فجوة ثقة غير ضرورية بين المعلمين والباحثين.

في التجارب التعليمية، يتم إجراء التجارب -غالبًا- بمشاركة فريق مشترك من المعلمين والباحثين، وفي الدراسات الأكبر، على وجه الخصوص، تكون هناك فرص كبيرة للقصور غير المقصود في مستوى الدقة، إما بسبب العوامل البشرية (مثل إساءة قراءة تعليمات البحث)، أو بسبب تغيُّرات في بيئة البحث (مثل تغيُّر توقيت الاختبار أو ظروفه).

طور الباحثون تجربة تحكم محوسبة عشوائية تحاكي تدخلاً وهميًّا، وذلك في 40 فصلًا دراسيًّا، كلٌّ منها يضم 25 طالبًا، وأجروا التجربة مرارًا وتكرارًا، وفي كل مرة عملوا على تعديل مجموعة من المتغيرات، من ضمنها حجم التأثير المحتمل للتدخل، ومستويات قدرة الطلاب، ودقة التجربة نفسها.

وفي النماذج اللاحقة، أضاف الباحثون عوامل أخرى يمكن أن تؤثر تأثيرًا أكبر على النتائج، مثل جودة الموارد المدرسية أو حقيقة أن المعلمين الأفضل قد يكون لديهم طلاب أفضل أداءً.

يقول الباحثون: عندما يُطلب من المعلمين تجربة طرق تدريس جديدة، فمن الطبيعي -وربما المثير للإعجاب– أن تكون لديهم رغبة في تكييف الطريقة المراد تجربتها مع احتياجات طلابهم المَعنِيين، ويجب الانتباه إلى تلك الرغبة وإلزامهم باتباع التعليمات بدقة، وإلا فلن يتمكن الباحثون من معرفة هل ستنجح التجربة وتكون فعالةً على نطاق واسع أم لا.

وردًّا على سؤال لـ"للعلم" حول إمكانية تطبيق هذه النتائج فى مجتمعات أخرى، تقول "إلفسون": نأمل أن يتم تعميم نتائج الدراسة، لكننا لم نصمم الجوانب الخاصة بمجتمع البحث على وجه التحديد؛ إذ لم نعتمد على المعلومات الديموغرافية أو الثقافية للمشاركين، وأعتقد أن الخطوة التالية قد تكون إعداد نماذج أكثر منهجيةً واهتمامًا بتلك الجوانب.