أدى استخدام أدوات التعلم عبر الإنترنت والبرامج القائمة على التفاعل بصورة متزايدة في مجال التعليم إلى زيادة حجم البيانات، فأصبح من الصعب تحليل واستخدام تلك البيانات الضخمة لتحسين الفعالية التعليمية ودعم البحوث الأساسية بشأن التعلم.
أدى هذا إلى ضرورة الحاجة إلى استحداث طرق جديدة وفعالة لتحليل هذا الكم الهائل من المعلومات والاستفادة منها في تحسين العملية التعليمية وتطوير الأبحاث في مجال التعليم، وهو ما يعرف بعلم المعلومات (Data science). و يعرف هذا العلم بأنه استخراج المعرفة من كميات كبيرة من البيانات كانت منظمة أو غير منظمة، و يعتبر تمديدا لمجال تنقيب البيانات (Data mining) و التحليلات التنبؤية (Predictive analytics).
و يدخل في نطاق “البيانات غير المنظمة” أنواع مختلفة من البيانات مثل رسائل البريد الإلكتروني والفيديو والصور و المحتوى الخاص بوسائل التواصل الاجتماعي، وغيرها من المحتويات الإعلامية المنتجة من قبل المستخدمين. وغالبا ما يتطلب علم البيانات فرز كمية كبيرة من المعلومات وكتابة خوارزميات لاستخراج أفكار و رؤى منها قد تقدم خدمات جديدة في ميادين شتى (ويكبيديا،2016م).
وتوجد مجموعة من الجمعيات والمؤسسات التي تهتم بتحليل البيانات التعليمية الضخمة منها: جمعية البيانات التعليمية الدولية: والتي قامت بمجموعة من الأنشطة منها: ورشة عمل سنة 2005م، المؤتمر الأول: أقيم في عام 2008م،نشر مجلة متخصصة في الميدان عام 2009م.
وهناك أيضا مجتمع بحوث تحليل التعلم الذي نظم المؤتمر الأول له عام 2011م، وأسس مجلة تحليل التعلم عام 2012م.
ويعرف معهد ماكينزي العالمي البيانات الضخمة بأنها: “مجموعة البيانات التي تفوق حجم أو قدرة أدوات قواعد البيانات التقليدية من التقاط، وتخزين، وإدارة وتحليل تلك البيانات”.
ولك أن تتخيل إحدى برمجيات التعليم على الإنترنت التي سجلت 250 ألف ساعة استخدام من قبل الطلاب في وقت قصير، وأن حوالي 30 مليون طالب يرتاد موقع هذه البرمجية خلال فترات متفاوتة من السنة، وما ينتج عن ذلك من بيانات حول العمليات والتفاعلات التي تحدث في هذا الموقع، والنصوص والوسائط التي يتم تداولها… كل هذه البيانات تشكل تحديا كبيرا للمختصين لجمعها، وتحليلها، وقراءتها بشكل جيد، واستخراج النتائج منها.
وتتميز هذه المعلومات الكبيرة بمستويات إنتاجها وتداولها الكبير وفي وقت قصير وسريع، وأن هذه البيانات تأتي من مصادر وأشكال مختلفة ومتنوعة، وأن درجة مصداقية هذه البيانات تختلف بشكل أو بآخر، مما يجعل تحليل هذه البيانات الضخمة يحتاج إلى التحكم في كيفية استخدام الطرق الرئيسية لاستخراج البيانات التعليمية وتحليل التعلمات الموجودة في هذه البيانات، والأساليب التي يجري تطويرها من قبل الباحثين في استخراج البيانات التعليمية وتفحصها من خلال تحليل التعلم، والتعلم على نطاق واسع، والنمذجة، ومجتمعات الذكاء الاصطناعي، وتعلم كيفية تطبيق هذه الأساليب ومتى يتم تطبيقها، فضلا عن نقاط القوة والضعف للتطبيقات والبرمجيات المختلفة التي تساعد على تحليل البيانات الكبيرة.
وتختلف نوعية البيانات الكبيرة التي يمكن جمعها من بيئات التعلم، فهناك بيانات كبيرة عن المتعلمين، وخبرات التعلم لدى المتعلمين، وبيانات متعمقة داخل بيئات التعلم، والتفاعلات الاجتماعية في بيئات التعلم، وبيانات مفصلة عن أنشطة التعلم من نصوص ووسائط ومقاطع فيديو، وتختلف هذه البيانات في نوعيتها وعمقها.
ويوجد العديد من الأدوات والتقنيات التي تستخدم لتحليل البيانات الكبيرة مثل: Hadoop ،MapReduce ،GridGain ،HPCC ،Storm ،Cassandr إلا أن Hadoop يعد من أشهر هذه الأدوات، و “هادوب” هو برنامج أو منصة برمجية مفتوحة المصدر مكتوبة بلغة الجافا لتخزين ومعالجة البيانات الضخمة بشكل موزع مثل تخزين بيانات ضخمة على عدة أجهزة ومن ثم توزيع عملية المعالجة على هذه الأجهزة لتسريع نتيجة المعالجة.
ويمكن الاستفادة من تحليل هذه الأنواع من البيانات الكبيرة في التعليم، لتوفير مجموعة متنوعة من الفرص والخيارات بهدف تحسين تعلم الطلاب وإضفاء الطابع الشخصي على مسار الطالب إلى إتقان المحتوى، من خلال التعلم التكيفي أو التعليم القائم على الكفاءة، مما ينتج عنه تعلم أفضل نتيجة لتشخيص أسرع وأكثر تعمقا لاحتياجات التعلم أو المتاعب التي تواجهه أثناء عملية التعلم، بما في ذلك تقييم المهارات مثل التفكير المنظم، والتعاون، وحل المشاكل في سياق عميق، و تقييم أصيل لمجال وموضوع المعرفة، بالإضافة لتحديد التدخلات المستهدفة لتحسين نجاح الطلاب وخفض التكاليف الإجمالية للطلاب والمؤسسات، واستخدام البيئات القائمة والمعلومات المعقدة في صنع القرارات وتحديد السياسات.
و يمكن أن توفر هذه البيانات أيضا أدوات حديثة وفعالة لقياس أداء الطلاب للمهام التعليمية، كما يُمكِّن قياس هذه الأنواع من المهام زيادة أهمية ودقة النتائج عن كيفية تعلم الطلاب، ويمكن أن تساعد كذلك في تصميم بيئات تعلم تصميما مخصصا وفق احتياجات محددة للطلاب، ويمكن أن تعطي تحليلا واضحا لردود الفعل الفردية والجماعية لمجموعة من القضايا التعليمية.
زيادة على ذلك، نشير إلى إمكانية قياس التفاعلات الاجتماعية بين الأفراد داخل البيئات التعليمية لحل المشكلات والمهارات التعاونية، مما يسمح بمزيد من التحليل والاستعراض المباشر للأداءات ذات الصلة بأدوات البحث القياسية.
نشير أيضا أنه بإمكان الباحثين الاستفادة من تحليل البيانات الكبيرة بجمع بيانات دقيقة عن عمل الطالب الفردي والجماعي، مما يوفر تفاصيل أكثر حول مسارات التعلم والإجراءات المتخذة للوصول إليه. بالإضافة إلى أن التقييمات الكبيرة توفر معلومات عن تطوير هذه التجارب، مثل تسجيل عدد المرات التي يبحث فيها الطالب بين صفحات مجموعة من المواقع والتي لها علاقة بمحتوى الكتاب المدرسي.
كما يساعد تحليل البيانات الكبيرة الباحثين في معرفة كيفية إنشاء البيانات، حيث يتعرفون على العملية التي أنتجت في الأصل تلك البيانات، وكيفية انتشار وصعود هذه البيانات، كما يساعد المهتمين والمتخصصين في عملية التعلم على كيفية بناء نماذج حديثة وفعالة لعملية التعلم لضمان أكثر الطرق جودة في سرعة وكمية الإنتاجية، كما تساعد على التنبؤ بالنتائج المستقبلية مثل أنماط أخذ الدورات.
المراجع:
Joseph Hellerstein. The commoditization of massive data analysis. Blog on O’Reilly.com, 19 November 2008
Data data everywhere. Kenneth Cukier interviewed for The Economist , 25 February 2010
Emmanuel Letouzé. Big data for development: opportunities and challenges. UN Global Pulse, May 2012
Big data, big impact: new possibilities for international development. World Economic Forum, 2012
James Manyika and others. Big data: the next frontier for innovation, competition and productivity. McKinsey Global Institute, May 2011
Danah Boyd and Kate Crawford. Six provocations for Big Data. A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society, September 2011
The physical size of big data. Infographic by Domo. 14 May 2013
Christopher Frank. Improving decision making in the world of Big Data. Forbes, 25 March 2012