ডেটা

স্নাতক শিক্ষার্থীরা বিভিন্ন বিশ্ববিদ্যালয় সিস্টেমের মাধ্যমে প্রতিদিন প্রচুর পরিমাণে আচরণগত ডেটা উত্পন্ন করে। এই শিক্ষার্থীদের আচরণের ডেটা একাডেমিক কর্মক্ষমতা, অধ্যয়নের অভ্যাস এবং অন্যান্য জীবনযাত্রার অভ্যাসগুলি মূল্যায়ন করতে বিশ্লেষণ করা যেতে পারে। এই গবেষণায় পরীক্ষিত ডেটাগুলি উত্তর -পূর্ব চীনের একটি বিশ্ববিদ্যালয়ের ক্যাম্পাস সিস্টেম ডাটাবেস থেকে আসে, যা শিক্ষার্থীদের প্রাথমিক তথ্য, একাডেমিক পারফরম্যান্স, পাশাপাশি দৈনিক লেনদেন এবং গ্রন্থাগার ভিজিট লগ সম্পর্কিত বিশদ তথ্য রেকর্ড করে। এই গবেষণাটি বিশ্ববিদ্যালয়ের ক্যাম্পাস সিস্টেম ডাটাবেস থেকে চার ধরণের ডেটা বের করেছে। প্রথমত, বেসিক শিক্ষার্থীদের তথ্যে প্রতিটি শিক্ষার্থীর নাম, লিঙ্গ, শিক্ষার্থী আইডি, কলেজ, মেজর, তালিকাভুক্তি বছর, শহর শহর এবং জাতিগততা অন্তর্ভুক্ত রয়েছে। দ্বিতীয়ত, একাডেমিক পারফরম্যান্সের ডেটা কোর্সের নাম, গ্রেড এবং র‌্যাঙ্ক নিয়ে গঠিত। তৃতীয়ত, লাইফস্টাইল লেনদেনের ডেটাতে ব্যয়, অবস্থান, পরিষেবা কাউন্টার, অর্থ প্রদানের পদ্ধতি, টাইমস্ট্যাম্পস, লেনদেনের পরিমাণ, বাকী ব্যালেন্স এবং রিচার্জের পরিমাণ অন্তর্ভুক্ত রয়েছে। ব্যয় বিভাগগুলি ক্যাফেটেরিয়াস এবং স্নানের ব্যয়গুলিতে ডাইনিংকে অন্তর্ভুক্ত করে। চতুর্থত, লাইব্রেরি অ্যাক্সেস লগগুলি সঠিক প্রবেশ এবং প্রস্থান করার সময় সরবরাহ করে, পাশাপাশি ফ্রিকোয়েন্সিগুলিও পরিদর্শন করে। ডেটা ব্যবহার গোপনীয়তার প্রয়োজনীয়তা এবং মানগুলির সাথে সম্মতি জানায় এবং শিক্ষার্থীদের জড়িত ডেটা সংবেদনশীল করা হয়েছে। সমস্ত ডেটা ডুপ্লিকেট রেকর্ডগুলি অপসারণ করতে এবং ফর্ম্যাটিংকে মানক করার জন্য প্রাক -প্রসেস করা হয়েছিল। শিক্ষার্থীদের একাডেমিক পারফরম্যান্স ডেটাও শাখা এবং মেজর জুড়ে স্কোর পরিবর্তনের জন্য অ্যাকাউন্টে স্বাভাবিক করা হয়েছিল।

এই গবেষণায় ব্যবহৃত ডেটাসেটে 2018 থেকে 2022 এর মধ্যে সংগৃহীত 3,499 আন্ডারগ্রাজুয়েট শিক্ষার্থীদের থেকে ক্যাম্পাস আচরণগত তথ্যের 3,123,840 রেকর্ড রয়েছে। প্রায় 78% শিক্ষার্থী পুরুষ ছিলেন এবং বাকি 22% মহিলা ছিলেন। এই গবেষণাটি কলেজ অফ ইঞ্জিনিয়ারিংয়ের মধ্যে পরিচালিত হয়েছিল, যেখানে শিক্ষার্থীদের লিঙ্গ অনুপাত উল্লেখযোগ্যভাবে ভারসাম্যহীন। গবেষণার নমুনায় 23 বছর বয়সী 22 এবং 1445 বছর বয়সী 1676 শিক্ষার্থী (যথাক্রমে 48% এবং ডেটাসেটের 41%) শিক্ষার্থী নিয়ে গঠিত। 398 স্নাতকদের একটি উপসেট জাতিগত সংখ্যালঘুদের প্রতিনিধিত্ব করে, নমুনার 11% গঠন করে। বেশিরভাগ শিক্ষার্থী (%১%) চীন কমিউনিস্ট পার্টির (সিপিসি) সদস্য ছিলেন। গড় গ্রেড পয়েন্ট গড় (জিপিএ) ছিল 80.095 পয়েন্ট, 9.373 এর মান বিচ্যুতি সহ। এই বিতরণটি একটি সাধারণের সাথে সাদৃশ্যপূর্ণ যে এটি কলেজের শিক্ষার্থীদের প্রকৃত একাডেমিক পারফরম্যান্সের ধরণগুলিকে মিরর করে। এই নমুনাটি তাই একটি যুক্তিসঙ্গত কাঠামো, প্রায় বাস্তব-বিশ্বের অনুপাতের অধিকারী ছিল এবং অত্যন্ত প্রতিনিধি ছিল। অতিরিক্তভাবে, ডেটাসেটটি ২০২০ সালের জানুয়ারিতে কোভিড -১৯-এর প্রাদুর্ভাবের পরে ক্যাম্পাস বন্ধের সাথে মিলে যায়। এই সময়ের মধ্যে, চীনের বিশ্ববিদ্যালয়গুলি ক্যাম্পাসে কঠোরভাবে অ্যাক্সেস নিয়ন্ত্রণ করে এবং বাইরে খাদ্য সরবরাহ নিষিদ্ধ করে। ক্যাফেটেরিয়াসে খাওয়া, স্নান করা এবং লাইব্রেরিতে অধ্যয়ন সম্পর্কিত ডেটা মূলত শিক্ষার্থীদের অন-ক্যাম্পাস আচরণকে হ্রাস বহিরাগত বিভ্রান্তির সাথে প্রতিফলিত করে। এই কারণগুলি সম্মিলিতভাবে অধ্যয়নের বিশ্বাসযোগ্যতা এবং নির্ভরযোগ্যতা সমর্থন করে।

ব্যবস্থা

একাডেমিক পারফরম্যান্স (জিপিএ) শিক্ষামূলক মানের একটি মূল মেট্রিক এবং শিক্ষার্থীদের কৃতিত্বের একটি পরিমাণগত ফলাফল। এই পরিমাপটি সাধারণত উচ্চ শিক্ষার সেটিংসে জিপিএকে বোঝায়, যা তাদের ক্রেডিট সময় অনুসারে পৃথক কোর্সের গ্রেডগুলি ওজন করে গণনা করা হয় (ওয়াং এট আল। 2015; জিক এট আল। 2015)।

এই অধ্যয়নটি শু এট আল এর (2020) ডাইনিং মডেল থেকে বেশ কয়েকটি স্বতন্ত্র ভেরিয়েবলকে বোঝায়। আগ্রহের দিকগুলি অন্তর্ভুক্ত শিক্ষার্থীদের অন্তর্ভুক্ত খাবারের সময় স্থায়িত্ব সহগ, প্রথম দিকে ক্রমবর্ধমান সহগ, রেস্তোঁরা কাউন্টার নির্বাচন, রেস্তোঁরা খরচ স্তরএবং রেস্তোঁরা ব্যবহারের স্থায়িত্ব। এই ভেরিয়েবলগুলি শিক্ষার্থীদের গ্রাহকের আচরণের আরও নিয়মতান্ত্রিক বিশ্লেষণের সুবিধার্থে খাওয়ার অভ্যাসের সূচকগুলির একটি পরিসীমা সংজ্ঞায়িত করতে ব্যবহৃত হয়েছিল। অন্যান্য বেশ কয়েকটি কারণ (যেমন, গড় স্নানের ফ্রিকোয়েন্সি, গড় স্নানের সময়, গড় লাইব্রেরি আগমন ফ্রিকোয়েন্সিএবং গড় অধ্যয়নের সময়কাল) প্রয়োগিত পরিসংখ্যানগুলিতে তাদের আপেক্ষিক তীব্রতার ভিত্তিতে মূল্যায়ন করা হয়েছিল। সমস্ত স্বাধীন ভেরিয়েবলের জন্য নির্দিষ্ট গণনাগুলি সারণি 1 এ দেখানো হয়েছে।

সারণী 1 স্বাধীন ভেরিয়েবলের সংজ্ঞা।

নিয়ন্ত্রণ ভেরিয়েবল অন্তর্ভুক্ত লিঙ্গ (মহিলা = 1 এবং 0 অন্যথায়), জাতিগততা (হান = 1 এবং 0 অন্যথায়), বয়সএবং রাজনৈতিক অধিভুক্তি (সিপিসি সদস্যতা = 1 এবং 0 অন্যথায়)। এই বৈশিষ্ট্যগুলি সম্ভাব্য বিভ্রান্তিকর কারণগুলির জন্য নিয়ন্ত্রণের জন্য সংহত করা হয়েছিল যা একাডেমিক কর্মক্ষমতা প্রভাবিত করতে পারে। এই পদ্ধতির ফলে শিক্ষার্থীদের জীবনযাত্রার অভ্যাসগুলি কীভাবে তাদের একাডেমিক কৃতিত্বকে প্রভাবিত করে তার আরও সুনির্দিষ্ট মূল্যায়ন নিশ্চিত করেছে।

মডেল প্রশিক্ষণ

এই গবেষণায়, আমরা শিক্ষার্থীদের historical তিহাসিক খাদ্যাভাসগুলির প্রক্রিয়া এবং গণনা সূচকগুলি গণনা করতে একটি এলএসটিএম (দীর্ঘ স্বল্প-মেয়াদী মেমরি) মডেল ব্যবহার করি। মডেলটি পাইথনে প্রয়োগ করা হয়েছে টর্চ লাইব্রেরির উপর ভিত্তি করে একটি কাস্টম স্ক্রিপ্ট ব্যবহার করে, গভীর শিক্ষার জন্য একটি বহুল ব্যবহৃত কাঠামো। টর্চ লাইব্রেরি নির্দিষ্ট কার্যগুলির জন্য উপযুক্ত কাস্টম এলএসটিএম মডেলগুলি ডিজাইন এবং প্রশিক্ষণে নমনীয়তা সরবরাহ করে। এক ধরণের পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (আরএনএন) কাঠামো হিসাবে, এলএসটিএম সময় সিরিজের ডেটা পরিচালনা করার জন্য বিশেষভাবে উপযুক্ত। Traditional তিহ্যবাহী আরএনএন এর সাথে তুলনা করে, এলএসটিএম ইনপুট গেটস, ভুলে গেটস, আউটপুট গেটস এবং একটি সেল স্টেট প্রবর্তন করে, যা এলএসটিএমকে ক্রমগুলিতে দীর্ঘমেয়াদী নির্ভরতাগুলি আরও ভালভাবে পরিচালনা করতে সক্ষম করে (গ্রাভস এবং শ্মিধুবার, 2005)। নির্দিষ্ট প্রক্রিয়া চিত্র 1 এ দেখানো হয়েছে।

চিত্র 1

এলএসটিএম মডেলের আর্কিটেকচার।

প্রতিটি সময় পদক্ষেপে টিএলএসটিএম একটি ইনপুট ভেরিয়েবল গ্রহণ করে এক্সটিযার মধ্যে সেই মুহুর্তে খাবারের সময় এবং অবস্থানের মতো আচরণগত বৈশিষ্ট্য রয়েছে। মডেল প্রসেসিংয়ের জন্য এই বৈশিষ্ট্যগুলি উপযুক্ত করার জন্য, এক-হট এনকোডিং প্রয়োগ করা হয়, বিভিন্ন বিভাগের সময় (প্রাতঃরাশ, ব্রাঞ্চ, মধ্যাহ্নভোজন, বিকেলে চা, ডিনার এবং দেরী-রাতের নাস্তা) এবং খাবারের অবস্থানগুলি পৃথক মাত্রা হিসাবে উপস্থাপন করে। ফলস্বরূপ, ইনপুট ভেরিয়েবলের মাত্রা 404 এ প্রসারিত হয়, সর্বকালের পয়েন্টগুলির জন্য শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করে। এক-হট এনকোডিং এখানে নিম্নরূপে সংজ্ঞায়িত করা হয়েছে: সাধারণত, খাবারের অবস্থানগুলির মতো শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি সংখ্যা (1 থেকে এন) দ্বারা প্রতিনিধিত্ব করা যেতে পারে, তবুও যেহেতু এই বিভাগগুলির মধ্যে কোনও অন্তর্নিহিত ক্রম বা মাত্রার সম্পর্ক নেই, সেগুলি কার্যকরভাবে পৃথক করার জন্য এগুলি এক-হট এনকোডযুক্ত ভেরিয়েবলগুলিতে রূপান্তর করা হয়। প্রতিটি বিভাগ একটি এন-বিট রেজিস্টার দ্বারা প্রতিনিধিত্ব করা হয়, যেখানে কেবল একটি বিট যে কোনও সময়ে সক্রিয় থাকে, যা কেবল শ্রেণিবদ্ধ ডেটাতে অন্তর্নিহিত অর্ডার দেওয়ার বিষয়টিই সম্বোধন করে না তবে বৈশিষ্ট্যটির স্থানকেও সমৃদ্ধ করে। এই যুক্ত মাত্রিকতা মডেলটিকে স্বতন্ত্র আচরণগত নিদর্শনগুলিকে আরও উন্নত করতে সহায়তা করে।

এলএসটিএম একটি ক্রমের দীর্ঘমেয়াদী এবং স্বল্প-মেয়াদী উভয় নির্ভরতা কার্যকরভাবে পরিচালনা করতে তিনটি অভ্যন্তরীণ গেট-ফোলেট গেট, ইনপুট গেট এবং আউটপুট গেট-এর মাধ্যমে তথ্যের প্রবাহকে নিয়ন্ত্রণ করে। ভুলে যাওয়া গেটটি পূর্ববর্তী লুকানো অবস্থা থেকে কোন তথ্য নির্ধারণ করে \ ({এইচ} _ {টি -1} \) বর্তমান সময়ের পদক্ষেপের সাথে প্রাসঙ্গিক historical তিহাসিক তথ্য ফিল্টারিং, ধরে রাখা বা বাতিল করা উচিত। ইনপুট গেট বর্তমান ইনপুট গ্রহণ করে এক্সটি এবং এলএসটিএম সেলে কোন নতুন তথ্য সংরক্ষণ করা উচিত তা স্থির করে। অবশেষে, আউটপুট গেট বর্তমান লুকানো অবস্থা উত্পন্ন করে এইচটি কোষের মধ্যে তথ্যের উপর ভিত্তি করে এবং মডেলের ভবিষ্যদ্বাণী তৈরি করে yটি সেই সময় পদক্ষেপে।

তত্ত্বাবধানে শেখার ক্ষেত্রে, মূল্যায়ন মেট্রিক ক্ষতির মান হিসাবে পরিচিত, যা মডেলের ত্রুটির পরিমাণ নির্ধারণ করে। এই সমীক্ষায়, এলএসটিএম মডেলটি খাদ্যাভাস সম্পর্কিত ভেরিয়েবলগুলি গণনা করতে ব্যবহৃত হয়েছিল এবং নির্বাচিত ভেরিয়েবলের জন্য প্রশিক্ষণ ক্ষতি চিত্র 2 এ দেখানো হয়েছে। উভয় মডেলের প্রশিক্ষণ এবং বৈধতা ক্ষতি শুরুতে তীব্রভাবে নেমে যায় এবং তারপরে নিম্ন স্তরে স্থিতিশীল হয়। সর্বোত্তম বৈধতা ক্ষতি 45 তম এবং 34 তম পুনরাবৃত্তির আশেপাশে উপস্থিত হয়, এটি ইঙ্গিত করে যে এলএসটিএম মডেল এই পয়েন্টগুলিতে একটি সন্তোষজনক কর্মক্ষমতা অর্জন করেছে।

চিত্র 2: দুটি এলএসটিএম মডেলের প্রশিক্ষণের সময় ক্ষতির ধরণগুলি, রেস্তোঁরা ব্যবহারের স্থায়িত্ব এবং রেস্তোঁরা কাউন্টার নির্বাচনের সাথে সম্পর্কিত।
চিত্র 2

প্রতিটি লাইন একটি পৃথক মডেলের জন্য যুগের তুলনায় ক্ষতির মান উপস্থাপন করে, অতিরিক্ত ফিটিং বা আন্ডারফিটিংয়ের কোনও প্রমাণ পর্যবেক্ষণ না করে।

বিশ্লেষণমূলক পদ্ধতি

স্নাতক শিক্ষার্থীদের জীবনযাত্রার অভ্যাস এবং একাডেমিক পারফরম্যান্সের সাথে সম্পর্কিত প্রভাব সম্পর্কিত এইচ 1 – এইচ 3 পরীক্ষা করার জন্য একাধিক রিগ্রেশন মডেল তৈরি করা হয়েছিল। নিম্নলিখিত রিগ্রেশন সমীকরণ প্রয়োগ করা হয়েছে:

$$ \ শুরু {অ্যারে} {সি} {ওয়াই} _ {জিপিএ} = {\ বিটা} _ {0}+{\ বিটা} _ {1} {x} _ {{} \ \}}}}}}}} \}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} \,+\, {\ বিটা} _ {4} বয়স+{\ বিটা} _ {5} রাজনৈতিক অপব্যবহার+\ ভারপসিলন \ শেষ {অ্যারে} $$ $$

(1)

কোথায় Yজিপিএ শিক্ষার্থীর একাডেমিক অভিনয় (জিপিএ);; এক্সঅভ্যাস শিক্ষার্থীর খাদ্যাভাস, স্বাস্থ্যকর অভ্যাস এবং অধ্যয়নের অভ্যাস; এবং লিঙ্গ, জাতিগততা, বয়স, রাজনৈতিক অধিভুক্তি নিয়ন্ত্রণ ভেরিয়েবল হয়। এলোমেলো অশান্তি শব্দ; 1 প্যারামিটারগুলি অনুমান করার জন্য বোঝায়। রিগ্রেশন বিশ্লেষণগুলি স্ট্যাটসমোডেলস লাইব্রেরির সাথে লিখিত কাস্টম কোড ব্যবহার করে প্রয়োগ করা হয়েছিল, এটি একটি বহুল ব্যবহৃত পাইথন মডিউল যা বিভিন্ন পরিসংখ্যানের মডেলগুলির অনুমান এবং বিশ্লেষণকে সহজতর করে।

উৎস লিঙ্ক