2.jpg-69.jpeg

سایت آزمون دکتری ( www.PhdAzmoon.Net ) –  یک پژوهشگر حوزه هوش مصنوعی با اشاره به تشکیل کارگاه و دوره‌های آموزشی مرتبط با داده‌کاوی، شبکه عصبی و… در جهاد دانشگاهی خراسان رضوی اظهار کرد: تحلیل داده‌های تحقیقات اجتماعی نیازمند تفکیک اطلاعات مهم از غیرمهم است.

دکتر عبداللهی در گفت‌وگو با خبرنگار پژوهشی خبرگزاری دانشجویان ایران(ایسنا) منطقه خراسان، درباره رابطه دو قلمرو داده‌کاوی با تحلیل شبکه‌های عصبی و اینکه آیا این دو، حوزه‌های متفاوتی هستند یا خیر، عنوان کرد: امروزه که با حجم بسیار عظیم داده‌ها در هر حوزه تحقیقاتی روبه‌رو شده‌ایم، ذهن ما قادر به پردازش و استخراج دانش از آن‌ها نبوده و نمی‌تواند از آن‌ها نتیجه‌گیری خاصی کند. برای اینکه بر روی این داده‌ها مدیریتی داشته و بتوانیم اطلاعات مفیدی از آن‌ها استخراج کنیم، باید بتوانیم بخش مهم و غیرمهم آن‌ها را از هم تشخیص داده و تفکیک کنیم.

وی افزود: باید بخش‌های غیرواقعی را از بخش‌های واقعی تشخیص داده و تا حد ممکن آن‌ها را اصلاح کنیم. همچنین بتوانیم با داشتن داده‌های موجود، داده‌های مفقوده گذشته و حال را تخمین زده و داده‌های آینده را نیز پیش‌بینی کنیم.

عبداللهی خاطرنشان کرد: وقتی حجم داده‌ها بسیار زیاد باشد، داده‌ها به تنهایی قابل استفاده نبوده بلکه دانش نهفته در داده‌ها ارزشمند و قابل استفاده است. بنابراین با بهره‌گیری از قدرت فرآیند داده‌کاوی جهت شناسایی الگوها و مدل‌ها و نیز ارتباط عناصر مختلف در پایگاه داده، آن‌ها را برای کشف دانش نهفته و نهایتا تبدیل داده‌ها به اطلاعات به کار گیریم.

وی ادامه داد: امروزه داده کاوی در تمام حوزه‌های تحقیقاتی اعم از علوم مهندسی، علوم تجربی و علوم انسانی کاربرد داشته و لزوم به کارگیری آن روز به روز ضروری‌تر می‌شود. برای پردازش اطلاعات و استخراج دانش نهفته درون این خیل عظیم داده‌ها نیاز به ابزارهایی بوده که از آن جمله می‌توان به منطق فازی، الگوریتم‌های ژنتیک، الگوریتم‌های ازدحام ذرات و… اشاره کرد.

این پژوهشگر حوزه هوش مصنوعی اضافه کرد: مهم‌ترین خاصیت این الگوریتم‌ها این است که از طبیعت الهام گرفته شده‌اند. دلیل اصلی الهام‌گیری از طبیعت این بوده که ما معتقدیم که طبیعت به دلیل زمان زیادی که در اختیار داشته بهترین راه‌حل را پیدا کرده است. در میان ابزارهای ذکر شده شبکه‌های عصبی به دلیل الگوبرداری از شبکه‌های عصبی جانوری به عنوان یکی از مهم‌ترین ابزارهای بهینه‌سازی مورد توجه بسیاری از محققان تقریبا در تمام حوزه‌های تحقیقاتی قرار گرفته است.

عبداللهی با اشاره به اینکه یکی از مشکلات مطالعات طولی در حوزه پژوهش‌های اجتماعی داده‌های مفقوده است، در خصوص راهکار داده‌کاوی و تحلیل شبکه‌های عصبی برای این گونه مشکلات، اظهار کرد: موضوع داده‌های گمشده یا Missing Values یکی از مهم‌ترین حوزه‌های تحقیقاتی در داده‌کاوی بوده که راهکارهای مطمئنی برای آن ارائه داده شده است. داده‌های گمشده مقادیر اندازه‌گیری نشده‌ای هستند که فیلدهای مربوط به آن‌ها بدون مقدار هستند به طور خلاصه می‌توان با داشتن یک تاریخچه از داده‌های موجود و اندازه‌گیری شده قبل به راحتی مقادیر داده‌های مفقوده را تخمین و جای گذاری کرد. این داده‌ها می‌توانند از هر نوع اعم از مقادیر عددی، متن، تاریخ یا هر داده دیگری باشند.

این پژوهشگر حوزه هوش مصنوعی عنوان کرد: یکی دیگر از مشکلات مطالعات طولی در حوزه پژوهش‌های اجتماعی وجود داده‌های مشکوک است. معمولا در هر دیتابیس داده‌هایی وجود دارند که از مقدارهای واقعی بسیار دور بوده و به اصطلاح پرت هستند. داده‌های مشکوک می‌توانند توسط خطا در دستگاه‌های اندازه‌گیری، بی‌توجهی یا غرض‌ورزی شخص ثبت‌کننده و حتی نویز باشند.

وی افزود: داده‌کاوی راه‌حل‌های مطمئنی برای تشخیص داده‌هایی است که همخوانی با داده‌های موجود نداشته (Outlier Detection) همچنین تخمین مقدار واقعی و اصلاح آ‌ن‌ها ارائه کرده است. لازم به یادآوری است که همانند داده‌های مفقوده، داده‌های مشکوک و غیرواقعی نیز می‌توانند از هر نوع داده‌ای باشند.

عبداللهی یکی دیگر از مشکلات در پژوهش‌های اجتماعی را عدم تهیه مستقیم برخی داده‌ها توسط محقق اعلام کرد و گفت: به همان صورت که داده‌های گمشده فیلدهایی خالی بوده و داده‌های پرت هم به دلیل غیر واقعی بودن فرقی با داده‌های گمشده نداشته و باید حذف و مجددا اصلاح شوند پس می‌توان با وجود داده‌های دیگر موجود آن‌ها را تخمین واقعی زده و جایگزین کرد اما گاهی داده‌هایی داریم که وجود خارجی نداشته و با توجه به نتیجه‌گیری از سایر داده‌ها می‌توان مقدار آن‌ها را به دست آورد به عنوان مثال معدل یک دانش‌آموز به هیچ عنوان توسط معلم تعیین نمی‌شود بلکه ناشی از سایر نمرات وی است؛ داده‌کاوی راه‌حل‌های بسیار دقیق و منطقی برای حل اینگونه مشکلات ارائه کرده است.

وی در خصوص ملاحظاتی که باید فردی در مقام پیش‌بینی قرار دارد، رعایت کند، گفت: معتقد هستیم که تمام رفتارهایی که در طبیعت رخ می‌دهد از یک الگوی خاصی پیروی می‌کند و می‌توان این الگوها را به فرم ریاضی بیان کرد.

عبداللهی خاطرنشان کرد: استفاده از ابزارهایی مانند شبکه‌های عصبی و در نهایت داده‌کاوی در کشف این الگوها به ما کمک کرده، به گونه‌ای که نیازی به درگیر شدن با این مفاهیم ریاضی نداشته باشیم. با در نظر گرفتن این موضوع که تمام داده‌های موجود در حوزه‌های اجتماعی برگرفته از رفتارهای طبیعی بوده، می توان با بررسی داده‌های موجود و ذخیره شده قبل و استخراج دانش‌هایی از آنان به تعیین مقادیری در گذشته که به آنان دسترسی نداشته(درون‌یابی و تشخیص تاریخچه) یا مقادیری در آینده که هنوز نیامده‌اند (برون‌یابی و پیش‌بینی) دست یافت.

این پژوهشگر حوزه هوش مصنوعی با توجه به اینکه در حوزه علوم انسانی و مطالعات طولی داده‌ها به آن اندازه پر حجم نیست و بنابراین هم حجم داده‌ها کم است و هم نسبت داده موجود به گمشده بالا است، به این سوال که آیا تعیین الگوی تغییرات در این شرایط امکان‌پذیر است، پاسخ داد: در این مورد باید توجه شود که داده‌هایی که ذکر شده در مقایسه با سایر حوزه‌های تحقیقاتی مانند حوزه‌های درمان یا آموزش و پرورش آنقدر نیز کم نبوده و مقادیر گمشده و پرت نیز خیلی زیاد نیستند به عنوان مثال ما در حوزه گردشگری سالانه میلیون‌ها گردشگر و توریست داشته که هر کدام یک داده هستند.

وی ادامه داد: مساله مهم دیگر در یک داده ویژگی‌های آن بوده که به آن «ابعاد داده» گفته می‌شود. یک داده از نوع توریست دارای ویژگی‌ها و مقادیر زیادی است که باید اندازه‌گیری شده، ثبت شود و در نهایت در پردازش‌های آتی مورد استفاده قرار گیرد. همانطور که مشاهده می‌شود داده‌های این حوزه تحقیقاتی حتی اگر به عنوان مثال کمتر از ۱۰۰۰ نیز که باشد خود مقدار بسیار بزرگی در مقایسه با سایر حوزه‌ها است.

عبداللهی اضافه کرد: قدرت داده‌کاوی علاوه بر داده‌های با حجم بالا، در پردازش داده‌های پیچیده و دارای ابعاد و ویژگی‌های زیاد بوده که روش‌های سنتی قادر به پردازش آن‌ها نیستند. به عنوان مثال داده‌های عددی مانند نمرات یک دانشجو مقادیری ساده بوده که می‌توان به راحتی با روش‌های سنتی آن‌ها را پردازش کرد اما داده‌هایی مانند متن‌ها و داده‌های حوزه اجتماعی از نوع داده‌های پیچیده بوده که قطعا داده‌کاوی و روش‌های بهینه‌سازی مانند شبکه‌های عصبی بهترین گزینه‌ها برای پردازش و استخراج دانش از آن‌ها است.

با تلاش گروه کامپیوتر جهاد دانشگاهی خراسان رضوی کارگاه و دوره‌های آموزشی مرتبط با داده‌کاوی، شبکه عصبی، سیستم‌های فازی، الگوریتم‌های ژنتیک و سایر روش‌ها و الگوریتم‌های فرا ابتکاری تعریف و ارائه شده است.

علاقه‌مندان می‌توانند برای کسب اطلاعات بیشتر به آدرس edu.jdm.ac.ir مراجعه کنند، این دوره‌ها می‌تواند برای درک عمیق از مباحث فوق برای تمام دانشجویان به ویژه محققانی که رشته تحصیلی آن‌ها کامپیوتر و گرایش‌های وابسته نیست بسیار سودمند و مفید باشد.