Author: Bayoumy, Engy Abd El-Maboud El-Shafeiy./ Title: Big data mining in biomedical informatics /

Search In this Thesis

العنوان

Big data mining in biomedical informatics /

المؤلف

Bayoumy, Engy Abd El-Maboud El-Shafeiy.

هيئة الاعداد

باحث / أنجى عبدالمعبود الشافعي بيومي

مشرف / على ابراهيم الدسوقي

مشرف / سالي محمد الغمراوي

مناقش / على ابراهيم الدسوقي

الموضوع

Data mining. Biomedical informatics - Data mining. Bioinformatics.

تاريخ النشر

2019.

عدد الصفحات

online resource (105 pages) :

اللغة

الإنجليزية

الدرجة

الدكتوراه

التخصص

هندسة النظم والتحكم

تاريخ الإجازة

1/8/2019

مكان الإجازة

جامعة المنصورة - كلية الهندسة - هندسة الحاسبات والنظم

الفهرس

Only 14 pages are availabe for public view

from

134

from

134

Abstract

بعد زيادة وانتشار المستشفيات الذكية وسجلات المرضى مع مجموعة متنوعة من المعلومات ذات الصلة. يمكن النظر إلى البيانات الكبيرة الطبية الحيوية كمصطلح جماعي للفيضانات الحديثة من البيانات الطبية، وعلى الرغم من انخفاض تكاليف توليد وتخزين البيانات الطبية وزيادة أحجام التخزين بشكل كبير، أصبحت هذه القضية مهمة بشكل متزايد. ومن المفارقات أن التعامل مع البيانات الرقمية الحيوية الطبية الضخمة لن يصبح أسهل من خلال هذا التقدم، ولا يزال تسخير هذه البيانات الطبية الحيوية يمثل تحديًا لتكنولوجيا المعلومات. ليس فقط التخزين الفعال للبيانات وتوفير صيغة قابلة للاستخدام للمستخدم، ولكن أيضا التعدين البيانات الطبية الحيوية هي النقاط الرئيسية هنا، واعتمادا على شكل البيانات، تقدم البيانات الطبية الحيوية الكبيرة تحديات مختلفة، ولكن البيانات الضخمة، وتراكم كميات كبيرة من البيانات، ليست مجرد مشكلة لبعض المستشفيات الذكية. إن الحجم المتزايد للبيانات التي تحتاج إلى التعدين ليس هو التحدي الوحيد المرتبط بالبيانات الضخمة. كما يتزايد عدد مصادر البيانات (مثل المطاريف المتنقلة، وإنترنت الأشياء ، وأجهزة الاستشعار والبيانات السريرية) وتنوع تنسيقات البيانات. في كثير من الأحيان ، يتم استخدام استخراج البيانات والتقنيات التنبؤية الذكية بشكل مترادف. في الواقع، تلعب أساليب وأدوات استخراج البيانات (مثل Apache Hadoop و spark و H2O) دورًا حيويًا في حلول تحليل البيانات الكبيرة؛ ومع ذلك، فإن التقنية التنبؤية الذكية تتجاوز تنقيب البيانات وتستخدم طرقًا أخرى مثل التعلم الآلي، أو تقنيات المحاكاة، وتستخدم التحليلات التنبؤية في البيانات الضخمة أيضًا تقنيات التحليل القائمة على التعدين المستندة إلى الخوارزميات للعثور على هياكل من مجموعة بيانات غير منظمة. نحاول استخراج البيانات والكشف عن أنماط واتجاهات وعلاقات مخفية في كميات كبيرة من البيانات باستخدام طرق أو خوارزميات إحصائية ورياضية متطورة على سبيل المثال، طرق استخراج البيانات التصنيفية. تقترح هذه الأطروحة حلول ثلاثة مشكلات كبيرة في البيانات الطبية الحيوية. الاقتراح الأول تم اقتراح خوارزميه FNBP يضع حد على مجموعات من العقد وإزالة البيانات الغير مستخدمه (الغير متكررة) من أجهزة الاستشعار ومن ثم اعاده هيكله شجره للعقد تسمى POC tree. وعلاوة على ذلك تم عمل إطار MR-FNBP لإعادة توزيع البيانات المستخدمة من أجهزة الاستشعار بمساعده MapReduce يكون اداء هذا الإطار في البيئات شديدة التوزيع والضخمة. في الاقتراح الثاني ، يستخدم تقنية التعلم الآلي للبيانات السريرية الكبيرة للتنبؤ بأمراض الكبد يتم استخدام أجهزة مكافحة ناقلات الدعم (SVM) ، Naive Bayes ، C5.0 لتصنيف أمراض الكبد غير المعروفة في مجموعة البيانات العيادية. في المقترح الثالث، تم اقتراح نهج الشبكات العصبية الاصطناعية الذكية الأمثل للتنبؤ بجودة الخصوبة في المرحلة المبكرة استناداً إلى خوارزمية الحوت (ANN-SWA).