بناء بيولوجيا الفضاء "حديقة الحيوان النموذجية"

تعتبر تقنية نقل التعلم (Transfer Learning) تقنية في مجال التعلم الآلي يتم فيها تدريب النموذج مسبقًا على مجموعة بيانات كبيرة وشاملة لتشفير السمات والعلاقات الأساسية، ثم يتم تحسينه باستخدام مجموعة بيانات أصغر لمجال المشكلة المحدد. تعتبر هذه التقنية ذات صلة بأبحاث علوم الفضاء الحيوية، حيث تحتوي مجموعات البيانات عادةً على حجم عينة محدود وتكون مساحة المشكلة مقيدة.

تحداك هو: (1) تصميم قاعدة بيانات شاملة تتضمن مجموعة واسعة من مجموعات البيانات الطبية المتاحة للجمهور يمكن استخدامها لتدريب نماذج مختلفة في "مكتبة النماذج"، و (2) تحديد مجموعات بيانات متاحة للجمهور وذات صلة بعلوم الفضاء الحيوية يمكن استخدامها لتحسين النماذج لاستكشاف أسئلة محددة في مجال علوم الفضاء الحيوية.


الخلفية






التعلم النقلي هو أحد تقنيات التعلم الآلي حيث يتم تدريب النموذج مسبقًا على مجموعة بيانات كبيرة وواسعة لتشفير الميزات والعلاقات الأساسية، ثم يتم تحسينه باستخدام مجموعة بيانات أصغر لمساحة مشكلة محددة. هذه التقنية ذات صلة بأبحاث علم الأحياء الفضائية، حيث يكون لمجموعات البيانات عادةً حجم عينة محدود ومساحة المشكلة مقيدة.

"حديقة الحيوان النموذجية" هي مجموعة من النماذج المدربة مسبقًا، كل منها مصمم للمساعدة في الإجابة على سؤال علمي مختلف. نقل التعلم هو أسلوب يمكن استخدامه لإنشاء حديقة حيوانات نموذجية. يمكن بعد ذلك استخدام كل نموذج من النماذج الموجودة في حديقة الحيوان النموذجية لحل مشكلة معينة عن طريق تحسين النموذج باستخدام مجموعات البيانات الموجودة ذات الصلة.

تلتقط حديقة الحيوان النموذجية مجموعة من المعلومات الواسعة التي يمكن تنقيحها لمعالجة أسئلة محددة. على سبيل المثال، هناك نماذج شبكات عصبية تم تدريبها مسبقًا على أكثر من مليون صورة، ويمكن تحسينها للقيام بمهمة تحليل صور محددة، مثل تصنيف صور القطط والكلاب. ستكون حديقة الحيوان النموذجية مفيدة لمجتمع علم الأحياء الفضائي أيضًا. على سبيل المثال، يمكن تدريب النماذج الموجودة في حديقة الحيوان النموذجية لبيولوجيا الفضاء مسبقًا على مجموعات كبيرة من البيانات الطبية الحيوية، ومن ثم تحسينها باستخدام مجموعات البيانات من تجارب بيولوجيا الفضاء للتحقيق في أسئلة محددة في بيولوجيا الفضاء.


الأهداف


التحدي الذي يواجهك هو: (1) تصميم قاعدة بيانات شاملة لمجموعات البيانات الطبية الحيوية المتاحة للعامة والتي يمكن استخدامها للتدريب المسبق لنماذج مختلفة من أجل "حديقة حيوانات نموذجية"، و(2) لتحديد مجموعات بيانات بيولوجيا الفضاء المتاحة للعامة ذات الصلة والتي يمكن استخدامها بعد ذلك تحسين النماذج للتحقيق في أسئلة محددة في علم الأحياء الفضائية.

لك الحرية في اقتراح مجموعات بيانات متعددة الوسائط بالإضافة إلى أنواع بيانات فردية. إذا أردت، يمكنك توسيع نطاق التحدي وتجميع وجمع قائمة من بنيات نماذج التعلم النقلي الواعدة التي يمكن اختبارها. إذا كان هناك وقت متبقي، فيمكنك أيضًا كتابة تعليمات برمجية للمعالجة المسبقة لنوع البيانات وتدريب نموذج على تلك البيانات للمساهمة بالنموذج الذي تم تدريبه مسبقًا التالي في حديقة الحيوان النموذجية.


اعتبارات محتملة


يفضل ولكن غير إلزامي مراعاة ما يلي عند إنشاء الحل الخاص بك:

  • ما هي أفضل طريقة لتقديم قاعدة البيانات هذه إلى أصحاب المصلحة؟
  • ما هي خطوات المعالجة المسبقة التي يجب اتخاذها لتحويل مجموعات البيانات الطبية الحيوية العامة لتكون جاهزة للنقل والتعلم؟ قد يتطلب البعض عملاً أكثر من البعض الآخر.
  • ما هي مجموعات البيانات متعددة الوسائط التي من المرجح أن تؤدي إلى اكتساب المعرفة البيولوجية؟
  • هل هناك بنيات تعلم نقلية ينبغي تجنبها في هذا الجهد لأي سبب من الأسباب؟
  • هل توجد نماذج بيولوجية مُدربة مسبقًا يمكن استخدامها خارج الصندوق في هذا الجهد؟
  • يستخدم نموذج في "حديقة حيوانات نموذجية" في علم الأحياء الفضائية مجموعة بيانات موجودة تضم آلاف الدراسات الطبية الحيوية المختلفة لتسلسل الحمض النووي الريبي (RNA). يمكن الاستفادة من هذا النموذج في أي مجموعة من مجموعات بيانات تسلسل الحمض النووي الريبي (RNA) لبيولوجيا الفضاء في مستودع بيانات العلوم المفتوحة التابع لناسا (OSDR) (انظر علامة تبويب الموارد). ومع ذلك، لدى OSDR العديد من أنواع البيانات المختلفة وسيكون من المفيد للجمهور أن يكون لديه نماذج مدربة مسبقًا لكل نوع من البيانات، وربما لمجموعات البيانات متعددة الوسائط، أو للمساعدة في معالجة مسائل بيولوجية مختلفة.
  • بالإضافة إلى ذلك، قد يكون من المثير للاهتمام استخدام بنيات مختلفة لنماذج تعلم النقل لإنشاء حديقة الحيوان النموذجية وملاحظة التأثيرات الناتجة.

    للحصول على البيانات والمصادر المتعلقة بهذا التحدي، راجع علامة التبويب "المصادر" في أعلى الصفحة. يمكن إضافة المزيد من المصادر قبل بدء الهاكاثون.


  • مكة المكرمة
    Oct 03, 2023

    Autotrophic nutrition in animals