क्रायो-इलेक्ट्रॉन टोमोग्राफी (क्रायो-ईटी) सेलुलर वातावरण और संलग्न जैव अणुओं की विस्तृत 3डी छवियां प्रदान करने के लिए एक शक्तिशाली तकनीक के रूप में उभर रही है। हालांकि, कार्यप्रणाली की चुनौतियों में से एक आगे की प्रक्रिया के लिए छवियों में प्रोटीन अणुओं की पहचान है। थोरस्टन वैगनर के नेतृत्व में डॉर्टमुंड में एमपीआई फॉर मॉलिक्यूलर फिजियोलॉजी के निदेशक स्टीफन रौंसर के आसपास एक शोध दल ने भीड़ भरे सेल वॉल्यूम में प्रोटीन का चयन करने के लिए सॉफ्टवेयर विकसित किया। TomoTwin नाम का नया ओपन सोर्स टूल, डीप मेट्रिक लर्निंग पर आधारित है और वैज्ञानिकों को हर बार नेटवर्क को मैन्युअल रूप से बनाए या फिर से प्रशिक्षित किए बिना उच्च परिशुद्धता और थ्रूपुट के साथ कई प्रोटीनों का पता लगाने की अनुमति देता है।
जितना ज्यादा उतना अच्छा
टॉमोट्विन क्रायो-ईटी की क्षमता का विस्तार करते हुए सीधे उनके सेलुलर वातावरण में प्रोटीन की स्वचालित पहचान और स्थानीयकरण का मार्ग प्रशस्त करता है।”
गेविन राइस, प्रकाशन के सह-प्रथम लेखक
क्रायो-ईटी में यह समझने की क्षमता है कि एक कोशिका के भीतर जैव अणु कैसे काम करते हैं और इस प्रकार जीवन के आधार और रोग की उत्पत्ति को प्रकट करते हैं।
क्रायो-ईटी प्रयोग में, वैज्ञानिक एक संचरण इलेक्ट्रॉन सूक्ष्मदर्शी का उपयोग करते हुए कोशिका आयतन की 3डी छवियां प्राप्त करते हैं, जिन्हें टॉमोग्राम कहा जाता है, जिसमें जटिल जैव अणु होते हैं। प्रत्येक अलग-अलग प्रोटीन की अधिक विस्तृत तस्वीर प्राप्त करने के लिए, वे फोटोग्राफरों के समान संभव के रूप में उनकी कई प्रतियों को औसत करते हैं, जो एक ही तस्वीर को अलग-अलग एक्सपोजर पर कैप्चर करते हैं और फिर उन्हें पूरी तरह से उजागर छवि में जोड़ते हैं। महत्वपूर्ण रूप से, किसी को औसत करने से पहले छवि में विभिन्न प्रोटीनों की सही पहचान और पता लगाना होगा। राइस कहते हैं, “वैज्ञानिक एक दिन में सैकड़ों टोमोग्राम प्राप्त कर सकते हैं, लेकिन हमारे पास अणुओं की पूरी तरह से पहचान करने के लिए उपकरणों की कमी थी।”
हाथ उठाया
अब तक, शोधकर्ताओं ने टोमोग्राम में मिलान खोजने के लिए पहले से ही ज्ञात आणविक संरचनाओं के टेम्प्लेट के आधार पर एल्गोरिदम का उपयोग किया है, लेकिन ये त्रुटि-प्रवण होते हैं। हाथ से अणुओं की पहचान एक और विकल्प है जो उच्च गुणवत्ता वाले चयन को सुनिश्चित करता है, लेकिन इसमें प्रति डेटा सेट में दिन या सप्ताह लगते हैं।
एक अन्य संभावना पर्यवेक्षित मशीन लर्निंग के एक रूप का उपयोग करने की होगी। ये उपकरण अत्यधिक सटीक हो सकते हैं, लेकिन वर्तमान में उनके उपयोग में आसानी की कमी है, प्रत्येक नए प्रोटीन के लिए सॉफ़्टवेयर को प्रशिक्षित करने के लिए हजारों उदाहरणों की मैन्युअल लेबलिंग की आवश्यकता होती है, जो एक भीड़ भरे सेलुलर वातावरण में छोटे जैविक अणुओं के लिए लगभग असंभव कार्य है।
टोमोट्विन
नव विकसित TomoTwin सॉफ्टवेयर इन बाधाओं में से कई पर काबू पा लेता है: यह ऐसे अणुओं को चुनना सीखता है जिनका एक टोमोग्राम के भीतर समान आकार होता है और उन्हें एक ज्यामितीय स्थान प्रदान करता है: समान प्रोटीन को एक दूसरे के करीब रखने के लिए सिस्टम को पुरस्कृत किया जाता है और ऐसा नहीं करने के लिए दंडित किया जाता है। तो विपरीत। नए मानचित्र में, शोधकर्ता विभिन्न प्रोटीनों को ठीक से अलग और पहचान सकते हैं और इसका उपयोग सेल के भीतर उनका पता लगाने के लिए कर सकते हैं। राइस कहते हैं, “टॉमोट्विन का एक फायदा यह है कि हम एक पूर्व-प्रशिक्षित ऑर्डर पूर्ति मॉडल प्रदान करते हैं।” प्रशिक्षण चरण को समाप्त करके, सॉफ्टवेयर स्थानीय कंप्यूटरों पर भी चल सकता है, जहां टॉमोग्राम को संसाधित करने में आमतौर पर 60 से 90 मिनट की आवश्यकता होती है, एमपीआई रेवेन सुपरकंप्यूटर पर निष्पादन का समय प्रति टमाटर 15 मिनट तक कम हो जाता है।
TomoTwin शोधकर्ताओं को मैन्युअल रूप से केवल एक का चयन करने में लगने वाले समय में दर्जनों टोमोग्राम का चयन करने की अनुमति देता है, डेटा थ्रूपुट को बढ़ाता है और एक बेहतर छवि के लिए औसत दर। वर्तमान में, सॉफ्टवेयर कोशिकाओं में 150 किलोडाल्टन से बड़े गोलाकार प्रोटीन या प्रोटीन परिसरों का पता लगा सकता है; भविष्य में, रौंसर के समूह में झिल्ली प्रोटीन, फिलामेंटस प्रोटीन और छोटे प्रोटीन शामिल करने का इरादा है।
झरना:
पत्रिका संदर्भ:
राइस, जी., और अन्य. (2023)। टोमोट्विन: स्ट्रक्चरल डेटा माइनिंग के साथ क्रायोइलेक्ट्रॉन टॉमोग्राम्स में मैक्रोमोलेक्युलस का सामान्यीकृत 3डी स्थानीयकरण। प्रकृति के तरीके. doi.org/10.1038/s41592-023-01878-z.