इलम में ज्यूपिटरलैब
विहंगावलोकन
ज्यूपिटरलैब नोटबुक, कोड और डेटा के लिए अगली पीढ़ी, वेब-आधारित इंटरैक्टिव विकास वातावरण है।
Within Ilum, JupyterLab serves as the main user interface for all interactive notebook workflows—whether launched in standalone/shared mode (with a single shared workspace) or provisioned automatically as a private workspace inside ज्यूपिटरहब .
JupyterLab provides a flexible, modern IDE for working with Python, R, Scala, SQL, and more. It lets you edit, run, and visualize code in notebooks, scripts, or terminals, with access to Ilum’s Spark clusters and data storage.
प्रमुख विशेषताऐं
- आधुनिक नोटबुक आईडीई
फ़ाइल ब्राउज़र, टैब्ड संपादन, टर्मिनलों और ड्रैग-एंड-ड्रॉप समर्थन के साथ एक शक्तिशाली वेब-आधारित UI में काम करें। - भाषा समर्थन
Run code in Python, Scala, R, Bash, SQL, and more—using kernels or magic commands. - बहु-दस्तावेज़ संपादन
एकाधिक नोटबुक्स, स्क्रिप्ट और टर्मिनल्स को साथ-साथ संपादित और निष्पादित करें. - स्पार्क एकीकरण
Seamless connection to Ilum’s Spark clusters via Sparkmagic and Livy Proxy—run big data workloads from notebooks using%manage_spark,%%स्पार्कऔर संबंधित जादू। - गिट संस्करण नियंत्रण
- स्टैंडअलोन/साझा JupyterLab में: एक एकल, साझा गिट भंडार Gitea व्यवस्थापक खाते द्वारा प्रबंधित।
- JupyterHub में: प्रति उपयोगकर्ता व्यक्तिगत, निजी Git रिपॉजिटरी गीता में प्रबंधित।
- रिच विज़ुअलाइज़ेशन
चार्ट, टेबल, मैटप्लोटलिब, प्लॉटली और अन्य पुस्तकालयों के लिए अंतर्निहित समर्थन। - तानाना
आवश्यकतानुसार अतिरिक्त JupyterLab एक्सटेंशन स्थापित करें (यदि व्यवस्थापक द्वारा अनुमति दी गई हो)।
JupyterLab: साझा बनाम JupyterHub (प्रति उपयोगकर्ता)
| दृष्टिकोण | JupyterLab (स्टैंडअलोन/साझा) | JupyterLab में JupyterHub |
|---|---|---|
| उपयोगकर्ता मॉडल | एकल उपयोगकर्ता या कई के बीच साझा | बहु-उपयोगकर्ता, JupyterHub द्वारा ऑर्केस्ट्रेटेड |
| प्रमाणीकरण | कोई नहीं/स्थानीय केवल या सरल लॉगिन | LDAP/SSO (इलम-एकीकृत) |
| कार्यस्थान अलगाव | स्थानीय या सभी उपयोगकर्ताओं के लिए साझा | प्रति-उपयोगकर्ता, पृथक कुबेरनेट्स पॉड |
| संसाधन प्रबंधन | स्थानीय सर्वर या साझा परिनियोजन | सेंट्रल, K8s पर JupyterHub द्वारा प्रबंधित |
| संस्करण नियंत्रण | एकल साझा गिट रेपो (गीता व्यवस्थापक) | प्रति उपयोगकर्ता निजी गिट रेपो (गिटिया उपयोगकर्ता) |
| स्पार्क एकीकरण | Livy Proxy & Sparkmagic के माध्यम से पूर्व-कॉन्फ़िगर किया गया | Livy Proxy & Sparkmagic के माध्यम से पूर्व-कॉन्फ़िगर किया गया |
| डेटा एक्सेस | इलम वॉल्यूम, एस 3, प्रोजेक्ट स्टोरेज | इलम वॉल्यूम, एस 3, प्रोजेक्ट स्टोरेज |
| प्रतिभूति | यथासंभव न्यूनतम | एंटरप्राइज़-ग्रेड (RBAC, रहस्य, समूह-आधारित पहुँच) |
संस्करण नियंत्रण मॉडल:
- स्टैंडअलोन/साझा JupyterLab मॉड्यूल में, सभी उपयोगकर्ता एक एकल साझा गिट भंडार Gitea व्यवस्थापक खाते द्वारा प्रबंधित।
- JupyterHub में, प्रत्येक उपयोगकर्ता को एक व्यक्तिगत निजी भंडार Gitea में, प्रति उपयोगकर्ता स्वचालित रूप से प्रबंधित।
- ऑर्केस्ट्रेटेड, सुरक्षित और संस्करण-नियंत्रित अनुभव के लिए, हम JupyterHub का उपयोग करने की सलाह देते हैं।
लॉग इन करना और एक्सेस करना
-
JupyterLab (साझा):
के माध्यम से प्रवेश JupyterLab > मॉड्यूल इलम यूआई में।
उपयोगकर्ता एक सामान्य कार्यक्षेत्र और एक एकल गिट भंडार साझा करते हैं।
प्रमाणीकरण सरल या अक्षम हो सकता है (परिनियोजन पर निर्भर करता है)। -
JupyterHub (अनुशंसित):
के माध्यम से प्रवेश JupyterLab > मॉड्यूल इलम यूआई में।
आपको Ilum SSO/LDAP प्रमाणीकरण (JupyterHub द्वारा संचालित) के माध्यम से निर्देशित किया जाएगा।
आपका अपना JupyterLab कार्यक्षेत्र लगातार फाइलों, डेटा, स्पार्क एकीकरण और एक व्यक्तिगत गिट रेपो के साथ खुल जाएगा।
आपका कार्यस्थान
JupyterLab में (साझा संस्करण)
-
साझा कार्यस्थान और रिपॉजिटरी:
सभी उपयोगकर्ता समान फ़ाइल स्थान साझा करते हैं और एक एकल गिट भंडार Gitea व्यवस्थापक खाते द्वारा प्रबंधित।
किसी भी उपयोगकर्ता द्वारा किए गए परिवर्तन सभी के लिए दृश्यमान होते हैं और उन्हें समन्वित किया जाना चाहिए।बहु-उपयोगकर्ता वर्कफ़्लोज़ पर नोट:
यदि आपको साझा JupyterLab इंस्टेंस (स्टैंडअलोन या गैर-JupyterHub मोड) में कई उपयोगकर्ताओं के साथ काम करने की आवश्यकता है, तो आप मुख्य के अंदर प्रत्येक उपयोगकर्ता के लिए एक अलग फ़ोल्डर बना सकते हैंकामडायरेक्टरी। प्रत्येक उपयोगकर्ता तब अपने स्वयं के सबफ़ोल्डर में काम कर सकता है।हालाँकि, यह दृष्टिकोण न तो अनुशंसित है और न ही सुरक्षित है।
- इस मोड में JupyterLab स्तर पर कोई उपयोगकर्ता प्रमाणीकरण या अलगाव नहीं है।
- कोई भी उपयोगकर्ता किसी अन्य उपयोगकर्ता से संबंधित फ़ाइलों को अधिलेखित, हटा या संशोधित कर सकता है।
- यदि कोई अन्य उपयोगकर्ता गलती से (या जानबूझकर) आपके फ़ोल्डर में फ़ाइलों को संपादित या हटाता है तो आप अपना काम खोने का जोखिम उठाते हैं।
हमेशा सच्चे बहु-उपयोगकर्ता, पृथक और सुरक्षित नोटबुक वातावरण के लिए JupyterHub का उपयोग करना पसंद करते हैं।
- इस मोड में JupyterLab स्तर पर कोई उपयोगकर्ता प्रमाणीकरण या अलगाव नहीं है।
-
स्टार्टर नोटबुक और संरचना:
त्वरित ऑनबोर्डिंग के लिए उदाहरण नोटबुक, नमूना डेटा और निर्देशिका संरचना के साथ पूर्व-पॉप्युलेट। -
गिट-समर्थित भंडारण:
सभी परिवर्तनों को प्रतिबद्ध किया जाना चाहिए और साझा भंडार में धकेल दिया जाना चाहिए।
गिट साइडबार या टर्मिनल (गिट ऐड/कमिट/पुश).
JupyterHub में (प्रति-उपयोगकर्ता संस्करण)
-
निजी कार्यक्षेत्र और भंडार:
प्रत्येक उपयोगकर्ता को एक पृथक कार्यक्षेत्र एक से जुड़ा हुआ है निजी गिट भंडार Gitea में, पहले लॉगिन पर स्वचालित रूप से बनाया गया। -
स्टार्टर नोटबुक और संरचना:
प्रत्येक निजी रेपो को स्टार्टर फाइलों, टेम्पलेट्स और ऑनबोर्डिंग के लिए अनुशंसित संरचना के साथ प्रारंभ किया जाता है। -
गिट-समर्थित भंडारण:
सभी परिवर्तनों को प्रतिबद्ध किया जा सकता है और आपके व्यक्तिगत भंडार में धकेल दिया जा सकता है, जो केवल आपके लिए उपलब्ध है (और वैकल्पिक रूप से व्यवस्थापक)। -
लगातार भंडारण:
फ़ाइलें क्लस्टर वॉल्यूम पर संग्रहीत की जाती हैं, केवल आपके लिए सुलभ होती हैं, और बैकअप / संस्करण के लिए आपके व्यक्तिगत गिट रेपो के साथ समन्वयित होती हैं।
स्पार्क के साथ काम करना
Ilum में JupyterLab Sparkmagic और Ilum-Livy-Proxy सेवा के माध्यम से Apache Spark के साथ पूर्व-एकीकृत है।
कार्यप्रवाह:
- प्रयोग
%manage_sparkस्पार्क सत्र को कॉन्फ़िगर करने और शुरू करने के लिए। - प्रयोग
%%स्पार्कक्लस्टर पर स्पार्क (पायथन/स्काला/एसक्यूएल) कोड ब्लॉक चलाने के लिए जादू, स्थानीय रूप से नहीं। - Ilum UI वर्कलोड मॉड्यूल के माध्यम से अपने स्पार्क कार्यों को देखें/प्रबंधित करें।
- सत्र प्रति उपयोगकर्ता अलग-अलग होते हैं, आपकी अनुमतियों और संग्रहण के लिए मैप किए जाते हैं.
स्पार्क नोटबुक के पूर्ण उपयोग के लिए, देखें ज्यूपिटर नोटबुक के लिए गाइड
JupyterLab में Git का उपयोग करना
- गिट एक्सटेंशन:
JupyterLab साइडबार में Git टैब का उपयोग स्टेज करने, प्रतिबद्ध करने और कोड/नोटबुक पुश करने के लिए करें। - टर्मिनल पहुँच:
आप भी उपयोग कर सकते हैंगिटटर्मिनल में कमांड। - रिपोजिटरी मॉडल:
सभी परिवर्तन एक में किए जाते हैं साझा भंडार Gitea व्यवस्थापक खाते के तहत प्रबंधित। - प्रत्यय-पत्र:
साझा व्यवस्थापक रिपॉजिटरी के लिए कॉन्फ़िगर किए गए क्रेडेंशियल्स के साथ प्रमाणित। - सहयोग:
सभी उपयोगकर्ता एक ही रेपो में काम करते हैं, इसलिए संघर्षों से बचने के लिए समन्वय प्रतिबद्ध हैं। आप नोटबुक को इस रूप में भी निर्यात कर सकते हैं.आईपीआईएनबीया बाहरी रूप से साझा करने के लिए पीडीएफ।
सबसे सही तरीके
- अक्सर प्रतिबद्ध:
वर्जनिंग और बैकअप सुनिश्चित करने के लिए अपने काम को नियमित रूप से गिट में सहेजें। - समन्वय संपादन (साझा संस्करण):
यदि आप साझा JupyterLab परिनियोजन का उपयोग करते हैं, तो साझा रेपो में विरोध से बचने के लिए अपनी टीम के साथ समन्वय करें। - लीवरेज स्पार्कमैजिक:
वितरित नौकरियों को चलाने के लिए हमेशा स्पार्क जादू का उपयोग करें; नोटबुक सर्वर पर ही भारी कार्यभार न चलाएं। - निष्क्रिय गुठली बंद करें:
अप्रयुक्त गुठली या सत्रों को रोककर संसाधनों को मुक्त करें।
अधिक संसाधन
- Ilum में JupyterHub (वास्तुकला, LDAP, परिनियोजन)
- इलम में ज़ेपेलिन
- नोटबुक में स्पार्क उपयोग
- प्रथमच लॉगिन मार्गदर्शक