9.8 KiB

Raw Blame History

comments	description	keywords
true	Ultralytics मार्गदर्शिका में MobileSAM के बारे में और उसके प्रायोगशाला तुलनात्मक विवेचन, मूल SAM के साथ तुलना और इसे Ultralytics ढांचे में डाउनलोड और परीक्षण कैसे करें। अपने मोबाइल ऐप्लिकेशन को बेहतर बनाएं।	MobileSAM, Ultralytics, SAM, मोबाइल ऐप्लिकेशन, Arxiv, GPU, API, छवि एनकोडर, मास्क डिकोडर, मॉडल डाउनलोड, परीक्षण पद्धति

मोबाइल सेगमेंट कुछ भी (MobileSAM)

मोबाइलSAM पेपर arXiv पर अब उपलब्ध है।

MobileSAM के संचालन का एक प्रदर्शन कम्प्यूटर पर पहुंचा जा सकता है उस डेमो लिंक के माध्यम से। Mac i5 CPU पर प्रदर्शन करने में लगभग 3 सेकंड का समय लगता है। हगिंग फेस डेमो परिवेश और कम प्रदर्शन वाले सीपियू ने प्रतिक्रिया को धीमी किया है, लेकिन यह अभी भी प्रभावी ढंग से काम करता है।

मोबाइलSAM Grounding-SAM, AnyLabeling, और Segment Anything in 3D सहित विभिन्न परियोजनाओं में लागू है।

मोबाइलSAM एक एकल GPU पर 100k डेटासेट (मूल छवि का 1%) के साथ प्रशिक्षित होता है और इसमें एक दिन से कम समय लगता है। इस प्रशिक्षण के लिए कोड भविष्य में उपलब्ध कराया जाएगा।

उपलब्ध मॉडल, समर्थित कार्य और ऑपरेटिंग मोड

इस तालिका में उपलब्ध मॉडल, उनके विशिष्ट पूर्व-प्रशिक्षित वजन, वे कार्य जिन्हें वे समर्थन करते हैं, और उनका अभिन्नतम संगतता के साथ विभिन्न ऑपरेटिंग मोड (इंफरेंस, वैधानिकी, प्रशिक्षण, और निर्यात) प्रदर्शित किए गए हैं, जिन्हें समर्थित मोड के लिए ✅ emoji और असमर्थित मोड के लिए ❌ emoji से दर्शाया गया है।

मॉडल प्रकार	पूर्व-प्रशिक्षित वजन	समर्थित कार्य	इंफरेंस	वैधानिकी	प्रशिक्षण	निर्यात
MobileSAM	`mobile_sam.pt`	इंस्टेंस सेगमेंटेशन	✅	❌	❌	✅

SAM से MobileSAM में अनुकूलन

MobileSAM मूल SAM की तरफ से समान पाइपलाइन बरकरार रखता है, हमने मूल की प्री-प्रोसेसिंग, पोस्ट-प्रोसेसिंग और सभी अन्य इंटरफेसों को सम्मिलित कर दिया है। इसलिए, वर्तमान में मूल SAM का उपयोग करने वाले लोग मिनिमल प्रयास के साथ MobileSAM में ट्रांसिशन कर सकते हैं।

MobileSAM मूल SAM के समान पाइपलाइन में उत्तम प्रदर्शन करता है और केवल छवि एन्कोडर में परिवर्तन होता है। विशेष रूप से, हम मूल भारीवज्ञानिक ViT-H एन्कोडर (632M) को एक छोटे Tiny-ViT (5M) से बदलते हैं। एकल GPU पर MobileSAM लगभग 12ms प्रति छवि पर ऑपरेट करता है: 8ms छवि एन्कोडर पर और 4ms मास्क डिकोडर पर।

विट-आधारित इमेज एन्कोडरों की तुलना नीचे दी गई तालिका प्रदान करती है:

छवि एन्कोडर	मूल SAM	MobileSAM
पैरामीटर्स	611M	5M
स्पीड	452ms	8ms

मूल SAM और MobileSAM दोनों में समान प्रॉम्प्ट गाइडेड मास्क डिकोडर का उपयोग किया गया है:

मास्क डिकोडर	मूल SAM	MobileSAM
पैरामीटर्स	3.876M	3.876M
स्पीड	4ms	4ms

यहां पाइपलाइन की तुलना है:

पूरा पाइपलाइन (एन्कोडर+डिकोडर)	मूल SAM	MobileSAM
पैरामीटर्स	615M	9.66M
स्पीड	456ms	12ms

MobileSAM और मूल SAM के प्रदर्शन को एक बिन्दु और बॉक्स के रूप में प्रदर्शित किया जाता है।

बेहतर प्रदर्शन से MobileSAM मौजूदा FastSAM की तुलना में लगभग 5 गुना छोटा और 7 गुना तेज है। अधिक विवरण MobileSAM प्रोजेक्ट पेज पर उपलब्ध हैं।

Ultralytics में MobileSAM का परीक्षण

मूल SAM की तरह ही, हम Ultralytics में एक सीधा परीक्षण विधि प्रदान करते हैं, जिसमें बिंदु और बॉक्स प्रॉम्प्ट्स दोनों के लिए मोड शामिल हैं।

मॉडल डाउनलोड

आप यहां से मॉडल डाउनलोड कर सकते हैं here।

बिंदु प्रॉम्प्ट

!!! Example "उदाहरण"

=== "Python"
    ```python
    from ultralytics import SAM

    # मॉडल लोड करें
    model = SAM('mobile_sam.pt')

    # बिंदु प्रॉम्प्ट पर आधारित एक सेगमेंट पूर्वानुमान करें
    model.predict('ultralytics/assets/zidane.jpg', points=[900, 370], labels=[1])
    ```

बॉक्स प्रॉम्प्ट

!!! Example "उदाहरण"

=== "Python"
    ```python
    from ultralytics import SAM

    # मॉडल लोड करें
    model = SAM('mobile_sam.pt')

    # बॉक्स प्रॉम्प्ट पर आधारित एक सेगमेंट पूर्वानुमान करें
    model.predict('ultralytics/assets/zidane.jpg', bboxes=[439, 437, 524, 709])
    ```

हमने MobileSAM और SAM दोनों को एक ही API का उपयोग करके इम्प्लिमेंट किया है। अधिक उपयोग जानकारी के लिए, कृपया SAM पेज देखें।

संदर्भ और आभार

अगर आप अपने अनुसंधान या विकास कार्य में MobileSAM का उपयोगयोगी पाते हैं, तो कृपया हमारे पेपर को साइट करने का विचार करें:

!!! Quote "" === "BibTeX"

    ```bibtex
    @article{mobile_sam,
      title={Faster Segment Anything: Towards Lightweight SAM for Mobile Applications},
      author={Zhang, Chaoning and Han, Dongshen and Qiao, Yu and Kim, Jung Uk and Bae, Sung Ho and Lee, Seungkyu and Hong, Choong Seon},
      journal={arXiv preprint arXiv:2306.14289},
      year={2023}
    }

9.8 KiB Raw Blame History