बुध: प्रसार के माध्यम से समानांतर टोकन पीढ़ी

Original: English

इंसेप्शन लैब्स ने मर्करी पेश किया, जो एक प्रसार-आधारित भाषा मॉडल है जो NVIDIA H100 GPU पर 1000 टोकन/सेकंड पर समानांतर टोकन पीढ़ी को सक्षम बनाता है। अनुक्रमिक रूप से उत्पन्न होने वाले ऑटोरेग्रेसिव मॉडल के विपरीत:

ऑटोरेग्रेसिव जटिलता: एन टोकन के लिए ओ(एन)।

प्रसार समानांतर पीढ़ी: O(1) से O(लॉग एन)

यह अनुक्रमिक से समानांतर पाठ निर्माण की ओर एक मौलिक बदलाव का प्रतिनिधित्व करता है, संभावित रूप से परिमाण के क्रम से अनुमान लागत को कम करता है।

एजेंटिक सिस्टम में पैरामीटर दक्षता

शोध से संकेत मिलता है कि 10 अरब मापदंडों के तहत मॉडल एजेंटिक एआई कार्यों के लिए इष्टतम हो सकते हैं। स्केलिंग प्रतिमान को चुनौती देते हुए, सामान्य प्रयोजन के बड़े मॉडल की तुलना में विशिष्ट छोटे मॉडल संरचित, नियमित संचालन के लिए बेहतर दक्षता प्रदर्शित करते हैं।

विचार श्रृंखला की तर्क सीमाएँ

कई अध्ययनों से पता चलता है कि स्पष्ट तर्क कदम सटीकता में सुधार किए बिना झूठा आत्मविश्वास बढ़ा सकते हैं। तर्क की शब्दाडंबरता और शुद्धता के बीच संबंध पहले की तुलना में कमजोर है, जिसका एआई सुरक्षा सत्यापन पर प्रभाव पड़ता है।

डिफ्यूजन लैंग्वेज मॉडल बनाम ऑटोरेग्रेसिव आर्किटेक्चर

डिफ्यूजन लैंग्वेज मॉडल (डीएलएम) डेटा-सीमित परिदृश्यों में बेहतर प्रदर्शन दिखाते हैं। "इंटेलिजेंस क्रॉसओवर" वहां होता है:

डेटा दक्षता अनुपात: DLM_performance / Autoregressive_performance > 1

जब डेटासेट का आकार < थ्रेशोल्ड_वैल्यू

इससे पता चलता है कि डीएलएम प्रतिबंधित प्रशिक्षण डेटा से अधिक अर्थ संबंधी जानकारी निकालते हैं।

स्वायत्त अनुसंधान प्रणालियाँ

कोस्मोस एआई-संचालित वैज्ञानिक खोज का प्रतिनिधित्व करता है, जो समानांतर डेटा विश्लेषण और पुनरावृत्त परिकल्पना परीक्षण को महीनों के बजाय घंटों में पूरा करता है। यह स्वचालित अनुसंधान वर्कफ़्लो की व्यवहार्यता को प्रदर्शित करता है।

निहितार्थ

समानांतर प्रसंस्करण आर्किटेक्चर के साथ छोटे, विशेष मॉडलों की ओर अभिसरण गणना-गहन स्केलिंग से दक्षता-अनुकूलित डिजाइन में बदलाव का सुझाव देता है। यदि पारा के प्रसार दृष्टिकोण को मान्य किया जाता है, तो कम कम्प्यूटेशनल आवश्यकताओं के माध्यम से उच्च-प्रदर्शन एआई अनुमान को लोकतांत्रिक बनाया जा सकता है।

Log in to add a comment.

Embed YouTube Video

Comments (0)

No comments yet. Be the first to comment!