نبض أرقام
08:24 ص
توقيت مكة المكرمة

2024/12/18
2024/12/17

مامبا: ثورة في معالجة البيانات تتفوق على كافة النماذج السابقة

2024/08/17 أرقام

- تشهد صناعة الذكاء الاصطناعي تطورًا سريعًا بفضل هيمنة نماذج المحولات، التي أحرزت تقدمًا كبيرًا في السنوات الأخيرة بفضل قدرتها على معالجة البيانات بشكل فعال وتوليد نصوص إبداعية وتحليل معقد.

 

- إلا أن هناك بديلاً واعدًا يظهر في الأفق، وهو نماذج مساحة الحالة مثل مامبا (Mamba)، التي تقدم بديلاً جذابًا للمحولات.

 

- تمتاز مامبا بقدرتها على التعامل مع تسلسلات طويلة جدًا تصل إلى مليون رمز، وهو ما يعكس إنجازًا مهمًا في التغلب على مشكلة "الاختناق التربيعي" التي تواجهها نماذج المحولات.

 

- كما أن مامبا تتفوق على المحولات في سرعة الأداء، حيث تصل سرعتها إلى حوالي خمس مرات أسرع من المحولات التقليدية.

 

- وتُعتبر مامبا مثالية لنمذجة البيانات الكبيرة والمتنوعة مثل اللغات والصوت والجينوم، مما يجعلها خيارًا مثيرًا للاهتمام في العديد من التطبيقات.

 

- نموذج مامبا-3ب (Mamba-3B)، على سبيل المثال، يتفوق على نماذج المحولات الأكبر حجمًا في مجموعة متنوعة من المهام، مما يفتح المجال أمام تطبيقات جديدة ومبتكرة في الذكاء الاصطناعي.

 

- في هذا التقرير، سنناقش المزايا والعيوب المتعلقة بنماذج مامبا مقارنةً بنماذج المحولات، ونتناول القياسات والحدس الذي يدفعنا للتفكير في إمكانيات مامبا، وأهمية ذلك بالنسبة لقابلية التفسير وسلامة الذكاء الاصطناعي.

 

مشاكل المحولات: تحديات وأساليب جديدة

 

 

- أحدثت نماذج المحولات ثورة في عالم التعلم الآلي، حيث تجاوزت قدراتها التصنيف البسيط للصور إلى إنجازات معقدة مثل توليد نصوص إبداعية وحل مشاكل علمية معقدة.

 

للاطلاع على المزيد من المواضيع والتقارير في صفحة مختارات أرقام

 

- تعتمد المحولات على تقنية تتيح لكل عنصر نصي الرجوع إلى جميع العناصر السابقة أثناء التنبؤ، مما يتطلب تخزين كميات هائلة من المعلومات في ذاكرة مؤقتة تُعرف بـ"KV"، هذه الآلية، رغم فعاليتها، تزيد من تعقيد العملية الحسابية وتؤدي إلى بطء كبير في التدريب وزيادة في متطلبات الذاكرة.

 

- حتى مع إضافة المزيد من الأجهزة لمعالجة مشكلات الذاكرة، تظل مشكلة البطء الشديد قائمة، مما يحد من فعالية المحولات عند التعامل مع كميات كبيرة من البيانات.

 

الهياكل الأساسية لنماذج التعلم الآلي

 

- تحتوي جميع الهياكل الأساسية الفعالة في هندسة التعلم الآلي على مكونات أساسية تتعلق بعمليتين: التواصل بين الرموز والحسابات داخل الرموز.

 

- في قلب نماذج التعلم الآلي نجد عمليتي الانتباه والحوسبة، حيث يتيح الانتباه للنموذج التركيز على الأجزاء المهمة من البيانات، بينما تقوم الحوسبة بمعالجة هذه المعلومات. تحسين أداء النماذج يستلزم تطوير هاتين العمليتين بشكل متكامل.

 

بدائل الانتباه: نموذج فضاء الحالة

 

- في محاولة لتحسين فعالية النماذج، نقوم حاليًا بتطوير آلية جديدة تعتمد على نموذج فضاء الحالة المستوحى من نظرية التحكم، والتي تهدف إلى تسهيل التفاعل بين عناصر البيانات المختلفة.

 

- بينما نحتفظ بآلية الحوسبة القائمة على الشبكات العصبية متعددة الطبقات، فإن الهدف من هذا التغيير هو تقليل التعقيد وزيادة كفاءة النموذج.

 

تدفق المعرفة في نماذج التحويل ونماذج مامبا

 

 

- تتغذى نماذج الذكاء الاصطناعي على نوعين من البيانات: بيانات التدريب وبيانات السياق. وتشمل بيانات التدريب المسبق، الذي يتضمن التعلم من كميات هائلة من البيانات، والضبط الدقيق لتخصيص النموذج لمهام محددة، وتعزيز التعلم من خلال التفاعل البشري.

 

- ويشبه تأثير هذه البيانات على النموذج تأثير الجينات على الكائن الحي، حيث يحمل النموذج بصمات التجارب السابقة دون تذكر التفاصيل الدقيقة.

 

- من ناحية أخرى، توفر بيانات السياق معلومات في الوقت الفعلي أثناء التفاعل مع المستخدم، مما يساعد النموذج على فهم المعنى المقصود وتقديم استجابات مناسبة.

 

في سياق البيانات

 

- في سياق البيانات، تقوم نماذج المحولات بدور الذاكرة المؤقتة الدقيقة، حيث تقوم بتخزين المعلومات السياقية واسترجاعها عند الحاجة.

 

- تتيح هذه الميزة للمحولات أداء مهام متنوعة، مثل التعرف على الأجسام غير المرئية وحساب الانحدارات الخطية.

 

الاسترجاع في المحولات

 

- عملية الاسترجاع هي جوهر عمل نماذج المحولات اللغوية، حيث تستدعي هذه النماذج المعلومات ذات الصلة من قاعدة بيانات واسعة قبل توليد النصوص.

 

- تشبه هذه العملية البحث عن كتاب في مكتبة، حيث يتطلب الأمر تحديد الكلمات المفتاحية الصحيحة للوصول إلى المعلومات المطلوبة.

 

- بعد العثور على المعلومات، يتم تقديمها للمحول كمدخل لعملية التوليد، مما يعزز دقة وشمولية النصوص المنتجة.

 

تدفق المعلومات في مامبا

 

 

- يتميز نموذج مامبا بآلية مبتكرة لتدفق المعلومات، حيث يدمج بين البيانات السياقية والاسترجاع بطريقة متكاملة.

 

- تعتمد مامبا على بيانات تدريب واسعة النطاق مع تركيز خاص على تحسين معالجة البيانات السياقية والاسترجاع.

 

- حيث تخضع البيانات السياقية في مامبا لعمليات تحويل وتصفية متقدمة، مما يجعلها أكثر ملاءمة لعمليات الاسترجاع.

 

- وتقدم مامبا واجهة برمجة تطبيقات للوصول إلى البيانات السياقية، ولكن دقة النتائج تعتمد على طبيعة البيانات المستخدمة.

 

تطورات متوقعة في نماذج اللغات الكبيرة

 

- من المتوقع أن تكون نماذج اللغات الكبيرة مثل مامبا أكثر كفاءة في المهام التي تتطلب فهمًا عميقًا لسياق واسع وحفظًا طويل الأمد.

 

- وتشمل التطبيقات المحتملة لهذه النماذج تحليل البيانات الجينية، توليد المحتوى المرئي، وإنتاج نصوص إبداعية مثل الروايات.

 

التلخيص وتحسين كفاءة المعالجة

 

- تخيل وكيلاً يتفاعل مع البيئة المحيطة ويتراكم لديه كمية هائلة من البيانات، ومع محدودية قدرة المحولات على معالجة هذه البيانات، يصبح من الضروري تبسيطها وتلخيصها.

 

- في حالة معالجة النصوص، قد يكون لدى طلاب القانون الخبرة الكافية لتلخيص النصوص القانونية المعقدة، حيث يُحافظ على الجوهر الأساسي للمعلومات رغم فقدان بعض التفاصيل.

 

- ولكن التلخيص في مجالات أخرى، مثل تلخيص فيلم مدته ساعتان، يظل معضلة. وهنا نتساءل هل يمكن للنموذج تعلم عملية التلخيص بشكل تلقائي بدلاً من الاعتماد على وصف الجوانب الجمالية للفيلم؟ هذا هو المجال الذي تتيح فيه تقنية مامبا إمكانيات جديدة.

 

سلامة الذكاء الاصطناعي

 

 

- تعتبر نماذج اللغات من العوامل الرئيسية في التخفيف من المخاطر المرتبطة بالذكاء الاصطناعي العام، وبعد أن كانت الأنظمة التي تعتمد على التعلم الذاتي مرشحة بارزة لتحقيق ذكاء اصطناعي عام، قدمت نماذج اللغات بديلاً أكثر أمانًا، حيث تفتقر إلى الأهداف بعيدة المدى التي قد تؤدي إلى مخاطر.

 

- تسلط القدرة على التفكير بعيد المدى الضوء على أهمية ضمان سلامة أنظمة الذكاء الاصطناعي القائمة على الوكلاء.

 

- رغم أن المخاوف المتعلقة بالوكلاء قد تكون أقل أهمية في النماذج اللغوية الكبيرة ذات نوافذ السياق الضخمة، إلا أن العديد منها يرتبط بالأنظمة ذات الذاكرة الطويلة الأمد والأهداف الذاتية المحتملة.

 

- وهنا تقدم تقنية مامبا بديلاً واعدًا في معالجة المعلومات وتقديم تحسينات على نماذج المحولات، مع توفير إمكانيات جديدة في التلخيص وكفاءة المعالجة، إضافةً إلى تحسين سلامة الذكاء الاصطناعي.

 

- ومع ذلك، ما زال الطريق طويلًا أمام كل من نماذج المحولات ومامبا لتحقيق توازن بين فعالية الأداء والتعامل مع البيانات الكبيرة، مما يفتح المجال لمزيد من الابتكارات في هذا المجال.

 

المصدر: ذا جرادينت

التعليقات {{getCommentCount()}}

كن أول من يعلق على الخبر

loader Train
عذرا : لقد انتهت الفتره المسموح بها للتعليق على هذا الخبر
الآراء الواردة في التعليقات تعبر عن آراء أصحابها وليس عن رأي بوابة أرقام المالية. وستلغى التعليقات التي تتضمن اساءة لأشخاص أو تجريح لشعب أو دولة. ونذكر الزوار بأن هذا موقع اقتصادي ولا يقبل التعليقات السياسية أو الدينية.