- اجتاحت موجة جديدة من أدوات الذكاء الاصطناعي العالم، وأعطتنا رؤية لطريقة ثورية للعمل وإيجاد المعلومات التي يمكن أن تبسط عملنا وحياتنا.
- هناك تشابه من ناحية المبدأ بين محرك بحث جوجل وروبوت الدردشة شات جي بي تي، فكلاهما يمكنك التواصل معه من خلال سطر واحد من المُدخلات النصية.
- بيد أن جوجل يعطيك مجموعة من نتائج البحث على شكل مقالات وصفحات ويب ذات علاقة بكلمة البحث التي استخدمتها.
- على النقيض من ذلك، يحلل شات جي بي تي سياق الكلمات المُدخلة محاولاً فهم مقصدك عند كتابة هذا السطر، ومن ثم يزوّدك برد مناسب وإجابة شاملة لسؤالك.
- لا يمكنك على سبيل المثال الطلب من جوجل كتابة قصة قصيرة أو كود برمجي من الصفر، ولكن شات جي بي تي يمكنه القيام بكل ذلك.
- في الأساس، تكمن ميزة جوجل في قدرته على البحث في ملايين قواعد البيانات وإعطائك أقرب النتائج لكلمة البحث.
- أما شات جي بي تي فتكمن قوته في قدرته على تحليل كلمات البحث من كافة الجوانب وإنتاج إجابة مخصصة لطلبك بناءً على المعلومات الموجودة في شبكة الإنترنت.
- سنشرح في هذا التقرير الآلية التي يتبعها شات جي بي تي لإنتاج هذه الإجابات بالتفصيل وبأسلوب مبسّط، ونجيب عن بعض الأسئلة التي من المؤكد أنها خطرت على بالك عند استخدام هذه الأداة.
المرحلتان الرئيسيتان لتشغيل شات جي بي تي
- دعونا نستخدم محرك البحث جوجل للمقارنة مرة أخرى. عندما تطلب من جوجل البحث عن شيء معين، فإنه في الحقيقة لا يبحث لحظتها في شبكة الإنترنت عن طلبك، وإنما يبحث في قواعد البيانات التي يخزنها عن صفحات ذات صلة بكلمة البحث المُستخدمة.
للاطلاع على المزيد من المواضيع والتقارير في صفحة مختارات أرقام
وهكذا فإن آلية عمل جوجل تتلخص في مرحلتين هما:
1- مرحلة جمع البيانات وفيها يتم التعرف على صفحات الويب وتخزين محتواها في قواعد بيانات ضخمة جداً.
2- مرحلة التفاعل مع المستخدم والبحث عن طلبه ضمن قواعد البيانات.
- يعمل شات جي بي تي بنفس الطريقة تقريبًا. تسمى مرحلة جمع البيانات مرحلة التدريب المُسبق، بينما تسمى مرحلة التفاعل مع المستخدم مرحلة الاستدلال.
- يعود سبب تطوّر مجال الذكاء الاصطناعي التوليدي مؤخراً بسرعة كبيرة إلى تطوّر المرحلة الأولى، أي التدريب المُسبق، وزيادة إمكانياتها بفضل تنامي إمكانيات الأجهزة والحوسبة السحابية.
- أصبحت قابلية التوسع هذه ممكنة بفضل الابتكارات الحديثة في تكنولوجيا الأجهزة والحوسبة السحابية بأسعار معقولة.
آلية عمل التدريب المُسبق في تقنيات الذكاء الاصطناعي التوليدي
- بشكل عام، يقوم الذكاء الاصطناعي بالتدريب المُسبق وفق آليتين إحداهما خاضعة للإشراف والأخرى غير خاضعة للإشراف.
- يُذكر أن معظم تقنيات الذكاء الاصطناعي التوليدي حتى يومنا هذا تدربت بواسطة الآلية الخاضعة للإشراف.
- في هذه الآلية يتم تدريب نموذج الذكاء الاصطناعي على مجموعة من البيانات المنظمة في جداول، بحيث يرتبط كل مُدخل بمُخرج مُحدد ومعروف.
- فعلى سبيل المثال يتم تدريب الذكاء الاصطناعي على مجموعة بيانات لمحادثة بين عميل وموظف خدمة العملاء.
- حيث تكون أسئلة وشكاوى العميل مرتبطة برد مناسب من قبل الموظف، وتُعتبر أسئلة العميل هي المُدخلات والإجابات هي المُخرجات.
- يتم تدريب التقنية على ربط المُدخل، على سبيل المثال، سؤال العميل "كيف يمكنني إعادة تعيين كلمة المرور" بالمُخرج المناسب وليكن مثلاً: "يمكنك إعادة تعيين كلمة المرور من خلال الدخول لصفحة إعدادات الحساب واتباع التعليمات".
- تتعلم تقنية الذكاء الاصطناعي وفق آلية التدريب الخاضعة للإشراف ربط المُدخلات بالمُخرجات الصحيحة، وبالتالي تتعلّم عدّة وظائف منها التصنيف، والتنبؤ بالقيم في مجال متسلسل منها وغيرها من المهارات.
- لا شك أن آلية التدريب هذه محدودة جداً، إذ يتوجب على البشر تزويد الآلة بكل المُدخلات والمُخرجات التي تخطر على البال.
- وبالتالي فإن عملية التدريب ستستغرق وقتاً طويلاً ولن تكون شاملة تماماً لكل المُدخلات والمُخرجات المُمكنة، بل ستكون هذه المُدخلات والمُخرجات مقتصرة على المجال الذي يختص به الشخص الذي يشرف على تدريب الآلة.
- ولكننا نعرف تماماً من خلال تجربتنا مع شات جي بي تي أنه لا حدود له تقريباً، إذ يمكنه كتابة قصص قصيرة والإجابة عن أسئلة تخصصية في مجالات السياسة والتاريخ والرياضيات وحتى كتابة أكواد برمجية دون أن يواجه أي صعوبة في ذلك.
- وبما أنه من المستحيل التنبؤ بكل الأسئلة التي يمكن أن يطرحها المستخدم على الآلة، فمن المستحيل أن يكون شات جي بي تي قد تدرب وفق الآلية الخاضعة للإشراف فحسب. وهنا يأتي دور التدريب غير الخاضع للإشراف.
مجموعات بيانات تدريب شات جي بي تي
- يعتمد شات جي بي تي أساساً على النسخة السابقة من هذا النموذج جي بي تي 3 (GPT-3). وقد تدرّب هذا النموذج على مجموعة بيانات تُدعى (WebText2)، وهي مكتبة ضخمة تحوي أكثر من 45 تيرابايت من البيانات النصية.
- هذه الكمية الضخمة من البيانات سمحت لشات جي بي تي بتعلّم العلاقات بين الكلمات والجمل وأنماطها والكثير من تفاصيل "اللغة الطبيعية" بسرعة ودقّة. وهذا ما جعله فعالاً جداً في إنتاج محتوى متناسق ومفهوم ومناسب لطلبات المستخدم.
- بشكل عام، عادةً ما تكون بيانات التدريب المستخدمة لصقل شات جي بي تي محادثة بطبيعتها ويتم تنسيقها خصيصًا لتشمل الحوارات بين البشر، مما يسمح لشات جي بي تي بتعلم كيفية توليد استجابات طبيعية وجذابة بتنسيق محادثة.
معالجة اللغات الطبيعية
- يهتم مجال معالجة اللغة الطبيعية بتمكين الحواسيب والآلات من فهم كلام البشر وتفسير مقاصده ومن ثم إنتاج نصوص مشابهة لهذا الكلام (أو ما يُدعى باللغة الطبيعية). ويُعد هذا المجال من المجالات المتطورة بسرعة والهامة جداً مؤخراً.
- يمكن استخدام تقنيات معالجة اللغة الطبيعية في الكثير من التطبيقات كروبوت الدردشة وتحليل المشاعر والتعرف على الكلام والترجمة، حيث تستخدم الشركات هذه التقنيات لأتمتة المهام وتحسين تجربة المستخدم.
- من التحديات التي تواجه هذا المجال التعامل مع تعقيدات وغموض اللغة التي يستخدمها البشر، إذ يتوجب تدريب تقنيات معالجة اللغة الطبيعية على الكثير من البيانات لتتمكن من استنتاج الأنماط وتعلم الفروق الدقيقة بين مقاصد اللغة. كما يتوجب تحديثها باستمرار بسبب ظهور تطورات جديدة دوماً على اللغات.
إدارة الحوار
- ربما لاحظت أن شات جي بي تي يمكنه طرح أسئلة متابعة لتوضيح مقصدك أو فهم احتياجاتك بشكل أفضل، وتقديم ردود مخصصة تأخذ في الاعتبار سجل المحادثة بأكمله.
- هذه هي الطريقة التي يمكن من خلالها لشات جي بي تي إجراء محادثات متعددة الأدوار مع المستخدمين بطريقة تبدو طبيعية وجذابة.
- يتضمن استخدام الخوارزميات وتقنيات التعلم الآلي لفهم سياق المحادثة والحفاظ عليها عبر تبادلات متعددة مع المستخدم.
- تُعد إدارة الحوار جانبًا مهمًا من جوانب معالجة اللغة الطبيعية لأنها تسمح لبرامج الكمبيوتر بالتفاعل مع الناس بطريقة تبدو وكأنها محادثة أكثر من كونها سلسلة من التفاعلات لمرة واحدة.
- يمكن أن يساعد ذلك في بناء الثقة والمشاركة مع المستخدمين، ويؤدي في النهاية إلى نتائج أفضل لكل من المستخدم والمؤسسة التي تستخدم البرنامج.
المصدر: زد نت
التعليقات {{getCommentCount()}}
كن أول من يعلق على الخبر
رد{{comment.DisplayName}} على {{getCommenterName(comment.ParentThreadID)}}
{{comment.DisplayName}}
{{comment.ElapsedTime}}