ماهو ChatGPT وكيف يمكنك استخدامه؟

هذا هو ChatGPT ولماذا قد يكون أهم أداة منذ محركات البحث الحديثة

قدم OpenAI ذكاء اصطناعي طويل الإجابة على الأسئلة يسمى ChatGPT، يجيب على الأسئلة المعقدة بالمحادثة. إنها تقنية ثورية لأنها مدربة على تعلم ما يعنيه البشر عندما يطرحون سؤالاً.

يشعر العديد من المستخدمين بالرهبة من قدرته على تقديم استجابات ذات جودة بشرية، مما يلهم الشعور بأنه قد يكون لديه في النهاية القدرة على تعطيل كيفية تفاعل البشر مع أجهزة الكمبيوتر وتغيير كيفية استرداد المعلومات.

ماهو ChatGPT؟

ChatGPT هو روبوت دردشة نموذجي كبير للغة تم تطويره بواسطة OpenAI بناءً على GPT-3.5. لديها قدرة رائعة على التفاعل في شكل حوار محادثة وتقديم ردود يمكن أن تبدو بشرية بشكل مدهش.

تؤدي نماذج اللغات الكبيرة مهمة التنبؤ بالكلمة التالية في سلسلة من الكلمات.

التعلم المعزز مع التغذية الراجعة البشرية (RLHF) هو طبقة إضافية من التدريب تستخدم ردود الفعل البشرية، لمساعدة ChatGPT على تعلم القدرة على اتباع الاتجاهات وتوليد استجابات مرضية للبشر.

من بدأ ChatGPT؟

تم إنشاء ChatGPT بواسطة شركة OpenAI للذكاء الاصطناعي، ومقرّها سان فرانسيسكو. OpenAI Inc، هي الشركة الأم غير الربحية لشركة OpenAI LP الربحية.

تشتهر أوبن إيه آي بنموذج DALL·E المعروف، وهو نموذج التعلم العميق الذي يولد صورًا من تعليمات نصية تسمى المطالبات. الرئيس التنفيذي هو Sam Altman، الذي كان سابقًا رئيس Y Combinator.

مايكروسوفت شريك ومستثمر بمبلغ 1 مليار دولار. لقد طوروا بشكل مشترك منصة Azure AI.

نماذج لغوية كبيرة

ChatGPT هو نموذج لغة كبير (LLM). يتم تدريب نماذج اللغات الكبيرة (LLMs) على كميات هائلة من البيانات للتنبؤ بدقة بالكلمة التالية في الجملة.

تم اكتشاف أنّ زيادة كمية البيانات زادت من قدرة النماذج اللغوية على فعل المزيد.

وفقًا لجامعة ستانفورد:

تحتوي GPT-3 على 175 مليار معلمة وتم تدريبها على 570 غيغابايت من النص. للمقارنة ، كان سلفه ، GPT-2 ، أصغر بأكثر من 100 مرة عند 1.5 مليار معلمة.

تؤدي هذه الزيادة في الحجم إلى تغيير جذري في سلوك النموذج – GPT-3 قادر على أداء المهام التي لم يتم تدريبها بشكل صريح ، مثل ترجمة الجمل من الإنجليزية إلى الفرنسية ، مع القليل من الأمثلة التدريبية أو معدومة.

كان هذا السلوك غائبًا في الغالب في GPT-2. علاوة على ذلك ، بالنسبة لبعض المهام ، يتفوق GPT-3 على النماذج التي تم تدريبها بشكل صريح على حل تلك المهام ، على الرغم من أنها تقصر في المهام الأخرى “.

تتوقع LLMs الكلمة التالية في سلسلة من الكلمات في جملة والجمل التالية نوعًا ما مثل: المكتمل تلقائيًا، ولكن على مقياس مذهل.

تسمح لهم هذه القدرة بكتابة فقرات وصفحات كاملة من المحتوى. لكن LLMs محدودة من حيث إنها لا تفهم دائمًا ما يريده الإنسان بالضبط.

وهذا هو المكان الذي تتحسن فيه ChatGPT على أحدث التقنيات، من خلال تدريب التعلم المعزز مع التعليقات البشرية (RLHF) المذكور أعلاه.

كيف تم تدريب ChatGPT؟

تم تدريب GPT-3.5 على كميات هائلة من البيانات حول الكود والمعلومات من الإنترنت، بما في ذلك مصادر مثل: مناقشات Reddit، لمساعدة ChatGPT على تعلم الحوار وتحقيق أسلوب إنساني في الاستجابة.

تم تدريب ChatGPT أيضًا باستخدام التعليقات البشرية (تقنية تسمى التعلم المعزز مع التعليقات البشرية)، بحيث تعلم الذكاء الاصطناعي ما يتوقعه البشر عندما طرحوا سؤالًا. تدريب LLM بهذه الطريقة ثوري لأنه يتجاوز مجرد تدريب LLM للتنبؤ بالكلمة التالية.

تشرح ورقة بحثية نُشرت في مارس 2022 بعنوان: “نماذج اللغة التدريبية لاتباع التعليمات مع الملاحظات البشرية” سبب كون هذا نهجًا رائعًا:

“هذا العمل مدفوع بهدفنا لزيادة التأثير الإيجابي لنماذج اللغة الكبيرة من خلال تدريبهم على القيام بما تريده مجموعة معينة من البشر منهم.

افتراضيًا، تعمل نماذج اللغة على تحسين هدف التنبؤ بالكلمة التالية، وهو مجرد وكيل لما نريد أن تفعله هذه النماذج.

تشير نتائجنا إلى أن تقنياتنا تبشر بجعل نماذج اللغة أكثر فائدة وصدقًا وغير ضارة.

جعل نماذج اللغة أكبر لا يجعلها بطبيعتها أفضل في اتباع نية المستخدم.

على سبيل المثال، يمكن لنماذج اللغات الكبيرة أن تولد مخرجات غير صادقة أو سامة أو ببساطة غير مفيدة للمستخدم.

وبعبارة أخرى، لا تتماشى هذه النماذج مع مستخدميها “.

استأجر المهندسون الذين بنوا ChatGPT مقاولين (يطلق عليهم العلامات) لتقييم مخرجات النظامين، GPT-3 وInstructGPT الجديد («نموذج الأخوة» لـ ChatGPT).

بناءً على التقييمات، توصّل الباحثون إلى الاستنتاجات التالية:

“يفضل العاملون بشكل كبير مخرجات InstructGPT على المخرجات من GPT-3.

تُظهر نماذج InstructGPT تحسينات في الصدق على GPT-3.

يُظهر InstructGPT تحسينات طفيفة في السمية على GPT-3، ولكن ليس التحيز. “

خلصت الورقة البحثية إلى أنّ نتائج InstructGPT كانت إيجابية. ومع ذلك، فقد أشار أيضًا إلى وجود مجال للتحسين.

“بشكل عام ، تشير نتائجنا إلى أن ضبط نماذج اللغة الكبيرة باستخدام التفضيلات البشرية يحسن بشكل كبير سلوكهم في مجموعة واسعة من المهام ، على الرغم من أنه لا يزال هناك الكثير من العمل الذي يتعين القيام به لتحسين سلامتها وموثوقيتها.”

ما يميز ChatGPT عن روبوت الدردشة البسيط هو أنه تم تدريبه خصيصًا لفهم النية البشرية في السؤال وتقديم إجابات مفيدة وصادقة وغير ضارة.

بسبب هذا التدريب، قد تتحدى ChatGPT أسئلةً معينة وتتجاهل أجزاءً من السؤال لا معنًى لها. تُظهر ورقة بحثية أخرى تتعلق بـ ChatGPT كيف قاموا بتدريب الذكاء الاصطناعي على التنبؤ بما يفضله البشر.

لاحظ الباحثون أن المقاييس المستخدمة لتقييم مخرجات معالجة الذكاء الاصطناعي للغة الطبيعية أدت إلى آلات سجلت نتائج جيدة في المقاييس، لكنها لم تتماشَ مع ما توقعه البشر.

فيما يلي كيف شرح الباحثون المشكلة:

“تعمل العديد من تطبيقات التعلم الآلي على تحسين المقاييس البسيطة التي ليست سوى وكلاء تقريبيين لما ينوي المصمم. يمكن أن يؤدي هذا إلى مشاكل، مثل توصيات اليوتيوب التي تروج لطعم النقر. “

لذا كان الحل الذي صمموه هو إنشاء ذكاء اصطناعي يمكنه إخراج إجابات محسّنة لما يفضله البشر. للقيام بذلك، قاموا بتدريب الذكاء الاصطناعي باستخدام مجموعات بيانات من المقارنات البشرية بين الإجابات المختلفة بحيث أصبحت الآلة أفضل في التنبؤ بما يعتبره البشر إجابات مرضية.

تشارك الصحيفة أن التدريب تم من خلال تلخيص منشورات Reddit واختبارها أيضًا على تلخيص الأخبار. تسمى الورقة البحثية الصادرة في فبراير 2022 “تعلم التلخيص من ردود الفعل البشرية.

كتب الباحثون:

“في هذا العمل، نظهر أنه من الممكن تحسين جودة الملخص بشكل كبير من خلال تدريب نموذج لتحسين التفضيلات البشرية.

نجمع مجموعة بيانات كبيرة عالية الجودة من المقارنات البشرية بين الملخصات، وندرب نموذجًا للتنبؤ بالملخص المفضل لدى الإنسان، ونستخدم هذا النموذج كدالة مكافأة لضبط سياسة التلخيص باستخدام التعلم المعزز”.

ما هي حدود ChatGPT؟

القيود المفروضة على الاستجابة

تمت برمجة ChatGPT على وجه التحديد لعدم توفير استجابات سامة أو ضارة. لذلك ستتجنب الإجابة على هذه الأنواع من الأسئلة.

تعتمد جودة الإجابات على جودة الاتجاهات

ويتمثل أحد القيود الهامة على ChatGPT في أنّ جودة الناتج تعتمد على جودة المدخلات. بعبارة أخرى، تولد توجيهات الخبراء (المطالب) إجابات أفضل.

الإجابات ليست صحيحة دائمًا

قيود أخرى هي أنه نظرًا لأنه مدرب على تقديم إجابات تشعر بأنها مناسبة للبشر، يمكن للإجابات أن تخدع البشر بأنّ الناتج صحيح.

اكتشف العديد من المستخدمين أنّ ChatGPT يمكن أن يقدّم إجابات غير صحيحة، بما في ذلك بعض الإجابات غير الصحيحة إلى حد كبير.

ربما اكتشف المشرفون على موقع الأسئلة والأجوبة الخاص بالترميز Stack Overflow نتيجة غير مقصودة للإجابات التي تشعر بأنها مناسبة للبشر.

غمر Stack Overflow بإجابات المستخدمين الناتجة عن ChatGPT، والتي بدت صحيحة، لكن العديد منها كان إجابات خاطئة.

طغت آلاف الإجابات على فريق المشرفين المتطوعين، مما دفع المسؤولين إلى سن حظر ضد أي مستخدم ينشر إجابات تم إنشاؤها من ChatGPT.

أدى تدفق إجابات ChatGPT إلى منشور بعنوان: “السياسة المؤقتة: تم حظر ChatGPT“:

“هذه سياسة مؤقتة تهدف إلى إبطاء تدفق الإجابات والمحتوى الآخر الذي تم إنشاؤه باستخدام ChatGPT.

… المشكلة الأساسية هي أنه في حين أن الإجابات التي تنتجها ChatGPT لها معدل مرتفع من كونها غير صحيحة، فإنها عادة “تبدو” أنها “قد” تكون جيدة”.

إن تجربة وسطاء Stack Overflow مع إجابات ChatGPT الخاطئة التي تبدو صحيحة هي أمر تدركه شركة OpenAI، صانعو ChatGPT، وحذروا منه في إعلانهم عن التكنولوجيا الجديدة.

يشرح OpenAI حدود ChatGPT

قدم إعلان OpenAI هذا التحذير:

“تكتب ChatGPT أحيانًا إجابات تبدو معقولة ولكنها غير صحيحة أو غير منطقية.

إن إصلاح هذه المشكلة يمثل تحديًا، على النحو التالي:

(1) أثناء تدريب RL، لا يوجد حاليًا مصدر للحقيقة ؛

(2) تدريب النموذج على توخي مزيد من الحذر مما يجعله يرفض الأسئلة التي يمكنه الإجابة عليها بشكل صحيح ؛ ‘

(3) التدريب الخاضع للإشراف يضلل النموذج لأن الإجابة المثالية تعتمد على ما يعرفه النموذج، وليس ما يعرفه المتظاهر البشري”.

هل ChatGPT مجاني الاستخدام؟

استخدام ChatGPT مجاني حاليًا خلال وقت «معاينة البحث». روبوت الدردشة مفتوح حاليًا للمستخدمين لتجربة وتقديم ملاحظات حول الردود حتى يصبح الذكاء الاصطناعي أفضل في الإجابة على الأسئلة والتعلم من أخطائه.

ينصّ الإعلان الرسمي على أن شركة OpenAI حريصة على تلقي ملاحظات حول الأخطاء:

“بينما بذلنا جهودًا لجعل النموذج يرفض الطلبات غير المناسبة، فإنه يستجيب أحيانًا للتعليمات الضارة أو يظهر سلوكًا متحيزًا.

نحن نستخدم واجهة برمجة التطبيقات المعتدلة لتحذير أو حظر أنواع معينة من المحتوى غير الآمن، لكننا نتوقع أن يكون لها بعض السلبيات والإيجابيات الخاطئة في الوقت الحالي.

نحن حريصون على جمع تعليقات المستخدمين للمساعدة في عملنا المستمر لتحسين هذا النظام”.

توجد حاليًا مسابقة بجائزة قدرها 500 دولار في اعتمادات ChatGPT، لتشجيع الجمهور على تقييم الردود.

“يتم تشجيع المستخدمين على تقديم ملاحظات حول مخرجات النماذج الإشكالية من خلال واجهة المستخدم، وكذلك على الإيجابيات/السلبيات الخاطئة من مرشح المحتوى الخارجي الذي يعد أيضًا جزءًا من الواجهة.

نحن مهتمون بشكل خاص بالتعليقات المتعلقة بالمخرجات الضارة التي يمكن أن تحدث في العالم الحقيقي، والظروف غير العدائية، بالإضافة إلى التعليقات التي تساعدنا في الكشف عن وفهم المخاطر الجديدة والتخفيف المحتمل.

يمكنك اختيار إدخال ChatGPT Feedback Contest3 للحصول على فرصة للفوز بما يصل إلى 500 دولار في أرصدة API.

يمكن إرسال الإدخالات عبر نموذج التغذية المرتدة المرتبط في واجهة ChatGPT”.

هل ستحل النماذج اللغوية محل بحث غوغل؟

أنشأ غوغل نفسها بالفعل روبوت دردشة للذكاء الاصطناعي يسمى LaMDA. كان أداء روبوت الدردشة من غوغل قريبًا جدًا من محادثة بشرية لدرجة أن مهندس غوغل ادعى أن LaMDA كان واعيًا.

بالنظر إلى كيف يمكن لهذه النماذج اللغوية الكبيرة الإجابة على العديد من الأسئلة، فهل من بعيد المنال أن تستبدل شركة مثل OpenAI أو غوغل أو مايكروسوفت يومًا ما البحث التقليدي بروبوت دردشة AI؟

أعلن البعض على تويتر بالفعل، أنّ ChatGPT ستكون غوغل التالية.

السيناريو القائل إن روبوت الدردشة للأسئلة والأجوبة قد يحلّ يومًا ما محلّ غوغل مخيف لأولئك الذين يكسبون عيشهم كمحترفين في تسويق البحث.

لقد أثارت مناقشات في مجتمعات تسويق البحث عبر الإنترنت، مثل: Facebook SEOSignals Lab الشهير؛ حيث سأل شخص ما إذا كانت عمليات البحث قد تبتعد عن محركات البحث وتتجه نحو روبوتات الدردشة.

بعد اختبار ChatGPT، يجب أن أوافق على أنّ الخوف من استبدال البحث بروبوت الدردشة لا أساس له من الصحة. لا يزال أمام التكنولوجيا طريق طويل لتقطعه، ولكن من الممكن تصوّر مستقبل بحث هجين وروبوت دردشة للبحث. لكن يبدو أن التنفيذ الحالي لـ ChatGPT هو أداة تتطلب، في مرحلة ما، شراء أرصدة لاستخدامها.

كيف يمكن استخدام ChatGPT؟

يمكن لـ ChatGPT كتابة التعليمات البرمجية والقصائد والأغاني وحتى القصص القصيرة بأسلوب مؤلف معين. تعمل الخبرة في الاتجاهات التالية على رفع مستوى ChatGPT من مصدر معلومات إلى أداة يمكن طلبها لإنجاز مهمة ما.

هذا يجعلها مفيدة لكتابة مقال حول أي موضوع تقريبًا. يمكن أن تعمل ChatGPT كأداة لإنشاء الخطوط العريضة للمقالات أو حتى الروايات بأكملها. وسيقدّم ردّاً على أيّ مهمة تقريباً يمكن الردّ عليها بنص مكتوب.

الاستنتاج

كما ذكرنا سابقًا، يتم تصور ChatGPT كأداة سيتعين على الجمهور في النهاية دفعها لاستخدامها. تم تسجيل أكثر من مليون مستخدم لاستخدام ChatGPT خلال الأيام الخمسة الأولى منذ فتحه للجمهور.

اقرأ أيضاً

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا
Captcha verification failed!
فشل نقاط مستخدم captcha. الرجاء التواصل معنا!

أحدث الأخبار