كل شيء عن وكلاء الذكاء الاصطناعي: كيف يعملون وما فائدتهم؟

نستعرض في هذا المقال مفهوم وكلاء الذكاء الاصطناعي ببساطة، كيف يعملون وما فائدتهم وما يمكنهم فعله عكس الأنظمة التقليدية للذكاء الاصطناعي.
استطاعت روبوتات الذكاء الاصطناعيّ مثل ChatGPT و Gemini خلال فترة وجيزة للغاية أن تتسلّل إلى أيدي ملايين المُستخدمين حول العالم بفضل قابليّتها المُستمرّة للتطوّر لتُصبح اليوم بين قائمة أكثر التطبيقات والخدمات استخدامًا على الإنترنت، هُناك من يستخدمها بصورة يوميّة للحصول على إجابات سريعة لاستفساراته، أو كأداة مُساعدة لإنجاز بعض المهام كإنشاء الصور أو إعداد خطط العمل أو كتابة التعليمات والأوامر البرمجيّة وغير ذلك الكثير.

وبينما لا يزال البعض حتّى هذه اللحظة واقفًا أمام هذه البوتات، غير مُصدّق لكُلّ هذه الأشياء التي يستغرق المُساعد الذكي ثوانٍ معدودة فقط لعملها، يبدو أن أسواق التقنية باتت على وشك تجاوز مرحلة تطبيقات الدردشة المدعومة بالذكاء الاصطناعيّ إلى مرحلة أبعد يكون فيها الذكاء الاصطناعيّ قادرًا على أداء المهامّ وحلّ المُشكلات الأكثر تعقيدًا بقدر أقلّ من التدخُّل البشريّ من خلال ما تُطلق عليه الشركات المطوّرة حاليًا اسم «وكلاء الذكاء الاصطناعيّ». فما هو وكيل الذكاء الاصطناعيّ؟ وبماذا يتفوّق على نماذج الدردشة الحاليّة المدعومة بالذكاء الاصطناعيّ؟ إليك كُلّ ما تحتاج لمعرفته في السطور التالية.
وكلاء الذكاء الاصطناعي

كل التفاصيل عن وكلاء الذكاء الاصطناعي

ما هو وكيل الذكاء الاصطناعيّ؟

تعتمد تطبيقات الدردشة المدعومة بالذكاء الاصطناعيّ على نماذج لغويّة مثل النموذج اللغوي الكبير (LLM) أو النموذج اللغويّ المُحسّن (LaMDA) وهو ما يجعها قادرة على فهم النصوص وتحليلها ومُحاكاة الأداء البشري في الاستجابة لها. وعلى الرغم من تطوّر أدائها بصورة ملحوظة، فإنّ تطبيقات الدردشة المدعومة بالذكاء الاصطناعيّ لا تزال تمتلك أوجه قصور عديدة. يتمثّل أحد أوجه القصور هذه في ضرورة وجود واجهات برمجة التطبيقات (APIs)، إذ لا يُمكنها أن تؤدّي عملها إلّا عن طريق الوصول لمواقع الويب والخدمات التي تمتلك "واجهة برمجة تطبيقات" يُمكن لروبوت الذكاء الاصطناعيّ التعامل معها وتُتيح المواقع من خلالها جميع الميزات والأدوات اللازمة لأداء المُهمّة المطلوبة.

كذلك تعتمد تطبيقات مثل ChatGPT و Gemini إلى حدّ كبير على تدخُّل العُنصر البشريّ من خلال الإجراءات والمُطالبات التي يقوم بها المُستخدم نفسه، ولكن لا يُمكنها اتّخاذ أيّة قرارات أو إجراءات أكثر تقدّمًا بالنيابة عن المُستخدم، فعلى سبيل المثال، يُمكن لـ ChatGPT أن يُساعدك في معرفة أسعار غُرف الفنادق المتوفّرة في المدينة التي ستسافر إليها لقضاء عُطلتك من خلال المعلومات المُتاحة على مواقع الويب، ولكن لا يُمكنه المُقارنة بين أسعار الفنادق المُختلفة، واختيار غرفة الفندق الأقلّ سعرًا ثُمّ حجزها لك.

مثال على Computer Use

لهذه الأسباب وغيرها عملت شركات مثل OpenAI و Microsoft و Google و Anthropic على تطوير ما يُعرف بوكلاء الذكاء الاصطناعيّ مثل Computer Use و OpenAI Operator. إنّ وكيل الذكاء الاصطناعيّ (AI Agent) هو ببساطة نظام أو برنامج يستخدم أدوات وتقنيات الذكاء الاصطناعيّ لحلّ المُشكلات أو للقيام ببعض المهام نيابة عن المُستخدم في بيئة مُحدّدة وفقًا لمُعطيات هذه البيئة. بمعنى آخر، يتم تزويد وكلاء الذكاء الاصطناعي بأجهزة استشعار متطورة وخوارزميات ذكية تتيح لهم إدراك البيئة المحيطة مثل نظام تشغيل الكمبيوتر أو متصفح الانترنت. وتشمل هذه المستشعرات البصرية والسمعية واللمسية، مما يتيح لهم تكوين فهم متكامل للمحيط.

ما الذي يُمكن لوكيل الذكاء الاصطناعيّ أن يفعله؟

أداة Operator

يستند وكيل الذكاء الاصطناعيّ عادًة إلى مُنشئ وكيل مثل Agentforce أو نموذج يجمع بين عدة مستشعرات – مثل CUA من OpenAI – لتمكين قدرات الادراك والتفكير والتحكم بالوكالة. إذ يعتمد على التعلُّم الآليّ و ومُعالجة اللغة الطبيعيّة للقيام بمجموعة واسعة من المهام بدءًا من الإجابة عن أسئلة المُستخدم البسيطة، ومسح البيانات، وحتّى حلّ المُشكلات الأكثر تعقيدًا، والتي تتطلّب القيام بمهام مُتعدّدة. وأهمّ ما يُميّز وكيل الذكاء الاصطناعيّ في كُلّ ذلك أنّه يتطلّب أقلّ قدر مُمكن من التدخُّل البشريّ لإنجاز كُلّ هذا، حتّى أنّ وكلاء الذكاء الاصطناعيّ يُمكنهم في الوقت الحاليّ استخدام أجهزة الكمبيوتر نيابة عن البشر، بما في ذلك التبديل بين أنظمة تشغيل الكمبيوتر مثل ويندوز ولينكس وماك، وفتح التطبيقات ومُتصفّحات الويب، وإجراء عمليّات البحث على صفحات الويب، وحتّى ملء النماذج عن طريق سحب البيانات من جداول البيانات وأنظمة إدارة علاقات العملاء ومصادر البيانات المُختلفة.

يُمكن لوكلاء الذكاء الاصطناعيّ أيضًا القيام بمهامّ أخرى كثيرة مثل تنزيل الملفّات على الكمبيوتر، وتصدير الصور، ودمج ملفّات PDF، وحلّ الاختبارات عبر الإنترنت، وجمع المعلومات حول العملاء على المتاجر الإلكترونيّة، وحتّى إضافة السلع والمكوّنات المطلوبة لوصفة معيّنة إلى عربة تسوّقه في المتاجر الإلكترونيّة، غير أن الوقت لا يزال مُبكّرًا على تجربة هذه الاستخدامات التي تتطلّب من المُستخدم منح وكيل الذكاء الاصطناعيّ الخاص به صلاحيّات استخدام بطاقاته الائتمانيّة وحساباته البنكيّة وبيانات الدفع الخاصّة به نظرًا لأن التقنية لا تزال في مهدها، ولا يتمتّع وكلاء الذكاء الاصطناعيّ بالقدر الكافي من الموثوقيّة.

كذلك عندما يُحاكي وكلاء الذكاء الاصطناعيّ الاستخدام البشريّ لأجهزة الكمبيوتر في الوقت الحاليّ فأنّ أداءها يكون أقلّ في السُرعة والدقّة مُقارنةً بالأداء البشريّ، ومع هذا فإنّ استخدامها يُمكن أن يعود بالكثير من الفائدة عن طريق توفير الوقت والجهد الذي قد يحتاجه العُنصر البشريّ للقيام بمهام أخرى أكثر تعقيدًا.

كيف يعمل وكيل الذكاء الاصطناعيّ؟

مثال على Claude computer use

كما أشرنا، يستخدم وكيل الذكاء الاصطناعيّ أجهزة استشعار عديدة وخوارزميات متقدمة لإدراك وفهم سياقات مُطالبات المُستخدم، فلا يكتفي بتحليل النصوص فقط، وإنّما يستخدم مزيجًا من النموذج اللغويّ المُدمج ولقطات الشاشة بالإضافة إلى آليّة لمحاكاة الأداء البشريّ.

على سبيل المثال عندما يُحاكي وكيل ذكاء اصطناعيّ مثل Computer Use الأداء البشريّ في استخدام الكمبيوتر، فإنّه يأخذ الكثير من لقطات الشاشة للكمبيوتر، ويقوم بتحليلها لإدراك وفهم ما يحدث على الشاشة، ثُمّ يُقسّم التعليمات والمهامّ المُعقّدة المطلوبة منه إلى سلسلة من الخطوات المنطقيّة التي يبدأ في تنفيذها وتجربتها من خلال واجهة المُستخدم العاديّة باستخدام ماوس ولوحة مفاتيح افتراضيّين، ويُكرّر تلك العمليّة لعدّة مرّات بهدف تصحيح الأخطاء المُحتملة والحصول على نتائج أقرب للدقّة قبل تحديد الأنماط واتّخاذ القرارات والاستجابات الأكثر مُلائمة لمُطالبة المُستخدم.

أبرز عيوب وكلاء الذكاء الاصطناعيّ، حاليًا

مقياس OSWorld

تتمثّل نقاط الضعف الرئيسيّة في مُعظم الإصدارات المتوفّرة حاليًا من وكلاء الذكاء الاصطناعيّ في أدائها البطيء عند مُحاكاة الاستخدام البشريّ لأجهزة الكمبيوتر، فقد يحتاج وكيل الذكاء الاصطناعيّ إلى تنفيذ مئات الخطوات قبل أنّ يتمكّن من إنجاز مهمّة بسيطة لا تستغرق من المُستخدم البشريّ سوى بضع خطوات، كما أنّ أداء وكلاء الذكاء الاصطناعيّ يكون أقلّ دقّة مُقارنةً بالأداء البشريّ، فخلال عرضها التوضيحيّ، قدّرت شركة OpenAI مدى دقّة الأداء التي حقّقها نموذج Computer Use Agent بنحو 38%، وقدّرت شركة Anthropic دقّة أداء الإصدار التجريبيّ من Computer Use وقُدرته على استخدام الكمبيوتر دون تدخُّل بشريّ بنحو 22% مُقارنة بدقّة الأداء البشريّ التي بلغت 72.4%.

مع هذا، وبالنظر إلى أنّ مُعظم الإصدارات المتوفّرة حاليًّا لا تزال في المرحلة التجريبيّة، نجد أنّ وكلاء الذكاء الاصطناعيّ الحاليّون يتمتّعون بميزات واعدة للغاية بفضل قُدرتهم على تحسين الأداء من خلال التدرّب المُستمرّ والتعلُّم الذاتيّ دون تدخّل من العُنصر البشريّ، ومن المُمكن في المُستقبل أن يكونوا قادرين على حجز غرف الفنادق والحفلات ورحلات الطيران للمُستخدمين، وحجز وشراء السلع اونلاين بمُجرّد توفّرها لدى البائعين، والقيام بمهام المُحاسبة، وسحب البيانات من جميع أنواع المصادر وجداول البيانات وعمل الكثير من الأشياء التي يُمكنها توفير وقت وجهد المُستخدمين وتحسين تجربة الاستخدام سواء على مستوى الأفراد أو على مستوى المُستخدمين العاملين في الشركات والمؤسّسات حيث يُمكنها المُساهمة في زيادة الإنتاجيّة وخفض التكاليف وتحسين عمليّة اتخاذ القرار.
يارا فاروق
يارا فاروق
مهندسة كهرباء وكاتبة محتوى تقني بخبرة تزيد عن 6 سنوات، مهتمة بمجال التقنية، حصلت على خمسة جوائز من مؤسسة ويكيميديا في مسابقات كتابة المحتوى.
تعليقات

احدث المقالات