المطلع
عاجل

post-image

باحثون يكشفون ضعف الذكاء الاصطناعي بأداء العمليات الحسابية


00:44 علوم وتكنولوجيا
2023-08-05
54551

أبهرت روبوتات الدردشة القائمة على الذكاء الاصطناعي كل من جرّبها منذ أن أصبحت متاحة على نطاق واسع للجمهور العام الماضي، بينما ولّدت أيضًا مخاوف من أنها ستهدد البشرية. 

وبحسب تقرير نشره موقع قناة الحرة اطلعت عليه وكالة المطلع ؛ أن بحثا جديدا صدر هذا الأسبوع يكشف عن تحدٍ أساسي لتطوير الذكاء الاصطناعي، حيث كشف أن "تشات جي بي تي" أصبح أسوأ في أداء بعض العمليات الحسابية.

وقال باحثون في جامعة ستانفورد وجامعة كاليفورنيا، إن هذا الأداء السيء هو مثال على ظاهرة يعرفها مطورو الذكاء الاصطناعي باسم "الانجراف" (drift)، حيث تؤدي محاولات تحسين جزء واحد من نماذج الذكاء الاصطناعي المعقدة إلى جعل أداء الأجزاء الأخرى من النماذج أسوأ.

قال جيمس زو، الأستاذ في جامعة ستانفورد الذي يعمل في مختبر الذكاء الاصطناعي بالجامعة، وأحد مؤلفي البحث الجديد: "تغييره في اتجاه واحد يمكن أن يؤدي إلى تراجعه في اتجاهات أخرى" وتابع "هذا يجعل التحسين المستمر أمرًا صعبًا للغاية".

ويمكن أن يكون "شات جي بي تي" مدهشا أحيانا، ومضحكا أحيانا أخرى، لكنه كثيرا ما يبدو "ملمًا بأي موضوع وقواعده النحوية لا تشوبها شائبة" وفق تعبير تقرير لصحيفة "وول ستريت جورنال".

 لكن الخبراء الذين أجروا اختبارات لبرنامج "تشات جي بي تي" تبينوا أنه لم يكن كذلك في كل الأوقات وقالوا إن برنامج الدردشة الآلي فشل في بعض مسائل الرياضيات الأساسية.

قام فريق من الباحثين باختبار نسختين من تشات جي بي تي": الإصدار 3.5، المتاح مجانًا عبر الإنترنت لأي شخص، والإصدار 4.0، المتاح من خلال اشتراك متميز.

أعطوا "شات بوت" مهمة أساسية وهي تحديد ما إذا كان رقم معين هو رقم أولي أم لا.
وهذا هو نوع من المسائل الحسابية معقد للناس العاديين، ولكنه بسيط لأجهزة الكمبيوتر، لكن الخبراء قالوا إن النتائج "لم تكن واعدة تماما".

ما لم تكن خبيرا، لا يمكنك حل هذا الأمر من خلال جهدك الذهني فقط، لكن من السهل على أجهزة الكمبيوتر إعطاؤك الحل، إذ يمكن للحاسوب أن يقسم العدد على اثنين، ثلاثة، خمسة، إلخ، وينظر في الحل قبل أن يقرر.
ولتتبع أدائه على مدد زمنية مختلفة، قام الباحثون بإعطاء البرنامج 1000 رقم مختلف.

في آذار/مارس، حدد الإصدار المتميز من GPT-4 بشكل صحيح 84 ٪ من الأرقام أولية. 
يقول الخبراء تعليقا على ذلك "بصراحة ، أداء متواضع جدا لجهاز كمبيوتر". 
لكن، وبحلول شهر يونيو، انخفض معدل الإجابات الصحيحة إلى 51٪.

وعبر ثماني مهام مختلفة، أصبح GPT-4 أسوأ في ست منها، بينما تحسن GPT-3.5 على ستة مقاييس، لكنه ظل أسوأ من قرينه المتقدم في معظم المهام.
وقال أحد الخبراء إن ظاهرة الانجراف غير المتوقعة، معروفة للباحثين الذين يدرسون التعلم الآلي والذكاء الاصطناعي "كان لدينا شك في أنه يمكن أن يحدث، لكننا فوجئنا بمدى سرعة حدوث الانجراف".

ولم يطرح باحثو جامعة ستانفورد، أسئلة الرياضيات الخاصة بـ "شات جي بي تي" فقط، بل طرحوا أسئلة  رأي أيضا، لمعرفة ما إذا كان "شات بوت" سيستجيب، بالاعتماد على قاعدة بيانات تضم حوالي 1500 سؤال.
في آذار/مارس، أجاب برنامج "تشات بوت" من الإصدار 4 على 98٪ من الأسئلة.

وبحلول شهر يونيو، أعطى إجابات لـ 23٪ فقط، وغالبا ما كان يقدم إجابات موجزة للغاية، قائلا إن السؤال غير موضوعي وبصفته ذكاء اصطناعيا ليس لديه أي آراء.

"أقل فاعلية"
يُظهر البحث الذي أجراه فريق ستانفورد-بيركلي من الناحية التجريبية أنه ليس مجرد انطباع روائي، إذ أصبح برنامج الدردشة الآلي أسوأ من الناحية التجريبية في وظائف معينة، بما في ذلك حساب أسئلة الرياضيات والإجابة على الأسئلة الطبية وإنشاء التعليمات البرمجية، وفق الصحيفة.

في العام الماضي، نشر جيسون وي وديني تشو، وهما خبيران في أبحاث غوغل، ورقة توضح أن نماذج الذكاء الاصطناعي كانت أفضل بكثير في مهام التفكير المعقدة عندما طُلب منها معالجة المشكلة خطوة بخطوة.

وفي مارس، كانت هذه التقنية، المعروفة باسم تحفيز سلسلة الأفكار، تعمل بشكل جيد، ولكن بحلول شهر يونيو، أصبحت أقل فاعلية بكثير.

كلمات مفتاحية

اخبار ذات صلة

تعليقات

أحدث الاخبار

النقل تعلن خطة التفويج العكسي لزائري عاشوراء وتستنفر حافلاتها في كربلاء

النقل تعلن خطة التفويج العكسي لزائري عاشوراء وتستنفر حافلاتها في كربلاء

2026-06-26 10:37 1287
الذهب يواصل النزيف للأسبوع الرابع على التوالي ويفقد مستوياته القياسية

الذهب يواصل النزيف للأسبوع الرابع على التوالي ويفقد مستوياته القياسية

2026-06-26 10:00 1278
النفط ينخفض مع عودة تدفق الشحنات وترقب تطورات مضيق هرمز

النفط ينخفض مع عودة تدفق الشحنات وترقب تطورات مضيق هرمز

2026-06-26 09:31 1584
السنغال ترفع شعار "الخطأ ممنوع" أمام العراق.. وسار: فرصة التأهل قائمة

السنغال ترفع شعار "الخطأ ممنوع" أمام العراق.. وسار: فرصة التأهل قائمة

2026-06-25 23:29 3994
أرنولد: نسعى للفوز على السنغال.. ومستقبلي مع المنتخب العراقي يُحسم بعد المونديال

أرنولد: نسعى للفوز على السنغال.. ومستقبلي مع المنتخب العراقي يُحسم بعد المونديال

2026-06-25 23:09 4241
رئيس البرلمان: نهضة الحسين جسّدت قيم التضحية والإصلاح والعدالة

رئيس البرلمان: نهضة الحسين جسّدت قيم التضحية والإصلاح والعدالة

2026-06-25 22:03 5953
الصدر: من رضي أو تعاون أو سكت عن قتل الحسين فقد نقض عهد الله

الصدر: من رضي أو تعاون أو سكت عن قتل الحسين فقد نقض عهد الله

2026-06-25 21:31 4617
عراقجي: عازمون على رسم مستقبل مضيق هرمز بالتشاور مع جيراننا

عراقجي: عازمون على رسم مستقبل مضيق هرمز بالتشاور مع جيراننا

2026-06-25 20:54 4077
الزيدي: العراق سيظل عزيزاً كريماً بأهله ما دام صوت الحسين حاضراً بالوجدان

الزيدي: العراق سيظل عزيزاً كريماً بأهله ما دام صوت الحسين حاضراً بالوجدان

2026-06-25 20:07 5025
​رد حاسم من طيف سامي على اختفاء 140 مليار دولار من الأموال العامة

​رد حاسم من طيف سامي على اختفاء 140 مليار دولار من الأموال العامة

2026-06-25 20:02 3796
تأمين اتصال ملايين الزائرين.. تفاصيل خطة هيئة الإعلام والاتصالات لزيارة عاشوراء

تأمين اتصال ملايين الزائرين.. تفاصيل خطة هيئة الإعلام والاتصالات لزيارة عاشوراء

2026-06-25 19:50 3295
اللجنة الأمنية للزيارات المليونية تصدر 4 توجيهات لتأمين زيارة العاشر من محرم

اللجنة الأمنية للزيارات المليونية تصدر 4 توجيهات لتأمين زيارة العاشر من محرم

2026-06-25 19:42 3743
رغم الخسارتين... كيف يحافظ العراق على أمل التأهل إلى دور الـ32 بكأس العالم

رغم الخسارتين... كيف يحافظ العراق على أمل التأهل إلى دور الـ32 بكأس العالم

2026-06-25 17:39 4688
ثمانية منتخبات تتنافس على بطاقات العبور الأخيرة إلى دور الـ32 في كأس العالم

ثمانية منتخبات تتنافس على بطاقات العبور الأخيرة إلى دور الـ32 في كأس العالم

2026-06-25 17:05 5022
مسؤول نفطي عراقي سابق يكشف تعرضه لابتزاز إلكتروني بفيديوهات مفبركة ومطالب مالية ضخمة

مسؤول نفطي عراقي سابق يكشف تعرضه لابتزاز إلكتروني بفيديوهات مفبركة ومطالب مالية ضخمة

2026-06-25 16:38 9741
باكستان ترد على أنباء محاولة إسرائيل اغتيال قائد جيشها في سويسرا

باكستان ترد على أنباء محاولة إسرائيل اغتيال قائد جيشها في سويسرا

2026-06-25 12:05 5292
تصويت جديد في مجلس الشيوخ يمنح ترامب ضوءاً أخضراً تجاه إيران

تصويت جديد في مجلس الشيوخ يمنح ترامب ضوءاً أخضراً تجاه إيران

2026-06-25 09:14 4146
النفط تنفي أنباء تلويح العراق بالانسحاب من أوبك وتؤكد العمل لرفع الإنتاج

النفط تنفي أنباء تلويح العراق بالانسحاب من أوبك وتؤكد العمل لرفع الإنتاج

2026-06-25 13:22 6129