لماذا لا يستطيع الذكاء الاصطناعي تحديد الوقت؟

كتب هانى سلام

في دراسة نُشرت على موقع “أركايف” (arXiv)، وهو أرشيف مفتوح المصدر للأبحاث العلمية، قام باحثون من جامعة إدنبرة باختبار قدرات سبعة نماذج مختلفة من نماذج اللغة الكبيرة (LLM) لتقييم قدرتها على تحديد الوقت.

شمل الاختبار مجموعة متنوعة من الأسئلة حول صور لساعات وتقويمات مختلفة، وكشفت النتائج – التي ستُنشر رسميًا في أبريل/نيسان المقبل – أن هذه النماذج تعاني من صعوبة في فهم هذه المهام، رغم أهميتها في حياتنا اليومية.

وأشار الباحثون في دراستهم إلى أن “القدرة على تفسير واستنتاج الوقت من المدخلات البصرية تُعدّ أمرًا جوهريًا للعديد من التطبيقات في العالم الحقيقي، مثل جدولة الأحداث والأنظمة المستقلة. ورغم التقدم الكبير في نماذج اللغة الكبيرة متعددة الوسائط، فقد ركزت الأبحاث غالبًا على مهام مثل التعرف على الأشياء وفهم المشاهد، بينما لم تُمنح الاستنتاجات الزمنية الاهتمام الكافي، مما جعل هذه الأنظمة تتجاهل عامل الوقت”.

قام فريق البحث باختبار نماذج ذكاء اصطناعي من عدة شركات، بما في ذلك “شات جي بي تي-4″ من أوبن إيه آي، و”جيميني” من غوغل، و”كلود” من أنثروبيك، و”لاما” من ميتا، بالإضافة إلى النموذج الصيني “كوين 2″ من علي بابا، و”ميني سي بي إم” من مودل بيست.

 

تضمنت التجربة تقديم صور متنوعة لهذه النماذج، شملت ساعات جدارية بألوان وأشكال مختلفة، وساعات بأرقام رومانية، وساعات بدون عقرب الثواني، إلى جانب تقاويم تعرض الأيام والأشهر على مدى السنوات العشر الماضية.

في اختبار الساعات، طرح الباحثون على نماذج اللغة الكبيرة سؤالًا مباشرًا: “ما الوقت الموضح في الصورة المرفقة؟”، بينما شمل اختبار التقويم أسئلة بسيطة مثل “ما اليوم الذي يوافق رأس السنة الميلادية؟”، وأخرى أكثر تعقيدًا مثل “ما هو اليوم رقم 153 من السنة؟”.

وأشار الباحثون إلى أن قراءة الساعات وفهم التقويم يتطلبان عمليات معرفية معقدة، تشمل التمييز البصري الدقيق لتحديد مواضع العقارب وتخطيط التقويم، بالإضافة إلى التفكير العددي الدقيق لحساب الفترات الزمنية بين التواريخ.

بشكل عام، لم تحقق نماذج الذكاء الاصطناعي أداءً مرضيًا، إذ تمكنت من قراءة الوقت بشكل صحيح في أقل من 25% من الحالات. وواجهت صعوبة خاصة في تفسير الساعات ذات الأرقام الرومانية، أو التي تحتوي على عقارب ذات تصميم غير تقليدي، بالإضافة إلى الساعات التي تفتقر إلى عقرب الثواني. ويرجح الباحثون أن المشكلة قد تعود إلى صعوبة اكتشاف العقارب وتفسير زواياها على ميناء الساعة.

ومن بين النماذج المختبرة، حقق “جيميني” أفضل أداء في قراءة الساعات، بينما تفوق “شات جي بي تي-4أو” في قراءة التقويم، حيث تمكن من تحديد الوقت بدقة تصل إلى 80%. في المقابل، ارتكبت معظم النماذج الأخرى أخطاء في اختبار التقويم بمعدل يقارب 20%.

وفي تعليق على النتائج، قال روهيت ساكسينا، أحد مؤلفي الدراسة وطالب دكتوراه في كلية المعلوماتية بجامعة إدنبرة: “يتمكن معظم البشر من معرفة الوقت واستخدام التقويمات في سن مبكرة، لكن دراستنا تكشف عن فجوة كبيرة في قدرة الذكاء الاصطناعي على أداء هذه المهام الأساسية. يجب ألا نغفل عن هذه التحديات، خاصة عند التفكير في دمج الذكاء الاصطناعي في تطبيقات حساسة للوقت، مثل الجدولة، والأتمتة، والتكنولوجيا المساعدة”.

 

 

عن هاني سلام

شاهد أيضاً

أمراض الكلى… الخطر الصامت الذي يهدد الحياة

بقلم: الدكتور عبد المولى صباغ / أخصائي أمراض وغسيل الكلى – مستشفى دلاعة أمراض الكلى …

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

أثبت إنسانيتك: 10   +   9   =  

هذا الموقع يستخدم خدمة أكيسميت للتقليل من البريد المزعجة. اعرف المزيد عن كيفية التعامل مع بيانات التعليقات الخاصة بك processed.