هل تنتج نماذج الذكاء الاصطناعى أفكارًا أصلية أكثر من الباحثين؟

Eine neue Studie zeigt, dass KI-Modelle mehr originelle Forschungsideen generieren können als 50 Wissenschaftler. Experten bewerten diese Ansätze.
أظهرت دراسة جديدة أن نماذج الذكاء الاصطناعى يمكنها توليد أفكار بحثية أصلية أكثر من 50 عالمًا. خبراء تقييم هذه الأساليب. (Symbolbild/natur.wiki)

هل تنتج نماذج الذكاء الاصطناعى أفكارًا أصلية أكثر من الباحثين؟

قام نظام مولد الأفكار الذي يقوده الذكاء الاصطناعي (AI) بتطوير المزيد من أساليب البحث الأصلية في دعامة حديثة على Arxiv من 50 من العلماء الذين عملوا بشكل مستقل عن بعضهم البعض

تم تقييم الأفكار التي تم إنشاؤها بواسطة People و AI من قبل الخبراء الذين لم يعرفوا من أو ماذا فعل كل فكرة. قام الخبراء بتقييم المفاهيم التي تم إنشاؤها من الذكاء الاصطناعى على أنها مثيرة مقارنة بالأفكار التي كتبها البشر ، على الرغم من أن مقترحات الذكاء الاصطناعى تفعل أسوأ قليلاً من حيث الجدوى.

ومع ذلك ، يشير العلماء إلى أن الدراسة ، التي لم تتم مراجعة النظراء بعد ، لها قيود. ركزت على مجال بحث معين وتطلب من المشاركين البشريين تطوير الأفكار تلقائيًا ، مما يضعف قدرتهم على إنتاج أفضل المفاهيم.

الذكاء الاصطناعي في العلوم

هناك ،

يعتبر المشروع العام واحد من أكبر المشاريع للتقييم ، سواء أكان نماذج اللغة الكبيرة-التكنولوجيا وراء أدوات مثل chatgpt -أساليب البحث غير المرتبط ، توم هوب ، عالم الكمبيوتر في جميع المعاهد من أجل الذكاء الاصطناعي في القدس. يقول: "يجب أن يكون هناك المزيد من العمل".

قام الفريق بتجنيد أكثر من 100 باحث في مجال معالجة اللغة الطبيعية ، وهي منطقة فرعية من علوم الكمبيوتر التي تتعامل مع التواصل بين الذكاء الاصطناعي والبشر. تم تكليف تسعة مشاركين بتطوير الأفكار والصياغة في غضون عشرة أيام بناءً على أحد مواضيع سبعة. كحافز ، تلقى الباحثون 300 دولار لكل فكرة ، مع مكافأة قدرها 1000 دولار لأفضل الأفكار الخمسة.

في الوقت نفسه ، طور الباحثون مولد فكرة مع Claude 3.5 ، وهو LLM الذي طورته الإنسان في سان فرانسيسكو ، كاليفورنيا. طلب الباحثون من أداة الذكاء الاصطناعى العثور على مقالات ذات صلة حول الموضوعات البحثية السبعة عبر Smantic Scholar ، وهو محرك بحث في الأدب القائم على الذكاء الاصطناعي. بناءً على هذه المقالات ، طلب الباحثون من وكلاء الذكاء الاصطناعي إنشاء 4000 فكرة لكل موضوع بحث وتقييم أكثرها أصليًا.

خبير الإنسان

ثم خصص الباحثون بشكل عشوائي الأفكار البشرية و AI التي تم إنشاؤها 79 خبراء قاموا بتقييم كل فكرة فيما يتعلق بالحداثة والتوتر والجدوى والفعالية المتوقعة. لضمان ظهور منشئو الأفكار غير معروفين للخبراء ، استخدم الباحثون LLM آخر لتحرير كلا النوعين من النص بحيث تم توحيد أسلوب الكتابة والصوت دون تغيير الأفكار بأنفسهم.

في المتوسط ​​، قام الخبراء بتصنيف الأفكار التي تولدها الذكاء الاصطناعى على أنها أكثر أصليًا وأكثر إثارة من المشاركين في البشر. عند النظر إلى 4000 أفكار التي تنتجها LLM ، وجد الباحثون حوالي 200 أفكار فقط ، والتي كانت فريدة من نوعها حقًا ، والتي تشير إلى أن الذكاء الاصطناعي أصبح أقل أصالة كلما زادت الأفكار التي أنشأتها.

عندما قابل المشاركون ، اعترف معظمهم بأن أفكارهم المقدمة كانت متوسطة مقارنة بالأفكار المنتجة في الماضي.

يقول كونغ لو ، الباحث في التعلم الآلي في جامعة كولومبيا البريطانية في فانكوفر ، كندا ، إن النتائج تشير إلى أن LLMs قد تولد الأفكار بسهولة من الأدب الحالي. ومع ذلك ، ما إذا كنت تستطيع أن تتفوق على أكثر الأفكار البشرية الرائدة لا تزال مسألة مفتوحة.

يقول Jevin West ، عالم الكمبيوتر الاجتماعي في جامعة واشنطن في سياتل ، إن القيود الإضافية للدراسة هي أن هناك قيودًا إضافية على الدراسة هي أن الأفكار المكتوبة المقارنة تمت معالجتها بواسطة LLM ، والتي غيرت لغة وطول التقديمات. ويضيف أن مثل هذه التغييرات قد تكون خفية ، كما يدرك الخبراء الحداثة. ويضيف ويست أنه قد لا يكون مقارنة عادلة تمامًا لوجود باحثين يتنافسون على LLM يمكن أن يولد الآلاف من الأفكار في غضون ساعات قليلة. يقول: "عليك مقارنة التفاح بالتفاح".

يخطط

SI وزملاؤه لمقارنة الأفكار التي تم إنشاؤها من الذكاء الاصطناعى مع مساهمات المؤتمر الرائدة من أجل الحصول على فهم أفضل لكيفية مقارنة LLMs بالإبداع الإنساني. يقول: "نحاول تحفيز المجتمع للتفكير أكثر حول شكل المستقبل إذا كان بإمكان الذكاء الاصطناعى القيام بدور أكثر نشاطًا في عملية البحث".

  1. si ، c. ، yang ، d. & hashimoto ، t. preprint at arxiv https://doi.org/10.48550/arxiv.24109 (2024).

  2. تنزيل المراجع