هل تنتج نماذج الذكاء الاصطناعى أفكارًا أصلية أكثر من الباحثين؟

هل تنتج نماذج الذكاء الاصطناعى أفكارًا أصلية أكثر من الباحثين؟
قام نظام مولد الأفكار الذي يقوده الذكاء الاصطناعي (AI) بتطوير المزيد من أساليب البحث الأصلية في دعامة حديثة على Arxiv من 50 من العلماء الذين عملوا بشكل مستقل عن بعضهم البعض
تم تقييم الأفكار التي تم إنشاؤها بواسطة People و AI من قبل الخبراء الذين لم يعرفوا من أو ماذا فعل كل فكرة. قام الخبراء بتقييم المفاهيم التي تم إنشاؤها من الذكاء الاصطناعى على أنها مثيرة مقارنة بالأفكار التي كتبها البشر ، على الرغم من أن مقترحات الذكاء الاصطناعى تفعل أسوأ قليلاً من حيث الجدوى. ومع ذلك ، يشير العلماء إلى أن الدراسة ، التي لم تتم مراجعة النظراء بعد ، لها قيود. ركزت على مجال بحث معين وتطلب من المشاركين البشريين تطوير الأفكار تلقائيًا ، مما يضعف قدرتهم على إنتاج أفضل المفاهيم. هناك ،
يعتبر المشروع العام واحد من أكبر المشاريع للتقييم ، سواء أكان نماذج اللغة الكبيرة-التكنولوجيا وراء أدوات مثل chatgpt -أساليب البحث غير المرتبط ، توم هوب ، عالم الكمبيوتر في جميع المعاهد من أجل الذكاء الاصطناعي في القدس. يقول: "يجب أن يكون هناك المزيد من العمل". قام الفريق بتجنيد أكثر من 100 باحث في مجال معالجة اللغة الطبيعية ، وهي منطقة فرعية من علوم الكمبيوتر التي تتعامل مع التواصل بين الذكاء الاصطناعي والبشر. تم تكليف تسعة مشاركين بتطوير الأفكار والصياغة في غضون عشرة أيام بناءً على أحد مواضيع سبعة. كحافز ، تلقى الباحثون 300 دولار لكل فكرة ، مع مكافأة قدرها 1000 دولار لأفضل الأفكار الخمسة. في الوقت نفسه ، طور الباحثون مولد فكرة مع Claude 3.5 ، وهو LLM الذي طورته الإنسان في سان فرانسيسكو ، كاليفورنيا. طلب الباحثون من أداة الذكاء الاصطناعى العثور على مقالات ذات صلة حول الموضوعات البحثية السبعة عبر Smantic Scholar ، وهو محرك بحث في الأدب القائم على الذكاء الاصطناعي. بناءً على هذه المقالات ، طلب الباحثون من وكلاء الذكاء الاصطناعي إنشاء 4000 فكرة لكل موضوع بحث وتقييم أكثرها أصليًا. ثم خصص الباحثون بشكل عشوائي الأفكار البشرية و AI التي تم إنشاؤها 79 خبراء قاموا بتقييم كل فكرة فيما يتعلق بالحداثة والتوتر والجدوى والفعالية المتوقعة. لضمان ظهور منشئو الأفكار غير معروفين للخبراء ، استخدم الباحثون LLM آخر لتحرير كلا النوعين من النص بحيث تم توحيد أسلوب الكتابة والصوت دون تغيير الأفكار بأنفسهم. في المتوسط ، قام الخبراء بتصنيف الأفكار التي تولدها الذكاء الاصطناعى على أنها أكثر أصليًا وأكثر إثارة من المشاركين في البشر. عند النظر إلى 4000 أفكار التي تنتجها LLM ، وجد الباحثون حوالي 200 أفكار فقط ، والتي كانت فريدة من نوعها حقًا ، والتي تشير إلى أن الذكاء الاصطناعي أصبح أقل أصالة كلما زادت الأفكار التي أنشأتها. عندما قابل المشاركون ، اعترف معظمهم بأن أفكارهم المقدمة كانت متوسطة مقارنة بالأفكار المنتجة في الماضي. الذكاء الاصطناعي في العلوم
خبير الإنسان
SI وزملاؤه لمقارنة الأفكار التي تم إنشاؤها من الذكاء الاصطناعى مع مساهمات المؤتمر الرائدة من أجل الحصول على فهم أفضل لكيفية مقارنة LLMs بالإبداع الإنساني. يقول: "نحاول تحفيز المجتمع للتفكير أكثر حول شكل المستقبل إذا كان بإمكان الذكاء الاصطناعى القيام بدور أكثر نشاطًا في عملية البحث".
-
si ، c. ، yang ، d. & hashimoto ، t. preprint at arxiv https://doi.org/10.48550/arxiv.24109 (2024).