حظرت نسبة 20 بالمئة من أفضل 1000 موقع ويب في العالم الزواحف الجامعة لبيانات الويب لصالح خدمات الذكاء الاصطناعي، وذلك وفقًا لبيانات جديدة من Originality.AI، وهو كاشف محتوى الذكاء الاصطناعي.
ووجدت بيانات Originality.AI أن معدل حجب زاحف GTBot بين أفضل 1000 موقع ويب يتزايد بنسبة 5 بالمئة تقريبًا أسبوعيًا، حيث تتولى مواقع الويب الكبيرة والصغيرة زمام الأمور بنفسها في ظل غياب قواعد قانونية أو تنظيمية واضحة تحكم استخدام الذكاء الاصطناعي للمواد المحمية بحقوق التأليف.
وقدمت OpenAI في أوائل شهر أغسطس زاحفها المسمى GTTBot، معلنة أن البيانات المجمعة من المحتمل أن تُستخدم لتحسين النماذج المستقبلية، ووعدت باستبعاد المحتوى المحمي بنظام الاشتراك المدفوع، وأصدرت تعليمات لمواقع الويب حول كيفية حظر الزاحف.
وبدأت مجموعة من المؤسسات الإعلامية، مثل نيويورك تايمز ورويترز وسي إن إن، بعد فترة وجيزة بحظر GTBot، وتبعتها منذ ذلك الحين مواقع أخرى كثيرة.
وارتفع عدد المواقع التي حظرت زاحف OpenAI من 9.1 بالمئة في 22 أغسطس إلى 12 بالمئة في 29 أغسطس بالنسبة لأكثر 1000 موقع ويب زيارةً في العالم، وذلك وفقًا لبيانات Originality.AI.
موضوعات ذات صلة بما تقرأ الآن:
وتظهر البيانات أن مواقع الويب ذات الحجم الأكبر من المرجح أن تكون قد حظرت زاحف الذكاء الاصطناعي، وتعتبر أمازون وكورا من بين مواقع الويب الكبرى التي حظرت زاحف GTBot.
ووصلت نسبة حظر زاحف Common Crawl، زاحف آخر يجمع بانتظام بيانات الويب لصالح خدمات الذكاء الاصطناعي، إلى 6.77 بالمئة عبر أفضل 1000 موقع ويب في العالم.
ويعمل الزاحف بطريقة مشابهة لمتصفح الويب، حيث يجمع البيانات من أي صفحة ويب متاحة ويخزنها في قاعدة بيانات بدلاً من عرضها للمستخدم، وهذه هي الطريقة التي تجمع بها محركات البحث، مثل جوجل، معلوماتها.
وتمتع مالكو المواقع دائمًا بالقدرة على وضع تعليمات تخبر زاحف الويب بالتوقف عن جمع البيانات، ولكن التعاون طوعي، حيث قد تتجاهل الجهات السيئة التعليمات.
وتنظر شركة جوجل وشركات الويب الأخرى إلى عمل زواحف البيانات على أنه استخدام عادل، ولكن العديد من الناشرين وأصحاب الملكية الفكرية اعترضوا منذ فترة طويلة، وواجهت الشركة دعاوى قضائية متعددة بشأن هذه الممارسة.
وأدى ظهور النماذج اللغوية الكبيرة والذكاء الاصطناعي التوليدي إلى عودة هذه المشكلة إلى دائرة الضوء مرة أخرى، حيث ترسل شركات الذكاء الاصطناعي زواحفها لجمع البيانات لتدريب نماذجها وتوفير المواد اللازمة لروبوتاتها للدردشة.
ورأى الناشرون بعض القيمة في السماح لزواحف البحث بالوصول إلى المواقع، وذلك بالنظر إلى أن جوجل ومواقع البحث الأخرى ترسل المستخدمين إلى مواقعهم المدعومة بالإعلانات، ولكن يحظر الناشرون زواحف الذكاء الاصطناعي لأنه لا يوجد أي جانب إيجابي في الوقت الحالي في تسليم بياناتهم إلى شركات الذكاء الاصطناعي.
وتجري العديد من المؤسسات الإعلامية محادثات مع شركات الذكاء الاصطناعي حول ترخيص بياناتها لتلك الشركات مقابل رسوم، ولكن لا تزال هذه المحادثات في مراحلها الأولى.
وفي غضون ذلك، تتخذ بعض مواقع الويب وأصحاب الملكية الفكرية إجراءات قانونية ضد شركات الذكاء الاصطناعي التي استخدمت بياناتهم دون إذن.
وتنظر المؤسسات الإعلامية، التي شعرت على مدى العقدين الماضيين بأن جوجل قد خدعتها، بعين الريبة إلى خدمات الذكاء الاصطناعي، وتكافح لإيجاد التوازن الصحيح بين تبني التقنية الناشئة ومقاومتها.
وتسعى تلك المؤسسات من ناحية إلى إيجاد طرق مبتكرة لتحسين هوامش الربح في أعمالها الكثيفة العمالة، ولكن إدخال التقنية الناشئة في سير عمل غرفة الأخبار يطرح أسئلة أخلاقية صعبة في الوقت الذي وصلت فيه الثقة بالمؤسسات الإعلامية إلى مستوياتها الأدنى تاريخيًا.
المصدر: البوابة العربية للأخبار التقنية