أخبار التكنولوجيا

تقرير: 20٪ فقط من السير الذاتية على ويكيبيديا تتحدث عن النساء

تقرير: 20٪ فقط من السير الذاتية على ويكيبيديا تتحدث عن النساء

ويكيبيديا ، التي تُصنف كواحدة من أكثر 10 مواقع ويب زيارة في العالم ، هي الوجهة الأولى للعديد من الأشخاص الذين يبحثون عن معلومات حول الشخصيات التاريخية وصناع التغيير. لكن لا يتم تمثيل الجميع بالتساوي على ويكيبيديا. وفقًا لمؤسسة ويكيميديا ​​، فإن حوالي 20٪ فقط من السير الذاتية على نسخة اللغة الإنجليزية للموقع تتحدث عن النساء ، ونعتقد أن النسبة أقل بالنسبة للنساء المنضوات في مجموعات متعددة الأوجه ، مثل النساء في العلوم ، والنساء في إفريقيا ، والنساء في قالت أنجيلا آسيا. معجب ، عالم أبحاث في ميتا. وأضافت: “بالنسبة لمشروع الدكتوراه الخاص بي كطالب في علوم الكمبيوتر في جامعة لورين ، إنريا ، في فرنسا ، عملت مع كلير جاردين لتطوير طريقة جديدة لمعالجة هذا التفاوت باستخدام الذكاء الاصطناعي”. “لقد أنشأنا نظامًا للذكاء الاصطناعي يمكنه البحث وكتابة مسودات تقريبية لإدخالات السيرة الذاتية بنفس أسلوب ويكيبيديا. الأشخاص المهمون غير الموجودين حاليًا على الموقع. “” كانت المشكلة شخصية بالنسبة لي وتستند إلى نقص التمثيل الذي رأيته يظهر في المكتبات عندما كنت في المدرسة الابتدائية “، قالت.” عندما كنت في الصف الثالث ، تم تكليفي بكتابة مقال عن شخصية تاريخية ، وكان الشرط الوحيد هو وجود كتاب عن تلك الشخصية في المكتبة “. وأضافت: “أردت أن أكتب عن إليانور روزفلت لكن كان علي أن أكتب فقط عن تيدي روزفلت. ماذا لو أردت الكتابة عن شخص يشبهني – هل كان ذلك ممكنًا؟ إذا فكرنا في نفس المهمة اليوم ، فإن الطلاب سيلجأون بلا شك إلى الإنترنت ، على الأرجح ويكيبيديا. تحتوي ويكيبيديا على ملايين المقالات المكتوبة باللغة الإنجليزية ، بما في ذلك مقال رائع عن “إليانور روزفلت. نحن نعلم أنه لا يزال هناك العديد من النساء اللواتي لم تصل قصصهن وإنجازاتهن إلى الأجيال القادمة.” بينما من المرجح أن تكتب النساء سيرًا ذاتية عن نساء أخريات ، وجد تقرير ويكيميديا ​​2021 Community Insights ، الذي يغطي العام السابق ، أن 15 في المائة فقط من محرري ويكيبيديا هم من النساء. وهذا يؤدي إلى إهمال المرأة وتهميشها ، على الرغم من التأثير الهائل الذي كان لها عبر التاريخ في مجالات العلوم وريادة الأعمال والسياسة وكل مجالات المجتمع الأخرى. فازت الفيزيائية الكندية دونا ستريكلاند بجائزة نوبل في الفيزياء عام 2018 ، ومع ذلك ، فإن أي شخص يبحث عن معلومات عنها على ويكيبيديا لن يتمكن من العثور عليها ، حتى تم نشر سيرة ذاتية لعملها العظيم على ويكيبيديا أخيرًا ، بعد أيام من فوزها الاكبر. جائزة في مجال دراستها. عبرت دراسات مختلفة ، بما في ذلك دراسات من مؤسسة ويكيميديا ​​نفسها ، عن عدم المساواة بين الجنسين على المنصة. حتى مع التمثيل الناقص ، لا تزال السير الذاتية للنساء مرشحة بشكل غير متناسب للحذف. وجدت إحدى الدراسات أنه في عام 2017 ، كانت 41٪ من السير الذاتية المرشحة للحذف تتعلق بالنساء. وقالت: “نعتقد أن العلم المفتوح والمتجدد يمكن أن يوفر نقطة انطلاق لمعالجة هذه المشكلة”. “نقدم اليوم نموذجًا شاملاً ومفتوح المصدر للذكاء الاصطناعي يُنشئ تلقائيًا مقالات سيرة ذاتية عالية الجودة عن الشخصيات العامة المهمة في العالم.” “يبحث نموذجنا في مواقع الويب عن المعلومات ذات الصلة ويقوم بإعداد إدخال على غرار Wikipedia حول هذا الشخص ، مع استكماله باقتباسات من المصادر. إلى جانب إصدار النموذج ، نحن نطرح مجموعة بيانات جديدة تم إنشاؤها لتقييم أداء النموذج على 1527 سيرة ذاتية لنساء من الفئات المهمشة “. “يمكن استخدام مجموعة البيانات هذه لتدريب النماذج وتقييم الأداء وتحسين النموذج. ونعتقد أن هذه المدخلات التي تم إنشاؤها بواسطة الذكاء الاصطناعي يمكن استخدامها كنقطة انطلاق للأشخاص الذين يكتبون محتوى على ويكيبيديا ومدققي الحقائق لنشر المزيد من السير الذاتية الفئات المهمشة في الموقع “. . وأكدت أنه لا يزال هناك الكثير مما يمكننا القيام به للمساعدة في توفير التمثيل إلى ويكيبيديا على نطاق أوسع للأشخاص المتميزين من جميع الخلفيات. بشكل أساسي ، سيتعين على أنظمة الذكاء الاصطناعي ، مثل تلك التي تم إنشاؤها ، أن تواجه تحديات مجتمعية وتقنية على نطاق واسع من أجل معالجة المشكلة بشكل كامل. يبدأ هذا بمحتوى مواقع الويب المستخدمة لإنشاء إدخالات Wikipedia ، والتي قد تكون معيبة أو تعبر عن تحيزات ثقافية. من الناحية الفنية ، قد يكون نظام إنشاء النص عرضة “للثرثرة” بمحتوى غير واقعي. حتى أفضل النماذج اللغوية اليوم تجد صعوبة في إنشاء نص متماسك في العديد من الفقرات. وقالت: “ نأمل في تحسين ذلك من خلال إحراز تقدم في العمارة العصبية التي تدعم مثل هذه النماذج ، ومن خلال إنجازات ملموسة في التطوير المسؤول للذكاء الاصطناعي ، وكذلك أن يكون هذا النهج قادرًا على مساعدة غير الخبراء في إنشاء دقيقة. مقالات لإضافتها إلى مجموعة المعلومات على الإنترنت ، مع الحد الأدنى من التعديل المطلوب. ” كيف يمكن للذكاء الاصطناعي أن يكمل الجهود الحالية لمعالجة التحيز في حين أن نموذجنا ليس حلاً سحريًا ، إلا أنه يعد خطوة مهمة لدعم وتكملة الجهود الحالية الأخرى التي تعمل على معالجة التمثيل الجنساني على ويكيبيديا. عمل المحررين المتطوعين جيسيكا ويد وبيني ريتشاردز بشكل مستقل لكتابة ونشر الآلاف من السير الذاتية في ويكيبيديا لنساء يستحقن التميز. وفقًا للتقرير ، هناك جهد جماعي كبير آخر هو مشروع Wikipedia Women in Red ، والذي يشرك محررين لإنشاء سير ذاتية جديدة وتوسيع السير الذاتية الحالية. حول النساء البارزات في الماضي والحاضر ، قررنا اتباع نهج تكميلي ، نظرًا لأن إجراء الأبحاث وإنشاء ببليوغرافيا والكتابة أمر مكثف ، إلا أن هناك مجموعة من المعلومات المتاحة عبر الإنترنت يمكن استخدامها. وأصوات وموروثات تم نسيانها أو تهميشها. على سبيل المثال ، استخدمنا النموذج لإنشاء سيرة ذاتية قصيرة لليبي هايمان ، الرائد في دراسة علم الحيوان اللافقاري. يتم سحب النص الأخضر من المقالة المرجعية التي بدأنا بها ، والنص الأرجواني من دليل الإنترنت ، والنص البرتقالي هو هذيان ؛ هذا يعني أن النموذج يحتوي على معلومات لا يمكن التحقق منها. استرجع النموذج معلومات السيرة الذاتية ذات الصلة عن هايمان ، بما في ذلك تركيزها على اللافقاريات ، والمنشورات المهمة ، وتأثير عملها ، والتي يمكن استخدامها بعد ذلك كنقطة انطلاق للمحررين للتحقق من الحقائق (وهو مجال لا يزال يعرض بعض أوجه القصور في نموذج) والتوسع في حياتها وإنجازاتها. باستخدام نموذج ما قبل التدريب والاسترداد لإنشاء سير ذاتية على ويكيبيديا ، نبدأ عملية إنشاء السيرة الذاتية بهيكل بناء استرداد معزز يعتمد على التدريب المسبق الشامل ، والذي يعلم النموذج كيفية اختيار المعلومات ذات الصلة فقط ، مثل مكان الميلاد أو مكان التحاق الشخص بالمدرسة تقول أنجيلا فان في تقريرها “بينما تخلق سيرة ذاتية”. يسترد النموذج أولاً المعلومات ذات الصلة من الإنترنت لعرض الموضوع. بعد ذلك يقوم نموذج الإنشاء بتوليد النص ، أما الخطوة الثالثة فهي نموذج الاقتباس ، وتعمل على إنشاء الببليوغرافيا وربطها بالمصادر التي تم استخدامها. تتكرر العملية بعد ذلك ، مع توقع كل قسم للقسم التالي ، مع دمج جميع العناصر التي تشكل سيرة ذاتية قوية لـ Wikipedia ، بما في ذلك المرحلة المبكرة للموضوع والتعليم والوظيفة. نقوم بإنشاء قسم تلو الآخر ، باستخدام آلية التخزين المؤقت المشابهة لـ Transformer-XL للإشارة إلى الأقسام المكتوبة مسبقًا ، وتحقيق سياق أكبر على مستوى المستند. يعد التخزين المؤقت مهمًا لأنه يسمح للنموذج بتتبع ما تم إنشاؤه مسبقًا بشكل أفضل. تظهر التقييمات التلقائية والبشرية أن النموذج قادر على العثور على المعلومات ذات الصلة واستخدامها لإنشاء السير الذاتية ، ولكن لا يزال هناك عمل يتعين القيام به. وجدت هذه التقييمات أن 68٪ من النص الذي تم إنشاؤه في السير الذاتية التي أنشأناها لم يتم العثور عليه في النص المرجعي. هذا يعني عدة أشياء ، بما في ذلك الإشارة إلى أن النموذج يقوم بعمل جيد في العثور على المعلومات ذات الصلة وتجميعها ولكنه لا يعمل كبرنامج سرقة أدبية تلقائي. ومع ذلك ، هذا أيضًا غير واضح ؛ لأنه من الصعب معرفة أي المعلومات دقيقة وأيها ليست كذلك. لقد طلبنا من المقيّمين تحديد ما إذا كانت الجمل الكاملة دقيقة أم لا ، ووجدنا العديد من الحالات التي لا يمكن فيها التحقق من الجمل إلا جزئيًا. تشبه هذه التحديات تحديات إنشاء النص بشكل عام ، على الرغم من تفاقمها في حالة الفئات المهمشة ، حيث لا يوجد سوى القليل جدًا من البيانات عنها. نأمل أن يسمح إصدار مجموعة البيانات هذه للباحثين الآخرين بدراسة هذه المشكلة. العقبات أثناء البحث أولاً ، كان من الصعب للغاية التغلب على نقص بيانات التدريب ، أو مقالات السيرة الذاتية الموجودة بالفعل حول المرأة. المقالات المتعلقة بالنساء ، وخاصة عن الفئات المهمشة ، أقصر بكثير من المقالة العادية عن الرجال ، وأقل تفصيلاً ، وتستخدم لغة مختلفة ، على سبيل المثال ، “عالمة” بدلاً من مجرد كلمة “عالمة”. هذا التحيز في بيانات التدريب تسبب في نماذج لاستيعاب هذا التحيز. بالإضافة إلى ذلك ، يجب كتابة مقالات ويكيبيديا بناءً على أدلة واقعية ، يتم الحصول عليها غالبًا من الإنترنت. ومع ذلك ، فإن تحيز ويكيبيديا يمتد إلى التحيز عبر الإنترنت: هناك عدد قليل جدًا من المواقع المستندة إلى الإنترنت التي يمكن استخدامها كدليل. في حين لا يمكن حل المشاكل المتأصلة بسرعة ، فإن هذا النوع من المشاكل بالتحديد هو الذي يمكن استخدام التكنولوجيا للمساعدة في إحداث تغيير إيجابي. ما هي الخطوة التالية؟ تسليط الضوء على المزيد من الأشخاص المهمشين على ويكيبيديا نحن متحمسون لمشاركة هذا العمل مع المجتمع للمساعدة في تعزيز المناقشات والتجربة وإحراز تقدم بهدف المساعدة في توفير أكثر إنصافًا للمحتوى على ويكيبيديا. يعالج نموذجنا جزءًا واحدًا فقط من مشكلة متعددة الأوجه ، لذلك هناك مجالات إضافية يجب استكشاف التقنيات الجديدة فيها. عندما يكتب محرر لـ Wikipedia أو نموذج AI الخاص بنا سيرة ذاتية ، يتم سحب المعلومات من مصادر مختلفة عبر الإنترنت والاستشهاد بها. ومع ذلك ، على الرغم من كل المعرفة الثرية التي وفرتها الإنترنت ، فإن بعض المصادر بها تحيزات يجب أخذها في الاعتبار. على سبيل المثال ، عندما يتم تمثيل النساء ، فمن المرجح أن تتضمن سيرتهن الذاتية تفاصيل إضافية عن حياتهن الشخصية. وجدت دراسة أجريت عام 2015 أن كلمة “مطلق” تظهر في السير الذاتية للنساء أربع مرات أكثر مما تظهر في السير الذاتية للرجال. قد يكون هذا لعدة أسباب ، بما في ذلك الصحف الشعبية التي تميل إلى متابعة حياة النساء البارزات عن كثب أكثر من حياة الرجال. نتيجة لذلك ، من المرجح أن تذكر النساء التفاصيل الشخصية في المقالات ، مما يصرف الانتباه عن الإنجازات التي يجب أن تكون في دائرة الضوء ويتم الاحتفال بها. لقد أظهرت التكنولوجيا بالفعل وعدًا في المساعدة على معالجة نماذج متعددة من عدم المساواة ، وهي دليل على أن هناك المزيد الذي يمكن للمجتمع القيام به للمساعدة في إحداث فرق. على سبيل المثال ، أوضح الرئيس التنفيذي السابق للموقع كيف اكتشفت خوارزمية خطأ فادحًا على الموقع: بينما يتم التحقق من المقالات الصحية في ويكيبيديا من قبل المحررين الطبيين ، لسنوات ، تم تصنيف بعض المقالات حول القضايا الصحية الحرجة للنساء ، مثل الرضاعة الطبيعية ، على أنها ” قليل الأهمية.” هناك المزيد من العمل الذي يتعين القيام به للفئات المهمشة والعديد من الجوانب الأخرى في جميع أنحاء العالم وعلى مستوى اللغات. يركز تقييمنا ومجموعة البيانات لدينا على النساء ، والتي تستبعد العديد من المجموعات الأخرى ، بما في ذلك الأشخاص الذين ليس لديهم جنس. مقالات حول المتحولين جنسياً والأشخاص الذين لا جنس لهم تميل إلى أن تكون أطول ، ولكن يتم تخصيص الكثير من المساحة الإضافية لحياتهم الشخصية بدلاً من التوسع في إنجازات الفرد ، وفقًا لدراسة أجريت عام 2021 حول التحيزات الاجتماعية في مقالات ويكيبيديا. من المهم إدراك أن التحيز موجود بأشكال مختلفة ، على وجه الخصوص في مصادر المعلومات الافتراضية عبر الإنترنت. نحن متحمسون لمشاركة هذا كمجال مهم من مجالات البحث مع المجتمع بين الأجيال عمومًا. ونأمل أن يتم استخدام تقنيتنا في النهاية كنقطة انطلاق للكتاب البشريين في ويكيبيديا ، وأن سيؤدي في النهاية إلى معلومات أكثر إنصافًا على الإنترنت يمكن الوصول إليها من قبل الطلاب الذين يكتبون السير الذاتية ، وما إلى ذلك.

قراءة الموضوع تقرير: 20٪ فقط من السير الذاتية على ويكيبيديا تتحدث عن النساء

كما ورد من مصدر الخبر

مقالات ذات صلة

Subscribe
نبّهني عن
guest
0 تعليقات
التقيمات المضمنة
عرض جميع التعليقات
زر الذهاب إلى الأعلى
Don`t copy text!