Ученые изучают Википедию

Так, английская версия содержит 4,9 миллионов статей (на июнь 2015 года), что составляет 13,8% от всего объема. При этом китайская версия содержит более 800 тысяч статей, а арабская – менее 400 тысяч. Количество пользователей, редактирующих статьи, тоже отличается: англоязычных авторов в 6,4 раз больше, чем немецких (они вторые по количеству). 38,4% всех правок, сделанных к статьям пользователями, относится к англоязычным статьям.

Такая ситуация приводит к тому, что на одну и ту же тему в Википедии присутствуют разные статьи на разных языках, отличающиеся по объему и качеству содержания; по некоторым темам статей на других языках кроме английского нет вообще. Но и английская версия Википедии не является «полной»: так, она включает только 51% статей, которые присутствуют в немецкой версии. Для такой асимметрии есть несколько причин: во первых, Википедия изначально стартовала как англоязычный ресурс в январе 2001, во-вторых, английский на данный момент является универсальным языком интернета; в-третьих, пользователи часто предпочитают вносить вклад в создание статей о хорошо знакомых им локальных событиях или местах.
Были предприняты усилия по развитию содержимого портала на других языках: например, в 2010 году компания Google выступила спонсором соревнования, поощряющего студентов Танзании и Кении к участию в создании статей на суахили; а в 2007 году немецкое правительство выделило финансирование на развитие немецкой версии. Но даже с учетом этих мер перевес в сторону англоязычной версии остается большим.
Предыдущие исследования показали,что пользователи оказывают влияние на асимметрию содержимого Википедии: авторы, владеющие несколькими языками, играют ключевую роль в снижении неравномерности и в устранении разницы в контенте статей на разных языках. И ученые заинтересовались – каково же это влияние? Исследования 2006 и 2014 годов показали, что основной язык и культурная среда людей, владеющих несколькими языками, влияет на то, как они видят, интерпретируют и документируют события, происходящие в мире.
Примерно 15% активных авторов Википедии владеют несколькими языками. В рамках этого исследования из всего массива информации были определены 12577 многоязычных авторов с общим количеством более 600 тысяч правок.
Данные показали, что большинство многоязычных авторов работает в статьях на 2-3 языках. Более полную картину по активности многоязычных авторов можно увидеть на рисунке ниже:

На рисунке: а) Соотношение пользователей по языкам: 77,3% из них билингвы, 11,4% владеют тремя языками, и 4,1% – четырьмя; 2,3% владеют более 10 языками. b) Английская версия Википедии самая большая по содержанию, и вместе с тем наиболее разнообразна по участию людей, владеющих другими языками. с) Соотношение других дополнительных языков для основного английского, немецкого и испанского: люди с родным английским имеют наибольшее разнообразие по количеству дополнительных языков в редактируемых ими статьях; для пользователей с родным испанским и немецким в качестве второго дополнительного значительно преобладает английский.
Основной целью исследования было изучить поведение многоязычных пользователей, редактирующих статьи на английском, испанском и немецком языках. Причем исследователи сравнивали поведение при редактировании статей, написанных на родном языке носителя и на дополнительных языках.

На рисунке: Под «невидимыми» правками понимаются правки по форматированию, правки ссылок и стилей.
Что касается тем статей, то сравнение по основному и дополнительному языкам не показало особой разницы в интересах пользователей. Отличие появилось при сравнивании ситуации для английского, немецкого и испанского по отдельности. Оказалось, что носители английского языка и редакторы английских статей основную активность проявляли в теме «Компьютеры», а пользователи, для которых английский был второстепенным, – в теме «Города». В немецкой версии Википедии носители немецкого больше всего интересовались темами в разделах «Компьютеры» и «Наука», а пользователи, для которых немецкий был второстепенным, – темами в разделах «Футбол» и «Мировой спорт». В испанской версии первые интересовались темами в разделах «Политика», «Социальные науки» и «Развлечение», а вторые – темами в разделах «Растения» и «Географические места».
Сложность языка статей тоже отличалась в зависимости от темы:

Закономерно, многоязычные пользователи тратили больше усилий и создавали статьи большей лингвистической сложности на родном языке. Однако, такая ситуация была характерна для испанской и немецкой версии; английская версия Википедии отличий по сложности для статей на родном и дополнительном языках не обнаружила: обладатели других языков делали правки и создавали контент не менее сложный, чем люди, для которых английский язык являлся родным. Данный факт указывает на уникальную роль английского языка как универсального. Исследователи предполагают, что дальнейшее преодоление барьера в изучении английского языка поможет устранению ассиметрии в распространяемой информации.
Уважаемые сообщники, как часто вы пользуетесь Википедией? Принимаете ли вы участие в создании и правке статьей, и если да, то на каком языке? Доверяете ли вы информации, размещенной на этом портале?
Источник:
PLOS: Understanding Editing Behaviors in Multilingual Wikipedia
Авторы: Suin Kim, Sungjoon Park, Scott A. Hale, Sooyoung Kim, Jeongmin Byun, Alice H. Oh
Дата публикации: май 2016 г.
Лицензия и копирайт: © 2016 Kim et al., Creative Commons Attribution License
|
</> |