WWW.PDF.KNIGI-X.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Разные материалы
 

«Анализ мотивов поведения российских участников добровольных распределенных вычислений ТИЩЕНКО В. И. Институт системного анализа ФИЦ «Информатика и ...»

Анализ мотивов поведения российских участников добровольных

распределенных вычислений

ТИЩЕНКО В. И.

Институт системного анализа ФИЦ «Информатика и управление» РАН, Россия,

117312 Москва проспект 60-летия Октября, 9;

тел. (499)135-24-38, факс (499)783-91-32, tischenko@isa.ru

Ключевые слова: добровольные распределённые вычисления, платформа BOINC, виртуальные

сообщества

Keywords: volunteer computing, BOINC platform, virtual computing

Для анализа мотивов, определяющих поведение сообщества российских участников добровольных вычислений (кранчеров) на платформе BOINC, был построен двудольный граф, вершины которого соответствовали участникам и проектам, в которых они участвуют. В результате кластеризации полученного графа было показано, что поведение кранчеров в большей степени определяется причастностью важным научным исследованиям и командным участием в решении поставленных задач. В то же время балльная оценка активности участия незначительно влияет на характер поведения участников проектов. Результаты исследования могут использоваться при оптимизации управления проектами добровольных распределенных вычислений.

The article shows that the Russian community members volunteer distributed computing (VC) on the BOINC platform (crunchers) can be represented in the form of a network, followed by visualizing as bipartite graph. Whose vertices correspond to the participants and projects in which they participate.

Using the paradigm of complex networks and the analysis of the data obtained by different methods of clustering bipartite graph, allowed to verify the basic behaviors of the Russian participants of the VC in selecting and joining the research projects. Decisive are the thematic preferences of participants of the VC. And practically there is no any effect on the behavior of a team or individual activity, quantitatively expressed as krdits. The results can be significant for optimizing VC management for solving problems that require large computational resources.

Сложность задач, стоящих перед современной наукой, сопровождается сложностью вычислений, необходимых для решения этих задач. Ранее для масштабных расчетов по приоритетным проблемам ученые использовали исключительно суперкомпьютеры или вычислительные кластеры. Однако ограниченность их числа и дороговизна использования потребовали поиска альтернативных методов проведения больших вычислений. Оказалось, что оптимальным методом оказывается программное обеспечение интеграции свободных вычислительных ресурсов персональных компьютеров пользователей Интернета, предоставляемых волонтерами, заинтересованными в решении поставленной научной проблемы, и используемых для решения множества мелких задач, полученных в результате разбиения исходной масштабной задачи [1]. Принципиальным итогом решения задачи распараллеливания масштабных расчетов и разбиения исходной задачи на множество мелких, стала возможность построения вычислительные системы для добровольных вычислений на принципах базе гридсистем.

Одной из самых известных и развитых платформ для проведения добровольных распределенных вычислений (ДРВ) является разработанная в университете Беркли система BOINC (Berkeley Open Infrastructure for Network Computing). С помощью BOINC возможно эффективно интегрировать свободные вычислительные ресурсы персональных компьютеров пользователей Интернета для решения задач, требующих огромные вычислительные мощности [2Платформа BOINC используется для реализации проектов в области математики, молекулярной биологии, медицины, астрофизики и климатологии. Статусы проектов, использующих платформу BOINC, отображаются на сайте Formula BOINC (http://formulaboinc.org/). На конец мая 2016 года из 52 активных проектов 23 имеют статус альфа, 11 – бета.

(Статус «альфа» означает, что проект функционирует и находится на начальном этапе разработки.) Участники проектов в соответствии с принципами национальной (страновой) общности, общими тематическими или иными интересами объединяются в команды. На территории России активно действуют четыре проекта добровольных вычислений, использующих платформу BOINC:

Einstein@Home, OPTIMA@home и SAT@home (в настоящее время эволюционирует), Gerasim@home. Все эти проекты имеют статус «альфа» [4-6]. И, как следует из статистики, размещенной на официальном сайте www.boincstats.com, зарегистрированных российских команд, участвующих в добровольных распределенных вычислениях – более 783. Среди них есть как крупные, так и состоящие всего из нескольких человек [7].

Членам команд и командам в целом участников проектов организаторами исследовательских проектов начисляют условные очки, количество которых зависит от предоставленных мощностей, времени участия в проектах, иных особенностей активности участников, так называемые, «крдиты».

Очевидно, что реализация каждого конкретного проекта зависит от количества участников, точнее – количества персональных компьютеров, а также времени предоставления их для использования в проекте. И важнейшей задачей организаторов проекта становится привлечение в проект и «удержание» максимального количества участников с максимальным числом доступных ресурсов. Таким образом, организаторы проектов, использующих для расчетов ресурсы компьютеров участников добровольных распределённых вычислений (ДРВ), помимо решения технических задач должны учитывать мотивы пользователей Интернета предоставлять вычислительные ресурсы своих компьютеров на добровольной основе и, соответственно, причины их подключения (в прямом и переносном смысле слова) к проектам.

Зарубежные исследователи уделяют значительное внимание решению этой задачи и выработке рекомендаций для инициаторов проектов и разработчиков программного обеспечения.

В работах Oded Nov, Ofer Arazy, David Anderson, Peter Darch, Annamaria Carusi показано, что при ведении проектов необходимо учитывать ряд факторов, которые определяют поведение участников проектов и которые, по их мнению, способствуют активному развитию [8-9].

Речь идет о причинах, мотивирующих пользователей предоставлять вычислительные ресурсы своих компьютеров на добровольной основе и, соответственно, к участию в проекте:

- ощущение причастности к важным научным исследованиям и, соответственно, получению значимых научных результатов;

- командный дух и атмосфера кооперации, сотрудничества при решении значимых научных задач; участники ДРВ могут объединяться в команды по разным признакам (национальному, региональному, пр.);

- информированность о командном и/или индивидуальном участии в проекте; за выполненное задание пропорционально затраченным вычислительным ресурсам участникам проектов начисляются т.н. «кредиты»; количество «кредитов» является характеристикой, по которой отдельные участники или команды соревнуются между собой; при получении результатов обычно на сайте проекта выкладывается информация об участнике, на ПК которого был получен данный результат;

И хотя в России такие исследования только начинаются, в них также подчеркивается значимость подобных мотивов для определения поведения российских участников добровольных распределенных вычислений [10-13].

Однако следует подчеркнуть, что анализ поведения участников добровольных вычислений во всех упомянутых выше исследованиях проводился на основе социологических опросов или интервью фокусных групп с последующей статистической обработкой результатов исследования.

И понятно, что представленные выше модели поведения сообщества участников ДРВ (кранчеров), несут неизбежно субъективный оттенок. В этой связи представлялось значимым провести такое исследование, которое опиралось бы на объективные характеристики мотивов/факторов, определяющих выбор тех или иных моделей поведения при вхождении в проекты и последующее участие в них. Исходя из этого, основной целью данного исследования являлось создание математической и статистической базы, которая бы позволила не только описать модели поведения кранчеров, но дать возможность руководителям проектов максимально эффективно решать задачу привлечения и «удержания» в проекте кранчеров в российском сегменте платформы boinc.ru.

В основе этого решения лежало представление о сетевой природе коммуникаций, опосредованных компьютером и, соответственно, представление о виртуальных коммуникациях как особой форме сложных сетей. [14].

В результате нами было обосновано, что виртуальное сообщество российских участников добровольных распределённых вычислений (volunteer computing, VC) на платформе BOINC может быть рассмотрено в форме сложной сети.

В качестве узлов сети рассмотрены 2 типа объектов:

участники сообщества (аккаунты пользователей, зарегистрированных на сайте boinc.ru) и исследовательские проекты, в которых пользователи принимают участие (зарегистрированные в системе BOINC учетные записи проектов). Сеть была визуализирована, как двудольный граф с помощью программы Gephi. На горизонтальной оси на изображении расположены проекты, на вертикальной – участники. Чем дальше вершина находится от пересечения осей, тем выше ее степень (количество связей).

В графе, представляющем данную сеть, ребро соединяет одну из вершин, относящихся к первому типу – пользователи, а другую, ко второму – проекты, в которых пользователь, отображенный первой вершиной, принимает участие (предоставляет свои ресурсы для вычислений). В результате мы получим двудольный граф с типами вершин “участник” и “проект”.

Вес каждого ребра равен количеству “кредитов” заработанных участником на исследовании, с которым он связан данным ребром. Рассматриваемая сеть состоит из 134 проектов, 740 проектов и 44985 участников, что в сумме дает 45119 вершин, 82827 связей между ними. Средняя степень вершины в графе составляет примерно 1,83. Среднее количество участников в проекте – 618.

Диаметр графа равен 6, средняя длина пути: 2.14.

Существующие модели поведения участников VC, выделяемые в российских и зарубежных публикациях, были в рассмотрены в качестве гипотез исследования двудольного графа. И получили соответствующие условные названия – тематическая, командная и количественная.

Первой и основной гипотезой является предположение о том, что участников и проекты в сообществе можно математическими методами разделить на некоторое, достаточно небольшое, количество кластеров, основной эмпирической характеристикой которых будет сфера научных интересов. Иными словами, наиболее существенным критерием при выборе проектов для участников является тематика, к которой относятся проекты (у каждого участника существует свойство – предпочтительная научная область проекта и принадлежность каждого проекта к этой области определяет его конечный выбор). Если данная гипотеза подтвердится, то решение задачи

– обеспечения решения исследовательского проекта оптимальным «объемом» ресурсов путем привлечения необходимого количества участников; поиска оптимального соотношения ресурсов и количества участников, – для руководителей проектов будет очевидным образом существенно упрощено.

Вторая гипотеза заключается в том, что решающую роль в выборе проекта для участника является его принадлежность к команде и организованное участие команды в проекте. Данную гипотезу также предполагается проверить на основе кластеризации графа.

Третья гипотеза – отражает активность участников, определяемую по «кредитам» в результате чего всех кранчеров можно разбить на страты по их активности (количеству кредитов), такие, что их поведение можно будет предсказать по принадлежности к определенной страте.

Для проверки гипотез были использованы четыре различных метода кластеризации двудольных графов (методы SRE, k-means, PDDP, «информационного бутылочного горлышка»), в основном ранее применявшиеся для кластеризации документов. Сравнение результатов работы методов показало высокую степень применимости каждого из них к данному объекту исследования.

По результатам кластеризации графов можно с уверенностью говорить, что подтвердилась тематическая гипотеза, объясняющая поведение участников boinc.ru сильной зависимостью от их тематических научных интересов. Гипотеза о том, что поведение участников находится в зависимости от команды, в которой они состоят, была подтверждена частично. И наконец, предположение о том, что индивидуальная или общая активность участников будет сильным фактором, определяющим их поведения при выборе проектов, было почти полностью опровергнута, за исключением отдельной группы сверхактивных участников. Наличие подобной группы, так называемых супер-кранчеров, обнаруживается и зарубежными исследователями [9].

Результаты кластеризации подтверждают сформированное ранее представление о статистике участия российских кранчеров в проектах VC [4]. Те участники добровольных распределённых вычислений, которые были ориентированы на развитие проекта как способа решения фундаментальной научной проблемы и видели результаты своего труда – демонстрировали лучшие показатели в предоставлении вычислительных мощностей своих компьютеров – активность, постоянство, время подключения и т.п.

Полученные результаты могут иметь существенное применение при решении практических задач по оптимизации работы в рамках сети Boinc.ru.

Литература

1. W. T. Sullivan, III, D. Werthimer, S. Bowyer, J. Cobb, D. Gedye, D. Anderson. A new major SETI project based on Project Serendip data and 100,000 personal computers // Astronomical and Biochemical Origins and the Search for Life in the Universe", Proc. of the Fifth Intl. Conf. on Bioastronomy = IAU

Colloq. No. 161, eds. C.B. Cosmovici, S. Bowyer, and D. Werthimer, 1997 // Информационный ресурс:

http://seticlassic.ssl.berkeley.edu/woody_paper.html доступен 27.05.2016.

2. David P. Anderson Public Computing: Reconnecting People to Science // Presented at the Conference on Shared Knowledge and the Web, Residencia de Estudiantes, Madrid, Spain, Nov. 17-19 2003 // Информационный ресурс: https://boinc.berkeley.edu/madrid.html доступен 20.05.2016.

3. David P. Anderson A Brief History of BOINC, talk at the 10th BOINC Workshop, 29 Sept 2014, Budapest // Информационный ресурс http://boinc.berkeley.edu/talks/workshop_14.pdf доступен 07.10.2016

4. Тищенко В. И., Прочко А. Л. Российские участники добровольных распределенных вычислений на платформе Boinc. Статистика участия // Компьютерные исследования и моделирование. 2015.

Т. 7. № 3. С. 727-734.

5. Заикин О. С., Посыпкин М. А., Семенов А. А., Храпов Н. П. «Опыт организации добровольных вычислений на примере проектов OPTIMA@home и SAT@home» // Вестник Нижегородского университета им. Н.И. Лобачевского вып. № 5-2 / 2012. стр. 340-347.

6. Посыпкин М.А. Развитие технологий добровольных вычислений в России. // Сборник тезисов докладов Национального суперкомпьютерного форума 23-27 ноября 2015 г. Информационный ресурс: http://2015.nscf.ru/nauchno-prakticheskaya-konferenciya/tezisy-dokladov/ доступен 07.10.2016.

7. Информационный ресурс: http://boincstats.com/en/stats/-1/team/list/0/0/25/ доступен 07.10.2016.

8. Oded Nov, Ofer Arazy, David Anderson. Scientists@Home: What Drives the Quantity and Quality of

Online Citizen Science Participation? PLOS One, April 1 2014, Информационный ресурс:

доступен http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0090375 / 07.10.2016

9. Peter Darch, Annamaria Carusi Retaining volunteers in volunteer computing projects Phil. Trans. R.

Soc. A (2010) 368, 4177–4192, Информационный ресурс: http://rsta.royalsocietypublishing.org/

10. Андреев А. Методы повышения популярности и привлечения участников в проектах добровольных распределенных вычислений на платформе BOINC. // Доклад на Национальном Суперкомпьютерном Форуме (НСКФ- 2014), г. Переславль-Залесский, 25–27 ноября 2014 года.

Информационный ресурс:

http://2014.nscf.ru/TesisAll/5_Gridi_iz_rabochix_stanciy_i_kombinirovannie_gridi/05_211_AndreevAL.

pdf доступен 07.10.2016.

11. Андреев А. Социология ГРИД. Троицкий вариант, № 166, 04 ноября 2014 года. с. 8

12. Курочкин И. И., Якимец В. Н. Исследование предпочтений участников добровольных распределенных вычислений. // 6-я международная конференция «Распределенные вычисления и Грид-технологии в науке и образовании» (GRID'2014), Россия, Дубна, ОИЯИ, 30 июня — 5 июля, 2014.

13. Якимец В. Н., Курочкин И. И. Добровольные распределенные вычисления в России:

социологический анализ // Сборник научных статей XVIII Объединенной конференции «Интернет и современное общество» IMS-2015, Санкт-Петербург, 23-25 июня 2015 г.

14. Тищенко В.И., Жукова Т.И., Попков Ю.С. Сетевые взаимодействия. Предмет исследования и объект моделирование. М.: ЛЕНАНД, 2014



Похожие работы:

«Московский государственный университет имени М. В. Ломоносова Факультет Вычислительной Математики и Кибернетики Кафедра Математических Методов Прогнозирования Дипломная работа «Математические модели дезинформации»Выполнил: студент 5 курса 517 группы Куракин Александр Владимирович Научный руководитель: д.ф-м.н.,...»

«СПЕЦВЫПУСК «ФОТОН-ЭКСПРЕСС» – НАУКА №6_2005 АЛГОРИТМ ОЦЕНИВАНИЯ ДЛИНЫ БИЕНИЙ ПРИ ИЗМЕРЕНИЯХ ПМД ОПТИЧЕСКИХ ВОЛОКОН РЕФЛЕКТОМЕТРИЧЕСКИМ МЕТОДОМ В.А. Бурдин, А.В. Бурдин 443010, г. Самара, ул. Льва Толстого, д. 23 тлф./факс (846) 228-00-27 E-mail: burdin@psati.ru; bourdine@samara.ru Кафедра Линии связи и измерения в технике свя...»

«Информационные процессы, Том 12, № 4, 2012, стр. 400–407. 2012 Орлов. c МАТЕМАТИЧЕСКИЕ МОДЕЛИ, ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ Иллюзия шара и алгоритмы ее порождения О.Ю. Орлов Институт проблем передачи информации им. А.А. Харкевича, Российская академия наук (ИП...»

«УДК 004.912 А. М. Федотов 1, 2, М. Н. Абделиева 2, А. Т. Байдавлетов 2 А. А. Бапанов 3, М. А. Самбетбаева 2, О. А. Федотова 4 Институт вычислительных технологий СО РАН пр. Акад. Лаврентьева, 6, Новосибирск, 630090, Россия Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия Ев...»

«РАЗРАБОТКА МЕТОДИКИ АНАЛИЗА ЭФФЕКТА ЛОЖНОГО ОКОНТУРИВАНИЯ НА ИЗОБРАЖЕНИЯХ м.н.с. Насонов А.В.1, проф. Крылов А.С.1, асп. Черноморец А.А.1, проф. Динг Йонг2 Московский государственный университет имени М.В...»

«ДОКЛАДЫ БГУИР № 1 (17) ЯНВАРЬ–МАРТ УДК 681.325 МЕТОДЫ ОЦЕНКИ РАССЕИВАЕМОЙ МОЩНОСТИ В ЦИФРОВЫХ КМОП СХЕМАХ И.А. МУРАШКО Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 22...»

«Российская академия наук Сибирское отделение Институт вычислительных технологий УТВЕРЖДАЮ Директор ИВТ СО РАН академик Ю. И. Шокин 1 сентября 2009 года «Подготовка цифровых батиметрических...»

«Министерство образования Республики Беларусь Учреждение образования «БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ» Кафедра систем телекоммуникаций П.А.КАПУРО, А.П.ТКАЧЕНКО Электронный учебно-методиче...»





















 
2017 www.pdf.knigi-x.ru - «Бесплатная электронная библиотека - разные матриалы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.