О выпуске
Второй выпуск про доклады с BOINC Workshop 2023 года.
Маркус Белкастро из Австралии рассказывает про опрос BOINC Census.
За ним Игорь Юрисика рассказывает про World Community Grid и его текущее состояние. Про борьбу с раком, вирусом Зика, туберкулезом и другие проекты. WCG это один из наиболее почтенных и доверенных проектов оберток для BOINC, внутри которого завершено больше десятка проектов от независимых учёных. Проект долгое время поддерживался IBM, а сейчас переезжает на свою инфраструктуру.
Выпуск 7
О борьбе с туребкулезом и вирусом Зика.

Транскрибация

Добрый день, меня зовут Василий Закиев и с вами подкаст Гритка. Этот подкаст про распределенные вычисления и про Boeing. Мы изучаем, что происходит в мире распределенных вычислений и ищем возможности помогать тем проектам, которые позволяют использовать простаивающие ресурсы компьютера для того, чтобы помогать человечеству. Обычный компьютер большую часть времени ничего не делает, это то время, когда его процессор и видеокарта могли бы использоваться для того, чтобы ученые вычисляли на них какие-то свои задачи. Существует большая сеть распределенных вычислений Boeing на программном обеспечении, которое также называется, и существует огромное количество проектов, к которым можно присоединиться, разрешив своему компьютеру простаивающую часть времени использоваться для задач науки. Сегодня мы продолжаем изучать, что говорили на Boeing Workshop. Boeing Workshop — это ежегодное мероприятие, которое проводится в начале года. В этом году оно прошло 1 и 8 апреля, на котором участники проектов распределенных вычислений и Boeing рассказывают друг другу, что у них произошло за год, какие планы. В общем, такая небольшая онлайн-конференция. Конференция проходит в Zoom. Качество там не очень. Язык английский. И в рамках серии выпусков подкаста Gritka мы, по сути, пересказываем, что было на этой конференции на русском языке, так, чтобы это было интересно слушать. Если у вас возникают по пути какие-то вопросы, пожалуйста, в комментарии. Не забывайте, пожалуйста, ставить лайк и подписываться на этот подкаст для того, чтобы продвигать нас на платформах, и как можно больше людей узнавали об этой интересной сфере деятельности. Итак, первый выпуск у нас это Маркус Белкастро. Он рассказывает про Boeing Census, то есть ежегодно проводимый опрос участников распределенных вычислений Boeing. Второй, и это основная часть сегодняшнего выпуска, это Игорь Юрисика. Он расскажет про то, как работает World Community Grid, один из крупнейших и тоже старейших проектов на Boeing. Итак, начнем с Маркуса. Маркус молодой парень, который живет в Австралии и сейчас занимается тем, что помогает Boeing продвигаться. Он один из ведущих Boeing Radio, который мы тоже будем переводить и комментировать. И каждый выпуск Boeing Radio начинает с того, что пьет какой-нибудь необычный напиток. Газировку, со вкусом огурца или газировку со вкусом молочного кофе. И рассказывает свои впечатления. На самом деле, это небольшая его фишка. Кроме того, что он ведет Boeing Radio, он, собственно, занимается организацией Boeing Census, то есть ежегодного опроса. В этом году, обычно опрос проходит в ноябре-декабре, и, соответственно, в прошлом году его прошло 1200 участников, из которых 900 заполнили опрос полностью, и 99% очевидно используют Boeing. Но вот есть 1% людей, которые по каким-то причинам Boeing не используют. Опрос показал, что большинство участников распределенных вычислений Boeing — это мужчины, то есть там практически прямо 99%. Большинство из них очень хорошо образованы, это высшее образование и так далее. Средний возраст — это 31 год и более, то есть от 31 до 50. Большинство тех, кто прошел опрос — это Штаты и Европа, но надо понимать, что есть определенные искажения, то есть участники в Boeing вычислений могут быть отовсюду, но опрос прошли в основном люди из США и Европы. Но на самом деле, большинство вычислительных ресурсов распределенных вычислений действительно расположены в США и Европе. Одним из первых интересных результатов опроса стало то, что большинство участников оценивают результативность своего участия как сам импакт, ну то есть небольшое участие, небольшая результативность, некоторая результативность. Это интересно, потому что, в принципе, люди, получается, большинство, больше половины делают свой вклад в распределенные вычисления, не ожидая какого-то серьезного результата. С другой стороны, это показывает проблему, что большинство людей не видят отдачи от того, что они делают, то есть они не видят какого-то объективного результата от своей работы. С одной стороны, здесь есть субъективные причины, что ученым сложно обозначить какие-то промежуточные результаты, а люди хотят какой-то результативность каждый день, ну чтобы каждый день какие-то показатели росли. Ну и есть объективная проблематика в том, что для достижения серьезных результатов требуются серьезные вычислительные ресурсы. Проекты накапливают эти ресурсы довольно долго и, ну, можно год отдавать ресурсы огромного количества компьютеров для того, чтобы только в конце года получить какой-то computational результат, а потом еще нужно довести его до некого научного результата. Интересно, что вообще-то Boeing был, как программное обеспечение, которое работает на сервере и на компьютерах участников, спроектирован так, чтобы в основном общаться с участниками через e-mail. И даже после выступления Маргуса один из главных создателей Boeing, Дэвид Андерсон, спрашивает, ну а почему там через e-mail неудобно, но он постарше. Ну, наверное, потому что большинство людей сейчас, довольно много людей сейчас не обращает внимания на электронную почту, считает это каким-то подвидом спама, да, и большинство участников опроса тоже ответило, что им было бы удобнее получать результаты своей работы прямо внутри Boeing менеджера, то есть программы, которые ставятся на компьютер. Порядка 8 процентов участников хотели бы запустить свой проект в Boeing, но не делают этого, потому что это требует довольно больших технических скиллов. Да, это действительно требует определенных технических скиллов, но у подкаста есть друзья, и если вы вдруг хотите, как ученые, запустить свой проект для того, чтобы волонтеры со всего мира помогали вам считать его результаты, обратитесь в комментариях или через Telegram-канал, мы вам поможем запустить свой проект. Следующая часть опроса касалась того, хотят ли люди какого-то дополнительного вознаграждения за то, что их компьютер участвует в этих вычислениях. И порядка половины пользователей ответили, что они бы вычисляли больше, если бы их работа вознаграждалась. Часть сказала, что никак не повлияет, а примерно треть еще сказала, что зависит от того, какое вознаграждение и насколько. Есть люди, которые свой компьютер использовали бы больше, если бы знали, что эта работа вознаграждается, потому что они специально занижают ту часть мощности, которая отдается на распределенные вычисления, боясь каких-то рисков. Ну, например, что перегрев будет или жесткий диск будет использоваться слишком сильно. Ну и есть часть людей, которые, может быть, специально купили бы дополнительный компьютер или сервер для того, чтобы отдавать его ученым, если бы эта работа полностью компенсировалась. Второй аспект — это электричество. У нас в России электричество в среднем в 6 раз дешевле, чем в развитых странах, но, например, даже у нас современный мощный компьютер, он будет потреблять от полкиловатта до киловатт в час, и, соответственно, это примерно 500-1000 рублей в месяц дополнительно к счету на электричество. И как минимум хотелось бы, чтобы эта сумма, например, компенсировалась, а в США и Европе, соответственно, этот вопрос стоит острее. Интересная часть этого вопроса в том, что существует гриткоин, то есть криптовалюта, которая выдается за то, что ты участвуешь в распределенных вычислениях. Другое дело, что размер выплат сейчас не такой, чтобы позволять оплачивать хотя бы электричество, ну, предположим, может даже в России, кстати, хватило бы, но большинство людей этим не пользуются, потому что это немного делает вот этот волонтерский вклад в распределенные вычисления уже таким более оплачиваемым, что ли. То есть появляется такой рынок, и это неинтересно. Опрос проводится третий раз, и Маркус предполагает, что дальше этот опрос будет продолжаться, и подводит небольшой итог этого опроса. То есть, на самом деле, опрос большой, и существует целый специальный выпуск Boeing Radio про этот опрос. Здесь, в общем-то, довольно простые выводы, что большинство участников мужчины, большинство участников хорошо образованы, хотели бы получать информацию о движении проектов, внутри проектов через Boeing Manager напрямую, и, в принципе, Маркус и участники дискуссии дальше считают, что имеет смысл дальше погружаться в вопрос вознаграждения. То есть, возможна ситуация, например, когда лаборатория выбирает между вычислениями на сервере или внутри распределенных вычислений, и могла бы за сервер заплатить какую-то сумму X, но в распределенных вычислениях за счет компенсации, например, из суммы в пол X можно было бы получить точно такой же результат, а люди получили бы вознаграждение за свою работу. Эту часть дальше стоит исследовать, и коллеги в рамках дискуссии как раз договорились это сделать.
Вторая часть сегодняшнего выпуска посвящена следующему докладу. Это Игорь Юрисико, который рассказывает про World Community Grid, которым он занимается. World Community Grid это проект внутри Boeing, то есть Boeing это программное обеспечение, у него есть серверная часть, есть клиентская часть, можно скачать клиентскую часть на свой компьютер, подключиться к каким-то серверам и начать помогать. Одним из этих серверов является World Community Grid, который считает не один проект, а несколько, довольно много, порядка двадцати они посчитали за все это время. Игорь приводит статистику, небольшую историю, как появился этот проект, и, например, большим соучастником этого проекта является IBM, которое довольно продолжительное время, порядка 15 лет, держал сервер World Community Grid у себя. Сейчас у World Community Grid наблюдаются проблемы, количество задач, которые отдаются проектами, довольно низкое. Я видел, что участники распределенных вычислений жалуются, что World Community Grid, которым они контрибьютили довольно большое время, сейчас почему-то не отдает проекты, не принимает результаты проектов и так далее. Но мы как раз сейчас разберемся, почему это происходит. Основные проекты, которыми сейчас занимается World Community Grid, это Open Pandemics, который ищет лекарства от COVID, это Africa Rainfall Project, который помогает предсказывать дожди в Африке. Эта информация предоставляется фермерам для того, чтобы они могли лучше прогнозировать урожайность на своих полях. Smash Childhood Cancer — это проект, который международный, помогает искать способы лечения для тех видов рака, которые поражают детей. Help Stop Tuberculosis — это проект, который помогает искать лекарства от туберкулеза. Например, в год от туберкулеза умирает полтора миллиона человек и действительно все еще требуется лекарство. То есть у нас в России тотальная прививка от туберкулеза — ПЦЖ помогает довольно хорошо сдерживать это заболевание, но время от времени случаются вспышки, и туберкулезные диспансеры, в общем-то, не зря до сих пор стоят во всех городах и работают, то есть люди регулярно страдают от этого заболевания. И Mapping Cancer Markers — это проект, который помогает находить связи между химическими соединениями, которые есть в крови человека, и раком, которым эти люди болеют. То есть этот проект помогает искать маркеры, позволяющие выявить рак на более ранних стадиях. Сейчас, получается, World Community Grid переносит свои сервера с IBM на новые, он рассказывает про некоторые проблемы, которые у них связаны с тем, что там какой-то массив RAID на время подсдох, где-то у них сервера перестали работать. Но самое главное, что в половине проектов у них сейчас научная пауза, то есть задания были даны, были обсчитаны, и ученые сейчас анализируют результаты предыдущих исследований для того, чтобы выдать следующее задание. Насколько мне известно, обычная ситуация обстоит так, что ученым даже нужны свои собственные сервера или доступ к суперкомпьютерам для того, чтобы обсчитывать хвосты так называемые, то есть ты выдаешь большую пачку заданий, но какие-то маленькие, небольшие области после обсчета этой большой пачки заданий хорошо бы доделать быстренько самому и не подключать сообщество, потому что, да, распределенные вычисления позволяют перемалывать довольно большое количество задач, но так как это распределенные вычисления, они не такие быстрые, то есть нужно отдать задачи, дождаться ответа, и только потом можно выдать следующую пачку задач. И часть проектов сейчас остановлена по техническим причинам, как раз потому, что переносятся сервера. В World Community Grid с 2012 года ведется разработка своего собственного, своей собственной серверной части, которая совместима с Boeing, но при этом у нее есть какие-то изменения. Половина выступления после того, как рассказывал Игорь, посвящена как раз тому, какой у них план, то есть как сейчас выглядит эта серверная инфраструктура, какой план изменений, какой план взаимодействия дальнейшего с Boeing. Но как бы в данный момент World Community Grid это полноценный проект именно внутри Boeing, то есть если ты зайдешь на сайт World Community Grid и скачаешь клиент, то это будет клиент Boeing, который используется одновременно не только для World Community Grid. Это отличает World Community Grid от какого-нибудь проекта типа, например, Folding at Home, у которого своя серверная часть, есть свой клиент, то есть можно скачать клиент, который работает только с Folding at Home, а можно скачать Boeing клиент и подключаться к Folding at Home, то есть такая получается вариативность и возможность. В случае с World Community Grid, повторюсь, там все работает только через Boeing. Вообще, как я сказал, проектов порядка 20, и один из хороших проектов это Zika, OpenZika, который искал лекарства от вируса Zika. Вирус Zika в Африке сейчас имеет статус пандемии, то есть это довольно серьезное заболевание, и ученые искали, при помощи вычислительных мощностей, возможные ингибиторы развития этого вируса, ну то есть примерно такая же история, как с любыми вирусами, вирус цепляется к клеткам человека, за счет этого попадает внутрь клетки и начинает себя реплицировать, и можно подобрать такие химические соединения, которые не вредят человеку, но при этом мешают вирусу реплицироваться или серьезно сокращают количество копий, которые может вирус сделать или, например, усложняют прицепление к клеткам, или делают вирус более явно видимым для иммунной системы, ну то есть вариантов может быть много, и так как белок — это трехмерная структура, очень большая, очень сложная, и более того, она еще и меняется во времени, то есть это четырехмерная структура, то подобрать навскидку лекарства от вируса довольно сложно, но что можно сделать, это подобрать кандидатов, и вот, например, для вируса Zika в рамках Open Zika Project было подобрано порядка 36 миллионов кандидатов, которые прошли верификацию на вычислительных ресурсах, то есть были смоделированы, и в итоге получилось порядка 61 варианта, который надо уже проверить в лаборатории, и вот за 2 года примерно в лаборатории эти варианты были проверены, было подобрано 3 соединения, которые довольно хорошо могут помочь. Как я понимаю, они пойдут в клинические испытания, и, возможно, это будет хорошим результатом работы над лекарством от вируса Zika. Значит, в ближайшее время, соответственно, в World Community Grid не ожидается никаких остановок, поэтому вы можете к нему спокойно подключаться. Работа будет продолжаться в трех направлениях. Есть короткий план по тому, чтобы работать над другими видами рака, над вирусами, над артритами и лечением болезни Паркинсона. Есть более длительные проекты, связанные с возобновляемыми источниками энергии и оценкой климата, ну типа Africa Rainfall Project, например. И третий трек — это как раз интеграция World Community Grid с Boeing, перенесение серверных мощностей для того, чтобы уже вне зависимости от IBM продолжать работать. Кроме того, World Community Grid работает над тем, чтобы помогать ученым подсоединяться к Boeing. То есть в простой ситуации выглядит так, что ученый читает документацию Boeing, запускает свой собственный сервер, потом пропагандирует волонтеров присоединяться к этому проекту, и через какое-то время у него появляется как бы свой суперкомпьютер такой распределенный. World Community Grid говорит, что ученым сложно и технически установить свой сервер. Мы помним, например, что по предыдущему опросу каждый десятый участник опроса хотел бы запустить свой Boeing проект, но не может, потому что не хватает времени или технических скиллов. А во-вторых, ученым сложно привлекать волонтеров для того, чтобы они участвовали над проектом. И в принципе, я вот вижу сейчас, что довольно большое количество старых Boeing проектов, они не отключаются, а начинают работать как обертки для новых. То есть позволяют новым проектам использовать ту базу волонтеров, которые уже работают над проектом для того, чтобы просто не терять ее, дать буст новым проектам и помогать им быстрее стартовать. А World Community Grid это такая большая обертка, которая помогает ученым засовывать свои проекты внутрь большого проекта World Community Grid, чтобы люди могли просто продолжать помогать World Community Grid, не сильно заморачиваясь над тем, какие именно проекты там считаются, просто доверяя Игорю Юрисике, его коллегам и тем людям, которые выбирают проекты, которые будут считаться в World Community Grid. World Community Grid порядка с двух террафлопсов скакнул до шестнадцати в двадцать первом году, это год, когда была пандемия, много людей сидели дома, хотели как-то в чем-то поучаствовать, у World Community Grid был проект связанный с поиском лекарства от COVID, потом в двадцать втором году количество ресурсов, доступных для World Community Grid упало примерно в четыре раза, и вот в двадцать третьем году примерно возвращается к старым показателям, то есть получается, что внезапное подключение огромного количества волонтеров, оно не создало долгосрочного эффекта. Долгосрочный эффект, чтобы его достичь, видимо, нужно, чтобы вот люди получали обратную связь от того, что происходит в проектах, какие вычисляются данные, и в рамках как раз дальнейшей дискуссии здесь и обсуждалось, что довольно много технически подкованных ребят занимается и распределенными вычислениями, и проектами, но довольно мало людей занимается именно маркетингом, а тут хорошо бы людям показывать, что происходит в проектах, гораздо более активно бы. Мы это, кстати, обсуждали с Натальей Никитиной и ее проектом Seedok, что этот маркетинг, он очень важен, хотя, на мой взгляд, в Seedok тоже можно гораздо больше информации о том, что происходит внутри проекта, генерировать и предоставлять участникам, мне кажется, это очень важно, и вот результаты хайпа, связанного с ковидом и последующих хвостов показывают, насколько это важно. Дальше анализируется, сколько в World Community Grid участников, то есть больше всего участников, которые пользуются Windows, меньше на Linux, но на Linux гораздо больше и вычислительные ресурсы суммарные, и количество хостов, то есть один участник как юзер может запускать несколько вычислительных модулей там на разных компьютерах, соответственно, у него может быть домашний компьютер, серверы, еще что-то, и вот оказывается, что Linux серверов, их больше. Почему так происходит, сказать сложно, возможно, потому что люди, которые пользуются Linux, они запускают вычисление на разных серверах, что я, например, сделал, у меня есть свой собственный VPN-сервер, который помогает там обходить ограничения, которые постоянно сейчас возникают в разных интернетах, у меня есть VPN-сервер в России, VPN-сервер за рубежом, и ну что такое сервер, то есть это какое-то количество выделенных виртуальных ядер, которые большую часть времени простаивают, потому что вообще-то VPN не требует каких-то серьезных вычислительных ресурсов. Я запустил на обоих этих серверах Boeing, чтобы просто эти вычислительные ресурсы не простаивали, тем более, что я за них и так заплатил, и не сказать, чтобы там какие-то гигантские вычислительные мощности, но какие-то мощности там есть. Выходит, что, по моим расчетам, арендовать сервер для того, чтобы отдать его полностью на Boeing, никакого смысла нет, это выйдет намного дороже, чем купить компьютер, купить его и отдать все его ресурсы на распределенные вычисления, но если у тебя уже есть сервер, и он уже чем-то занимается, и большую часть времени простаивает, то почему нет? Вообще ничего не теряешь, в общем-то, мой VPN от этого точно хуже не стал. Весь этот выпуск заканчивается довольно большой и для меня не очень информативной частью про то, как сейчас происходит работа над улучшением серверной части World Community Grid, как там все устроено, какие там очереди, как задания и статистика пересылаются на сервера Boeing и так далее, и так далее, и так далее, если интересно, подключайтесь. Ну, вообще, Boeing — это опенсорсное программное обеспечение, можно на GitHub найти Boeing и, соответственно, подключиться к разработке этого программного обеспечения, если хочется помочь ребятам или, например, нарастить свой скилл в разработке. Если у вас есть какие-то вопросы, задавайте в комментариях, подписывайтесь на наш Telegram канал, его легко найти по названию Gridka, мы есть почти на всех популярных платформах, можно подписаться там и нет ничего более полезного для нас, чем если вы просмотрите выпуск на платформе, поставите лайк там в топ, плюс или что-нибудь такое, что показывает, что вам это понравилось. Большое спасибо и до встречи в новых выпусках.
Платформы