Всем привет! Мы начинаем второй выпуск подкаста про распределенные вычисления У нас сегодня в гостях Максим Манзюк из Волгограда. Он довольно давно занимается распределенными вычислениями. Я, когда делал свои первые опыты в этом направлении, связывался с Максимом, потому что довольно видный, заметный деятель этой сферы. Максим, слово тебе. Расскажи, пожалуйста, пару слов о себе. Давай познакомимся. В данный момент я являюсь сотрудником антисферы. Мне нравилось то, что связанное с компьютерами еще со школы. И когда я учился программировать, то мне, конечно, было интересно попробовать смоделировать что-то на компьютере. Поведение каких-то материальных точек, как они будут сжиматься в какую-то туманность, планету. У меня была, например, когда-то школьная работа по моделированию дифракции электромагнитных волн, например, радиоволн и световых на разных отверстиях. И с самого начала я воспринимал компьютер как некую машину, которая позволяет что-то сделать в науке. Мне это было всегда интересно. В саму науку я не пошел. Я пошел учиться на факультет электроники, врачники и техники. Я стал профессиональным программистом, потому что сама по себе эта область тоже очень похожа, как мне кажется, на науку. Потому что ты сначала исследуешь предметную область, ты устанавливаешь какие-то законы, которые в ней действуют. Ты эти законы пытаешься как-то формализовать и воплотить в виде какого-то просто программного нематериального объекта, на котором тоже работаешь. Сочетание вот этих двух компонентов, восприятие машины, компьютера как именно средства вычисления, средства моделирования чего-то. С другой стороны, эта работа в антиотражной, она мне помогала и по самой работе. Потому что когда в определенный момент я столкнулся с базами данных, очень полезно оказалось понимать, насколько тот или иной процессор может быть быстрее, что могут на самом деле те или иные процессоры, как бы наивный глупо это сейчас не звучало. Была, например, ситуация, когда мы просто смогли выставить начальству необходимость перемежда на новый сервер, который формально выглядел, может быть, не таким уж и мощным, но именно просто проверив его реальную производительность, мы показали, что он уже весьма-весьма устарел и после перемежды на новый сервер система стала работать раз в 10 быстрее. Прямо в 10 раз? Да. Производительность процессора там была не в 10 раз быстрее, но из-за того, что там использовалась база данных, скажем так, блокировочного типа, ускорение где-то в 2-2,5 раза по процессору, оно привело к тому, что стало меньше проблем внутри базы и просто система начала так работать. В целом, такое постоянное общение с людьми, которое, ну, всегда как-то награжает свое железо, просто и постоянный такой интерес к этой области, с одной стороны, свободное от работы время, с другой стороны, задачи, именно возникающие по работе, они привели к тому, что одно помогает другому. То есть в итоге, как люди увлекаются, например, тем, чтобы из своего автомобиля выжать максимум, просто потому что им нравится это, они это делают ради искусства, но потом они эти знания могут использовать в чем-то другом. Да, да. Кроме этого, некоторые аналогии, которые используются в распределенных решениях, понятия, они иногда при переносе в рабочую область, они могут давать хороший эффект. Ну, например, перенятие, понятие ворфьюника, которое используется в выдаче заданий и переносово там в очень небольшую систему, которую приходилось мне делать на работе, она была вспомогательной, но она улучшила работу, ну, несколько десятков человек на своем небольшом поле. А если не секрет, чем ты разрабатываешь, то есть что ты разрабатываешь, на чем пишешь? Сейчас, если говорить о каких-то рабочих задачах, я больше занимаюсь даже администрированием, но если нужно что-то написать, то там C++ или даже скриптовые языки, ну, вообще там SQL и языки, связанные с базами данных, в зависимости от того, что мне придется делать. В начале своей деятельности я принимал участие и занимался именно разработкой ПО, то есть мы прямо писали бизнес-приложения нашим подразделениям, потом постепенно я ушел в администрирование баз данных, ну, сейчас я на стыке баз данных и разработки. А как связано с распределенными вычислениями? Ну, то есть, как разработчик, наверное, довольно такой обычный путь, интересовался компьютерами, хотелось что-то из них получить, для этого пришлось научиться программировать, это стало хорошей профессией, а как связался с распределенными вычислениями? Познакомился я с ними, как и большинство, по-моему, людей, да, случайно, потому что я одновременно увлекаюсь астрономией, здесь на сайте
astronet.ru рубрика такая, картинка дня, и однажды в ней была, в очередной день была публикована картинка, связанная с City Hall, прочитав ее, я вспомнил, что еще когда учился на первом или втором, или третьем, может быть, курсе, я читал в компьютере об этом проекте, тогда участие в нем казалось чем-то трудным, потому что, ну, тогда интернет был еще по диалогу, были сложности с дозвоном и прочее, прочее. Извиняюсь, да, сделаю небольшую ремарку, да, что City at Home это такой проект, который крутится также на Боинке, который помогает из огромного количества радиосигналов, которые человечество зарегистрировало на радиотелескопах и другими средствами, помогает из них отобрать кандидатов на то, чтобы эти сигналы считались искусственного происхождения, это, наверное, один из первых проектов, которые запустились в Боинке, по-моему, даже он был раньше, чем Боинг. Да, Боинг вырос из City at Home, City не был первым проектом распределенных вычислений, вообще, какой первым называть, это отдельная интересная история, но Боинг был создан Дэвидом Андерсеном и его командой, которые в свое время написали City at Home. Ну, пока они ничего не нашли, и как мы ничего не нашли, я тоже участвовал в этом проекте, эта задача, она очень хорошо подходит как раз для распределенных вычислений, я так понимаю, как раз потому, что можно нарезать весь сигнал на кусочки, эти кусочки кормить каждому отдельному компьютеру, каждый отдельный кусочек, и каждый компьютер сам считает, есть ли там какой-то признак искусственного сигнала. Да, именно так, это один из образцово-показательных случаев, когда задача проверится идеально, на независимой блоке, и это то, что нужно как раз распределенным вычислением, по-моему, для этого лучше всего подходит. Мне стало интересно, вот когда я во второй раз его увидел, это был ноябрь 2013 года, и вот так уж получилось, что с 1 декабря 2004 года я начал участвовать в Сети Хоум и распределенных вычислениях вообще. Одновременно стали появляться другие новости, связанные с проектом Эйнштейна Хоум, причем он казался даже еще более дерзким проектом. На мой взгляд, вот именно дерзость целей, которые стали в проекте распределенных вычислений, играет очень большую роль. Она, как мне кажется, это вот мое личное мнение, я не готов его подтвердить какими-то вопросами или исследованиями, но мне кажется это из общения, что сочетание важной научности, то есть цели важной для науки и при этом дерево вот такой дерзости, это вот очень важно для того, чтобы привлечь людей. Если мы берем Сети Хоум, то то есть земного разума — мегазадача. Эйнштейн Хоум ставил перед собой задачу открыть гравитационный волн. Открыть очень интересным образом, изучая фоновый шум, который поступает с гравитационно-волновых детекторов, и выделяя из него то цель, которая могла быть сгенерирована электронными звездами, вращающимися. Мы иногда видим в радиодиапазоне радиопульсары, здесь мы должны были их поймать по гравитационному излучению. И если бы это удалось, это было бы идеальное подтверждение того, что гравитационный волн существует. Потому что если бы мы сначала из данных ЛАИГО, это Лазерный Гравитационный Интерферометр, вычислили бы, что в том-то направлении неба должна находиться электронная звезда, а потом какими-то другими способами нашли ее. Либо, может быть, в оптическом диапазоне, если повезет. Либо у ЛАЙГИНЫ все-таки очень слабый на радио сигнал. Если бы мы так ее нашли, это стопроцентно подчеркивало бы, что мы точно поймали гравитационный волн. Правда, здесь одно «но». Это мое понимание этой ситуации. Я думаю, что если мы перейдем к неким реалиям, по именно точности, с которой определяет местоположение сигнала сами детекторы ЛАЙГИН, ВИРГО, вот сейчас еще дополнительные вводятся, то, скорее всего, там на небе такая площадка большая, на которой должно быть очень много электронных звезд. Но на любом случае, если бы удалось как-то именно таким путем пройти, это был бы очень хороший вариант такого подтверждения. Есть огромный, получается, проект LIGO, который связан с поиском гравитационных волн, который недавно нашумели. Это специальный интерферометр, использующий не только один большой детектор, но еще какие-то для того, чтобы регистрировать гравитационные волны. И данные с этого инструмента, наряду с данными с других средств наблюдения, они поступают в проект Einstein at Home для того, чтобы продолжать искать гравитационные волны, анализировать сигналы, которые приходят от вращающихся нейтронных звезд и так далее. Верно же? Да. Это именно данные, которые оттуда поступают, и это тоже для нас, для участников, было очень важно. Мы понимали, что мы работаем с самыми настоящими данными, с предыдущими, с того же установки. И, например, администраторами Эйнштейна были люди, которые сами участвовали в Live Scientific Collaboration. Более того, в довольно значимую часть времени, может быть, и сейчас даже, я проверял в последний раз довольно давно, несколько месяцев назад, в вычислениях помимо участников были включены еще и кластеры научных институтов, входящих в Live Scientific Collaboration. И, в частности, там Ахмос в такой класте, ну и еще ряд других. И вот когда люди видели это, они понимали, что да, это фундаментальная задача, она действительно интересна ученым, они действительно включили в нее все свои ресурсы, которые есть, и более того, эти ресурсы намного меньше, чем наши. То есть мы все вместе все равно выдаем намного больше. Я еще помню из первых проектов, которые меня заинтересовали, это Climate Prediction. Они пытались обсчитать разные сценарии будущего климата планеты на большие сроки, то есть на тысячи и миллионы лет при разных вводных. И я помню, что у них был красивый скринсейвер, который показывал какое состояние климата в данный момент обсчитывает твой компьютер. В общем, да, вначале там было много хороших проектов, а что считаешь сейчас? Сейчас я большую часть мощностей отдаю в два проекта. В RankSearch, потому что он мне интересен и с математической точки зрения, с другой стороны, я просто знаком с Эдуардом, который как раз выступал в первом подкасте, ну и поэтому еще я знаком с его научной частью. Насколько я его понимаю. Плюс в свое время в RankSearch одна из идей обсчитывалась, которую я, в том числе, выдвигал. Ну, просто болезнь этих проектов, это интересная его тема. Другой проект, The SideEffect Hall по борьбе с коронавирусом, потому что он также при нашем участии в нашем российском целом участии существует по мере возможностей, я помогаю ему работать, но там должна скрипка, конечно, играть. Уже в комедии именно из профильных научных институтов. Из Испании или Италии, насколько я помню. Ну, у нас будет вот следующий выпуск с Натальей Ениезиной, как раз про SideEffect Hall и его научную составляющую.