Углеродный след вычислительной науки

Поскольку чрезвычайная климатическая ситуация и кризис стоимости жизни заставляют нас думать о том, как сократить потребление энергии, группа ученых обратила внимание на скрытые экологические издержки некоторых из наших крупных достижений.

Высокопроизводительные вычисления изменили методы проведения исследований и нашу способность делать ранее немыслимые открытия. Мы можем моделировать наш будущий климат с беспрецедентной точностью. Мы можем предсказать, как выглядит белок, исходя из его генетического кода. Мы даже знаем, как выглядит черная дыра на расстоянии 55 миллионов световых лет.

Но хотя мало кто будет возражать против такого прогресса, он имеет свою цену.

За 15 лет написания о медицинские исследованияя обнаружил, что пишу бесчисленные рассказы о полногеномные ассоциативные исследования, где исследователи сравнивают ДНК потенциально сотен тысяч людей — пациентов и здоровых «контролей» — для поиска генетических вариантов, которые увеличивают риск развития определенного заболевания. Я ни разу не задумывался о влиянии таких исследований на окружающую среду.

Оказывается, это может быть довольно ошеломляющим.

В начале этого года команда из Кембриджа вместе с коллегами из Института Бейкера в Мельбурне, Австралия, опубликовала исследование, показывающее, что полногеномное ассоциативное исследование (GWAS), извлекающее данные 500 000 участников, зарегистрированных в базе данных биобанка, создаст углеродный след 17,3 кг CO2e (эквивалент углекислого газа) для каждого изучаемого генетического признака.

Но на самом деле исследователи обычно рассматривают тысячи признаков. Тот же самый запуск GWAS для 1000 признаков будет генерировать 17,3 метрических тонны CO2e. Это эквивалентно 346 рейсам между Парижем и Лондоном. (Исследователи отмечают, что обновление используемого программного обеспечения до последней версии сократит этот показатель на три четверти.)

В начале 2020 года Лоик Ланнелонг был в середине докторской степени. в науке о данных здравоохранения в Департаменте общественного здравоохранения и первичной медико-санитарной помощи Кембриджа. Он был вычислительным биологом, использующим машинное обучение, чтобы предсказать, как белки взаимодействуют в организме человека. Одним из его сотрудников был Джейсон Грили, академик из Мельбурнского университета, Австралия. Ланнелонг смотрел новости — и слышал из первых рук Грили — о лесных пожарах, бушующих по Австралии. Это заставило его задуматься о чрезвычайной климатической ситуации и той роли, которую мы все играем.

Несколькими месяцами ранее Ланнелонг прочитал об исследовании, в котором обучение искусственного интеллекта (ИИ) приравнивалось к углеродному следу пяти автомобилей за время их жизни. Он начал задаваться вопросом, какое влияние оказала его собственная работа, и вместе с Грили решил разобраться, ожидая найти онлайн-калькулятор, в который они могли бы просто вставить свои числа.

«Мы начали думать, что это будет двухнедельный проект, хороший перерыв в нашей работе над докторской диссертацией, — говорит Ланнелонг, — просто выяснить, какой углеродный след мы делаем, чтобы получить число и, возможно, написать об этом в Твиттере. … За исключением того, что там ничего не было. Мы поняли, что существует огромный пробел, что ученые-вычислители еще не думали о своем углеродном следе ».

Предоставлено: Кембриджский университет.

С тех пор при поддержке своего руководителя, доктора Майкла Иноуе, Ланнелонг тратил половину своего времени, работая над этим проектом, что привело к разработке Зеленых алгоритмов, простого онлайн-калькулятора, который позволяет исследователям вычислять углеродный след окружающей среды. их вычислительная работа.

Это уже не первый раз исследовательское сообщество обратил внимание на свою собственную практику. Некоторые в сообществе уже задавали вопросы о влиянии полетов через земной шар, например, чтобы представить свои выводы на научных конференциях.

Другие подняли вопрос о пластиковых и химических отходах и потребность в энергии из так называемых «мокрых лабораторий», то есть лабораторий, где проводятся экспериментальные работы. Существенное влияние оказывают и компьютерные лаборатории: оборудование нуждается в обновлении и замене как минимум раз в несколько лет, а само хранение данных требует энергии.

А еще есть сама вычислительная работа, которой в наши дни феноменальное количество. Чтобы дать вам представление о ее масштабах, в 2020 году одна только основанная в США XSEDE (среда экстремальных научных и инженерных открытий — виртуальная система, позволяющая ученым обмениваться вычислительными ресурсами, данными и опытом) исследователями было использовано 9 млрд. вычислительных часов, или 24 миллиона часов в день.

«Для мощных вычислений вам нужно либо много ядер — вы фактически соединяете много компьютеров, и все они делают всю работу за вас, — либо вам нужно много памяти. В любом случае это требует энергии».

Часть проблемы, по его словам, заключается в том, что вычисление может показаться бесплатным. Исследовательские группы часто имеют бесплатный доступ к высокопроизводительные вычисления (HPC) в своем учреждении.

«Когда вы впервые приходите в качестве аспиранта, вы похожи на ребенка в кондитерской — у вас фактически есть неограниченная вычислительная мощность на кончиках ваших пальцев. но проблема в том, что вы просто думаете, что это бесплатно».

Он приводит пример процесса машинного обучения, называемого настройкой гиперпараметров, который включает в себя тестирование различных конфигураций вашей модели, чтобы определить, какая из них работает лучше всего. «Никогда не знаешь, когда достиг максимума. Все становится только лучше, пока в какой-то момент ты не скажешь: «Ну, я думаю, что сделал это так хорошо, как только мог».

«Но скажем, вы находитесь в конце дня и думаете: «Кто знает, может быть, я мог бы просто оставить его работать на ночь. Может быть, я получу дополнительные полпроцента точности. кто-то использует компьютеры ». Но на самом деле есть цена – есть стоимость углерода ».

Чего он хочет, так это не ограничить исследования, а сократить вычислительные потери, «заставить людей думать: «Мне действительно нужно это делать? Вероятно, нет».

Ланнелонг признается, что, когда они впервые запустили Зеленые алгоритмы, он скептически относился к тому, будут ли люди их использовать. В первые несколько месяцев он использовался всего несколько десятков раз в месяц — в основном пользователями из его собственной лаборатории. Но с тех пор он стал популярен, и еженедельно они получают более 300 пользователей со всего мира.

Тем не менее, он признает, что инструмент может быть «громоздким» для некоторых людей, поскольку он требует от них ручного ввода своих данных. Вот почему они работают над Green Algorithms 4HPC (который уже доступен в бета-версии на GitHub), который использует журналы данных из центров высокопроизводительных вычислений для автоматического расчета углеродного следа проекта.

«Многие отделы заинтересованы в этом, поскольку это безболезненный способ для ученых внедрить его. Отдел может отслеживать весь углеродный след выполняемой там работы — не только отдельные ученые, но и целые группы могут начать говорить: «Хорошо». , давайте проследим за нашим углеродным следом и посмотрим, каково наше влияние из месяца в месяц».

Он хотел бы видеть большую прозрачность со стороны исследовательских групп, и именно поэтому его команда теперь регулярно рассчитывает свой углеродный след с помощью инструмента «Зеленые алгоритмы» и включает его в конце своих исследовательских работ.

Легко предположить, что по мере того, как алгоритмы и компьютеры, на которых они основаны, будут становиться все более эффективными, углеродный след вычислительной науки уменьшится, как это произошло в примере с биобанками. Но это не обязательно так из-за «эффекта отскока».

«Если вы сделаете инструмент в десять раз более эффективным, ученые будут использовать его в 100 раз чаще», — говорит Ланнелонг.

«Я имею в виду, это блестяще, именно так работают инновации. Но именно поэтому мы должны иметь возможность более точно отслеживать, что на самом деле то, что мы делаем, приводит к снижению энергии — в противном случае мы можем выполнять всю тяжелую работу, а затем мы поймем, что счета за энергию так высоки, как никогда».

В конечном счете, считает он, должен быть элемент личной ответственности, когда дело доходит до сокращения углеродного следа вычислительной науки. «Люди думают: «Мне не нужно менять то, как я действую, все центры обработки данных скоро будут питаться от ветра и солнца». Мне бы понравилось, если бы это было правдой — просто мы знаем, что это не так. нужно действовать сейчас, и тогда, если в будущем мы придем к моменту, когда это больше не имеет значения, тогда, блестяще, мы сможем возобновить нашу жизнь без чувства вины».

И изменила ли его работа то, как работает он сам?

«К сожалению, да, — смеется он. Он был тем мальчишкой из сказки о конфетах, который проводил несколько анализов только потому, что мог. Однако теперь, когда он все еще продолжает свои исследования и использует машинное обучение, он более внимательно относится к используемым ресурсам. Он остановится и спросит себя, действительно ли ему нужна эта дополнительная память или ему нужно провести анализ еще раз, чтобы быть в безопасности. Вместо этого ему потребуется время, чтобы выяснить, что именно ему нужно, прежде чем приступить к работе.

«Я знаю, что это к лучшему, — говорит он, прежде чем с тоской добавить, — но мне нравилась невинность незнания. Это было прекрасное время».

Дополнительная информация:
Зеленые алгоритмы: www.green-algorithms.org/

Предоставлено
Кембриджский университет

Цитата: Скрытая стоимость больших данных: углеродный след вычислительной науки (2023 г., 20 января), получено 20 января 2023 г. с https://techxplore.com/news/2023-01-big-hidden-carbon-footprint-science.html.

Этот документ защищен авторским правом. За исключением любой честной сделки с целью частного изучения или исследования, никакая часть не может быть воспроизведена без письменного разрешения. Контент предоставляется только в ознакомительных целях.

Углеродный след вычислительной науки

Related

Leave a Comment Cancel reply

Share this:

Related

Leave a Comment Cancel reply