Вхід

Исполнение задач на кластере

Требования к организации работ в портале

 

1. Разрешение экрана должно быть не меньше 1024x768.

2. В используемом браузере должна быть включена поддержка JavaScript.

3. Пользователь должен быть зарегистрирован как пользователь кластера.

Примечания:


Как подготовить и как управлять исполнением задач


Средства подготовки и управления задачами пользователя включают:

  • Файловый менеджер, поддерживающий работу с файлами в домашнем каталоге пользователя;
  • Механизм локального профиля задачи, поддерживающий создание, сохранение и обновление данных запуска конкретной задачи на исполнение;
  • Средства контроля и перехвата ошибок при подготовке рабочего варианта профиля задачи, а также вывода к пользователю всех сообщений, порождаемых в процессе запуска задачи на исполнение;
  • Средства слежения за исполнением задачи и удаления задачи из решения, если возникает такая необходимость.

Для полного представления о состоянии запущенной на исполнение задачи нужно использовать не только поле «Задачи», но и еще два поля меню – поле «Ресурсы», содержащее данные как о кластерных ресурсах, так и поле «Очереди задач», содержащее данные о задачах в очередях исполнения задач и статистику где фиксируются данные о всех задачах пользователя, поступивших в очередь исполнения за определенный интервал времени (например, за сутки), в том числе и о результатах уже закончившихся задач.  Поле меню «Задачи» обслуживается следующими фреймами:

1.Файловый менеджер
2. Профили запуска
3.Запуск задач

Файловый менеджер


Панель управления файловым менеджером (доступные пользователю операции) содержит  следующие функции (они реализованы как малые кнопки - пиктограммы):
- выход на один уровень выше из текущего каталога
- удалить файл или каталог
- вырезать файл или каталог
 - копировать файл или каталог
 - вставить файл или каталог
 - создать каталог (директорию)
 - закачать файл на кластер с локального компьютера
 - архивировать файл
 - разархивировать файл.

 

Путь, выбранный файловым менеджером к текущему каталогу внутри домашнего каталога пользователя высвечивается строкой «Путь», для перехода в другой каталог нужно использовать одинарное нажатие на левую кнопку мыши.
Чтобы выделить все файлы и папки в текущем (активном) каталоге необходимо вставить отметку в чекбокс напротив «../», для выделения одного файла или папки нужно пометить соотвествующий чекбокс.
Профиль запуска
Профиль запуска – это сохраненные данные для настройки запуска конкретной задачи (в предыдущей версии управления задачами ту же функцию выполнял паспорт задачи).
Профиль можно создавать, сохранять (кнопкой «Сохранить»), модифицировать и удалять ( - пиктограммой удаления профиля).
Профиль можно создавать по частям, не полностью заданные в нем обязательные данные не позволят запустить задачу в исполнение.
Для активации подготовки конкретной задачи необходимо вызвать соответствующий профиль, если он есть, используя одинарное нажатие на левую кнопку мыши на выбранном профиле.

 

Запуск задачи из текущего каталога

Подготовка задачи (параметры):

«Имя задачи» - обязательный параметр, это имя, под которым задача выполняется на кластере. При запуске задачи создается одноименный локальный профиль.
«Выполняемый файл» - обязательный параметр, имя выполняемого файла, если он находится в текущем каталоге, в противном случае должен быть указан полный путь к файлу.
«Параметры задачи» - не обязательный параметр, это аргументы, которые представляют специфику запуска конкретной задачи.
Параметр «MPI» определяет, какими средствами обеспечивается параллельное исполнение на вычислительных узлах кластера:
«MPI» - задает режим использования системы параллельного программирования OpenMPI;
«None» - задает режим, в котором пользователь должен самостоятельно обеспечить организацию параллельных вычислений.
Необходимость выполнения компиляции устанавливается отметкой в чекбоксе, при этом  нужно указать язык, на котором написаны пользовательские программы, и требуемый компилятор (выбрать один из возможных).

Ресурсы
«Раздел кластера» - раздел, на ресурсах которого будет выполняться данная задача.
«Количество процессоров» - количество ядер-процессоров, необходимое для выполнения задачи.
«Ограничение времени» - ограничение на время выполнения задачи (в минутах), после достижения которого задача безусловно снимается с решения.

Для выполнения задачи нужно ввести все необходимые параметры и нажать кнопку «Запустить», при наличии ошибок в верхней части фрейма появляются сообщения для исправлений в профиле задачи пользователя, про их отсутствии – сообщения о прохождении этапов приема задачи на исполнение.

 

Удалить задачу

Для удаления задачи нужно в разделе "Состояние кластеров" напротив соответстующей задачи нажать пиктограмму - удалить.

 

Редактирование файлов

Чтоб открыть файл для редактирования необходимо использовать одинарное нажатие левой клавиши мыши по названию файла, после чего отрывается окно редактирования файла.

 

Загрузка и выгрузка файлов
Для загрузки фалов на кластер необходимо нажать на пиктограмму  на панели управления файловым менеджером, после чего нажать кнопку "Обзор" и указать файл, затем нажать кнопку "Загрузить".
Для того чтоб загрузить на кластер каталог, нужно предварительно его заархивировать.
Для выгрузки файла из кластера на персональный компьютер нужно нажать на пиктограмму напротив нужного файла.

 

Статистика
Это поле меню содержит сведения о всех задачах, которые либо исполнялись, либо исполняются за определенный системой интервал времени (сейчас он равен 24 часам, начиная с 8.00)  
Выводятся следующие данные:
JOBID – порядковый номер задачи, он присваивается системой управления ресурсами;
PARTITION – раздел кластера на ресурсах которого задача исполнялась или должна быть выполнена;
USER – имя пользователя - владельца конкретной задачи.
NAME – название задачи, дано пользователем (лучший вариант) или присвоено системой по умолчанию (худший вариант);
ST – короткое обозначение состояния выполнения задачи, присваивается системой, может принимать такие значения:
  •    CA  - исполнение задачи отменено пользователем или администратором;
  •    CD – задача закончила все процессы на всех узлах нормально, с точки зрения системы;
  •    CG – задача в процессе завершения. Некоторые процессы на некоторых узлах еще активны;
  •    F – задача завершена  с ненулевым кодом ошибки или аварийно завершена по другим причинам;
  •    NF – задача завершена из-за сбоя в работе одного или более узлов, выделенных для задачи;
  •    PD  - задача находится в очереди и ожидает получения  заказанных ресурсов;
  •    R – задача выполняется;
  •    S – задача получила ресурсы, но выполнение  приостановлено администратором;
  •    TO – задача завершена из-за истечения выделенного ей лимита времени.
START – время помещения  задачи в очередь (дни–часы:минуты:секунды);
END – время окончания выполнения задачи(дни–часы:минуты:секунды);
TIME - время выполнения задачи (дни–часы:минуты:секунды);
TIMELIMIT – максимально возможное время использования выделенных задаче ресурсов;
DEPENDENCY - зависимость запуска выполнения данной задачи от результатов другой задачи, предшествующей ей;
NODES – количество выделенных задаче узлов;
CPUS – количество используемых ядер-процессоров для данной задачи;
NODELIST(REASON) – список конкретных узлов, назначенных задаче или причина аварийного окончания.
вычисления на суперкомпьютере, сверхбыстрые вычисления, рендеринг, фитнес клубы, спортивные клубы