Исполнение задач на кластере
1. Разрешение экрана должно быть не меньше 1024x768.
2. В используемом браузере должна быть включена поддержка JavaScript.
3. Пользователь должен быть зарегистрирован как пользователь кластера.
Примечания:
- Если используется браузер Microsoft Internet Explorer 7.0, то должна быть отключена функциональность Form Feeder
- Рекомендуется мспользовать браузер Mozilla Firefox, его можно взять здесь
Средства подготовки и управления задачами пользователя включают:
- Файловый менеджер, поддерживающий работу с файлами в домашнем каталоге пользователя;
- Механизм локального профиля задачи, поддерживающий создание, сохранение и обновление данных запуска конкретной задачи на исполнение;
- Средства контроля и перехвата ошибок при подготовке рабочего варианта профиля задачи, а также вывода к пользователю всех сообщений, порождаемых в процессе запуска задачи на исполнение;
- Средства слежения за исполнением задачи и удаления задачи из решения, если возникает такая необходимость.
Для полного представления о состоянии запущенной на исполнение задачи нужно использовать не только поле «Задачи», но и еще два поля меню – поле «Ресурсы», содержащее данные как о кластерных ресурсах, так и поле «Очереди задач», содержащее данные о задачах в очередях исполнения задач и статистику где фиксируются данные о всех задачах пользователя, поступивших в очередь исполнения за определенный интервал времени (например, за сутки), в том числе и о результатах уже закончившихся задач. Поле меню «Задачи» обслуживается следующими фреймами:
1.Файловый менеджер
2. Профили запуска
3.Запуск задач
Панель управления файловым менеджером (доступные пользователю операции) содержит следующие функции (они реализованы как малые кнопки - пиктограммы):
- выход на один уровень выше из текущего каталога
- удалить файл или каталог
- вырезать файл или каталог
- копировать файл или каталог
- вставить файл или каталог
- создать каталог (директорию)
- закачать файл на кластер с локального компьютера
- архивировать файл
- разархивировать файл.
Чтобы выделить все файлы и папки в текущем (активном) каталоге необходимо вставить отметку в чекбокс напротив «../», для выделения одного файла или папки нужно пометить соотвествующий чекбокс.
Профиль можно создавать, сохранять (кнопкой «Сохранить»), модифицировать и удалять ( - пиктограммой удаления профиля).
Профиль можно создавать по частям, не полностью заданные в нем обязательные данные не позволят запустить задачу в исполнение.
Для активации подготовки конкретной задачи необходимо вызвать соответствующий профиль, если он есть, используя одинарное нажатие на левую кнопку мыши на выбранном профиле.
Подготовка задачи (параметры):
«Имя задачи» - обязательный параметр, это имя, под которым задача выполняется на кластере. При запуске задачи создается одноименный локальный профиль.
«Выполняемый файл» - обязательный параметр, имя выполняемого файла, если он находится в текущем каталоге, в противном случае должен быть указан полный путь к файлу.
«Параметры задачи» - не обязательный параметр, это аргументы, которые представляют специфику запуска конкретной задачи.
Параметр «MPI» определяет, какими средствами обеспечивается параллельное исполнение на вычислительных узлах кластера:
«MPI» - задает режим использования системы параллельного программирования OpenMPI;
«None» - задает режим, в котором пользователь должен самостоятельно обеспечить организацию параллельных вычислений.
Необходимость выполнения компиляции устанавливается отметкой в чекбоксе, при этом нужно указать язык, на котором написаны пользовательские программы, и требуемый компилятор (выбрать один из возможных).
«Количество процессоров» - количество ядер-процессоров, необходимое для выполнения задачи.
«Ограничение времени» - ограничение на время выполнения задачи (в минутах), после достижения которого задача безусловно снимается с решения.
Для выполнения задачи нужно ввести все необходимые параметры и нажать кнопку «Запустить», при наличии ошибок в верхней части фрейма появляются сообщения для исправлений в профиле задачи пользователя, про их отсутствии – сообщения о прохождении этапов приема задачи на исполнение.
Для удаления задачи нужно в разделе "Состояние кластеров" напротив соответстующей задачи нажать пиктограмму - удалить.
Чтоб открыть файл для редактирования необходимо использовать одинарное нажатие левой клавиши мыши по названию файла, после чего отрывается окно редактирования файла.
Для того чтоб загрузить на кластер каталог, нужно предварительно его заархивировать.
Для выгрузки файла из кластера на персональный компьютер нужно нажать на пиктограмму напротив нужного файла.
PARTITION – раздел кластера на ресурсах которого задача исполнялась или должна быть выполнена;
USER – имя пользователя - владельца конкретной задачи.
NAME – название задачи, дано пользователем (лучший вариант) или присвоено системой по умолчанию (худший вариант);
ST – короткое обозначение состояния выполнения задачи, присваивается системой, может принимать такие значения:
- CA - исполнение задачи отменено пользователем или администратором;
- CD – задача закончила все процессы на всех узлах нормально, с точки зрения системы;
- CG – задача в процессе завершения. Некоторые процессы на некоторых узлах еще активны;
- F – задача завершена с ненулевым кодом ошибки или аварийно завершена по другим причинам;
- NF – задача завершена из-за сбоя в работе одного или более узлов, выделенных для задачи;
- PD - задача находится в очереди и ожидает получения заказанных ресурсов;
- R – задача выполняется;
- S – задача получила ресурсы, но выполнение приостановлено администратором;
- TO – задача завершена из-за истечения выделенного ей лимита времени.
END – время окончания выполнения задачи(дни–часы:минуты:секунды);
TIME - время выполнения задачи (дни–часы:минуты:секунды);
TIMELIMIT – максимально возможное время использования выделенных задаче ресурсов;
DEPENDENCY - зависимость запуска выполнения данной задачи от результатов другой задачи, предшествующей ей;
NODES – количество выделенных задаче узлов;
CPUS – количество используемых ядер-процессоров для данной задачи;
NODELIST(REASON) – список конкретных узлов, назначенных задаче или причина аварийного окончания.