to the top
close form
Для получения триального ключа
заполните форму ниже
Team license
Enterprise license
** Нажимая на кнопку, вы даете согласие на обработку
своих персональных данных. См. Политику конфиденциальности

close form
Запросите информацию о ценах
Новая лицензия
Продление лицензии
--Выберите валюту--
USD
EUR
* Нажимая на кнопку, вы даете согласие на обработку
своих персональных данных. См. Политику конфиденциальности

close form
Бесплатная лицензия PVS-Studio для специалистов Microsoft MVP
** Нажимая на кнопку, вы даете согласие на обработку
своих персональных данных. См. Политику конфиденциальности

close form
Для получения лицензии для вашего открытого
проекта заполните, пожалуйста, эту форму
** Нажимая на кнопку, вы даете согласие на обработку
своих персональных данных. См. Политику конфиденциальности

close form
Мне интересно попробовать плагин на:
** Нажимая на кнопку, вы даете согласие на обработку
своих персональных данных. См. Политику конфиденциальности

close form
check circle
Ваше сообщение отправлено.

Мы ответим вам на


Если вы так и не получили ответ, пожалуйста, проверьте папку
Spam/Junk и нажмите на письме кнопку "Не спам".
Так Вы не пропустите ответы от нашей команды.

>
>
Параллельные заметки N4 - продолжаем зн…

Параллельные заметки N4 - продолжаем знакомиться с конструкциями OpenMP

11 Мар 2010

Продолжим знакомство с технологией OpenMP и рассмотрим некоторые функции и новые директивы.

В OpenMP существует ряд вспомогательных функций. Для их использования не забудьте подключить заголовочный файл <omp.h>.

Функции исполняющей среды

Эти функции позволяют запрашивать и задавать различные параметры среды OpenMP:

  • omp_get_num_procs - возвращает число вычислительных узлов (процессоров/ядер) в компьютере.
  • omp_in_parallel - позволяет потоку узнать, занимается ли он в данный момент выполнением параллельного региона.
  • omp_get_num_threads - возвращает число потоков, входящих в текущую группу потоков.
  • omp_set_num_thread - задает число потоков для выполнения следующего параллельного региона, который встретится текущему выполняемому потоку. Функция может помочь распределить ресурсы. Например, если мы одновременно обрабатываем звук и видео на процессоре с четырьмя ядрами, то можно создать для звука один поток, а для обработки видео - три.
  • omp_get_max_threads - возвращает максимально допустимое число нитей для использования в следующей параллельной области.
  • omp_set_nested - разрешает или запрещает вложенный параллелизм. Если вложенный параллелизм разрешён, то каждая нить, в которой встретится описание параллельной области, породит для её выполнения новую группу нитей и станет в ней главной.
  • omp_get_nested - возвращает, разрешен ли вложенный параллелизм или нет.

Если имя функции начинается с omp_set_, то ее можно вызывать только вне параллельных регионов. Все остальные функции можно использовать как внутри параллельных регионов, так и вне таковых.

Функции синхронизации/блокировки

OpenMP позволяет строить параллельный код без использования этих функций, так как имеются директивы, позволяющие осуществлять определенные виды синхронизации. Однако в ряде случаев эти функции удобны и даже необходимы.

В OpenMP два типа блокировок: простые и вложенные. Вложенные имеют суффикс "nest". Блокировки могут находиться в одном из трех состояний - неинициализированном, заблокированном и разблокированном.

  • omp_init_lock/omp_init_nest_lock - инициализация переменной типа omp_lock_t/omp_nest_lock_t. Аналог InitializeCriticalSection.
  • omp_destroy_lock/omp_destroy_nest_lock - освобождение переменной типа omp_lock_t/omp_nest_lock_t. Аналог DeleteCriticalSection.
  • omp_set_lock/omp_set_nest_lock - один поток выставляет блокировку, а остальные потоки ждут, пока поток, вызвавшая эту функцию, не снимет блокировку с помощью функции omp_unset_lock(). Аналог EnterCriticalSection.
  • omp_unset_lock/omp_unset_nest_lock - снятие блокировки. Аналог LeaveCriticalSection.
  • omp_test_lock/omp_test_nest_lock - неблокирующая попытка захвата замка. Данная функция пробует захватить указанный замок. Если это удалось, то для простого замка функция возвращает 1. Если замок захватить не удалось, то возвращается 0. Аналог TryEnterCriticalSection.

Простые блокировки (omp_lock_t) не могут быть установлены более одного раза, даже тем же потоком. Вкладываемые блокировки (omp_nest_lock_t) идентичны простым с тем исключением, что когда поток пытается установить уже принадлежащую ему вкладываемую блокировку, он не блокируется.

Приведем пример кода, использующий описанные функции. Все создаваемые потоки по очереди выведут сообщения "Begin work" и "End work". Между этими двумя сообщениями от одного потока могут встретиться сообщения от других потоков, выводимых при неудачной попытке войти в закрытую секцию.

omp_lock_t lock;
int n;
omp_init_lock(&lock);
#pragma omp parallel private (n)
{
  n=omp_get_thread_num();
  while (!omp_test_lock (&lock))
  {
    printf("Wait..., thread %d\n", n);
    Sleep(3);
  }
  printf("Begin work, thread %d\n", n);
  Sleep(5); // Work...
  printf("End work, thread %d\n", n);
  omp_unset_lock(&lock);
}
omp_destroy_lock(&lock);

На машине с четырьмя ядрами может быть получен следующий вывод:

Begin work, thread 0

Wait..., thread 1

Wait..., thread 2

Wait..., thread 3

Wait..., thread 2

Wait..., thread 3

Wait..., thread 1

End work, thread 0

Begin work, thread 2

Wait..., thread 3

Wait..., thread 1

Wait..., thread 3

Wait..., thread 1

End work, thread 2

Begin work, thread 3

Wait..., thread 1

Wait..., thread 1

End work, thread 3

Begin work, thread 1

End work, thread 1

Функции работы с таймерами

  • omp_get_wtime - возвращает в вызвавшем потоке астрономическое время в секундах (вещественное число двойной точности - double), прошедшее с некоторого момента в прошлом. Если некоторый участок программы окружить вызовами данной функции, то разность возвращаемых значений покажет время работы данного участка.
  • omp_get_wtick() - возвращает в вызвавшем потоке разрешающую способность таймера в секундах, то есть точность таймера.

На этом знакомство с функциями мы завершим и рассмотрим парочку новых директив. Это директивы можно назвать опциями создаваемых параллельных регионов.

if (условие)

Выполнение параллельной области по условию. Создание нескольких потоков осуществляется только при выполнении некоторого условия. Если условие не выполнено, то код выполняется в последовательном режиме.

Пример использования:

void test(bool x)
{
  #pragma omp parallel if (x)
  if (omp_in_parallel())
  {
    #pragma omp single
    printf_s("parallelized with %d threads\n",
             omp_get_num_threads());
  }
  else
  {
    printf_s("single thread\n");
  }
}
int _tmain(int argc, _TCHAR* argv[])
{
  test(false);
  test(true);
  return 0;
}

Результат работы:

single thread
parallelized with 4 threads

num_threads

Явное задание количества потоков, которые будут выполнять параллельную область. По умолчанию выбирается последнее значение, установленное с помощью функции omp_set_num_threads().

Если мы модифицируем пример приведенный выше следующим образом:

...
#pragma omp parallel if (x) num_threads(3)
...

то получим следующий вывод:

single thread
parallelized with 3 threads

В следующем выпуске "Параллельных заметок" мы продолжим...

Tags: OpenMP

Популярные статьи по теме
C++ — язык 2022 года. Почему так, и что с другими языками?

Дата: 20 Янв 2023

Автор: Сергей Васильев

C++ становится языком 2022 года по версии TIOBE, обгоняя Python. Rust, C#, Go и прочие — далеко позади. Странно? Сейчас разберёмся.
PVS-Studio в 2022 году

Дата: 19 Янв 2023

Автор: Полина Алексеева

На дворе январь 2023, а значит, самое время подвести итоги уже прошлого 2022 года. Мы расскажем, чем занимались, и покажем, что нового появилось в анализаторе за это время. Давайте вместе взглянем на…
PVS-Studio: 2 фишки для быстрого старта

Дата: 08 Дек 2022

Автор: Сергей Васильев

В этой заметке расскажу, как легко начать использовать PVS-Studio. Рассмотрим два сценария: когда вы пробуете анализатор впервые и когда внедряете его в проект.
Почему ты делаешь за меня мою работу? Типы людей, которые не пишут в поддержку

Дата: 06 Дек 2022

Автор: Алёна Фоканова

Привлекательное название статьи должно раскрывать то, что будет в ней. Так вот, работа специалистом поддержки клиентов подразумевает появление вопросов к пользователю. Иногда возникает как раз такой:…
Как Apple и другие крупные компании настиг программный баг

Дата: 09 Ноя 2022

Автор: Ульяна Гришина

Сегодня мы отобрали свежие случаи программных ошибок, чтобы вы могли немного отвлечься и, возможно, узнать что-то новенькое. Если вам интересно узнать, как программисту удалось сломать Интернет по вс…

Комментарии (0)

Следующие комментарии next comments
close comment form
Unicorn with delicious cookie
Мы используем куки, чтобы пользоваться сайтом было удобно.
Хорошо