PBSPro について

PBSPro は Altair Engineering Inc. が販売している OpenPBS の商用版です。日本ではAltair Japanの代理店から購入可能です。

PBS(Portable Batch System) は分散環境のために登場したバッチキューイングシステムで、NASAのために開発されたものをVeridian社が商用化したのが PBSPro(Portable Batch System Professional Edition)でした。その後、VeridianのPBS部門は、Altair Engineering, Inc.に買収され、現在に至ってます。

OpenPBSのデフォルトスケジューラであるFIFOスケジューラは、計算ノードでのロードアベレージを見ながらジョブをキューイングします。このため、ノード毎のジョブ数の制限はできません。各ノードでのジョブ数を制限するためには、ロードアベレージの閾値を調整してやらねばなりません。あるプログラムを走らせたときのロードアベレージはマシンのスペックによって異なるため、その調整はかなり難しいものです。また、ジョブがキューから実行へ効率のよいタイミングで移される保証がありません。実際に、4つのタイムシェアリングノードで試してみたところ、あるノードでのジョブが終わったにもかかわらず、キューのジョブを実行に移さないまま待っている状態が確認されました。この問題は PBSPro を使って、タイムシェアリングではなく、クラスタとして設定し、ノードあたりのジョブ数の制限を行うことで、簡単に解決できました。