PM ツール Ver. 1.2

[英語版], [日本語版]


NAME
pmload - Myrinet インタフェースの初期化

SYNOPSYS
% pmload [-unit unit][-mcp mcp_file][-conf config_file]

DESCRIPTION
LANai プログラム (mcp) をロードし、Myrinet インタフェースの初期化を行ないます。

OPTIONS
-unit unit
初期化する Myrinet インタフェースのユニット番号を指定する。デフォルトは 0。
-mcp mcp_file
ロードする LANai プログラムを指定する。デフォルトは "pm.mcp"。
-conf config_file
PM のコンフィギュレーションファイル名を指定する。デフォルトは "pm.cnf"。

ERRORS
pmload は Myrinet インタフェースの初期化に失敗すると 以下のようなエラーメッセージを出力します。

can't load mcp_file, config_file(error)

ここで error の内容は次の通りです。
Invalid argument
unit の値が範囲を超えている。
No such device
ユニット unit の Myrinet インタフェースが存在しない。
LANaiデバイスをmmap(2)できない。
Device busy
コンフィギュレーションファイルのノード名/経路に重複がある。
No such file or diredtory
mcp ファイルかコンフィギュレーションファイルが存在しない。
No route to host
あるノードへの経路が存在しない。
Too many links
あるノードへのホップ数が 4 を超えている。


NAME
pmroute - 経路情報の表示

SYNOPSYS
% pmroute [-conf config_file][-src src_pe][-dest dst_pe]

DESCRIPTION
PM の経路情報を以下の形式で出力します。

(src_node) -> port[switch]port -> (dst_node)

OPTIONS
-conf config_file
PM のコンフィギュレーションファイル名を指定する。デフォルトは "pm.cnf"。
-src src_pe
送信元の PE 番号を指定する。デフォルトは全 PE。
-dest dst_pe
受信先の PE 番号を指定する。デフォルトは全 PE。

ERRORS
pmroute はエラーが発生すると 以下のようなエラーメッセージを出力します。
can't read config_file(error)
config_file が読めない。
can't get node pe_num(error)
PE 番号 pe_num がコンフィギュレーションファイルにない。
can't find route pe_num(error)
PE 番号 pe_num からの経路が見つからない。


NAME
pmtest - PM の動作テストおよび性能測定

SYNOPSYS
[PE_Y]% pmtest -reply [PE_X]% pmtest -dest pe_y -ping [options]

[PE_Y]% pmtest -sink [PE_X]% pmtest -dest pe_y -burst -bw [options]

DESCRIPTION
PM の動作テスト、および性能測定などを行ないます。
最初の例ではノード PE_X とノード PE_Y との間でピンポン転送を行ない、 ラウンドトリップタイムを表示します。
二番目の例ではノード PE_X からノード PE_Y へバースト転送を行ない、 データ転送レートを表示します。

NOTICE
pmtest は Myrinet インタフェースの初期化を行なわないので、 各 PE 上で pmload によって 初期化が行なわれている必要があります。
pmtest は大量のメモリを使用します。 pmtest を使用する前に data size のリミットを 26 MB 以上に設定して下さい。

OPTIONS
-len length
メッセージの長さを指定する。デフォルトは 8 バイト。
-iter iteration
実行回数を指定する。デフォルトは 100000 回。
-unit unit
Myrinet インタフェースのユニット番号を指定する。デフォルトは 0。
-chan chan
PM のチャネル番号を指定する。デフォルトは 0。
-ctx ctx
PM のコンテキスト番号を指定する。デフォルトは 0。
-wait
割り込みを用いた受信を行なう。
-bw
データ転送レートを表示する。デフォルトは一回のテストにかかった時間。

ERRORS
XXX: Operation timed out
XXX を何度か繰り返したが成功しなかった。


NAME
wsctest - クラスタ全体のPMの動作テスト

SYNOPSYS
% wsctest [options]

DESCRIPTION
クラスタ全体の PM の動作テストを行ないます。

NOTICE
wsctest は、rsh(1) によって、 各ノード上の 起動されたディレクトリと同じディレクトリ上で、 同じ実行ファイルを実行します。 そのため、wsctest を起動するホストは クラスタのノードである必要はありませんが、 テストする全ノードに対して rsh(1) ができなければなりません。
また、実行ファイルのコピーあるいは NFS などのファイル共有によって、 同じ実行ファイルにアクセスできなければなりません。
さらに、同じディレクトリへ移動するために、環境変数 PWD に 起動されたディレクトリの論理パス設定されている必要があります。 tcsh、bash、zsh などは自動的にこれを行ないますが、 その他のシェルで、automount や amd を用いている場合は、 実際のパスと論理パスが異なる場合があるので、手動で設定して下さい。
最後に、wsctest は Myrinet インタフェースの初期化を行なうので、 各 PE 上で pmload を 実行する必要はありません。

OPTIONS
-unit unit
Myrinet インタフェースのユニット番号を指定する。デフォルトは 0。
-chan chan
PM のチャネル番号を指定する。デフォルトは 0。
-ctx ctx
PM のコンテキスト番号を指定する。デフォルトは 0。
-len length
メッセージの長さを指定する。デフォルトは 8 バイト。
-mcp mcp_file
LANai プログラムのファイル名を指定する。デフォルトは "pm.mcp"。
-conf config_file
コンフィギュレーションファイル名を指定する。デフォルトは "pm.cnf"。
-count count
実行回数を指定する。デフォルトは無限回。
-pe num_pe
PE の個数を指定する。デフォルトは PE 全部。
-base base_pe
テストする最初の PE を指定する。デフォルトは 0。
-burst
バースト転送を行なってテストする。デフォルト。
-ping
ピンポン転送を行なってテストする。デフォルトはバースト転送。
-multi
マルチキャスト転送を行なってテストする。デフォルトはバースト転送。
-v
-verbos
テスト状況を表示する。デフォルトはエラーが起きなければ表示しない。

EXAPMLE
% wsctest -v -pe 32 -ping
32PE 上で、ピンポン転送のテストを行ないます。

ERRORS
wsctest はエラーが発生すると、 以下のようなエラーメッセージを出力します。

node_name(pe#) XXX: error

ここで error の内容は次の通りです。
XXX: Operation timed out
XXX を何度か繰り返したが成功しなかった。
Signal: Interrupted system call
シグナルによってプロセスが中断された。

BUGS
wsctest はネットワークに非常に高い負荷をかけるので、 特に 3 個以上の PE でのバースト転送のテストでは、 タイムアウトエラーが発生することがあります。

NAME
bustest - I/O バス性能の測定

SYNOPSYS
% bustest [-unit unit]

DESCRIPTION
Myrinet インタフェースの DMA を使って I/O バスのデータ転送レートを測定します。
出力形式は以下の通りです。
cpu  read: WWW		I/O -> CPU
cpu write: XXX		CPU -> I/O
DMA  read: YYY		I/O -> Memory
DMA write: ZZZ		Memory -> I/O

OPTIONS
-unit unit
Myrinet インタフェースのユニット番号を指定します。デフォルトは 0。

ERRORS
bustest はエラーが発生すると 以下のようなエラーメッセージを出力します。
_pmMapLANai: error
Myrinet インタフェースが初期化できない。
_pmMapContext: error
PM のコンテキスト 0 が初期化できない。