metametals's blog

研究者の日々のライフハックとか気づいたこととか

データサイズごとの最適データ送付方法に関する簡単な評価

昨日始めたデータ(250GB)のネットワークバックアップ(職場のネットワークHDD→自分のPC)が今朝終わっていないことに気付いた.そのときふと,場合によってはネットワークを使わず,HDDなどにデータを入れて歩いたり交通機関でデータ送った方が早いこともあるんじゃね?と思って計算してみた.

 

 自分の職場を起点として,ある程度具体的な数値を入れて,個々の交通機関でカバーしそうな距離を考慮した.以下はそうして得られた結果.

f:id:metametals:20140425171303j:plain

Fig.1: データ転送時間と転送距離の関係

 

ちなみにシステムバウンダリは職場から交通機関を降りるまで.また交通機関の場合,本来はUSBなどでコピーする時間が必要なんだけど,それを反映するのは面倒なので,逆にネットワーク転送の方からコピーにかかる時間(USB2.0の実効速度30MB/sを仮定)を差し引いて機能単位を揃えた.

 

図の見方は,要するに最も下にある経路を通れば良い.データ転送サイズが100MBの場合,自分の机の上にあるPC間での転送ならUSBを使う.それ以上はネットワークオンリー.1GBの場合,転送距離が50m弱なら基本徒歩.それより長い距離はネットワーク転送オンリー.10GBになると100m以内は徒歩.それから自転車→バイクとなって,距離が2-3kmを超えるとネットワークを使うべき.転送サイズが100GBを超えると,電車が使えるようになってくる.そして1TB以上のデータになると,飛行機を使った方が良い場合が出てくる.10TB以上は,時間効率でいえば,ネットワークは基本使わない方が良い.ローカルならイントラネットなのでもっと早いとかの議論もあるけど,大体の方針はこれで言える気がする.ということで,大きなデータ海外の研究者とやりとりするというのは,海外出張の良い理由になるかも(笑)

 

そして気付いたこと.昨日からの自分の作業が非常に時間の無駄であることを自ら証明してしまった.そしてこの計算をしている間に,件のデータは十分HDDを介したコピーでバックアップできていることにも気付いた.