データ処理の概要
良く晴れた暗い夜には, 何十億年も宇宙を旅してきた光が ニューメキシコ州南部の山の上に降り注ぎます. 地球上には まだ藻類しか存在していなかった頃に天体を発した光が, そこで スローン・ディジタル・スカイ・サーベイ(SDSS)の2.5m望遠鏡に入射し, 運んできた情報を高度な観測装置に渡すのです. その光はもはや光子としての命は絶たれますが, その運んできたデータは 磁気テープに記録されたディジタル画像として生き続けます. 一つの画像は無数の画素(ピクセル)からなり, その画素の一つ一つが 空の微小部分の明るさを記録してます. しかし, 空が画素からできているわけではありません. 実際にあるのは 星や銀河です. SDSSのデータ処理系の役割は, ニューメキシコ州の山の 上で電気的に記録された画素のディジタルデータを処理して, 実在する天体の真の情報に変換することです. 天文学者は, ディジタル 画像を処理して星や銀河を同定し, それらの性質を調べることに使える 情報を引き出します. そのためには, 画素の集合である画像データから 天体を検出し, その種類を見分け, その明るさを測って, それら星, 銀河, クエーサーのカタログとして収集しなければなりません. コンピューターの専門家はこのプロジェクトを, 空に対してマンハッタン地区の 電話帳を作るようなものだと述べています. 星の一つ一つが, 電話帳の中の 名前と住所を持った一人の人間にたとえられます. 空の電話帳には 「黄色のページ」すらあります. そこに載っている少数の天体には, スペクトルという形で名前と住所以外により多くの情報が載せられています. それらについては, 地球から遠ざかる速度が与えられていて, それからその天体の距離を計算することができます. データは迅速に(約1週間以内に)処理しなければなりません. 次の新月の時期に観測装置をどのように使うのが最良かという 装置計画を立てるための情報が必要なのです. 時間を掛けすぎてしまうと, 季節が移って目標とする天体が沈んで行ってしまうのです.
データ処理パイプラインと呼ばれるソフトウエアの開発の中心 となっているのは, フェルミ加速器 研究所(フェルミ研)の科学者達です. パイプラインとは, ディジタルデータを処理して特定の情報を抽出する コンピューターのプログラムのことです. パイプラインと言う言葉は, データ処理が自動化されているという 含みをもって使われています. データは人間がほとんど関与する ことなく多数のパイプラインの中を「流れて」行きます. 例えばアメリカ海軍天文台の科学者によって作られた位置決定パイプ ラインは, 空の上で星や銀河の二次元の精密な位置を決定します. この場合には, 2.5m望遠鏡に入射した光子から作られたディジタル データがパイプラインの一方の端から入力され, 出口からは 天体の位置が出てきます. 入口と出口の間にパイプラインに沿って, 画素を実際の情報に変換するソフトウエアがあるのです. データ処理のための多数のパイプラインは大きな共同作業の結果です. プリンストン大学 の科学者は測光パイプラインを作り, シカゴ大学 の専門家は分光パイプラインを作りました. フェルミ研 は監視望遠鏡パイプラインと分光観測の対象を選択するための 対象選択パイプラインを作りました. フェルミ研はまた, 全てのパイプラインがスムースに動くように全体の調整を 行っています. SDSSのデータ処理はまずデータの取得から始まります. 天体からの光が望遠鏡に入射してCCD素子に集められます. 「バケツ」に たまった電荷はディジタル信号に変換され, 山の上で磁気テープに 書き込まれます. そのデータは速達便で アパッチポイント 天文台から フェルミ研に運ばれます. テープはフェルミ研のファインマン計算 センターにおいて色々なパイプラインに仕訳して入力されます. 分光データは分光パイプライン, 監視データは監視望遠鏡パイプライン, そして撮像データは位置決定, 測光, 対象選択, およびもう二つの 計5個のパイプラインというぐあいです. これらのパイプラインから星, 銀河, クエーサーの情報が出力され フェルミ研とアメリカ海軍天文台で, サーベイを遂行するために 必要な情報を網羅する作業用データベースに書き込まれます. 作業用データベースの情報は, 最終的には「防火壁」を越えて ジョンス・ホプキンス大学の科学者によって開発された科学用 データベースに移されます. 科学用データベースは, プロジェクト に携わる研究者がデータをすぐに使えるようにする検索エンジン として機能します. 私たちが空を認識する形態は, 利用できる技術によって必然的に 支配されます. 50年前に行われたサーベイでは, 画像データは 写真乾板という形で蓄えられ, カタログは書物の形で印刷されました. 今日では, 画像はディジタル形式で磁気テープやハードディスク に蓄えられ, カタログはディジタルなデータベースとなります. しかし, どんな時代であっても, どんな技術を使っても, 人類は 空を見上げ続け, そして空は星々に満ちているのです. SDSSの用語SDSSの画像データを理解するのに有効ないくつかの用語を説明して おきましょう. カメラの一つの真空容器には5個のCCD素子が納められ
ています. それらは空の同じ領域を掃いて行きます.
この5個のCCD素子から出てくるデータをスキャンラインと言います.
カメラにはこのような真空容器が6個有り, 6セットのCCD素子の列は
素子の幅の約80%の間隔を開けて配置されています.
これら6列のCCD素子によって掃かれる空の領域をストリップと言います.
連続した空の領域であるストライプは, ほぼCDD素子の幅だけずらし
て観測した二つのストリップを合成して得られます.
一つのスキャンライン中で, 一つのCCD素子から出てくるデータは,
2048x1489画素からなるフレームに分割されます. 隣り合うフレームは
10%ほど重なり合っています. 5色のフィルターによって撮影された
同じ空の領域(5枚のフレーム)はフィールドと呼ばれます.
2.5m望遠鏡が一度の観測で掃く連続した空の領域のデータをランと
言います. 典型的なランの長さは数時間です.
撮像データ
位置のキャリブレーション(個々の天体に精密な座標を与えること)
は位置決定パイプライン(Astrometric Pipeline: Astrom)によって行
われます. 測光の目盛り付け(地球大気の透明度を測定すること)は,
監視望遠鏡パイプライン(Monitor Telescope Pipeline: MT)で行われ
ます. この目盛り付けの基礎となる一次標準星は, 明るすぎて2.5m望遠鏡
では適切に観測できないので, 2.5m望遠鏡が掃いている空の一部
(二次標準星領域)を監視望遠鏡で観測します. 空のあちこちに配置され
ているこれら二次標準星領域が2.5m望遠鏡の観測と1次標準星をも観測
できる監視望遠鏡の測光システムを結びつけるのに使われます.
このような計算を行うために, フレームパイプラインは検出器の
性質と空の背景光を知ることが必要です. これらは一つのラン
全体に対して切手画像パイプライン(Postage Stamp Pipeline: PSP)
で行われます. このパイプラインはラン全体に渡ってこれらの量を計算し,
それぞれのフレームの中心での値を内挿によって求めます.
PSPは明るい(が飽和していない)星の画像をたくさん切り出し,
(連星など)質の悪いものを除いて, 単純なモデル化を
したPSF(Point Spread Function)のパラメータを求めます.
PSFとは星像の形のことで, 点光源がそのシステムでどのように
結像されるかを示すものです. 星像の切り出しは, 連続星像収集
パイプライン(Serial Stamp Collecting Pipeline: SSC)によって
行われます. このパイプラインは, 一つのフィールドに対する
5枚のフレームの位置あわせも行います.
以下に, 各処理ステップの例を, 一つのフレームのごく一部分を
取り出して示します.
撮像データがこれらのパイプラインによって処理されれば,
5色の画像を組み合わせて
このウエッブサイトからアクセスできる
美しいカラー画像を作ることができます. さらに, すべての
天体の測定量はデータベースに収納され, 私たちはそれを
検索することができます.
分光データ
分光観測をする目的は三つあります.
分光データを処理するパイプラインは, これらの
重要な量を出力するように設計されています.
撮像データの場合と同じく分光データも, CCDデータを入力として
完全に処理されたスペクトルを出力する大きなパイプラインに
よって処理されます.
パイプラインの最初の部分では, 検出器の特性や欠陥に対する
補正が行われます. これらの補正をするには, 以下のような
補助データが必要です.
さらに, 地球大気による吸収の補正(地球大気補正)と太陽の周りを
公転する地球の運動によるドップラー効果の補正(太陽中心補正)
が行われます.
これらの補正がすべて完了すると, パイプラインは個々のスペクトルを
画像から抜き出し, 一次元のスペクトル(放射強度を波長の関数として
あらわしたもの)を作ります. この一次元スペクトルは波長の目盛りが
ついていて, 赤い側の半分と青い側の半分が合成され, 天体の種類が
同定されていなくてはなりません.
この最後の作業である天体種別の同定は, 極めて重要だがとても
難しいものです. 銀河のスペクトルには実にさまざまなものがあり,
それに加えて星があり, クエーサーがあり, さらに他の種類の
天体もあるのです. 元々の性質が違うばかりでなく, それらの天体は
それぞれ異なった赤方偏移にあって, 異なる波長域のスペクトルを
見せているのです. この同定作業を行うためにまず, ソフトウエアは
すべての輝線(原子や分子によって特定の波長の光が放射される
ことによるスペクトルの特徴)を検出し, それらの波長を同定します.
次にスペクトル全体と, 各種天体の標準的なスペクトルのテンプレート
(雛形)との合致度を, テンプレートを色々な赤方偏移に置いて調べます.
もっとも良い合致度を示すものから, その天体の種類と同時に
赤方偏移が推定されるのです.
データベース
| ||||||||||||||||||||||||||||||