SDSSについて
 SDSSの望遠鏡
 観測装置
 データ処理
 - 撮像データ
 - 用語
 - 分光データ
 - データベース
 初期の発見
 SkyServerとは
 早期データ公開
 データの詳細
データ処理

データ処理の概要

良く晴れた暗い夜には, 何十億年も宇宙を旅してきた光が ニューメキシコ州南部の山の上に降り注ぎます. 地球上には まだ藻類しか存在していなかった頃に天体を発した光が, そこで スローン・ディジタル・スカイ・サーベイ(SDSS)の2.5m望遠鏡に入射し, 運んできた情報を高度な観測装置に渡すのです. その光はもはや光子としての命は絶たれますが, その運んできたデータは 磁気テープに記録されたディジタル画像として生き続けます. 一つの画像は無数の画素(ピクセル)からなり, その画素の一つ一つが 空の微小部分の明るさを記録してます.

しかし, 空が画素からできているわけではありません. 実際にあるのは 星や銀河です. SDSSのデータ処理系の役割は, ニューメキシコ州の山の 上で電気的に記録された画素のディジタルデータを処理して, 実在する天体の真の情報に変換することです. 天文学者は, ディジタル 画像を処理して星や銀河を同定し, それらの性質を調べることに使える 情報を引き出します. そのためには, 画素の集合である画像データから 天体を検出し, その種類を見分け, その明るさを測って, それら星, 銀河, クエーサーのカタログとして収集しなければなりません.

コンピューターの専門家はこのプロジェクトを, 空に対してマンハッタン地区の 電話帳を作るようなものだと述べています. 星の一つ一つが, 電話帳の中の 名前と住所を持った一人の人間にたとえられます. 空の電話帳には 「黄色のページ」すらあります. そこに載っている少数の天体には, スペクトルという形で名前と住所以外により多くの情報が載せられています. それらについては, 地球から遠ざかる速度が与えられていて, それからその天体の距離を計算することができます.

データは迅速に(約1週間以内に)処理しなければなりません. 次の新月の時期に観測装置をどのように使うのが最良かという 装置計画を立てるための情報が必要なのです. 時間を掛けすぎてしまうと, 季節が移って目標とする天体が沈んで行ってしまうのです.

データ処理パイプラインと呼ばれるソフトウエアの開発の中心 となっているのは, フェルミ加速器 研究所(フェルミ研)の科学者達です. パイプラインとは, ディジタルデータを処理して特定の情報を抽出する コンピューターのプログラムのことです. パイプラインと言う言葉は, データ処理が自動化されているという 含みをもって使われています. データは人間がほとんど関与する ことなく多数のパイプラインの中を「流れて」行きます. 例えばアメリカ海軍天文台の科学者によって作られた位置決定パイプ ラインは, 空の上で星や銀河の二次元の精密な位置を決定します. この場合には, 2.5m望遠鏡に入射した光子から作られたディジタル データがパイプラインの一方の端から入力され, 出口からは 天体の位置が出てきます. 入口と出口の間にパイプラインに沿って, 画素を実際の情報に変換するソフトウエアがあるのです.

データ処理のための多数のパイプラインは大きな共同作業の結果です. プリンストン大学 の科学者は測光パイプラインを作り, シカゴ大学 の専門家は分光パイプラインを作りました. フェルミ研 は監視望遠鏡パイプラインと分光観測の対象を選択するための 対象選択パイプラインを作りました. フェルミ研はまた, 全てのパイプラインがスムースに動くように全体の調整を 行っています.

SDSSのデータ処理はまずデータの取得から始まります. 天体からの光が望遠鏡に入射してCCD素子に集められます. 「バケツ」に たまった電荷はディジタル信号に変換され, 山の上で磁気テープに 書き込まれます. そのデータは速達便で アパッチポイント 天文台から フェルミ研に運ばれます. テープはフェルミ研のファインマン計算 センターにおいて色々なパイプラインに仕訳して入力されます. 分光データは分光パイプライン, 監視データは監視望遠鏡パイプライン, そして撮像データは位置決定, 測光, 対象選択, およびもう二つの 計5個のパイプラインというぐあいです. これらのパイプラインから星, 銀河, クエーサーの情報が出力され フェルミ研とアメリカ海軍天文台で, サーベイを遂行するために 必要な情報を網羅する作業用データベースに書き込まれます.

作業用データベースの情報は, 最終的には「防火壁」を越えて ジョンス・ホプキンス大学の科学者によって開発された科学用 データベースに移されます. 科学用データベースは, プロジェクト に携わる研究者がデータをすぐに使えるようにする検索エンジン として機能します.

私たちが空を認識する形態は, 利用できる技術によって必然的に 支配されます. 50年前に行われたサーベイでは, 画像データは 写真乾板という形で蓄えられ, カタログは書物の形で印刷されました. 今日では, 画像はディジタル形式で磁気テープやハードディスク に蓄えられ, カタログはディジタルなデータベースとなります. しかし, どんな時代であっても, どんな技術を使っても, 人類は 空を見上げ続け, そして空は星々に満ちているのです.


SDSSの用語

SDSSの画像データを理解するのに有効ないくつかの用語を説明して おきましょう.

カメラの一つの真空容器には5個のCCD素子が納められ ています. それらは空の同じ領域を掃いて行きます. この5個のCCD素子から出てくるデータをスキャンラインと言います. カメラにはこのような真空容器が6個有り, 6セットのCCD素子の列は 素子の幅の約80%の間隔を開けて配置されています. これら6列のCCD素子によって掃かれる空の領域をストリップと言います. 連続した空の領域であるストライプは, ほぼCDD素子の幅だけずらし て観測した二つのストリップを合成して得られます.

一つのスキャンライン中で, 一つのCCD素子から出てくるデータは, 2048x1489画素からなるフレームに分割されます. 隣り合うフレームは 10%ほど重なり合っています. 5色のフィルターによって撮影された 同じ空の領域(5枚のフレーム)はフィールドと呼ばれます.

2.5m望遠鏡が一度の観測で掃く連続した空の領域のデータをランと 言います. 典型的なランの長さは数時間です.

撮像データ

SDSSの目標は, 北銀極を中心とする全天の約4分の1の空の領域を 可視光波長域全体をカバーする5つのバンド(色)で, (感度の良いバンド では)23等級の深さまで撮像することです. 観測の仕方が特別なので, データは連続したタペストリ(つづれ織り) のような形式になっています. このデータは相互に関連する一連のパイ プラインによって自動的に処理されます. それらパイプラインによって, 画像の欠陥が修復され, 位置と明るさの目盛りが入れられ, 空の背景光 の強さが測られ, 天体が検出され測定されてカタログ化されます. 最後の処理ステップがもっとも計算時間がかかるので, データは フィールドと言う単位に分割され, それぞれのフィールドは独立に 処理されます.

位置のキャリブレーション(個々の天体に精密な座標を与えること) は位置決定パイプライン(Astrometric Pipeline: Astrom)によって行 われます. 測光の目盛り付け(地球大気の透明度を測定すること)は, 監視望遠鏡パイプライン(Monitor Telescope Pipeline: MT)で行われ ます. この目盛り付けの基礎となる一次標準星は, 明るすぎて2.5m望遠鏡 では適切に観測できないので, 2.5m望遠鏡が掃いている空の一部 (二次標準星領域)を監視望遠鏡で観測します. 空のあちこちに配置され ているこれら二次標準星領域が2.5m望遠鏡の観測と1次標準星をも観測 できる監視望遠鏡の測光システムを結びつけるのに使われます.

SDSSのデータ処理の流れ図
(フローチャート).
撮像データの処理は測光パイプライン(Photometric Pipeline: Photo) によって行われます. このパイプラインは連続する3つのパイプライン よりなっています. そのうちの最後のフレームパイプライン(Frames Pipeline: Frames)は, 一つのフィールド を構成する5つのフレームのセットに対して以下のような処理を 行います. すなわち, 画像の欠陥(CCDの不具合のある列, 宇宙線による汚染など)の補正, 検出器のバックグラウンドおよび感度の非一様性の補正, (明るいものと暗いものに分けた)2段階の天体検出, ビニング(平均化 によって画素を大きくし画像を滑らかにすること)した画像による 低面輝度天体の探索, 5色の画像で検出された天体の対応付け, 天体の(位置, 大きさ, 形, 明るさの)測定, 天体の分類, 重なり合った 天体の分離, アトラスイメージ(天体を含む部分の小さな画像)の切り出 しを行い, 一連の出力を書き出します. 出力は, 測定された種々の パラメータ(測定量)の表, 欠陥や感度の非一様性の補正された 画像, 4x4画素のビニングを行った空(天体は切り出されている) の画像, 天体のアトラスイメージ, マスクフレーム(CCDが飽和 現象を起こしている画素や周辺から値を外挿した画素などの位置を 示す), および各フレームの種々の統計量の要約からなっています.

このような計算を行うために, フレームパイプラインは検出器の 性質と空の背景光を知ることが必要です. これらは一つのラン 全体に対して切手画像パイプライン(Postage Stamp Pipeline: PSP) で行われます. このパイプラインはラン全体に渡ってこれらの量を計算し, それぞれのフレームの中心での値を内挿によって求めます. PSPは明るい(が飽和していない)星の画像をたくさん切り出し, (連星など)質の悪いものを除いて, 単純なモデル化を したPSF(Point Spread Function)のパラメータを求めます. PSFとは星像の形のことで, 点光源がそのシステムでどのように 結像されるかを示すものです. 星像の切り出しは, 連続星像収集 パイプライン(Serial Stamp Collecting Pipeline: SSC)によって 行われます. このパイプラインは, 一つのフィールドに対する 5枚のフレームの位置あわせも行います. 以下に, 各処理ステップの例を, 一つのフレームのごく一部分を 取り出して示します.

処理のステップ
生データ.
二つのアンプのバイアスレベルの違いが見える.
バイアス補正後
飽和画素, 欠陥列, 宇宙線は緑色でマスクされている.
補正画像
飽和画素, 欠陥列, 宇宙線を補正した.
明るい天体の検出.
青色で表示.
暗い天体の検出.
赤色で表示.
測定する天体,
はマスクされ四角で囲んである. 小さな空の四角はこのバンドでは検出されなかった天体.
測定された天体. 再構成された画像.
個々の天体のアトラスイメージと空のビニング画像から作った.

撮像データがこれらのパイプラインによって処理されれば, 5色の画像を組み合わせて このウエッブサイトからアクセスできる 美しいカラー画像を作ることができます. さらに, すべての 天体の測定量はデータベースに収納され, 私たちはそれを 検索することができます.

分光データ

分光観測をする目的は三つあります.
赤方偏移: 二次元の空の画像から三次元の宇宙の地図へと進む ためには, 銀河やクエーサーの距離を推定できる赤方偏移を 測る必要があります.
分類: 天体が星であるのか, 銀河であるのか, あるいはクエーサー であるかはスペクトルからわかります.
強度と波長: 天体の化学組成などの性質を理解するには適切に 目盛り付けされたスペクトルが必要です.

分光データを処理するパイプラインは, これらの 重要な量を出力するように設計されています.

撮像データの場合と同じく分光データも, CCDデータを入力として 完全に処理されたスペクトルを出力する大きなパイプラインに よって処理されます. パイプラインの最初の部分では, 検出器の特性や欠陥に対する 補正が行われます. これらの補正をするには, 以下のような 補助データが必要です.
フラットフィールド画像: 一様な光が入射したときに望遠鏡 の光学系と分光器がどのように感応するかを決めるのに使われます.
アークランプ画像: (街頭のネオン灯のように)良く理解されている 電離ガスの輝線スペクトルで, 画像上の位置と波長の対応付けに 使われます.
空のスペクトル: 一枚のプレートの中で数本の光ファイバーは 何もない空に向けられています. これらは空からの輝線を差し引くのに 使われます.
標準星: 標準星はその性質が良く知られているので, 測定した 光の強度に適切な目盛り付けをするのに使われます.
フラットフィールド画像
アークランプ画像
天体のスペクトル画像

さらに, 地球大気による吸収の補正(地球大気補正)と太陽の周りを 公転する地球の運動によるドップラー効果の補正(太陽中心補正) が行われます.

これらの補正がすべて完了すると, パイプラインは個々のスペクトルを 画像から抜き出し, 一次元のスペクトル(放射強度を波長の関数として あらわしたもの)を作ります. この一次元スペクトルは波長の目盛りが ついていて, 赤い側の半分と青い側の半分が合成され, 天体の種類が 同定されていなくてはなりません.

この最後の作業である天体種別の同定は, 極めて重要だがとても 難しいものです. 銀河のスペクトルには実にさまざまなものがあり, それに加えて星があり, クエーサーがあり, さらに他の種類の 天体もあるのです. 元々の性質が違うばかりでなく, それらの天体は それぞれ異なった赤方偏移にあって, 異なる波長域のスペクトルを 見せているのです. この同定作業を行うためにまず, ソフトウエアは すべての輝線(原子や分子によって特定の波長の光が放射される ことによるスペクトルの特徴)を検出し, それらの波長を同定します. 次にスペクトル全体と, 各種天体の標準的なスペクトルのテンプレート (雛形)との合致度を, テンプレートを色々な赤方偏移に置いて調べます. もっとも良い合致度を示すものから, その天体の種類と同時に 赤方偏移が推定されるのです.

4つの異なる赤方偏移(0.0, 0.05, 0.10, 0.15, 0.20)にある 銀河のスペクトル.

データベース