ChIP-chip versus ChIP-seq: Lessons for experimental design and data analysis｜BMC Genomics

Analysis of input DNA profiles
Genome-wide signal reproducibility within and between technologies
TSSおよびTESにおける平均シグナルプロファイルの構築
Effect of using different input profiles in ChIP-seq data normalization
異なるピークコーラーの使用による変動の評価

Analysis of input DNA profiles

シーケンスベースとマイクロアレイベースのChIPデータの技術的差異を理解するために、まずマイクロアレイ（INPUT-chip）とハイスループットシーケンス（INPUT-seq）で生成した架橋・超音波処理したDNA断片（入力DNA）のプロファイルを分析しました。インプットDNAのプロファイルは、ChIPに使用した抗体に依存しないはずなので、この比較によって、これら2つのプロファイリング技術間の具体的な違いを知ることができる。我々は、2チャンネルマイクロアレイデータのバックグラウンドチャンネルからINPUT-chipデータを取得した。このマイクロアレイプラットフォームは競合ハイブリダイゼーションを用いているが、我々のAgilentマイクロアレイの2つのチャンネルは、どちらかのチャンネルが飽和することは非常にまれであるため、比較的独立していることが示されている。抽出した INPUT-chip プロファイルのうち、ほとんどのプロファイルが非常に類似しているため、ここでは代表的な 8 つのプロファイル（4 つの発生時点からそれぞれ 2 つずつ）のみを解析した結果を示す（追加ファイル 2: Figure S1）。次に、8つのINPUT-chipプロファイルを、本研究で収集した9つのINPUT-seqプロファイルと比較した（追加ファイル1：表S3）

最も顕著な観察の1つは、マイクロアレイハイブリッド化及び配列決定に同じ入力DNA材料を使用したにもかかわらず、INPUT-chip及びINPUT-seqプロファイルが大幅に異なって見えるということである（図1）。ピークの相対的な大きさと位置は、複数の実験によるINPUT-chipプロファイルで一貫しているようである。しかし、9つのINPUT-seqプロファイルのパターンは、より多様であるように見える。複数のINPUT-seqプロファイルにわたって一貫性のないシグナル濃縮を有する多くの領域を視覚的に識別することができる（図1aで強調）。この観察を定量化するために、クラスタリング解析を行った。その結果、8つのINPUT-chipプロファイルすべてが互いに密接にクラスタリングしていることがわかりました（図1b）。この結果は、マイクロアレイとハイスループットシーケンスから測定されるバックグラウンドDNAの分布が異なることを示している。すべてのINPUT-chipプロファイルおよび9つのINPUT-seqプロファイルのうち7つは、ゲノム全体レベル（図1b）および転写開始点（TSS）および転写終了点（TES）周辺（図1c）でゲノムGC量と正の相関を示した。 GCとの相関の強さは、INPUT-chipプロファイル間では非常に一貫しているが、INPUT-seqプロファイル間では大きく変動している（図1b-cおよび追加ファイル2: 図S2）。注目すべきは、E-16-20時間（E16）およびE-20-24時間（E20）で得られたINPUT-seqプロファイルは、GC含量と相関しない。

また、高いシーケンス深度（>400万マッピングリード）のINPUT-seqは、低いシーケンス深度のものよりも密にクラスタリングする傾向があることに留意し、シーケンス深度と入力DNA変動との間に関係がある可能性を示唆する。この仮説を検証するために、最も深く配列決定されたインプットDNAサンプル（AdultMale; AM）から異なるサンプリング比率で配列決定リードをサブサンプリングして、11の追加INPUT-seqプロファイルを作成した（図1dおよび追加ファイル2：図S3）。予想通り、配列決定深度の高いプロファイルは、より強くクラスタリングする傾向があり、GC含量の変動との相関はより一貫している。しかし、GC含量の相関は、シーケンス深度が非常に低い場合（<200万リード；図1d）だけ、非常に弱くなる。これは、低いシーケンス深度がINPUT-seqの品質に影響を与える唯一の要因ではないことを示している。さらに、比較的低いシーケンス深度のいくつかのINPUT-seq（E0およびAF、<400万リード）は、一貫した入力DNAプロフィールを与えることができる。このことは、INPUT-seqの変動が他の実験的要因に起因する可能性もあることを示唆している。インプットDNAライブラリの変動に影響を与える実験的要因の全範囲を解剖するためにさらなる研究が必要であるが、サンプル調製の変動（例えば、異なるクロマチン調製や超音波処理）、シーケンサーのラン間変動、同一モデルでのシーケンサー間変動、および実験における他の多くの変動要因に影響を受けている可能性がある。変動が大きいとChIP-seqプロファイルの密度推定が不安定になり、下流のデータ解析に影響を与えるため、INPUT-seqプロファイル間の高い変動は、実に重要な問題です。本論文の後続のセクションで示すように、GC含量との相関が異常に弱いINPUT-seqは、重要なゲノム位置での平均プロファイルの構築に影響を与える可能性があります。したがって、インプットDNAを十分に深く配列し、得られたプロファイルが類似の実験から得られたプロファイルと一貫性があることを確認することが不可欠である。 ChIP-chipのゲノムカバレッジはマイクロアレイのプローブデザインによって制限され、ChIP-seqのカバレッジはシーケンスの深さに依存する。当社のAgilentマイクロアレイで達成されたゲノムカバレッジは約70％です。サブサンプリングされたINPUT-seqデータを用いて、INPUT-seqは100万リードという低いシーケンス深度で、一般的に高いゲノムカバレッジを提供することを示す。ランダムにサブサンプルされたデータから構築されたこの傾向は、他の8つの実際のINPUT-seqデータセットで観察されたゲノムカバレッジを裏付けるものである（図1e）。 2つの技術によって生成されたプロファイルを比較するために、ゲノムを1 kbの重複しないビンに分割し、各ビンにおける濃縮レベルを、入力チャネルに対するIPチャネルの対数比の平均として定義した（詳細については、方法のセクションを参照のこと）。 ChIPプロファイルのシグナル分布を、全ビンの濃縮値の分布と呼ぶことにした。まず、2つの技術によって生成されたプロファイルの平均的な信号対雑音比を特徴付けることを目的とした。プロファイルのS/N比の指標として、分布の最高と最低5%のシグナルを除去した後のシグナル密度プロファイルの（切り捨てた）歪度を用いました。歪度は分布の非対称性の指標であり、歪度が正であれば、右側のテールが長く、良好なS/N比であることを意味する。ほぼすべての場合において、ChIP-seqプロファイルは、同じ生物学的条件の対応するChIP-チッププロファイルよりも高い歪度を有しています（図2および追加ファイル1：表S4）。歪度の違いは、抗体の品質およびヒストン修飾または結合事象の有病率の違いによる可能性があるIP要因に依存することに留意してください。また、異なるbinサイズを用いても、同じ結論が導き出される（Additional file 2: Figure S4）。我々の結果は、ChIP-seqは通常、ChIP-chipよりも特徴的なシグナルプロファイルを生成するという一般的な観察を確認した。

次に、各ChIPプロファイル内の濃縮領域の特徴を示した。公平な比較を行うために、ChIP-seqとChIP-chipのデータに対して同じ基準でピークコールを行うアルゴリズムを使用したいと思います。現在、一般的に使用されているピークコールアルゴリズムの多くは、ChIP-chipデータまたはChIP-seqデータの解析に特化して設計されており、その両方を解析することはできません。この制限を克服するために、我々はChIP-chipとChIP-seqの両方のプロファイルから、同じゲノムスキャンヒューリスティックを用いてピークを同定しました（方法セクションを参照）。その結果、同じ生物学的サンプルを解析する場合、ChIP-chipと比較してChIP-seqから生成されたデータを使用すると、ほぼ常に、より多くのピークとより狭いピークを発見できることが示され、この結論は、使用した識別基準の厳しさに関わらず一貫しています（図2および追加ファイル2：図S5）。実際には、ピークコール手順の中で鎖特異的情報を明示的に利用すれば（各リードをその5’末端に向かって一定の塩基対数だけシフトさせる以外に）、ChIP-seqデータ中のさらに多くの狭いピークを同定できると思われるので、今回の解析はChIP-chipと比較してChIP-seqの有効性に関する下限値を示すものである。 1577>

Genome-wide signal reproducibility within and between technologies

さらに、ChIP-chipおよび/またはChIP-seqプロファイル間の再現性をゲノムレベル（1 kbビン）で評価しました。ゲノムカバレッジとシーケンスマッピングの違いによるバイアスを避けるため（図1e）、マイクロアレイプローブを含まないゲノム領域と、複数のINPUT-seqプロファイル間で異常に高い変動がある領域を除外した。ピアソン相関係数、rは、2つのシグナル分布のテールを比較するのにスピアマン相関係数よりも感度が高く、ChIP濃縮シグナルプロファイルを解析する際に特に重要であるため、相関性の指標として使用された。 ChIP-chip複製ペア間およびChIP-seq複製ペア間の相関は概して高く（中央値r = 0.85および0.82、それぞれ）、両技術が再現性のある結果をもたらすことが示された。予想通り、ChIP-chipおよびChIP-seqプロファイルの複製ペア間のクロスプラットフォーム相関はより緩やかです（中央値r = 0.41; Additional file 1: Table S5）。プロファイル間の相関を計算するために異なるビンサイズを使用しても、同様の結論に達することができます（追加ファイル2：図S6）。各技術のペアを比較した代表的な散布図を図3b-dに示す。我々はまた、歪度とプロファイル間再現性の間に正の相関を観察し（追加ファイル2：図S7）、より感度の高い抗体が2つの技術間でより一貫したプロファイルを生成する可能性があることを示唆する。 (a) 2つのプロファイル間のゲノムワイドな再現性は、それらのシグナル強度の間のピアソンの相関係数、r、（1kbビン）で測定されました。 ChIP-chipとChIP-seqの両方が高い再現性を持つのに対し（中央値r≈0.83）、複製されたChIP-chipとChIP-seqプロファイル間の再現性は中程度（中央値r≈0.41）である。この図は、（b）ChIP-chipとChIP-chip、（c）ChIP-seqとChIP-seq、（d）ChIP-chipとChIP-seqの生体内複製間のゲノム幅相関の1つの典型例も示しています。 1577>

TSSおよびTESにおける平均シグナルプロファイルの構築

TSSおよびTESなどの重要なゲノム特徴周辺の平均ChIPシグナルプロファイルの構築は、これらの特徴周辺のシグナル富化を可視化する一般的な方法である。そこで、ChIPプロファイルの複製ペアごとに、平均TSSおよびTESプロファイル（2kb上流および2kb下流）の再現性を調査した（追加ファイル2：図S8）。ほとんどの複製ペアの平均プロファイルは非常に一貫している。しかし、特にE-16-20時間およびE-20-24時間の両ステージにおけるH3K27Me3およびH3K9Me3のプロファイルが著しく異なっているペアがいくつかある（追加ファイル2：図S8cおよび図S8g）。外部からの検証を行わない限り、ChIP-chipとChIP-seqのどちらがより正確な平均シグナルプロファイルを生成しているかを判断することは不可能である。それでも、2つの証拠から、ChIP-chipからの平均シグナルプロファイルがより正確である可能性が高いと信じるに至りました。第一に、これらの時点における3つのChIP-chip複製はすべて、非常に一貫した平均プロファイルを有していました。第二に、これらの生物学的条件におけるChIP-seq平均シグナルプロファイルは、TSSおよびTESにおけるGC含量の変動傾向に類似していた（図1c）。 E-16-20時間およびE-20-24時間のGC含量とINPUT-seqプロファイルの間の相関が異常に低いことから（図1bおよび追加ファイル2：図S2b）、観察された不一致は、それぞれのINPUT-seqプロファイルによるGC含量の変動の誤表示によるものではないかという仮説を立てることになった。 H3K27Me3とH3K9Me3の両方は、通常TSSとTESで枯渇する抑制マークであるため、バックグラウンド減算の変動は、これらのゲノム特徴で強いシグナル濃縮を有する他のヒストンマークよりもはるかに顕著であると思われる。我々の仮説を検証するために、対応するINPUT-seqのバックグラウンドを、GC含量の変動と最も相関が高いAdultFemaleサンプルのINPUT-seqに置き換えた。置換後、これら2つの発生段階におけるChIP-seqおよびChIP-chipによって生成された平均シグナルプロファイルは一致した（図4および追加ファイル2：図S9）。この結果は、同じChIP-seqプロファイルのネガティブコントロールとして異なるINPUT-seqを使用すると、データの解釈が大幅に異なることを示すため、顕著である。

Effect of using different input profiles in ChIP-seq data normalization

平均TSSおよびTESプロファイルの構築におけるINPUT-seqの影響を観察したので、バックグラウンド正常化のために異なるINPUT-seqプロファイルを使用するとChIP-seqピークコール結果に著しく影響するかどうかを質問してみました。我々はSPPを用いて、10個のChIP-seqサンプル（E16-20時間およびE20-24時間のCBP、H3K9Ac、H3K9Me3、H3K27Ac、H3K27Me3）のピークをコールし、各ChIPプロファイルをバックグラウンドとして4種類のINPUT-seq（一致時点からの入力、成人女性、成人男性およびE4-8時間）に対して正規化しました。これらのINPUT-seqプロファイルは、異なる配列深度とGC含量との相関を有するため、選択された（図1b）。ピークの数とピーク幅の中央値の比較を図5に示す。異なるINPUT-seqをバックグラウンドとして使用した場合、どのChIP-seqサンプルでもコールされるピークの数に大きな差があることが観察されました。極端なケース（E-16-24 h, H3K9Me3 ChIP）では、FDR 5%でピーク数が0から40,000近くまで変化することがあります（図5a）。一般に、差の絶対的な大きさはChIPデータセットによって異なるものの、深く配列された入力DNAサンプル（この実験ではAdultMaleとE-4-8 h）に対して正規化すると、より統計的に有意なピーク（FDR < 0.05）が検知されました。ピーク数の差は検出力の差を示していると考えられる。各ChIPサンプルについて、4つの異なる入力DNAバックグラウンドによって生成された各ピークセットのペア間の重複の割合を計算した（つまり、ChIPサンプルあたり6つの比較）。その結果、小さい方のピークセットに関する重複割合の平均は約95%であり、検出ピーク数の差は、弱いピークを呼び出す力の差に起因すると考えられることがわかった。また、強いピーク（つまり検出FDRが低いピーク）は異なるピークセットで検出されやすいことが確認された（例として、Additional file 2: Figure S10を参照）。検出されたピークの中央値幅は、バックグラウンドとして異なるINPUT-seqを使用することによっても影響を受けます（図5b）。この分析から、異なるINPUT-seqを用いた正規化は、ピークコールに重大な、そして過小評価された影響を持つ可能性があることが示された。

異なるピークコーラーの使用による変動の評価

ChIP-chipおよびChIP-seqプロファイルの解析におけるもう一つの重要な変動要因は、異なる解析アルゴリズムの使用に由来する。現在までに多くのChIP-chipおよびChIP-seq解析ツールが開発されており、そのすべてがタグシフト、プロファイルの正規化、スムージング、ピーク同定、偽発見率の算出に異なる方法を利用している。したがって、特に弱いシグナルを持つピークを扱う場合、ピークコーラーの違いによって結合部位の同定結果が大きく異なることは、さほど驚くべきことではありません。 ChIP-chipとChIP-seqのデータセットを用いて、異なるプロファイリング技術と異なるピークコーラーの使用により、ピーク同定にどの程度のばらつきが生じるかを評価することができます。本研究では、2つのピークコーラーを用いてChIP-chipプロファイルを解析しました。 MA2CとSplitterを使用し、ChIP-seqプロファイルは別の2つのピークコーラーを使用して分析しました。 MACSとSPP（Additional file 1: Table S8参照）。これらのピークコーラーは、広く使用され、一般に公開されており、過去の比較研究において一般的に良好な性能を示したため、選択されました。我々は、4つの因子（CBP、H3K4Me1、H3K4Me3、H3K27Me3）の上位1000ピークの複数の発生段階にわたる重複を計算した。 4つのIP因子は、広いピーク（CBPとH3K27Me3）と狭いピーク（H3K4Me1とH3K4Me3）を含む代表的なプロファイルであることから選択された。ここでは、上位1,000ピークの比較結果のみを示す。これは、これらのプロファイルにおける高信頼性濃縮部位の生物学的に妥当な数であるためである。この解析の一般的な結論は、様々なピーク呼び出しの閾値に対して頑健である（追加ファイル2：図S11）。 2つのピークセット間の一致度は、重複するピークの平均的な割合で測定された。図6に示すように、H3K4Me1とH3K4Me3のプロファイルに基づく比較では、プラットフォーム内一致度がプラットフォーム間一致度よりも高い（すなわち、同じプロファイル上で2人のピークコーラーが生成したピークセットは、2つのプロファイル上で2人のピークコーラーが生成したピークセットよりも一致している）という予想通りの結果がもたらされた。しかし、H3K27Me3とCBPのプロファイルを解析した場合、プラットフォーム内の一致度はプラットフォーム間の一致度と同じくらい低くなることがあり、ピークコールアルゴリズムのばらつきは、あるIP因子に対して異なるプロファイリング技術を使用した場合と同じくらい大きくなる可能性があることを示唆している。 H3K4Me1やH3K4Me3に比べ、CBPやH3K27Me3といった広い領域を持つChIPプロファイルでは、現在のピークコールアルゴリズムでは一致した結果が得られないということは、広い濃縮領域の特定においてアルゴリズムがあまり一致しないということを示唆していると考えられ、今後の研究課題として興味深いかもしれません。

。

Analysis of input DNA profiles

Genome-wide signal reproducibility within and between technologies

TSSおよびTESにおける平均シグナルプロファイルの構築

Effect of using different input profiles in ChIP-seq data normalization

異なるピークコーラーの使用による変動の評価

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル