ChIP-chip versus ChIP-seq: oppeja koesuunnittelusta ja datan analysoinnista | BMC Genomics

Syöttö-DNA-profiilien analyysi
Profiilien ominaisuuksien vertailu
Genominlaajuinen signaalin toistettavuus tekniikoiden sisällä ja niiden välillä
Keskimääräisen signaaliprofiilin rakentaminen TSS:n ja TES:n kohdalla
Erilaisten syöttöprofiilien käytön vaikutus ChIP-seq-datan normalisoinnissa
Erilaisten piikkisoittimien käytöstä johtuvan vaihtelun arviointi

Syöttö-DNA-profiilien analyysi

Ymmärtääksemme sekvensointipohjaisen ja mikrosirupohjaisen ChIP-datan välisiä teknologisia eroja analysoimme ensin mikrosirulla (INPUT-chip) ja korkean läpimenotehon sekvensoinnilla (INPUT-seq) tuotettujen ristisilloitettujen ja sonikoitujen DNA-fragmenttien profiileja (syöttö-DNA). Koska syöttö-DNA-profiilin pitäisi olla riippumaton ChIP:ssä käytetystä vasta-aineesta, tämä vertailu voi antaa tietoa näiden kahden profilointitekniikan välisistä erityisistä eroista. Saimme INPUT-chip-tiedot kaksikanavaisen mikrosirutietomme taustakanavasta. Vaikka tämä mikrosirualusta käyttää kilpailevaa hybridisaatiota, Agilent-mikrosirumme kahden kanavan on osoitettu olevan suhteellisen riippumattomia, koska kyllästyminen kummassakin kanavassa on hyvin harvinaista . Kaikista poimimistamme INPUT-siruprofiileista esitämme tässä vain kahdeksan edustavan profiilin analyysin (kaksi kustakin neljästä kehitysajankohdasta), koska useimmat INPUT-siruprofiilit ovat hyvin samankaltaisia (lisätiedosto 2: kuva S1). Kahdeksan INPUT-chip-profiilia verrattiin sitten tässä tutkimuksessa kerättyihin yhdeksään INPUT-seq-profiiliin (Lisätiedosto 1: Taulukko S3).

Yksi silmiinpistävimmistä havainnoista on se, että INPUT-chip- ja INPUT-seq-profiilit näyttävät eroavan toisistaan huomattavasti, vaikka mikroarray-hybridisaatioon ja sekvensointiin käytettiin samaa DNA-syöttömateriaalia (Kuva 1). Huippujen suhteellinen suuruus ja sijainti näyttävät olevan yhdenmukaisia useiden kokeiden INPUT-chip-profiileissa. Yhdeksän INPUT-seq-profiilin kuviot näyttävät kuitenkin olevan vaihtelevampia. Voimme visuaalisesti tunnistaa monia alueita, joiden signaalirikastuminen on epäjohdonmukaista useissa INPUT-seq-profiileissa (korostettu kuvassa 1a). Tämän havainnon kvantifioimiseksi tehtiin klusterointianalyysi. Havaitsimme, että kaikki kahdeksan INPUT-siruprofiilia klusteroituivat tiiviisti toisiinsa (kuva 1b). Tämä tulos osoittaa, että taustan DNA-jakauma, joka on mitattu mikrosirusta ja suurläpimittaussekvensoinnista, on erilainen. Kaikki INPUT-chip-profiilit ja seitsemän yhdeksästä INPUT-seq-profiilista korreloivat positiivisesti genomin GC-pitoisuuden kanssa koko genomin tasolla (kuva 1b) sekä transkription aloituskohtien (TSS) ja transkription lopetuskohtien (TES) ympärillä (kuva 1c). GC:n kanssa korreloivan korrelaation voimakkuus on erittäin johdonmukainen INPUT-chip-profiilien välillä, mutta vaihtelee suuresti INPUT-seq-profiilien välillä (kuva 1b-c ja lisätiedosto 2: kuva S2). Huomionarvoista on, että E-16-20 h:n (E16) ja E-20-24 h:n (E20) kohdalla saadut INPUT-seq-profiilit eivät korreloi GC-pitoisuuden kanssa.

Huomautamme myös, että INPUT-seq-tietueet, joilla on suurempi sekvensointisyvyys (>4 miljoonaa kartoitettua lukua), klusteroituvat yleensä tiiviimmin yhteen kuin ne, joilla on matalampi sekvensointisyvyys, mikä osoittaa, että sekvensointisyvyydellä voi olla yhteys syötetyn DNA:n vaihteluun. Tämän hypoteesin testaamiseksi luotiin 11 uutta INPUT-seq-profiilia ottamalla sekvensointilukemat syvimmin sekvensoidusta syöttö-DNA-näytteestä (AdultMale; AM) eri näytteenottosuhteilla (kuva 1d ja lisätiedosto 2: kuva S3). Odotetusti profiilit, joiden sekvensointisyvyys on suurempi, klusteroituvat yleensä voimakkaammin yhteen, ja niiden korrelaatio GC-pitoisuuden vaihtelun kanssa on johdonmukaisempi. GC-sisällön korrelaatio heikkenee kuitenkin huomattavasti vain hyvin alhaisella sekvensointisyvyydellä (<2 miljoonaa lukua; kuva 1d). Tämä osoittaa, että alhainen sekvensointisyvyys ei ole ainoa INPUT-seq-laatuun vaikuttava tekijä. Lisäksi jotkin INPUT-seq:t, joiden sekvensointisyvyys on suhteellisen pieni (E0 ja AF, <4 miljoonaa lukua), voivat antaa johdonmukaisia DNA-profiileja. Tämä viittaa siihen, että INPUT-seqin vaihtelu voi johtua myös muista kokeellisista tekijöistä. Vaikka tarvitaankin lisätutkimuksia, jotta voidaan eritellä kaikki kokeelliset tekijät, jotka vaikuttavat syötettyjen DNA-kirjastojen vaihteluun, siihen voivat vaikuttaa näytteen valmistuksen vaihtelut (esim. erilainen kromatiinivalmistelu ja sonikointi), sekvenssilaitteen ajoittainen vaihtelu, sekvenssilaitteesta sekvenssilaitteeseen tapahtuva vaihtelu samassa mallissa ja lukuisat muut muuttujat kokeissa. INPUT-seq-profiilien suuri vaihtelu on todellakin kriittinen ongelma, koska suuri vaihtelu vaikuttaa ChIP-seq-profiilin tiheyden estimoinnin epävakauteen, mikä vaikuttaa datan analyysiin myöhemmässä vaiheessa. Kuten tämän asiakirjan myöhemmissä osissa osoitetaan, INPUT-seq, jolla on epätavallisen heikko korrelaatio GC-pitoisuuden kanssa, voi vaikuttaa keskimääräisten profiilien rakentamiseen tärkeissä genomipaikoissa. Näin ollen on ehdottoman tärkeää sekvensoida syöttö-DNA riittävän syvälle ja varmistaa, että saatu profiili on yhdenmukainen samankaltaisista kokeista saatujen profiilien kanssa.

Genominen kattavuus on toinen keskeinen näkökohta valittaessa ChIP-chipin ja ChIP-seq:n välillä. ChIP-chipin genomista kattavuutta rajoittaa mikrosirun koettimien suunnittelu, ja ChIP-seqin kattavuus riippuu sekvensointisyvyydestä. Agilent-mikrosirulla saavutettu genominen kattavuus on noin 70 prosenttia. Käyttämällä INPUT-seq-dataa, josta on otettu alinäytteet, osoitamme, että INPUT-seq tarjoaa yleensä suuremman genomisen kattavuuden, kun sekvensointisyvyys on vain miljoona lukua. Tämä satunnaisesti osanäytteistetyistä aineistoista konstruoitu suuntaus vahvistaa muiden kahdeksan todellisen INPUT-seq-aineiston havaitun genomisen kattavuuden (kuva 1e).

Profiilien ominaisuuksien vertailu

Tämän jälkeen vertasimme ChIP-chip- ja ChIP-seq-profiilien ominaisuuksia. Vertaillaksemme näiden kahden tekniikan tuottamia profiileja jaoimme genomin 1 kb:n päällekkäisiin bineihin ja määrittelimme rikastumistason kussakin binissä IP-kanavan log-suhteen keskiarvona tulokanavan log-suhteeseen nähden (lisätietoja on kohdassa Menetelmät). Viittaamme ChIP-profiilin signaalijakaumaan sen kaikkien binien rikastusarvojen jakaumana. Ensiksi pyrimme luonnehtimaan kahdella tekniikalla tuotettujen profiilien keskimääräistä signaali-kohinasuhdetta. Käytimme profiilin signaali-kohinasuhteen mittarina signaalitiheysprofiilin (typistettyä) vinoutta sen jälkeen, kun jakauman ylimmästä ja alimmasta 5 prosentista oli poistettu signaalit. Vinouma on jakauman epäsymmetrian mitta, ja positiivinen vinouma osoittaa, että oikeanpuoleinen häntä on pidempi, mikä viittaa hyvään signaali-kohinasuhteeseen. Lähes kaikissa tapauksissa ChIP-seq-profiililla on suurempi vinous kuin vastaavalla ChIP-siruprofiililla samasta biologisesta tilasta (kuva 2 ja lisätiedosto 1: taulukko S4). Huomaamme, että vinouden ero on riippuvainen IP-tekijästä, joka voi johtua erilaisesta vasta-aineen laadusta ja histonimodifikaatioiden tai sitoutumistapahtumien yleisyydestä. Sama johtopäätös voidaan tehdä, vaikka käytettäisiin eri binäärikokoa (Additional file 2: Figure S4). Tuloksemme vahvistivat yleisen havainnon, jonka mukaan ChIP-seq tuottaa yleensä erottuvamman signaaliprofiilin kuin ChIP-chip.

Seuraavaksi luonnehdimme rikastumisalueita kunkin ChIP-profiilin sisällä. Oikeudenmukaisen vertailun suorittamiseksi haluaisimme käyttää algoritmia, joka suorittaa piikkien kutsumisen ChIP-seq- ja ChIP-chip-datalla käyttäen samoja kriteerejä. Tällä hetkellä monet yleisesti käytetyt peak calling -algoritmit on suunniteltu erityisesti analysoimaan ChIP-chip- tai ChIP-seq-dataa, mutta ei molempia. Tämän rajoituksen poistamiseksi tunnistimme piikkejä sekä ChIP-chip- että ChIP-seq-profiileista käyttämällä samaa genomin skannausheuristiikkaa (ks. kohta Menetelmät). Tuloksemme osoittavat, että pystymme lähes aina löytämään suuremman määrän piikkejä ja kapeampia piikkejä käyttämällä ChIP-seq- ja ChIP-chip-dataa, kun analysoimme samaa biologista näytettä, ja tämä johtopäätös on johdonmukainen riippumatta käytettyjen tunnistuskriteerien tiukkuudesta (Kuva 2 ja Additional file 2: Kuva S5). Käytännössä voimme todennäköisesti tunnistaa vielä suuremman määrän kapeita piikkejä ChIP-seq-datasta, jos hyödynnämme nimenomaisesti säikeispesifistä tietoa piikkien kutsumismenettelyssä (sen lisäksi, että kutakin lukua siirretään vain 5′-lukua kohti sen 5′-lukupäätä vakiomääräisellä määrällä emäspareja), joten nykyinen analyysi tarjoaa alemman rajan ChIP-seq-analyysin tehokkuudelle ChIP-chip-analyysiin verrattuna. Kaiken kaikkiaan tuloksemme osoittavat, että ChIP-seq tarjoaa suuremman spatiaalisen resoluution ja paremman signaali-kohinasuhteen.

Genominlaajuinen signaalin toistettavuus tekniikoiden sisällä ja niiden välillä

Lisäksi arvioimme ChIP-chip- ja/tai ChIP-seq-profiilien välistä toistettavuutta genominlaajuisella tasolla (1 kb:n bins). Välttääksemme genomin kattavuuden ja sekvenssikartoituksen eroista johtuvia vääristymiä (kuva 1e) jätimme pois genomialueet, jotka eivät sisällä yhtään mikrosirukoetta, ja alueet, joilla oli epätavallisen suurta vaihtelua useissa INPUT-seq-profiileissa. Korrelaation mittarina käytettiin Pearsonin korrelaatiokerrointa r, koska se on Spearmanin korrelaatiokerrointa herkempi kahden signaalijakauman hännän vertailussa, mikä on erityisen tärkeää ChIP-rikastumissignaaliprofiilien analysoinnissa. Korrelaatio ChIP-chip- ja ChIP-seq-toistoparien välillä on yleensä korkea (mediaani r = 0,85 ja 0,82), mikä osoittaa, että molemmilla tekniikoilla voidaan tuottaa toistettavia tuloksia. Odotetusti ChIP-chip- ja ChIP-seq-profiilien replikaattiparien välinen korrelaatio on vaatimattomampi (mediaani r = 0,41; lisätiedosto 1: taulukko S5). Samanlaisiin johtopäätöksiin päästään, vaikka käytettäisiin eri binäärikokoja profiilien välisen korrelaation laskemiseen (lisätiedosto 2: kuva S6). Kuvassa 3b-d esitetään edustava hajontakuvio, jossa verrataan kutakin teknologiaparia. Havaitsemme myös positiivisen korrelaation skewnessin ja profiilien välisen toistettavuuden välillä (Additional file 2: Figure S7), mikä viittaa siihen, että herkemmät vasta-aineet saattavat tuottaa johdonmukaisempia profiileja näiden kahden tekniikan välillä.

Keskimääräisen signaaliprofiilin rakentaminen TSS:n ja TES:n kohdalla

Keskimääräisten ChIP-signaaliprofiilien rakentaminen tärkeiden genomipiirteiden, kuten TSS:n ja TES:n, ympärille on tavallinen tapa havainnollistaa signaalin rikastumista näiden piirteiden ympärillä. Siksi tutkimme keskimääräisten TSS- ja TES-profiilien (2 kb ylöspäin ja 2 kb alavirtaan) toistettavuutta jokaiselle ChIP-profiilien toistoparille (Additional file 2: Kuva S8). Useimpien toistoparien keskimääräiset profiilit ovat erittäin johdonmukaisia. On kuitenkin muutamia pareja, jotka eroavat merkittävästi toisistaan, erityisesti H3K27Me3:n ja H3K9Me3:n profiilit sekä vaiheessa E-16-20 h että E-20-24 h (lisätiedosto 2: kuvat S8c ja S8g). Ilman ulkoista validointia on mahdotonta määrittää, ovatko ChIP-chipin vai ChIP-seqin tuottamat keskimääräiset signaaliprofiilit tarkempia. Kaksi todistusaineistoa sai meidät kuitenkin uskomaan, että ChIP-chipistä saadut keskimääräiset signaaliprofiilit ovat todennäköisemmin tarkkoja. Ensinnäkin kaikkien kolmen ChIP-chip-replikaatin keskimääräiset profiilit olivat hyvin johdonmukaisia näissä aikapisteissä. Toiseksi ChIP-seqin keskimääräiset signaaliprofiilit näissä biologisissa olosuhteissa muistuttivat GC-pitoisuuden vaihtelun suuntausta TSS:ssä ja TES:ssä (kuva 1c). GC-pitoisuuksien ja E-16-20 h:n ja E-20-24 h:n INPUT-seq-profiilien epätavallisen alhaiset korrelaatiot (kuva 1b ja lisätiedosto 2: kuva S2b) saivat meidät olettamaan, että havaittu ristiriita johtui GC-pitoisuuden vaihtelun virheellisestä esittämisestä vastaavissa INPUT-seq-profiileissa. Sekä H3K27Me3 että H3K9Me3 ovat repressiivisiä merkkejä, jotka yleensä köyhtyvät TSS:ssä ja TES:ssä, joten taustan vähennyksessä mahdollisesti esiintyvä vaihtelu on todennäköisesti paljon voimakkaampaa kuin muilla histonimerkeillä, joilla on voimakas signaalirikastuminen näissä genomin piirteissä. Hypoteesimme testaamiseksi korvasimme vastaavan INPUT-seq-taustan AdultFemale-näytteen INPUT-seq-taustalla, koska sillä on korkein korrelaatio GC-pitoisuuden vaihtelun kanssa. Korvaamisen jälkeen ChIP-seqin ja ChIP-chipin tuottamat keskimääräiset signaaliprofiilit näissä kahdessa kehitysvaiheessa vastaavat toisiaan (kuva 4 ja lisätiedosto 2: kuva S9). Tämä tulos on silmiinpistävä, sillä se osoittaa, että erilaisten INPUT-seq-profiilien käyttäminen saman ChIP-seq-profiilin negatiivisena kontrollina voi johtaa olennaisesti erilaiseen tulkintaan tiedoista.

Erilaisten syöttöprofiilien käytön vaikutus ChIP-seq-datan normalisoinnissa

Havaittuamme INPUT-seq:n vaikutuksen keskimääräisten TSS- ja TES-profiilien rakentamisessa kysyimme, vaikuttaako erilaisten INPUT-seq-profiilien käyttäminen taustan normalisoinnissa merkittävästi ChIP-seq-piikkien kutsumisen tuloksiin. Käytimme SPP:tä piikkien kutsumiseen 10 ChIP-seq-näytteellemme (CBP, H3K9Ac, H3K9Me3, H3K27Ac, H3K27Me3 E16-20 h:ssa ja E20-24 h:ssa), joissa kukin ChIP-profiili normalisoitiin neljää erilaista INPUT-seq:ia vasten taustaksi (tulo vastaavasta ajankohdasta, AdultFemale-, AdultMale- ja E-4-8 h:n tulosta). Nämä INPUT-seq-profiilit valittiin, koska niillä on erilainen sekvensointisyvyys ja korrelaatio GC-pitoisuuden kanssa (kuva 1b). Huippujen lukumäärän ja mediaanipiikin leveyden vertailu on esitetty kuvassa 5. Havaitsimme suuren eron piikkien lukumäärissä kaikissa ChIP-seq-näytteissä, kun taustana käytettiin erilaista INPUT-seq-profiilia. Ääritapauksessa (E-16-24 h, H3K9Me3 ChIP) piikkien määrä voi vaihdella nollasta lähes 40 000:een 5 prosentin FDR:llä (kuva 5a). Yleensä havaittiin enemmän tilastollisesti merkitseviä piikkejä (FDR < 0,05), kun normalisoitiin syvästi sekvensoitua lähtö-DNA-näytettä vastaan (AdultMale ja E-4-8 h tässä kokeessa), vaikka eron absoluuttinen suuruus vaihtelee ChIP-tietoaineistojen välillä. Huippujen lukumäärän ero osoittaa todennäköisesti eroa havaitsemistehossa. Kullekin ChIP-näytteelle laskimme päällekkäisyyksien osuuden kunkin neljän eri syöttö-DNA-taustan tuottaman piikkisarjan parin välillä (eli kuusi vertailua ChIP-näytettä kohti). Havaitsimme, että keskimääräinen päällekkäisyyden osuus pienemmän piikkisarjan osalta on noin 95 %, mikä osoittaa, että erot havaittujen piikkien määrässä johtuvat todennäköisesti erilaisesta tehosta kutsua heikompia piikkejä. Havaitsimme, että vahvat piikit (eli piikit, joiden havaitsemisfDR on alhainen) havaittiin todennäköisemmin eri piikkijoukoissa (ks. lisätiedosto 2: kuva S10 esimerkkinä). Havaittujen piikkien mediaanileveyteen vaikuttaa myös se, että taustana käytetään erilaisia INPUT-sekvenssejä (kuva 5b). Tämä analyysi osoitti, että eri INPUT-seq:ia käyttävällä normalisoinnilla voi olla merkittävä ja aliarvioitu vaikutus piikkien kutsumiseen.

Erilaisten piikkisoittimien käytöstä johtuvan vaihtelun arviointi

Toinen tärkeä vaihtelun lähde ChIP-chip- ja ChIP-seq-profiilien analysoinnissa on peräisin erilaisten analyysialgoritmien käytöstä. Tähän mennessä on kehitetty suuri määrä julkisesti saatavilla olevia ChIP-chip- ja ChIP-seq-analyysityökaluja, ja ne kaikki käyttävät erilaisia menetelmiä tagien siirtämiseen, profiilin normalisointiin, tasoittamiseen, piikkien tunnistamiseen ja väärän löydön osuuden laskemiseen. Siksi ei ole kovin yllättävää havaita, että eri piikkien kutsuohjelmat voivat tuottaa varsin erilaisia tuloksia sitoutumiskohtien tunnistamisessa, erityisesti silloin, kun kyseessä ovat piikit, joiden signaalit ovat heikkoja. ChIP-chip- ja ChIP-seq-tietokokonaisuuksiemme avulla pystyimme arvioimaan, kuinka paljon vaihtelua piikkien tunnistamisessa voi johtua erilaisesta profilointitekniikasta ja erilaisten piikkien kutsujien käytöstä. Tässä tutkimuksessa analysoimme ChIP-chip-profiilejamme käyttämällä kahta peak calleria: MA2C ja Splitter ja analysoimme ChIP-seq-profiilejamme käyttämällä kahta muuta piikkikutsuohjelmaa: MACS ja SPP (ks. lisätiedosto 1: taulukko S8). Nämä peak callerit valittiin, koska niitä käytetään laajalti, ne ovat julkisesti saatavilla ja ne ovat yleensä osoittaneet hyvää suorituskykyä aiemmissa vertailututkimuksissa . Laskimme neljän tekijän (CBP, H3K4Me1, H3K4Me3, H3K4Me3 ja H3K27Me3) 1000 suurimman piikin päällekkäisyyden eri kehitysvaiheissa. Nämä neljä IP-tekijää valittiin, koska ne olivat edustavia profiileja, jotka sisälsivät laajoja piikkejä (CBP ja H3K27Me3) ja kapeita piikkejä (H3K4Me1 ja H3K4Me3). Esitämme tässä vain 1 000 suurimman piikin vertailun tulokset, koska tämä on biologisesti kohtuullinen määrä korkean varmuuden omaavia rikastumiskohtia näissä profiileissa. Tämän analyysin yleinen johtopäätös on vankka erilaisilla piikkien kutsumisen kynnysarvoilla (lisätiedosto 2: kuva S11). Kahden piikkisarjan välinen yhteneväisyys mitattiin päällekkäisten piikkien keskimääräisellä osuudella. Kuten kuvasta 6 nähdään, H3K4Me1- ja H3K4Me3-profiileihin perustuvat vertailut tuottivat odotettuja tuloksia, joissa alustan sisäinen yhtenevyys on suurempi kuin alustan välinen yhtenevyys (eli kahden piikkikutsuttajan samasta profiilista tuottamat piikkisarjat ovat yhtenevämpiä kuin kahden piikkikutsuttajan kahdesta profiilista tuottamat piikkisarjat). Alustan sisäinen konkordanssi voi kuitenkin olla yhtä alhainen kuin alustojen välinen konkordanssi analysoitaessa H3K27Me3:n ja CBP:n profiileja, mikä viittaa siihen, että vaihtelu piikkien kutsumisalgoritmeissa voi olla yhtä suurta kuin erilaisten profilointitekniikoiden käyttö joidenkin IP-tekijöiden osalta. Havainto siitä, että nykyiset peak calling -algoritmit tuottavat vähemmän yhteneviä tuloksia ChIP-profiileille, joissa on laajoja alueita (CBP ja H3K27Me3) kuin niille, joissa on teräviä piikkejä (H3K4Me1 ja H3K4Me3), voi viitata siihen, että ne eivät ole yhtä johdonmukaisia tunnistamaan laajoja rikastumisalueita, mikä voi olla mielenkiintoinen jatkotutkimuksen aihe.

ChIP-chip versus ChIP-seq: Oppia kokeelliseen suunnitteluun ja data-analyysiin