Análise de perfis de DNA de entrada

Para entender as diferenças tecnológicas entre dados ChIP baseados em seqüenciamento e baseados em microarranjos, primeiro analisamos os perfis de fragmentos de DNA reticulados e sonoros (DNA de entrada) gerados por microarranjo (INPUT-chip) e seqüenciamento de alto rendimento (INPUT-seq). Como o perfil de ADN de entrada deve ser independente do anticorpo utilizado para o ChIP, esta comparação pode dar uma ideia das diferenças específicas entre estas duas tecnologias de definição de perfis. Obtivemos dados do INPUT-chip do canal de fundo dos nossos dados de microarranjo de dois canais. Enquanto esta plataforma de microarray utiliza hibridização competitiva, os dois canais do nosso microarray Agilent demonstraram ser relativamente independentes, uma vez que a saturação em ambos os canais é muito rara. De todos os perfis de chip INPUT que extraímos, apresentamos aqui apenas a análise de oito perfis representativos (dois de cada um dos quatro pontos de tempo de desenvolvimento) já que a maioria dos perfis de chip INPUT são muito semelhantes (arquivo adicional 2: Figura S1). Os oito perfis do chip INPUT foram então comparados com os nove perfis INPUT-seq coletados neste estudo (Arquivo adicional 1: Tabela S3).

Uma das observações mais marcantes é que os perfis INPUT-chip e INPUT-seq parecem ser substancialmente diferentes, mesmo que o mesmo material de DNA de entrada tenha sido usado para hibridização e seqüenciamento de microarranjos (Figura 1). A magnitude relativa e a localização dos picos parecem ser consistentes entre os perfis do chip INPUT a partir de múltiplas experiências. Entretanto, os padrões nos nove perfis INPUT-seq parecem ser mais variáveis. Podemos identificar visualmente muitas regiões que têm um enriquecimento de sinal inconsistente através de múltiplos perfis INPUT-seq (destacados na Figura 1a). Uma análise de agrupamento foi realizada para quantificar esta observação. Verificamos que todos os oito perfis de chip INPUT se agruparam de forma muito próxima uns dos outros (Figura 1b). Este resultado mostra que a distribuição de DNA de fundo medida a partir de microarranjo e seqüenciamento de alto rendimento é diferente. Todos os INPUT-chip e sete dos nove perfis INPUT-seq se correlacionaram positivamente com o conteúdo de GC genômico em nível genômico (Figura 1b), bem como em torno dos locais de início de transcrição (TSS) e de fim de transcrição (TES) (Figura 1c). A força da correlação com GC é altamente consistente entre os perfis do chip INPUT, mas altamente variável entre os perfis INPUT-seq (Figura 1b-c e arquivo adicional 2: Figura S2). Notavelmente, os perfis INPUT-seq obtidos em E-16-20 h (E16) e E-20-24 h (E20) não se correlacionam com o conteúdo de GC.

Figure 1
>

>

Comparação dos perfis de DNA de entrada obtidos por tecnologias de microarranjo e seqüenciamento. (a) Uma visão do navegador do genoma dos perfis de DNA de entrada do cromossoma 2R do D. melanogaster em vários estágios de desenvolvimento medidos por microarray (INPUT-chip; azul) e sequenciamento (INPUT-seq; vermelho). (b) Um mapa de calor que resume o coeficiente de correlação Spearman entre cada par dos nove perfis de INPUT-seq e oito INPUT-chip juntamente com o conteúdo de GC em todo o genoma. O número de leituras mapeáveis (em milhões) é escrito ao lado do nome de cada perfil INPUT-seq. (c) Os perfis médios de sinal de INPUT-seq e INPUT-chip em torno de sites de início de transcrição (TSSs) e sites de fim de transcrição (TESs) são amplamente consistentes, e suas variações ao longo dessas regiões genômicas geralmente coincidem com a variação do conteúdo do GC. (d) Geramos 11 perfis adicionais a partir de uma das amostras INPUT-seq (AM) por subamostragem das leituras em diferentes proporções (90%,80%,…,10%,5%,1%). Uma representação sumária do mapa de calor do coeficiente de correlação Spearman entre cada par de perfis INPUT-seq subamostragem e conteúdo GC é mostrada aqui. (e) A relação entre a profundidade do sequenciamento e a cobertura genómica. A curva mostra como a sequência lida subamostragem (isto é, reduzindo a profundidade de sequenciação) afecta a cobertura genómica. A cobertura genômica dos nove conjuntos de dados INPUT-seq e nosso microarray Agilent também são mostrados no gráfico.

>

Amos também notar que INPUT-seq com maior profundidade de seqüenciamento (>4 milhões de leituras mapeadas) tendem a se agrupar mais fortemente do que aqueles com menor profundidade de seqüenciamento, sugerindo que pode haver uma relação entre profundidade de seqüenciamento e variabilidade de DNA de entrada. Para testar esta hipótese, geramos 11 perfis INPUT-seq adicionais através do sequenciamento de subamostragem de leituras da amostra de DNA de entrada mais profundamente sequenciada (AdultMale; AM) em diferentes proporções de amostragem (Figura 1d e arquivo adicional 2: Figura S3). Como esperado, perfis com maior profundidade de seqüenciamento tendem a se agrupar mais fortemente, e sua correlação com a variação do conteúdo de GC é mais consistente. Entretanto, a correlação com o conteúdo de GC só se torna muito mais fraca em uma profundidade de seqüenciamento muito baixa (<2 milhões de leituras; Figura 1d). Isto indica que a baixa profundidade de seqüenciamento não é o único fator que afeta a qualidade INPUT-seq. Além disso, algumas INPUT-seq com profundidade de seqüenciamento relativamente baixa (E0 e AF, <4 milhões de leituras) podem dar perfis de DNA de entrada consistentes. Isto implica que a variabilidade do INPUT-seq também pode ser atribuída a outros factores experimentais. Embora sejam necessários mais estudos para dissecar toda a gama de fatores experimentais que afetam a variabilidade das bibliotecas de DNA de entrada, ela pode ser afetada por variações no preparo da amostra (por exemplo, diferentes preparações de cromatina e sonicação), variação run-to-run do seqüenciador, variação sequenciador a sequenciador para o mesmo modelo, e uma série de outras variáveis nos experimentos. A alta variabilidade entre perfis INPUT-seq é de fato uma questão crítica, já que grande variabilidade contribui para a instabilidade da estimativa da densidade em um perfil ChIP-seq, o que afetará a análise dos dados a jusante. Como será mostrado nas seções subsequentes deste trabalho, um INPUT-seq com correlação anormalmente fraca com o conteúdo de GC pode impactar a construção de perfis médios em locais genômicos importantes. Portanto, é imperativo sequenciar o DNA de entrada com profundidade suficiente e verificar se o perfil obtido é consistente com os de experimentos similares.

A cobertura genômica é outra consideração chave ao escolher entre ChIP-chip e ChIP-seq. A cobertura genómica do ChIP-chip é limitada pelo desenho da sonda de microarranjo, e a cobertura do ChIP-seq depende da profundidade de sequenciação. A cobertura genómica alcançada pelo nosso microarray Agilent é de cerca de 70%. Usando os dados INPUT-seq subamostra, mostramos que o INPUT-seq geralmente fornece uma maior cobertura genômica na profundidade de seqüenciamento, tão baixa quanto um milhão de leituras. Esta tendência construída a partir dos dados subamostragens aleatórias corrobora a cobertura genômica observada dos outros oito conjuntos de dados reais do INPUT-seq (Figura 1e).

Comparação das características dos perfis

Comparamos então as características dos perfis ChIP-chip e ChIP-seq. Para comparar os perfis gerados pelas duas tecnologias, dividimos o genoma em silos não sobrepostos de 1 kb e definimos o nível de enriquecimento em cada silos como a média do log ratio do canal IP sobre o canal de entrada (veja a seção Métodos para detalhes). Referimo-nos a uma distribuição de sinal de um perfil ChIP como a sua distribuição dos valores de enriquecimento de todos os contentores. Em primeiro lugar, o nosso objectivo é caracterizar a relação sinal/ruído média para os perfis gerados pelas duas tecnologias. Como medida da relação sinal/ruído de um perfil, utilizamos a inclinação (truncada) do perfil de densidade de sinal após a remoção dos sinais dos 5% mais altos e mais baixos da distribuição. O enviesamento é uma medida de assimetria de uma distribuição e um enviesamento positivo indica que a cauda do lado direito é mais longa, implicando uma boa relação sinal/ruído. Em quase todos os casos, um perfil ChIP-seq tem uma assimetria maior do que o seu perfil ChIP-chip correspondente da mesma condição biológica (Figura 2 e arquivo adicional 1: Tabela S4). Observamos que a diferença de enviesamento depende do fator IP, que poderia ser devido à diferente qualidade de anticorpos e prevalência de modificação do histórico ou eventos de ligação. A mesma conclusão pode ser tirada mesmo que tenha sido utilizado um tamanho diferente de contentor (Ficheiro Adicional 2: Figura S4). Nossos resultados confirmaram a observação geral de que o ChIP-seq geralmente produz um perfil de sinal mais distinto que o ChIP-chip.

Figure 2

Comparação das características dos perfis ChIP-chip e ChIP-seq. As figuras (a) e (b) resumem o enviesamento das distribuições de sinal de todos os perfis do ChIP-chip e ChIP-seq. Um perfil ChIP com uma boa relação sinal/ruído deve ter uma distribuição de sinal positivamente enviesada (ou seja, enviesamento >0). Uma maior assimetria implica uma melhor relação sinal/ruído. Em quase todos os casos, um perfil ChIP-seq tem maior enviesamento de sinal do que o seu perfil ChIP-chip correspondente. As figuras (c) e (d) mostram as razões do número e largura média das regiões de enriquecimento identificadas pelo ChIP-chip e ChIP-seq usando nossa abordagem heurística (ver a seção Métodos deste trabalho). Em quase todos os casos, podemos identificar picos maiores e mais estreitos num perfil ChIP-seq do que no perfil ChIP-chip correspondente.

Próximo, caracterizamos as regiões de enriquecimento dentro de cada perfil ChIP. Para realizar uma comparação justa, gostaríamos de usar um algoritmo que realiza chamadas de pico nos dados ChIP-seq e ChIP-chip usando os mesmos critérios. Atualmente, muitos algoritmos de chamada de pico comumente usados são projetados especificamente para analisar dados ChIP-chip ou ChIP-seq, mas não ambos. Para superar esta limitação, identificamos picos de ambos os perfis ChIP-chip e ChIP-seq usando o mesmo genoma heurístico de varredura (veja a seção Métodos). Nossos resultados indicam que quase sempre podemos descobrir um número maior de picos e picos mais estreitos usando dados gerados pelo ChIP-seq em comparação com o ChIP-chip ao analisar a mesma amostra biológica, e esta conclusão é consistente independentemente do rigor dos critérios de identificação utilizados (Figura 2 e arquivo adicional 2: Figura S5). Na prática, provavelmente podemos identificar um número ainda maior de picos estreitos nos dados ChIP-seq se fizermos uso explícito de informações específicas de strand dentro do procedimento de chamada de pico (ao lado de apenas deslocar cada leitura para sua extremidade de 5′ por um número constante de pares de base), de modo que a análise atual fornece um limite inferior na eficácia do ChIP-seq em comparação com o ChIP-chip. Em conjunto, os nossos resultados demonstram que o ChIP-seq fornece maior resolução espacial e relação sinal/ruído.

Reprodutibilidade de sinal em todo o genoma dentro e entre tecnologias

Outra, estimamos a reprodutibilidade entre perfis ChIP-chip e/ou ChIP-seq no nível de todo o genoma (contentores de 1 kb). Para evitar vieses devido a diferenças na cobertura genómica e mapeamento de sequências (Figura 1e), excluímos regiões genómicas que não contêm quaisquer sondas de microarranjo e regiões com variabilidade invulgarmente elevada em múltiplos perfis INPUT-seq. O coeficiente de correlação de Pearson, r, foi usado como medida de correlação, uma vez que é mais sensível que o coeficiente de correlação de Spearman para comparar a cauda de duas distribuições de sinal, o que é particularmente importante na análise dos perfis de sinal de enriquecimento de ChIP. A correlação entre pares de replicados ChIP-chip e entre pares de replicados ChIP-seq é geralmente alta (mediana r = 0,85 e 0,82, respectivamente), indicando que ambas as tecnologias podem produzir resultados reprodutíveis. Como esperado, a correlação entre os pares de réplicas dos perfis ChIP-chip e ChIP-seq é mais modesta (mediana r = 0,41; arquivo adicional 1: Tabela S5). Conclusões semelhantes podem ser alcançadas mesmo que utilizemos tamanhos de caixas diferentes para calcular a correlação entre perfis (arquivo adicional 2: Figura S6). Um gráfico representativo de dispersão comparando cada par de tecnologias é mostrado na Figura 3b-d. Observamos também uma correlação positiva entre o enviesamento e a reprodutibilidade entre perfis (arquivo adicional 2: Figura S7), sugerindo que anticorpos mais sensíveis podem produzir perfis mais consistentes entre as duas tecnologias.

Figure 3
>

>

Reprodutibilidade em todo o genoma dentro e entre perfis replicados ChIP-chip e ChIP-seq. (a) A reprodutibilidade em todo o genoma entre dois perfis foi medida pelo coeficiente de correlação de Pearson, r, entre suas intensidades de sinal (em silos de 1 kb). Ambos os perfis ChIP-chip e ChIP-seq possuem alta reprodutibilidade (mediana r≈0.83), enquanto que a reprodutibilidade entre os perfis de replicação ChIP-chip e ChIP-seq é moderada (mediana r≈0.41). Esta figura também mostra um exemplo típico de correlação genómica entre réplicas biológicas de (b) ChIP-chip e ChIP-chip, (c) ChIP-seq e ChIP-seq, e (d) ChIP-chip e ChIP-seq. Uma linha de regressão de splatterplot (LOESS) ponderada localmente é também mostrada em cada um destes gráficos.

Construção do perfil de sinal médio no SST e EST

Construção do perfil de sinal médio do ChIP em torno de características genómicas importantes como o SST e EST é uma forma comum de visualizar o enriquecimento do sinal em torno destas características. Portanto, investigamos a reprodutibilidade de perfis médios de TSS e TES (2 kb acima e 2 kb abaixo) para cada par de perfis ChIP replicados (arquivo adicional 2: Figura S8). Os perfis médios da maioria dos pares de réplicas são altamente consistentes. Entretanto, existem alguns pares que são significativamente diferentes, especialmente os perfis de H3K27Me3 e H3K9Me3 em ambos os estágios E-16-20 h e E-20-24 h (Arquivo adicional 2: Figuras S8c e S8g). Sem validação externa, é impossível determinar se os perfis de sinal médios gerados pelo ChIP-chip ou ChIP-seq são mais precisos. No entanto, duas linhas de evidência nos levaram a acreditar que os perfis médios de sinal do ChIP-chip tinham mais probabilidade de serem mais precisos. Primeiro, todos os três ChIP-chip replicados nesses momentos tinham perfis médios muito consistentes. Em segundo lugar, os perfis de sinal médio do ChIP-seq nestas condições biológicas assemelhavam-se à tendência de variação do conteúdo de GC no EST e ETE (Figura 1c). As correlações anormalmente baixas entre os conteúdos de GC e os perfis INPUT-seq de E-16-20 h e E-20-24 h (Figura 1b e arquivo adicional 2: Figura S2b) nos levaram a supor que a discrepância observada se devia a uma distorção da variação do conteúdo de GC pelos respectivos perfis INPUT-seq. Tanto H3K27Me3 quanto H3K9Me3 são marcas repressivas que normalmente estão esgotadas nos ESTs e ETEs, portanto qualquer variação na subtração de fundo é provavelmente muito mais pronunciada do que outras marcas de histone que têm forte enriquecimento de sinal nessas características genômicas. Para testar nossa hipótese, substituímos o fundo INPUT-seq correspondente pelo INPUT-seq da amostra AdultFemale, uma vez que ele tem a maior correlação com a variação do conteúdo GC. Após a substituição, os perfis médios de sinal gerados pelo ChIP-seq e ChIP-chip nestes dois estágios de desenvolvimento estão de acordo (Figura 4 e arquivo adicional 2: Figura S9). Este resultado é impressionante pois mostra que o uso de diferentes INPUT-seq como controle negativo de um mesmo perfil ChIP-seq pode levar a uma interpretação substancialmente diferente dos dados.

Figure 4

Ilhustração de como a variabilidade em um perfil INPUT-seq pode afetar a reconstrução do perfil de sinal médio no SST e no ETE. O painel superior mostra os perfis de sinal médio no TSS e TES para os perfis ChIP-chip e ChIP-seq de H3K27Me3 na E-16-20 h. Estes perfis ChIP-chip e ChIP-seq diferem substancialmente, e os perfis ChIP-seq assemelham-se aos da variação do conteúdo GC (Figura 1c). Posteriormente reprocessamos a amostra ChIP-seq usando a INPUT-seq em AdultFemale como pano de fundo para normalização, uma vez que este perfil tem uma forte correlação com a variação do conteúdo de GC, que provavelmente reflete os vieses específicos da tecnologia real da nossa plataforma de seqüenciamento. Após este procedimento, os perfis de sinal médio do ChIP-chip e ChIP-seq são muito mais parecidos, indicando que o INPUT-seq original em E-16-20 h não captura apropriadamente a variação específica da tecnologia nestes locais.

Efeito do uso de diferentes perfis de entrada na normalização dos dados do ChIP-seq

Ainda observado o impacto do INPUT-seq na construção dos perfis TSS médios e TES, perguntamos se o uso de diferentes perfis de INPUT-seq para normalização de fundo afeta significativamente os resultados da chamada de pico do ChIP-seq. Usamos SPP para chamar picos para 10 de nossas amostras ChIP-seq (CBP, H3K9Ac, H3K9Me3, H3K27Ac, H3K27Me3 em E16-20 h e E20-24 h) onde cada perfil ChIP foi normalizado contra quatro INPUT-seq diferentes como fundo (a entrada do ponto de tempo correspondente, AdultFemale, AdultMale, e E-4-8 h). Estes perfis INPUT-seq foram escolhidos porque têm profundidade de seqüenciamento e correlação diferentes com o conteúdo de GC (Figura 1b). Uma comparação do número de picos e largura mediana dos picos é mostrada na Figura 5. Observamos uma grande diferença no número de picos sendo chamados para qualquer amostra ChIP-seq quando diferentes INPUT-seq foram usados como fundo. No caso extremo (E-16-24 h, H3K9Me3 ChIP), o número de picos pode variar de zero a quase 40.000 a um FDR de 5% (Figura 5a). Em geral, picos estatisticamente mais significativos (FDR < 0,05) foram detectados ao normalizar contra uma amostra de DNA de entrada profundamente sequenciada (AdultMale e E-4-8 h neste experimento), embora a magnitude absoluta da diferença varie entre os conjuntos de dados ChIP. A diferença no número de picos indica provavelmente uma diferença no poder de detecção. Para cada amostra de ChIP, calculamos a proporção de sobreposição entre cada par de conjuntos de picos gerados por quatro diferentes fundos de ADN de entrada (ou seja, seis comparações por amostra de ChIP). Verificamos que a proporção média de sobreposição em relação ao conjunto de picos menores é de cerca de 95%, indicando que as diferenças no número de picos detectados são provavelmente devidas a diferentes potências para chamar picos mais fracos. Observamos que os picos fortes (ou seja, aqueles com FDR de baixa detecção) foram mais provavelmente detectados em diferentes conjuntos de picos (ver arquivo adicional 2: Figura S10 para um exemplo). A largura mediana dos picos detectados também é afetada pelo uso de diferentes INPUT-seq como fundo (Figura 5b). Esta análise mostrou que a normalização usando diferentes INPUT-seq pode ter um impacto significativo, e subvalorizado, sobre os picos de chamada.

Figure 5

Efeito da normalização com diferentes INPUT-seq sobre os picos de chamada ChIP-seq. Comparamos o número de picos (a) e largura de pico mediana (b) de 10 amostras de ChIP-seq (CBP, H3K9Ac, H3K9Me3, H3K27Ac, H3K27Me3 em E16-20 h e E20-24 h) onde cada uma delas foi normalizada contra quatro amostras diferentes de DNA de entrada (a entrada para a partir do ponto de tempo de correspondência, AdultFemale, AdultMale, e E-4-8 h). A chamada de picos foi realizada com SPP usando os mesmos parâmetros. Claramente a detecção de picos é significativamente afetada pelo uso de diferentes bibliotecas de DNA de entrada como controle de fundo. Em geral, mais picos são identificados como estatisticamente significativos (FDR < 0,05) quando normalizados com uma biblioteca INPUT-seq com maior profundidade de seqüenciamento, embora a magnitude das diferenças varie entre os diferentes conjuntos de dados ChIP.

Variação de variação devido ao uso de diferentes picos de chamada

Uma outra importante fonte de variação na análise dos perfis ChIP-chip e ChIP-seq tem origem no uso de diferentes algoritmos de análise. Um grande número de ferramentas de análise ChIP-chip e ChIP-seq disponíveis publicamente foram desenvolvidas até hoje, e todas elas utilizam diferentes métodos para mudança de tags, normalização de perfis, suavização, identificação de picos e cálculo da taxa de falsas descobertas. Portanto, não é muito surpreendente descobrir que diferentes picos de chamadas podem gerar resultados bastante diferentes em termos de identificação de sites vinculados, particularmente quando se trata de picos com sinais fracos. Usando nosso compêndio de ChIP-chip e conjuntos de dados ChIP-seq, poderíamos avaliar quanta variação na identificação de picos pode ser atribuída ao uso de diferentes tecnologias de perfilagem e ao uso de diferentes picos de chamadas. Neste estudo, nós analisamos nossos perfis de ChIP-chip usando dois picos de chamadas: MA2C e Splitter e analisámos os nossos perfis ChIP-seq utilizando outros dois picos de chamadas: MACS e SPP (ver arquivo adicional 1: Tabela S8). Estes picos de chamadas foram escolhidos porque são amplamente utilizados, disponíveis ao público e geralmente mostram um bom desempenho em estudos comparativos anteriores. Calculamos a sobreposição dos 1.000 picos superiores de quatro dos fatores (CBP, H3K4Me1, H3K4Me3, e H3K27Me3) ao longo de múltiplos estágios de desenvolvimento. Os quatro fatores IP foram escolhidos por serem perfis representativos contendo picos amplos (CBP e H3K27Me3) e picos estreitos (H3K4Me1 e H3K4Me3). Aqui, apresentamos apenas os resultados da comparação dos 1.000 picos superiores, uma vez que este é um número biologicamente razoável de locais de enriquecimento de alta confiança nestes perfis. A conclusão geral desta análise é robusta em relação a uma variedade de limiares de pico de chamada (arquivo adicional 2: Figura S11). A concordância entre dois conjuntos de picos foi medida pela proporção média de picos sobrepostos. Como mostrado na Figura 6, as comparações baseadas nos perfis de H3K4Me1 e H3K4Me3 produziram resultados esperados, nos quais a concordância intraplataforma é maior do que a concordância entre plataformas (ou seja, os conjuntos de picos gerados por dois picos de chamadas no mesmo perfil são mais concordantes do que os conjuntos de picos gerados por dois picos de chamadas em dois perfis). Entretanto, a concordância intraplataforma pode ser tão baixa quanto a concordância inter-plataforma ao analisar os perfis de H3K27Me3 e CBP, implicando que a variação nos algoritmos de chamada de pico pode ser tão grande quanto o uso de diferentes tecnologias de perfilamento para alguns fatores IP. A observação de que os atuais algoritmos de pico de chamada produzem resultados menos concordantes para perfis ChIP com domínios amplos (CBP e H3K27Me3) do que aqueles com picos acentuados (H3K4Me1 e H3K4Me3) pode sugerir que eles são menos consistentes na identificação de regiões de enriquecimento amplo, o que pode ser um assunto interessante para investigação adicional.

>

Figure 6

Variabilidade devido aos algoritmos de pico de chamada. Comparamos a proporção média de picos sobrepostos identificados por dois picos ChIP-seq (vermelho) e dois picos ChIP-chip (azul) para os perfis ChIP-seq e ChIP-chip, respectivamente. Curiosamente, a variação na concordância de identificação de picos devido ao uso de diferentes algoritmos pode ser tão grande quanto as diferenças tecnológicas, o que é especialmente claro na comparação dos perfis CBP e H3K27Me3.

Deixe uma resposta

O seu endereço de email não será publicado.