Hyvin polymorfiset RNA-virukset, kuten ihmisen immuunikatoviruksen tyyppi 1 (HIV-1) ja hepatiitti C, esiintyvät yksilöissä heterogeenisten mutta läheisesti sukua olevien genomien kvasilajeina (Martell et al., 1992; Coffin, 1995). Vaikka klonaalisella virussekvensoinnilla voidaan määrittää viruksen kvasilajin yksittäisten jäsenten geneettinen sekvenssi, suoraa PCR-pohjaista ”populaatiopohjaista” sekvensointia käytetään yhä useammin, koska se pystyy havaitsemaan nukleotidisekvenssejä ja on edullisempi. Kun suora PCR-sekvensointi tehdään geneettiselle materiaalille, joka sisältää alleelien sekoituksia, tuloksena saatava sekvenssi sisältää epäselviä nukleotideja, kuten R (A/G) ja M (A/C).

Nukleotidikorvaukset, jotka aiheuttavat aminohappomuutoksen, ovat ei-synonyymejä; ne, jotka eivät aiheuta, ovat synonyymejä. Ei-synonyymien ja synonyymien substituutioiden suhde proteiinia koodaavassa geenissä kuvastaa positiivisen valinnan ja neutraalin evoluution suhteellista vaikutusta. On kehitetty useita menetelmiä synonyymien ja ei-synonyymien substituutioiden lukumäärän arvioimiseksi kahden sekvenssin välillä, ja näihin menetelmiin perustuvia ohjelmia käytetään usein (esim. MEGA (Kumar et al., 2000), SNAP (Korber, 2000)). Nämä ohjelmat jättävät kuitenkin huomiotta koodonit, joissa on alleelisekoituksia.

Koska koodonit, joissa on alleelisekoitusten aiheuttamia epäselviä nukleotideja, ovat todennäköisesti nopeamman evoluution kohteena kuin koodonit, joissa ei ole sekoituksia, kehitimme ohjelman Syn-SCAN, joka laskee synonyymiset ja ei-synonyymiset substituutioluvut geneettiset sekoitukset sisältävän mallin avulla. Tässä mallissa viruspopulaatio, joka sisältää yhden nukleotidin (esim. A) jossakin kohdassa, on evolutiivisesti lähempänä populaatiota, joka sisältää A:n ja toisen nukleotidin sekoituksen (esim. A/G = R) kuin populaatiota, joka sisältää toisen nukleotidin (G). Tällaiset osittaiset erot viittaavat usein siihen, että yksilön sisällä oleva viruspopulaatio on muuttumassa, erityisesti silloin, kun toinen nukleotidi on syntynyt selektiivisen antiretroviraalisen lääkeainepaineen aikana (Wei ym., 1995).

Syn-SCAN edellyttää, että syöttösekvenssit on moninkertaisesti kohdistettu ja sijoitettu sopivaan lukukehykseen. Mahdollisten synonyymien (S) ja ei-synonyymien (N) substituutioiden lukumäärät sekvenssiä kohti lasketaan iteroimalla sekvenssin jokainen koodoni läpi käyttäen hash-taulukkoa, jossa on mahdollisten synonyymien substituutioiden lukumäärä kullekin 64:lle ei-epäselvälle koodonille (kuva 1a). Epäselviä nukleotideja sisältävät koodonit jaetaan komponenttisekoituksiinsa, ja S ja N määritetään laskemalla keskiarvo synonyymisten ja ei-synonyymisten substituutioiden potentiaalista kunkin komponentin osalta.

Kolme tietorakennetta, joita Syn-SCAN käyttää. Taulukossa 1 on 64 merkintää, jotka sisältävät mahdollisten synonyymien substituutioiden lukumäärän kullekin ei-epäselvälle koodonille. Taulukossa 2 on 4096 merkintää, jotka sisältävät synonyymien ja ei-synonyymien muutosten määrän minkä tahansa kahden koodonin välillä. Taulukossa 3 on 225 merkintää, jotka sisältävät nukleotidietäisyyspisteet kunkin epäselvän ja epäselvän nukleotidin välillä. Taulukon 3 sisältöä muutetaan ajon aikana käyttäjän määrittelemien mieltymysten perusteella. syn, synonymous, nonsyn, non-synonymous.

Kahden sekvenssin välisten synonyymisten (Sd) ja ei-synonyymisten (Nd) erojen lukumäärät lasketaan käymällä iteroimalla läpi kaksi sekvenssissä olevaa jokaista linjattua kodoniparia. Kun eroja esiintyy sellaisten koodonien välillä, joista puuttuu moniselitteisiä nukleotideja, synonymian laajuus määritetään käyttämällä hash-taulukkoa, jossa on synonyymien ja ei-synonyymien muutosten määrä minkä tahansa kahden koodonin välillä (kuva 1b). Kun epäselviä nukleotideja sisältävien koodonien välisiä eroja esiintyy, sekä epäselviä että epäselviä nukleotideja sisältävää nukleotidisubstituutiomatriisia (kuva 1c) käytetään muuttamaan kuvan 1b hash-taulukosta saatua synonymian laajuutta.

Synonyymisten (pS) substituutioiden osuus (pS) sekvenssivertailua kohti saadaan jakamalla Sd potentiaalisten synonyymisten kohtien (S) lukumäärällä. Ei-synonyymien (pN) substituutioiden osuus sekvenssivertailua kohti saadaan jakamalla Nd mahdollisten ei-synonyymien kohtien lukumäärällä (N). Synonyymiset (dS) ja ei-synonyymiset etäisyydet (dN) lasketaan soveltamalla Jukes-Cantor-korjausta takaisinmutaatiota varten. Ohjelman tuloste sisältää jokaisen etäisyysmittauksen ja tekstitiedostot, jotka sisältävät dS- ja dN-arvojen matriisit fylogeneettisten ohjelmien analysointiin soveltuvassa muodossa. Syn-SCAN on kirjoitettu Perl-kielellä ja se toimii Windows- ja Unix-ympäristöissä.

Syn-SCAN tuottaa ajoaikana nukleotidisubstituutiomatriisin käyttäjän valitseman painotusjärjestelmän perusteella. Oletuspainotus määrittää kahden epäselvän nukleotidin sekä epäselvän ja ei-epäselvän nukleotidin välille etäisyyden, joka on verrannollinen kunkin nukleotidin epäselvyyden laajuuteen (1–4-kertainen) ja kääntäen verrannollinen yhteisten nukleotidien määrään (eli R ja M jakavat yhden nukleotidin, A). Tätä painotusjärjestelmää suositellaan, koska siinä otetaan huomioon se, että sekoitusten esiintyessä muutos nukleotidipaikassa voi johtua pikemminkin kahden kilpailevan populaation osuuden muutoksesta kuin uudesta mutaatiosta. Tarkastellakseen tuloksia, joita muut ohjelmat, jotka laskevat synonyymisten ja ei-synonyymisten mutaatioiden määriä, tuottaisivat, käyttäjillä on mahdollisuus jättää huomioimatta osittaiset erot.

Syn-SCANista on kaksi online-toteutusta. Ensimmäinen hyväksyy minkä tahansa proteiinia koodaavan geenin sekvenssit. Toinen hyväksyy paritetut HIV-1-sekvenssit, jotka on testattu lääkeresistenssin osalta. Esimerkkiaineistot sekä muut julkaistut sekvenssiaineistot (Condra ym., 1996; Bacheler ym., 2000) osoittavat, että antiretroviraalisen lääkehoidon aikana valitut mutaatiot etenevät välivaiheen läpi, jossa esiintyy sekä villityyppisiä että mutantteja jäämiä. Syn-SCAN tarjoaa geneettisen etäisyyden estimaatteja, joissa tämä välivaihe otetaan huomioon, mikä tekee ohjelmasta ainutlaatuisen työkalun isännänsisäisen virusevoluution kvantitatiivisiin tutkimuksiin.

Vastaa

Sähköpostiosoitettasi ei julkaista.