Abstract
A Cas9/CRISPR hatékonyan képes célzott génbontást és homológ rekombinációt indukálni prokarióta és eukarióta sejtekben egyaránt. Ezért kifejlesztettünk egy útmutató RNS-szekvencia tervezési platformot a Cas9/CRISPR csendesítő rendszerhez modellorganizmusok számára. A platform könnyen használható gRNS-tervezésre a bemeneti lekérdezési szekvenciákkal. PAM segítségével megtalálja a potenciális célpontokat, és rangsorolja őket olyan tényezők alapján, mint az egyediség, az SNP, az RNS másodlagos szerkezete és az AT-tartalom. A platform lehetővé teszi a felhasználók számára, hogy feltöltsék és megosszák kísérleti eredményeiket. Ezen túlmenően a publikált cikkekből származó legtöbb vezető RNS-szekvencia bekerült az adatbázisunkba.
1. Bevezetés
A géntechnológiai technológia mindig is forró téma volt az élettudományi kutatásokban. A génmódosítási technológia fejlődésével bizonyos gének kiiktathatók vagy alacsonyabb szintre csökkenthetők. A cink-ujj nukleáz (ZFN) és a tale nukleáz (TALEN) megjelenése nagymértékben felgyorsította a fejlődést ezen a területen, de hatékonyságuk gyakran kiszámíthatatlan, és nehéz a kiválasztott géneket célba venni .
A közelmúltban a Cas9 / CRISPR-ről beszámoltak, hogy sikeresen indukál célzott génbontást és homológ rekombinációt prokarióta és eukarióta sejtekben egyaránt, nagyobb hatékonysággal, mint a ZFN és a TALEN . Ezenkívül a Cas9 / CRISPR rendszer számára könnyebb a vezető szekvencia tervezése és könnyű a használata. Ez az új technológia nagy lehetőségeket rejt magában mind a kutatási területen, mind a klinikai vizsgálatokban való alkalmazásra.
A Cas9/CRISPR csendesítő rendszer vezető RNS tervezésére azonban nem áll rendelkezésre eszköz. Bár Mali és munkatársai beszámoltak az egyedülálló, a teljes emberi genomot lefedő, több mint 40% emberi exont lefedő útmutató RNS-könyvtár felépítéséről, nem biztosítottak eszközt a kutatók számára új célszekvenciák tervezéséhez más modellorganizmusok számára.
A létező könyvtár nem vette figyelembe a kapcsolódó befolyásoló tényezőket, mint például az SNP, a deléció vagy inszerció a genomban és a lehetséges RNS-szekunder szerkezetet. A gRNS érési folyamatáról alkotott jelenlegi ismereteink szerint a gRNS másodlagos szerkezete döntő fontosságú a Cas9-gRNS komplex számára . A 20 bp vezető RNS-szekvencia a genomokban lévő célhelyhez való kötődésre szolgál. Ha ezek többnyire RNS-hurokban vesznek részt, a célhelyekhez való kötődés hatékonysága alacsony lenne. Ezért ezt a tényezőt figyelembe kell venni. Emellett az interferencia hatékonysága valószínűleg szorosan összefügg a gRNS-DNS hibrid olvadási hőmérsékletével. A viszonylag magas AT-tartalom negatívan korrelál a célponton kívüli hatással, ezért a rendkívül alacsony AT-százalékú szekvencia bizonyos mértékig nem ajánlott .
Ezért kifejlesztettünk egy online platformot a Cas9/CRISPR csendesítő rendszer vezető RNS-tervezéséhez (http://cas9.cbi.pku.edu.cn/), amelybe a DNS-változatokra vonatkozó információkat integráltuk. Ez az eszköz segíti a kutatókat a jelölt vezető RNS-szekvenciák könnyebb megtervezésében, és segítséget nyújt a felhasználóknak a jobb jelöltek kiválasztásában az előzetes eredmények alapján.
2. Anyagok és módszerek
A vezető RNS-szekvenciákat és a hozzájuk tartozó hatékonyságot kézzel gyűjtöttük az irodalomból, és adatbázisunkban tároltuk. A vezető RNS tervezéséhez egy elsősorban 5 lépést tartalmazó Java keretrendszert használtunk, amely Tomcat webszerverhez csatlakozik.
Az első lépésben a program az N20NGG szekvencia-mintázat elve alapján, ahol az NGG a PAM-szekvenciát jelöli, Java reguláris kifejezések illesztését felhasználva keresett meg minden jelölt szekvenciát. A második lépésben a program az összes jelölt szekvenciát egy fasta fájlba helyezné, és futtatná a bowtie 0.12.9-et, hogy ellenőrizze, leképezhetőek-e a kiválasztott modellorganizmus genomjára egyedileg . A bowtie paraméterei a következők voltak: “-f -v 1 -k 10 -l 16 -S”, mivel a “-f” azt mondta a bowtie-nak, hogy a bemenet egy fasta fájl, a “-v 1” csak legfeljebb egy eltérést engedett meg, a “-k 10” legfeljebb 10 jó illeszkedést jelentett, a “-l 16” a mag hosszát 16-ra állította, az “-S” pedig sam formátumot adott ki. Mivel a célrégió hossza csak 23 bp volt, a bowtie alapértelmezett 28-as maghossza nem volt megfelelő ehhez a feladathoz, ezért 16-ra állítottuk be. Úgy gondoltuk, hogy az eltérések száma nagymértékben befolyásolhatja a hatékonyságot, és ez a lépés elsősorban a leképezés egyediségének ellenőrzésére összpontosított, ezért csak a legfeljebb egy eltérést tartalmazó találatokat kerestük, és legfeljebb 10 találatot adtunk ki. A leképezés eredményét Java-ban elemeznénk, majd a harmadik lépésben meghívnánk a tabix 0.2.5-öt, hogy kiderítsük az átfedő SNP-ket vagy indeleket a dbSNP135 szerint, ha a célgenom a humán hg19 lenne. A dbSNP135 vcf fájlt a GATK csomagból töltöttük le. A negyedik lépésben megjósolná az RNS-szekunder struktúrákat ezekre a jelölt gRNS-szekvenciákra a Vienna RNAfold 2.0.7 alapértelmezett paraméterekkel történő hívásával . Az utolsó lépésben a program átrendezte az összes információt a tervezett gRNS-hez, és jobban kinéző HTML-be formázta. A változatok AT%-át és a célrégió 3′ végétől való távolságát is kiszámítottuk. A kimeneti gRNS-eket mind a leképezési találatok száma, mind az átfedő SNP-k száma szerint rendeztük. Ennek a csővezetéknek az időigénye főként a bowtie és néha a tabix futtatása volt, amikor sok célszekvencia létezett, és nagyjából három másodperc volt egy lekérdezési szekvencia esetében.
3. Eredmények és megbeszélés
A kötegelt gRNS-tervezéshez több génszekvencia is megengedett, és ennek a platformnak az áramvonalát az 1. ábra mutatja. Az eredmények tartalmazzák a gRNS-ek és a bennük lévő SNP/INDEL genomikus lókuszok információit. Ez segítené a kutatókat egy egyedibb céljelölt kiválasztásában és az SNP/insertion/deletio elkerülésében. Ezenkívül ez a platform az összes jelöltet értékeli az RNS másodlagos szerkezete és AT-tartalma alapján, lehetővé téve a felhasználók számára, hogy jobb jelölteket válasszanak (2. ábra).
A vezető RNS tervezési platform áramvonalas felépítése. A célszekvenciákat a teljes genomban keresik az egyediség szempontjából, majd ellenőrzik az SNP/indel státuszt. Az eredmények fentről lefelé haladva a több egyedi és kevesebb SNP/indel kimenetelűek. A teljes gRNS másodlagos szerkezetét is megadjuk referenciaként.
A platform működésének bemutatása. A platform felületének áttekintése. (A)-(C) a funkciókat és az adatbázist ábrázolják. (D) a kimeneti szekvenciák sense/antisense és pozícióinformációit ábrázolja a célszekvenciákon. (E) az egyediséget és az SNP/indel státuszt mutatja. (F) az érett gRNS másodlagos szerkezetét ábrázolja.
A közelmúltban Jiang és munkatársai arról számoltak be, hogy csak a PAM közelében lévő első hat bázispárnak van nagy jelentősége a baktériumok felismerési hatékonysága szempontjából. Nem ismert, hogy ez eukarióta vagy akár emlős sejtek esetében is így van-e vagy sem. Folyamatosan frissítjük algoritmusunkat a jelölt gRNS-ek rangsorolásához.
Validálást végeztünk a platformunkban jelentett eredmények felhasználásával olyan tényezőkre, mint az egyediség, az SNP és a hurokban lévő bázis (1. táblázat, a dőlt betűtípus alacsony hatékonyságú célpontokat jelöl). Minél egyedibb, kevesebb SNP-vel és bázissal a hurokban, általában a gRNS hatékonyabb. Az adott PVALB gén esetében az első célszekvencia 50%-kal hatékonyabb, mint a másik kettő, mivel az elsőnek 0 SNP-je van, míg a többinek 3 vagy 2 SNP-je. Az első célszekvencia kevesebb bázispárral vesz részt az RNS másodlagos szerkezetű hurkokban, ami lehetővé teszi, hogy jobban kötődjön a célgenomhoz, míg a másik kettőnek mindkettőnek 9 bázispárja van a hurkokban. Az adott AAVS1 gén esetében az első célszekvencia több mint kétszer olyan hatékony, mint a másik, mivel a másiknak van egy off-target helye a genomban. Az adott VEGFA gén esetében az első körülbelül fele olyan hatékony, mint a másik kettő, mivel 1 SNP-vel rendelkezik, míg a többi nem.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Az ND nem kimutathatót jelent. A dőlt betűtípus alacsony hatékonyságú gRNS-eket jelent ugyanazon géncsoporton belül. |
AT tartalom döntő tényező, mint a korábban említettek, mivel a bizonyíték nem egyértelmű. Ezért itt a felhasználók számára megfontolásként soroljuk fel.
4. Következtetések
Platformunk egy könnyen használható szoftver a potenciálisan hatékony gRNS helyek azonosítására adott szekvenciákon belül modellorganizmusok esetében, elkerülve az off-target hatásokat és SNP-ket. Ez a platform azt is lehetővé teszi a felhasználók számára, hogy meglévő vezető RNS/protospacer szekvenciákat keressenek és megosszák eredményeiket. A legtöbb bejelentett gRNS/protospacer szekvenciát kézzel extraháltuk az adatbázisunkba referenciaként, és az újonnan publikált munkákkal bővíteni fogjuk.
Tájékoztatás
Az online platform, az adatbázis és a dokumentum elérhető a http://cas9.cbi.pku.edu.cn/ címen.
A szerzők hozzájárulása
Ming Ma és Adam Y. Ye egyenlő mértékben járultak hozzá a munkához. Ming Ma fogalmazta meg az ötletet, Adam Y. Ye, Weiguo Zheng pedig a programozást és a weboldal felépítését végezte. Lei Kong felügyelte az egész munkát és iránymutatást adott. Ming Ma, Adam Y. Ye és Lei Kong fogalmazta meg a cikket.