BLAST űrlap
A honlapról linkelt általános BLAST űrlapok mostantól közös designt használnak. Az egyes űrlapokon csak a kiválasztott programtípusnak és algoritmusnak megfelelő opciók jelennek meg.
Az űrlap tetején található Enter Query Sequence szakasz (1. ábra) helyet biztosít egy vagy több lekérdezési szekvencia megadására, akár accession vagy gi számmal, akár IUPAC szekvenciaként FASTA formátumban. A támogatott IUPAC karakterek a BLAST súgóban a http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml oldalon találhatók. Az opcionális Query Subrange mezők a keresést a lekérdezési szekvencia egy altartományára korlátozzák. A szekvencia szövegdobozba történő kivágása/beillesztése helyett a lekérdezési szekvencia(k) helyi lemezfájlból is feltölthetők.
Az új Job Title (Munkacím) az a munka neve, amely a Mentett stratégiák és a Legutóbbi eredmények menüpontban, valamint minden BLAST-jelentés tetején megjelenik. A cím megjelenik a jelentés böngészőablakának vagy lapjának címsorában is, valamint a jelentéshez tartozó bármely könyvjelző alapértelmezett címeként. A feladat alapértelmezett címe a lekérdezési szekvencia definíciós sora (FASTA-ban a ‘>’-vel kezdődő sor), de az alapértelmezett cím fölé beírhatja a feladat tetszőleges címét. Ha a bemeneti szekvencia egy accession vagy gi szám, a BLAST webes felület automatikusan megkeresi a definíciós sort a GenBankban az oldal újratöltése nélkül. Ha több szekvencia van jelen, a rendszer megfelelő leíró címet generál (pl. “5 nukleotid szekvencia”).
A BLAST űrlap Choose Search Set szakasza kiválasztja a keresendő BLAST adatbázist, és korlátozó kritériumokat alkalmaz, például organizmus vagy Entrez lekérdezés. A keresés egy adott szervezetre (fajra vagy rendszertani csoportra) korlátozható a tudományos név, a köznév vagy a taxid (a taxon egész számú azonosítója az NCBI taxonómiai adatbázisában) megadásával. Amint a felhasználó beírja az organizmus nevét, a Szervezet beviteli mező a lehetséges kiegészítések legördülő listájával szólítja fel a felhasználót (3. ábra). A felhasználó bármikor megnyomhatja a lefelé nyíl billentyűt a választási lehetőségek listájának görgetéséhez, és/vagy megnyomhatja a Return billentyűt a kiválasztott taxon kiválasztásához. A lista 20 elemre van korlátozva, és fordított sorrendben van rendezve aszerint, hogy az egyes taxonok milyen gyakran szerepelnek a GenBankban, így a leggyakrabban vizsgált organizmusok a lista tetejére kerülnek. Ez az “automatikus kitöltés” funkció egyrészt segíti a felhasználókat abban, hogy tudják, milyen organizmusnevek állnak rendelkezésre, másrészt megelőzi a helyesírási és gépelési hibákat.
A felhasználó a gépelés során javaslatot tesz az organizmusnevek lehetséges kiegészítéseire. A felhasználó lekérdezésének első 20 találata jelenik meg, a találatok a megfelelő organizmusban bárhol megengedettek (pl. a plat megtalálja a “duck billed platypus” kifejezést, még akkor is, ha a “plat” nem szerepel a célszöveg elején). A részleteket lásd a szövegben.
Az egyes BLAST űrlapokon megadott korlátok és egyéb értékek a böngésző munkamenet időtartamára vagy a felhasználó általi visszaállításukig maradnak érvényben. Ha a felhasználó bejelentkezik a My NCBI-ba, akkor ezek az értékek a böngésző munkameneteken keresztül érvényben maradnak.
A nukleotid BLAST űrlapon további keresési beállítások állnak rendelkezésre. A nukleotid adatbázis szakasz három általános választási lehetőséget biztosít: Human genomic + transcript, Mouse genomic + transcript és Other. A genomikus + transzkript adatbázisok csak NCBI referenciaszekvenciákat tartalmaznak. Ezek a szervezetek genomi szekvenciáit és mRNS-eit is tartalmazzák, így mindkét szekvenciatípus megjelenik a kapott jelentésben. Az Egyéb a korábban elérhető adatbázisokat tartalmazza egy legördülő listában. Ha a felhasználó kiválaszt egy adatbázist ebből a listából, az Other automatikusan kiválasztódik.
A genomikus + transzkript adatbázisok megkönnyítik az emberi és egér szekvenciák keresését, és automatikusan megjelenítik a transzkriptek igazítását a genomhoz. A humán és egér adatkészletek egy új gyors indexelt keresési algoritmust használnak, amely négyszeresére csökkenti egy tipikus keresés befejezéséig eltelt időt (Morgulis,A. et al., kézirat előkészítés alatt). Az embertől vagy egerektől eltérő organizmusok kereséséhez egyszerűen ki kell választani egy alternatív adatbázist és egy opcionális organizmus limitet. Egy böngésző munkameneten belül minden BLAST űrlap automatikusan azt az adatbázist választja ki, amelyet a felhasználó utoljára kiválasztott, így az alternatív adatbázist csak egyszer kell kiválasztani.
A BLAST űrlap Program Selection szakasza kiválasztja a kereséshez és az illesztéshez használt algoritmust. Nukleotid keresés esetén a megablast (alapértelmezett), discontiguous megablast és blastn választható. Fehérjekeresés esetén a lehetőségek a blastp (alapértelmezett), a PSI-BLAST és a PHI-BLAST. Az ehhez a szakaszhoz tartozó súgó link a BLAST programválasztási útmutatóhoz vezet, amely ismerteti az algoritmusokat és a köztük való választás kritériumait.
Az űrlapnak ezen a pontján a legtöbb felhasználó egyszerűen megnyomja a BLAST gombot egy új keresés elindításához. A BLAST korábban alapértelmezés szerint új ablakban nyitotta meg az eredményeket, amit sok felhasználó idegesítőnek és zavarónak talált. Az új alapértelmezett viselkedés szerint az eredmények ugyanabban az ablakban jelennek meg, mint az űrlap (és így helyettesítik az űrlapot). A felhasználó a BLAST gomb melletti jelölőnégyzet bejelölésével kérheti az eredmények új ablakban történő megjelenítését.
A kiválasztott program hangolásának részletes paraméterei továbbra is az űrlapon maradnak, de mostantól az Algoritmus paraméterei című link alá vannak összezsugorítva, mivel a felhasználóknak csak egy elenyésző hányada használja őket. A linkre kattintva megjelennek a paramétervezérlők. Természetesen a linkre való kattintás után a paraméterek a böngésző munkamenet hátralévő részében láthatóak maradnak. Ezek a paraméterek a kiválasztott algoritmustól függően változnak.
A nukleotid űrlapon az elérhető algoritmusok a megablast, a discontiguous megablast és a blastn. A megablast kiválasztása nagy szóméretet választ (jelenleg 28), és a jutalmat és a büntetést (1 és -2) körülbelül 95%-os azonosságú igazításokhoz optimalizálja (3). A discontiguous megablast és a blastn paraméterei jobban megfelelnek a fajok közötti összehasonlításhoz, kisebb szómérettel (11), valamint jutalom és büntetés (2, -3) kiválasztásával, amelyek körülbelül 85%-os azonosságú illesztésekre optimalizálnak (3).
A fehérjeformában a blastp, PSI-BLAST és PHI-BLAST választható. A blastp helyett a PSI-BLAST kiválasztása több célszekvenciát jelenít meg, és lehetővé teszi a felhasználó számára, hogy a következő PSI-BLAST iterációhoz kiválasztott szekvenciákból felépítse a PSSM-et. Mindkét esetben “feltételes kompozíciós pontszámmátrix-beállításokat” (4) használunk. A PHI-BLAST nem támogatja a kompozíciós kiigazításokat, ezért a PHI-BLAST kiválasztása esetén az opció eltűnik.
Egy új, fejlett funkcióval bővült: a BLAST mostantól felismeri a rövid bemeneti szekvenciákat a nukleotid és fehérje keresési formákhoz, és beállítja a paramétereket, hogy javítsa a releváns egyezések megtalálásának esélyét. Rövid szekvenciák esetén (legfeljebb 30 maradék fehérjék esetében, 50 bázis nukleotidok esetében) a BLAST mostantól automatikusan csökkenti a szóméretet (nukleotidok esetében hétre, fehérjék esetében kettőre), növeli a várható értéket (1000-re), és kikapcsolja az alacsony komplexitású szűrést. Ezenkívül a fehérjéknél a PAM30 pontozási mátrixot használja a rövid szekvenciákhoz, ahogy azt Altschul javasolta (5). Ez a funkció kikapcsolható az űrlap Algorithm Parameters (Algoritmus paraméterek) részében.