Osnovni Boolovi operatorji
so AND, OR in NOT (NOT je tudi unitarni operator). Sprejmejo par argumentov in
jih spremenijo v rezultat.
Sklic
določa celico ali obseg celic na delovnem listu in kaže Microsoft Excelu, kje iskati
vrednosti ali podatke, ki jih želite uporabiti v formuli. S sklici lahko
podatke, ki so v različnih delih delovnega lista, uporabite v eni formuli ali
pa uporabite vrednost ene celice v več formulah. Prav tako se lahko se
sklicujete na celice na drugih listih istega delovnega zvezka in na druge
delovne zvezke. Sklici na celice v drugih delovnih zvezkih se imenujejo
povezave.
Relativni sklici Relativen sklic v formuli, kot je A1,
temelji na relativnem položaju celice, ki vsebuje formulo in celico, na katero
se sklic nanaša. Če se mesto celice, ki vsebuje formulo, spremeni, se spremeni
tudi sklic. Če formulo prekopirate prek vrstic ali prek stolpcev, se sklic
samodejno prilagodi.
Absolutni sklici Absoluten sklic na celico v formuli, kot je $A$1, se
vedno sklicuje na celico na določenem mestu. Če se mesto celice, ki vsebuje
formulo, spremeni, absoluten sklic ostane nespremenjen. Če formulo prekopirate
prek vrstic ali prek stolpcev, se absolutni sklic ne prilagodi. Nove formule
privzeto uporabljajo relativni sklic in jih morate preklopiti na absoluten
sklic.
Mešani sklici Mešani sklic vsebuje ali absoluten
stolpec in relativno vrstico ali absolutno vrstico in relativen stolpec. Sklic
na absoluten stolpec jemlje oblike $A1, $B1 itd. Sklic na absolutno vrstico
jemlje oblike A$1, B$1 itd. Če se položaj celice, ki vsebuje formulo, spremeni,
se relativni sklic spremeni, medtem ko se absolutni sklic ne.
Optimalni začetni nukleotidi
za PCR (določimo jih z GeneRunnerjem)
|
Pri DNA |
Pri RNA |
Dolžina |
18-30 nt |
18-25 nt |
Tm (tališče) |
52- |
55- |
stabilnost |
Nizka vsebnost G |
Zadnji nukleotid G ali C,
vendar ne več zaporednih GC parov |
% GC |
40-60 |
45-55 |
|
Preprečevanje tvorbe nezaželenih sekundarnih
struktur |
|
|
Nekomplementarnost samemu sebi ali drugemu
nukleotidu predvsem na 3' koncu |
|
|
Specifičnost samo za izbrano DNA/RNA |
Frekvenca uporabe genskega
koda. Povezava s koncentracijo specifičnih tRNA. Pomembno za optimalno ekspresijo
rekombinantnih proteinov
Original assumption: if multiple codons for an amino
acid, expect equal frequency of use.
Surprise! Codon use is often highly biased. Eg. E.
coli can use AUA, AUU, or AUC to specify isoleucine; but only
Torej..
če uporabimo AUA za izolevcin v našem rekombinantnem proteinu, je zelo velika
verjetnost, da bomo pri delu neuspešni!
Restrikcijske
mape povejo, katera mesta za restriktaze so prisotna in katerih ni. Posebno
pomembna so mesta, ki nastopajo le enkrat ali dvakrat. Pri večjem številu
encimov (in s tem fragmentov) je za analizo mest potreben zahteven računalniški
program, ki upošteva razgradnjo neznanega zaporedja z več encimi hkrati, potem
pa mora fragmente urediti po zaporedju.
An expressed sequence tag
or EST is a short sub-sequence of a protein-coding DNA
sequence. It was originally intended as a way to identify gene transcripts,
but has since been instrumental in gene discovery and sequence determination.
An EST is produced by one-shot sequencing of a cloned mRNA, and the resulting
sequence is a relatively low quality fragment whose length is limited by
current technology to approximately 500 to 800 nucleotides.
ESTs are also a useful resource for designing probes for DNA
microarrays used to determine gene
expression. (vir: wikipedia)
Uporaba
drsečega okna okno povpreči neke vrednosti v aminokislinskem zaporedju.
Velikost okna je odvisna od vprašanja, ki nas zanima. ( če iščemo
transmembranske vijačnice ki so dolge ~20 AK, uporabimo velikost okna od 5 do 9 AK)
Hidrofobnost
AK zaporedje določa prostorsko strukturo proteinov in hidrofobni efekt je ena
najpomembnejših interakcij, ki so podlaga tvorbe 3D strukture. Fizikalna osnova
je entropijski efekt ureditve topila okoli nepolarnih skupin , s katerimi
topilo ne more tvoriti vodikovih vezi. Hidrofobni profil je pripomoček, s
pomočjo katerega lahko napovemo lastnosti izbranih regij v AK zaporedju.
(primer: najvišja hidrofobnost pogosto sovpada z beta strukturo). Struktura
proteinov
primarna |
nukleotidno zaporedje,
cisteinski mostički |
sekundarna |
α-vijačnica,
β-ploskev |
terciarna |
3D-zvitje ene polipeptidne
verige |
kvartarna |
Kako se več podenot
organizira med sabo |
Programi,
kot je Generunner (in ostala orodja na www.expasy.ch
) vsebujejo algoritme za iskanje določenih predelov v AK zaporedju, ki se zvijejo
v značilne sekundarne strukture:
Algoritem
Chou-Fasman: izmeri težnjo aminokislin, da se nahajajo v določenem tipu
sekundarne strukture.. Podatki za to »težnjo« so bili dobljeni iz statistične
analize vseh takrat znanih 3D struktur proteinov. Algoritem opazuje več
sosednjih AK in če imajo vse podobno težnjo jim pripiše določeno sekundarno
strukturo.
Garnier-Robson:
Temelji na tem, kakšen vpliv ima določena AK, na ostale, bolj oddaljene AK
Sekundarno
strukturo se določa še z: nevronskimi mrežami, na osnovi segmentov znanih
struktur in z vključitvijo nelokalnih interakcij (H vezi med segmenti beta
strukture in alfa vijačnico, na osnovi statistike 3D struktur)
Napovedovanje
transmembranskih regij omogočajo programi (najdeš jih pa na (www.au.expasy.org/tools/#topology):
DAS - Prediction of
transmembrane regions in prokaryotes using the Dense Alignment Surface method
(Stockholm University)
HMMTOP - Prediction of
transmembrane helices and topology of proteins (Hungarian Academy of Sciences)
PredictProtein
- Prediction of transmembrane helix location and topology (Columbia University)
SOSUI
- Prediction of transmembrane regions (TUAT; Tokyo Univ. of Agriculture &
Technology)
TMAP - Transmembrane detection
based on multiple sequence alignment (Karolinska Institut; Sweden)
TMHMM (TM-hiden Markovski
Models) - Prediction
of transmembrane helices in proteins (CBS; Denmark) → tega smo mi uporabljali (definiramo stanja, ki odgovarjajo
bioločki realnosti, recimo TM-regije, notranje ali zunanje zanke; in vsaka AK
ima določeno verjetnost, da se nahaja v enem od teh stanj; recimo za prolin je
najbolj verjetno, da bo v zanki, ker je preokoren za heliks. Določi se
verjetnost prehoda med stanjim uparabimo pa seveda udi bazo proteinov z znanimi
TM-strukturami in te informacije povežemo z utežnimi matrikami)
TMpred
- Prediction of transmembrane regions and protein orientation (EMBnet-CH)
TopPred 2 -
Topology prediction of membrane proteins (Stockholm University)
Program
COILS – na osnovi znanih obvitih vijačnic so pripravili frekvečno pozicijsko
matriko
Faktor
vpliva (IF=impact factor) je številka, ki nam pove kako pomembna je revija,
glede na to, koliko njenih člankov je citiranih v drugih revijah. Večji kot je,
boljša/bolj vplivna je revija. Izračunava jo ISI enkrat na leto po naslednjem
postopku:
The impact factor is calculated by dividing the number of current citations to articles published in the two previous years by the total number of articles published in the two previous years.
Dodajanje
bioloških informacij nukleotidnemu oziroma AK zaporedju v bazah podatkov je
anotacija
Prileganje (alignment) je medsebojna ureditev zaporedij tako,
da se določi korespondenco med posameznimi elementi aminokislinskih ali
nukleotidnih zaporedij
Optimalno
prileganje ustreza največji
podobnosti med zaporedjema.
Iz
podobnosti zaporedij lahko sklepamo na podobnost terciarne strukture in podobno
funkcijo (tudi v različnih organizmih).
PODOBNOST je kvantitativna
oznaka, ki pove, kako podobni sta si zaporedji (lahko v %).
HOMOLOGIJA je kvalitativna
oznaka, ki poudarja evolucijsko povezanost dveh zaporedij (ne moremo recimo reči,
da sta si zaporedji 45% homologni, lahko edino rečemo ali sta ali nista).
V
matriki na mestu, kjer sta znaka enaka naredimo piko. Predeli, kjer sta dve
zaporedji enaki se pokažejo kot črte. Pri nukleinskih kislinah je dosti šuma
(25% naključna verjetnost da sta dve enaki). Matrike izboljšamo z uporabo oken
in s tem odstranimo večino »šuma« (npr. točka le, če je enakih 5 zaporednih
znakov) točkovne matrike tockovne
Rigorozni |
Hevristični |
Vedno izračunajo optimalno
prileganje |
Reševanje problema po
stopnjah (vsak korak je osnova za naslednjega, ki predlaga boljšo rešitev),
vendar ni zagotovila, da najdejo optimalno prileganje |
Časovno zahtevni |
Hitrejši, ker primerjajo
le del potencialnega prileganja |
Needleman-Wunsch, Smith-Waterman |
FASTA, BLAST algoritmi za
prileganje |
Globalno
prileganje – primerja celotno dolžino dveh zaporedij, statistična teorija ocene
prileganja ni poznana, najprimernejše za primerjanje homolognih zaporedij, težko
zazna podobnost mozaičnih proteinov
Lokalno
prileganje – primerja le najbolj podobne predele zaporedij, statistična ocena
kvalitete prileganja, primeren za iskanje podobnih domen
Needleman-Wunsch
je rigorozen algoritem za prileganje zaporedij. Vedno izračuna optimalno
prileganje, zato je časovno zahteven. Vendar pa uporablja dinamično
programiranje. Koraki: inicializacija matrike (začne desno spodaj), sešteje
vrednosti na vseh optimalnih delnih poteh (premika se levo navzgor), povratno
sledi optimalno prileganje (maksimalno število v prvi vrstici in stolpcu). Glej še 8. profesorjevo predavanje z
naslovom Prileganje uaporedij beljakobin in nukleinskih kislin!
Za
izračun podobnosti med zaporedji potrebujemo neko merilo za izračun razdalje
(matrika) matrike zamnejav
Lahko
upoštevamo identiteto, upoštevamo da določeni tipi mutacij nastopajo pogosteje,
upoštevamo minimalno število nukleotidnih zamenjav za AK spremembo, kemijsko
sorodnost, evolucijske zamenjave, prileganje sorodnih proteinov (PAM), prileganje
segmentov sorodnih proteinov (BLOSUM)
Program
ClustalX omogoča prileganje več
zaporedij: najprej primerja pare zaporedij, tvori drevo za vodenje prileganja,
bolj podobna zaporedja si ležijo bližje.
Taka
prileganja uporabimo za tvorbo dreves,
s katerimi ugotavljamo filogenetske odnose med zaporedji (oz. posredno
organizmi). Drevesa so grafi sestavljeni iz vozlov in vej. Delimo jih na
zakoreninjena in nezakoreninjena. Predstavimo jih lahko kot kladogram,
dendrogram, radioalno nezakoreninjeno drevo ali filogram. Drevo lahko vsebuje
še več informacij: če je to čas divergence imamo ultrametrično drevo, če odraža
evolucijske spremembe je to aditivno drevo
Fenetični
pristop – drevo zgradimo na osnovi (fenotipskih) podobnosti podatkov brez
razumevanja evolucijskih mehanizmov
Kladistični
pristop – drevo zgradimo ob upoštevanju različnih možnih evolucijskih poti, med
katerimi izberemo optimalnega – kladogram
HOMOLOGA=dva proteina sta
homologna če imata skupnega prednika, ni pa nujno, da imata isto funkcijo. Homologe
delimo na paraloge in ortologe (in ksenologe):
ORTOLOGA=homologi, ki
nastanejo z razvojem novih vrst (isti prednik, drugačna funkcija)
PARALOGA=homologi, ki
nastanejo z gensko duplikacijo (isti prednik, ista funkcija)
KSENOLOGA=homologi
nastali s horizontalnim prenosom genov (to je takrat kadar se % GC-parov v
zaporedju zelo razlikuje od ostalih genov za proteine v določenem organizmu)
NJ-
zdruzevanje sosedov- vsota dolžin vej je minimalna, sosedje so elementi v
drevesu, ki so povezani preko enega notranjega vozla. Izračunamo dolžino vej za
vse pare i-j, in par z najmanjšo vsoto dolžin vej izberemo za soseda. Nov par
obravnavamo kot en element, nove razdalje izračunamo iz povprečja starih.
Metoda
vezanja – analiziramo, če je topologija drevesa ustrezna tudi za omejen izbor
znakov iz primerjalnih vrst. Iz izvirnih podatkov vzorčimo nove podatke tako,
da stolpci v prileganju ostajajo enaki. Vzorčenje in tvorbo dreves ponovimo
velikokrat in beležimo, kako pogosto se ponovi določena topologija. Pri
bootstrapingu nove podatke kreiramo na osnovi izbora stolpcev s tem, da je
obseg novih podatkov enak kot izhodni in lahko določen stolpec izberemo večkrat
kakšnega pa nikoli.
Molekulo
lahko predstavimo s programi Swiss-PdbViewer, Rasmol, Chime, Cn3D,VRML, MOLMOL,
VMD. Vrste prikazov, če nas zanimajo: predstavitev
Atomi: CPK-model, žična mreža (slaba za proteine), palčke
in kroglice (stick&ball), navidezne vezi
Površine: van der Waalsova, Connolyeva, površina dostopna
topilu ali encimu, izopotencialne (ki imajo enak elektrostatski, lipofilni
potencial ali interakcijsko energijo)
Vezi: predvsem skeletni modeli
Shematsko: trakovi, cilindri
The
result of a structural alignment of two proteins is a superposition of their
atomic coordinate
sets with a minimal root mean square deviation (RMSD) (ja..wtf?
between the two structures. (Wikipedia)
Open
reading frame ORF Je način na katerega lahko beremo zaporedje
V
izoelektrični točki je vsota vseh nabojev posameznih aminokislin v proteinu
enaka nič. Določamo jo z uporabo titracijskih krivulj Koristno jo je poznati pri ločevanju in
čiščenju proteinskih vzorcev.
BLAST
je program s katerim iščemo prileganja med našim danim zaporedjem in vsemi
ostalimi zaporedji v zbirki. Odvisno od vrste zaporedja, ki ga imamo, in od
tega, kako želimo imeti podan rezultat, obstajajo sledeče oblike programa
BLAST:
Ime oblike |
Katero
zaporedje imaš? |
Po kateri
bazi zaporedij išče? |
blastp |
aminokislinsko |
aminokislinsko |
tblastn |
aminokislinsko |
nukleotidno (prevedeno) |
blastx |
nukleotidno (prevedeno) |
aminokislinsko |
blastn |
nukleotidno |
nukleotidno |
tblastx |
nukleotidno (prevedeno) |
nukleotidno (prevedeno) |
E- porazdelitev ekstremne vrednosti. Verjetnost da najdemo zadetek z
rezultatom S je eE. Manjši kot je E, boljše je ujemanje dveh zaporedij.
Rezultat v programu BLAST je odvisen od iskanega zaporedja, zbirke zaporedij ki
jih preiskujemo, uporabljene matrike zamenjav, definirane E vrednosti,
filtriranja predelov z nizko kompleksnostjo, omejitev na organizem oziroma
taksonomsko skupino, parametrov za vrzeli, dolžine besed.. e-vrednost Filtri - Iščemo samo po določenih
organizmih, ne upoštavamo regij z nizko kompleksnost