SLIDE 22 Patterns, Profiles, HMMs, PSI-BLAST
Generalized profiles are an extension of PSSMs
- Generalized profiles can be represented by a finite state automata:
D
n
D M
n-1
M I
31 Patterns, Profiles, HMMs, PSI-BLAST
Excerpt of a generalized profile
ID THIOREDOXIN_2; MATRIX. AC PS50223; DT ? (CREATED); MAY-1999 (DATA UPDATE); ? (INFO UPDATE). DE Thioredoxin-domain (does not find all). MA /GENERAL_SPEC: ALPHABET=’ABCDEFGHIKLMNPQRSTVWYZ’; LENGTH=103; MA /DISJOINT: DEFINITION=PROTECT; N1=6; N2=98; MA /NORMALIZATION: MODE=1; FUNCTION=LINEAR; R1=1.9370; R2=0.01816483; TEXT=’-LogE’; MA /CUT_OFF: LEVEL=0; SCORE=361; N_SCORE=8.5; MODE=1; TEXT=’!’; MA /DEFAULT: D=-20; I=-20; B1=-100; E1=-100; MM=1; MI=-105; MD=-105; IM=-105; DM=-105; M0=-6; MA /I: B1=0; BI=-105; BD=-105; ... many lines deleted ... MA /M: SY=’K’; M=-8,0,-25,1,8,-24,-14,-9,-22,19,-20,-11,0,-9,5,13,-3,-4,-16,-24,-13,6; D=-3; MA /I: I=-3; DM=-16; MA /M: SY=’P’; M=-6,-13,-26,-12,-9,-12,-19,-14,-5,-11,-5,-4,-12,8,-11,-13,-9,-6,-6,-25,-11,-12; MA /M: SY=’V’; M=-4,-22,-19,-24,-20,-2,-25,-21,11,-15,2,3,-20,-23,-17,-14,-9,-1,19,-11,-4,-19; MA /M: SY=’A’; M=28,-7,-15,-13,-6,-20,-2,-15,-15,-6,-14,-11,-5,-12,-6,-11,9,1,-6,-21,-17,-6; MA /M: SY=’P’; M=-6,-3,-27,2,2,-22,-14,-11,-20,-6,-24,-17,-5,25,-4,-11,3,1,-19,-29,-17,-3; MA /M: SY=’W’; M=-16,-27,-41,-28,-21,2,-13,-20,-20,-16,-19,-17,-26,-25,-15,-15,-26,-20,-26,93,19,-15; MA /M: SY=’C’; M=-9,-17,106,-26,-27,-20,-27,-28,-29,-28,-20,-20,-17,-37,-28,-28,-8,-9,-10,-48,-29,-27; MA /M: SY=’G’; M=-4,-12,-31,-9,-9,-27,24,-18,-27,-13,-25,-17,-7,14,-13,-17,-3,-13,-24,-24,-26,-13; MA /M: SY=’H’; M=-12,-10,-30,-8,-4,-14,-18,18,-17,-10,-18,-8,-7,16,-5,-11,-8,-10,-20,-22,-1,-8; MA /M: SY=’C’; M=-9,-19,111,-28,-28,-20,-29,-29,-28,-29,-20,-19,-18,-38,-28,-29,-8,-8,-9,-49,-29,-28; MA /M: SY=’R’; M=-12,-4,-27,-4,3,-22,-20,-2,-21,22,-19,-6,-2,-13,9,23,-9,-8,-16,-20,-6,4; ... many lines deleted ... // 32