Структура записи последовательности

 

Записи в базе данных SWISS-PROT структурированы так, чтобы их могли использовать как читатели, так и компьютерные программы. Объяснения, описания, классификации и другие комментарии на обычном английском языке. Везде, где возможно, используются символы, знакомые биохимикам, белковым химикам и молекулярным биологам.

Каждая запись последовательности состоит из строк. Различные типы линий, каждая со своим собственным форматом, используются для записи различных данных, которые составляют запись.

 

ID GRAA_HUMAN STANDARD; PRT; 262 AA.

AC P12544;

DT 01-OCT-1989 (Rel. 12, Created)

DT 01-OCT-1989 (Rel. 12, Last sequence update)

DT 15-DEC-1998 (Rel. 37, Last annotation update)

DE GRANZYME A PRECURSOR (EC 3.4.21.78) (CYTOTOXIC T-LYMPHOCYTE PROTEINASE

DE 1) (HANUKKAH FACTOR) (H FACTOR) (HF) (GRANZYME 1) (CTL TRYPTASE)

DE (FRAGMENTIN 1).

GN GZMA OR CTLA3 OR HFSP.

OS Homo sapiens (Human).

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;

OC Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo.

RN [1]

RP SEQUENCE FROM N.A.

RC TISSUE=T-cell;

RX MEDLINE; 88125000.

RA Gershenfeld H.K., Hershberger R.J., Shows T.B., Weissman I.L.;

RT "Cloning and chromosomal assignment of a human cDNA encoding a T

RT cell- and natural killer cell-specific trypsin-like serine

RT protease.";

RL Proc. Natl. Acad. Sci. U.S.A. 85:1184-1188(1988).

RN [2]

RP SEQUENCE OF 29-53.

RX MEDLINE; 88330824.

RA Poe M., Bennett C.D., Biddison W.E., Blake J.T., Norton G.P.,

RA Rodkey J.A., Sigal N.H., Turner R.V., Wu J.K., Zweerink H.J.;

RT "Human cytotoxic lymphocyte tryptase. Its purification from granules

RT and the characterization of inhibitor and substrate specificity.";

RL J. Biol. Chem. 263:13215-13222(1988).

RN [3]

RP SEQUENCE OF 29-40, AND CHARACTERIZATION.

RX MEDLINE; 89009866.

RA Hameed A., Lowrey D.M., Lichtenheld M., Podack E.R.;

RT "Characterization of three serine esterases isolated from human IL-2

RT activated killer cells.";

RL J. Immunol. 141:3142-3147(1988).

RN [4]

RP SEQUENCE OF 29-39, AND CHARACTERIZATION.

RX MEDLINE; 89035468.

RA Kraehenbuhl O., Rey C., Jenne D.E., Lanzavecchia A., Groscurth P.,

RA Carrel S., Tschopp J.;

RT "Characterization of granzymes A and B isolated from granules of

RT cloned human cytotoxic T lymphocytes.";

RL J. Immunol. 141:3471-3477(1988).

RN [5]

RP 3D-STRUCTURE MODELING.

RX MEDLINE; 89184501.

RA Murphy M.E.P., Moult J., Bleackley R.C., Gershenfeld H.,

RA Weissman I.L., James M.N.G.;

RT "Comparative molecular model building of two serine proteinases from

RT cytotoxic T lymphocytes.";

RL Proteins 4:190-204(1988).

CC -!- FUNCTION: THIS ENZYME IS NECESSARY FOR TARGET CELL LYSIS IN CELLCC

MEDIATED IMMUNE RESPONSES. IT CLEAVES AFTER LYS OR ARG. MAY BE

CC INVOLVED IN APOPTOSIS.

CC -!- CATALYTIC ACTIVITY: HYDROLYSIS OF PROTEINS, INCLUDING FIBRONECTIN,

CC TYPE IV COLLAGEN AND NUCLEOLIN. PREFERENTIAL CLEAVAGE: ARG-|-XAA,

CC LYS-|-XAA >> PHE-|-XAA IN SMALL MOLECULE SUBSTRATES.

CC -!- SUBUNIT: HOMODIMER, DISULFIDE-LINKED.

CC -!- SUBCELLULAR LOCATION: CYTOPLASMIC GRANULES.

CC -!- SIMILARITY: BELONGS TO PEPTIDASE FAMILY S1; ALSO KNOWN AS THE

CC TRYPSIN FAMILY. STRONGEST TO OTHER GRANZYMES AND TO MAST CELL

CC PROTEASES.

CC --------------------------------------------------------------------------

CC This SWISS-PROT entry is copyright. It is produced through a collaboration CC between the Swiss Institute of Bioinformatics and the EMBL outstation - CC the European Bioinformatics Institute. There are no restrictions on its CC use by non-profit institutions as long as its content is in no way CC modified and this statement is not removed. Usage by and for commercial CC entities requires a license agreement (See http://www.isb-sib.ch/announce/

CC or send an email to license@isb-sib.ch). CC --------------------------------------------------------------------------

DR EMBL; M18737; AAA52647.1; -.

DR PIR; A28943; A28943.

DR PIR; A30525; A30525.

DR PIR; A30526; A30526.

DR PIR; A31372; A31372.

DR PDB; 1HF1; 15-OCT-94.

DR MIM; 140050; -.

DR INTERPRO; IPR001254; -.

DR PFAM; PF00089; trypsin; 1.

DR PROSITE; PS00134; TRYPSIN_HIS; 1.

DR PROSITE; PS00135; TRYPSIN_SER; 1.

KW Hydrolase; Serine protease; Zymogen; Signal; T-cell; Cytolysis;

KW Apoptosis; 3D-structure.

FT SIGNAL 1 26

FT PROPEP 27 28 ACTIVATION PEPTIDE.

FT CHAIN 29 262 GRANZYME A.

FT ACT_SITE 69 69 CHARGE RELAY SYSTEM (BY SIMILARITY).

FT ACT_SITE 114 114 CHARGE RELAY SYSTEM (BY SIMILARITY).

FT ACT_SITE 212 212 CHARGE RELAY SYSTEM (BY SIMILARITY).

FT DISULFID 54 70 BY SIMILARITY.

FT DISULFID 148 218 BY SIMILARITY.

FT DISULFID 179 197 BY SIMILARITY.

FT DISULFID 208 234 BY SIMILARITY.

FT CARBOHYD 170 170 N-LINKED (GLCNAC...) (POTENTIAL).

SQ SEQUENCE 262 AA; 28968 MW; DA87363A0D92BAF4 CRC64;

MRNSYRFLAS SLSVVVSLLL IPEDVCEKII GGNEVTPHSR PYMVLLSLDR KTICAGALIA

KDWVLTAAHC NLNKRSQVIL GAHSITREEP TKQIMLVKKE FPYPCYDPAT REGDLKLLQL

TEKAKINKYV TILHLPKKGD DVKPGTMCQV AGWGRTHNSA SWSDTLREVN ITIIDRKVCN

DRNHYNFNPV IGMNMVCAGS LRGGRDSCNG DSGSPLLCEG VFRGVTSFGL ENKCGDPRGP

GVYILLSKKH LNWIIMTIKG AV

//

Каждая строка начинается с двухсимвольного кода строки, который указывает тип данных, содержащихся в строке. Текущие типы строк и коды строк, а также порядок их появления в записи показаны в таблице ниже.

 

 

Как показано в приведенной выше таблице, некоторые типы линий присутствуют во всех записях, другие являются необязательными. Некоторые типы линий встречаются много раз в одной записи. Каждая запись должна начинаться с строки идентификации (ID) и заканчиваться строкой терминатора (//).

Подробное описание каждого типа линии приведено в следующем разделе этого документа. Следует отметить, что, за исключением GN, все типы линий SWISS-PROT существуют в базе данных EMBL. Двухсимвольный код типа строки, начинающийся с каждой строки, всегда сопровождается тремя пробелами, так что фактическая информация начинается с шестого символа. Информация не распространяется за пределы позиции символа 75, за исключением одного исключения, строки CC, содержащие тему «БАЗА ДАННЫХ»

 

 

СПИСОК ЛИТЕРАТУРЫ

 

1. Bairoch, A. Apweiler, R. The SWISS-PROT Protein Sequence Data Bank and Its New Supplement TREMBL / Nucleic Acids Research, Volume 24, Issue 1, 1 January 1996, Pages 21–25.

2. Bairoch, A. Apweiler, R. Тhe swiss-prot protein sequence database user manual. May 2000

3. Boutet, Е., Lieberherr, D Et al UniProtKB/Swiss-Prot The Manually Annotated Section of the UniProt Knowledge Base // Methods in Molecular Biology, vol. 406: Plant Bioinformatics: Methods and Protocols. January 2007.   

4. Gasteiger, E, Jung, E., Bairoch, A SWISS-PROT: Connecting Biomolecular Knowledge Via a Protein Database // Curr. Issues Mol. Biol. (2001) 3(3): 47-55.

5. O’Donovan, C. Martin, MJ Et al. High-quality protein knowledge resource: SWISS-PROT and TrEMBL // Briefings in Bioinformatics. vol 3. no 3. 275–284. september 2002

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: