CoV2D Browser

2ARQ_1	1QAZ_1	3SUF_1	Letter	Amino acid
19	15	4	N	Asparagine
7	8	4	H	Histidine
16	9	4	M	Methionine
22	21	19	V	Valine
15	22	14	R	Arginine
16	12	9	I	Isoleucine
25	18	8	K	Lycine
24	14	3	F	Phenylalanine
14	20	11	P	Proline
18	22	19	T	Threonine
28	35	16	A	Alanine
4	4	5	C	Cysteine
12	16	10	Q	Glutamine
25	23	23	G	Glycine
33	19	20	S	Serine
4	7	2	W	Tryptophan
17	23	7	D	Aspartic acid
39	27	13	L	Leucine
12	18	5	Y	Tyrosine
32	18	7	E	Glutamic acid

2ARQ_1

1QAZ_1

3SUF_1

Letter

Amino acid

Asparagine

Histidine

Methionine

Valine

Arginine

Isoleucine

Lycine

Phenylalanine

Proline

Threonine

Alanine

Cysteine

Glutamine

Glycine

Serine

Tryptophan

Aspartic acid

Leucine

Tyrosine

Glutamic acid

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
2ARQ , Knot	160	382	0.83	40	212	360	MEDLCVANTLFALNLFKHLAKASPTQNLFLSPWSISSTMAMVYMGSRGSTEDQMASVLQFNEVGAAADKIHSSFRSLSSAINASTGNYLLESVNKLFGEKSASFREEYIRLCQKYYSSEPQAVDFLECAEEARKKINSWVKTQTKGKIPNLLPEGSVDGDTRMVLVNAVYFKGKWKTPFEKKLNGLFPFRVNSAQRTPVQMMYLREKLNIGYIEDLKAQILELPYAGDVSMFLLLPDEIADVSTGLELLESEITYDKLNKWTSKDKMAEDEVEVYIPQFKLEEHYELRSILRSMGMEDAFNKGRANFSGMSERNDLFLSEVFHQAMVDVNEEGTEAAAGTGGVMTGRTGHGGPQFVADHPFLFLIMHKITNCILFFGRFSSP
1QAZ , Knot	155	351	0.86	40	218	340	GSHPFDQAVVKDPTASYVDVKARRTFLQSGQLDDRLKAALPKEYDCTTEATPNPQQGEMVIPRRYLSGNHGPVNPDYEPVVTLYRDFEKISATLGNLYVATGKPVYATCLLNMLDKWAKADALLNYDPKSQSWYQVEWSAATAAFALSTMMAEPNVDTAQRERVVKWLNRVARHQTSFPGGDTSCCNNHSYWRGQEATIIGVISKDDELFRWGLGRYVQAMGLINEDGSFVHEMTRHEQSLHYQNYAMLPLTMIAETASRQGIDLYAYKENGRDIHSARKFVFAAVKNPDLIKKYASEPQDTRAFKPGRGDLNWIEYQRARFGFADELGFMTVPIFDPRTGGSATLLAYKP
3SUF , Knot	96	203	0.83	40	143	197	GSHMASMKKKGSVVIVGRINLSGDTAYAQQTRGEEGCQETSQTGRDKNQVEGEVQIVSTATQTFLATSINGVLWTVYHGAGTRTIASPKGPVTQMYTNVDKDLVGWQAPQGSRSLTPCTCGSSDLYLVTRHADVIPVRRRGDSRGSLLSPRPISYLKGSSGGPLLCPAGHAVGIFRAAVCTRGVAKAVAFIPVESLETTMRSP

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

2ARQ , Knot

160

382

0.83

212

360

MEDLCVANTLFALNLFKHLAKASPTQNLFLSPWSISSTMAMVYMGSRGSTEDQMASVLQFNEVGAAADKIHSSFRSLSSAINASTGNYLLESVNKLFGEKSASFREEYIRLCQKYYSSEPQAVDFLECAEEARKKINSWVKTQTKGKIPNLLPEGSVDGDTRMVLVNAVYFKGKWKTPFEKKLNGLFPFRVNSAQRTPVQMMYLREKLNIGYIEDLKAQILELPYAGDVSMFLLLPDEIADVSTGLELLESEITYDKLNKWTSKDKMAEDEVEVYIPQFKLEEHYELRSILRSMGMEDAFNKGRANFSGMSERNDLFLSEVFHQAMVDVNEEGTEAAAGTGGVMTGRTGHGGPQFVADHPFLFLIMHKITNCILFFGRFSSP

1QAZ , Knot

155

351

0.86

218

340

GSHPFDQAVVKDPTASYVDVKARRTFLQSGQLDDRLKAALPKEYDCTTEATPNPQQGEMVIPRRYLSGNHGPVNPDYEPVVTLYRDFEKISATLGNLYVATGKPVYATCLLNMLDKWAKADALLNYDPKSQSWYQVEWSAATAAFALSTMMAEPNVDTAQRERVVKWLNRVARHQTSFPGGDTSCCNNHSYWRGQEATIIGVISKDDELFRWGLGRYVQAMGLINEDGSFVHEMTRHEQSLHYQNYAMLPLTMIAETASRQGIDLYAYKENGRDIHSARKFVFAAVKNPDLIKKYASEPQDTRAFKPGRGDLNWIEYQRARFGFADELGFMTVPIFDPRTGGSATLLAYKP

3SUF , Knot

203

0.83

143

197

GSHMASMKKKGSVVIVGRINLSGDTAYAQQTRGEEGCQETSQTGRDKNQVEGEVQIVSTATQTFLATSINGVLWTVYHGAGTRTIASPKGPVTQMYTNVDKDLVGWQAPQGSRSLTPCTCGSSDLYLVTRHADVIPVRRRGDSRGSLLSPRPISYLKGSSGGPLLCPAGHAVGIFRAAVCTRGVAKAVAFIPVESLETTMRSP

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
2ARQ_1,1QAZ_1	172	4
2ARQ_1,3SUF_1	183	4
1QAZ_1,3SUF_1	179	3

Pair

\(Z_2\)

Length of longest common subsequence

2ARQ_1,1QAZ_1

172

2ARQ_1,3SUF_1

183

1QAZ_1,3SUF_1

179

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	2ARQ_1	1QAZ_1	132	126.5

Status

Protein1

Protein2

d₁/2

Query variables

2ARQ_1

1QAZ_1

132

126.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM