CoV2D Browser

4ZLT_1	8GXM_1	5TNY_1	Letter	Amino acid
23	10	16	D	Aspartic acid
16	16	15	Q	Glutamine
8	13	6	M	Methionine
16	5	9	F	Phenylalanine
17	5	7	Y	Tyrosine
20	5	29	A	Alanine
20	6	25	R	Arginine
7	1	10	N	Asparagine
12	0	0	C	Cysteine
35	22	18	E	Glutamic acid
29	13	25	G	Glycine
18	5	12	H	Histidine
22	15	6	K	Lycine
32	6	19	T	Threonine
4	4	0	W	Tryptophan
16	3	22	I	Isoleucine
42	13	28	L	Leucine
21	3	23	P	Proline
28	5	25	S	Serine
34	4	37	V	Valine

4ZLT_1

8GXM_1

5TNY_1

Letter

Amino acid

Aspartic acid

Glutamine

Methionine

Phenylalanine

Tyrosine

Alanine

Arginine

Asparagine

Cysteine

Glutamic acid

Glycine

Histidine

Lycine

Threonine

Tryptophan

Isoleucine

Leucine

Proline

Serine

Valine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
4ZLT , Knot	173	420	0.83	40	233	400	GPVGEPVASEINEASKVSSRLLTQDILFRKDRQATISLPIKLPVEDIITQTCDKITYGPLKFLDLLEKETAVLPLSTDITCPACLGRAVLVGKWECPAHVAVNESDLTVFGPNKEEHVPQFVTVQQPSDGKMQRLFFAKFLGTEESLAVLRVPGPDGHLCIQEALIHFKELSGAGVCSLWKANDSREEGLEMKQVDCLETTVLENQTCIATTLSKKIYHRLYCGERLMTGGQVSTRVLLTALGFYKRQPYTFHRVPKGMVYVHLIDSGSEDYMEYSECEEVTPGRYEDKQISYTFYTDLFQTADGEPVLASVWGTSGLKDSAYESCAFVIPTDGEEDLVPRRIMSKCYPFRLTYHPSTMTVRLDVRVEKHHGATDQGFVFLKMESGTYSEGREYYLDRVLWGEDSSTNNVLQHHHHHHHH
8GXM , Knot	73	154	0.79	38	109	149	GVTELSDAQKKQLKEQQEMQQMYDMIMQHKRAMQDMQLLWEKAVQQHQHGYDSDEEVDSELGTWEHQLRRMEMDKTREWAEQLTKMGRGKHFIGDFLPPDELEKFMETFKALKEGREPDYSEYKEFKLTVENIGYQMLMKMGWKEGEGLGSEGQ
5TNY , Knot	139	332	0.81	36	177	307	MAVPSPPPASPRSQYNFIADVVEKTAPAVVYIEILDRHPFLGREVPISNGSGFVVAADGLIVTNAHVVADRRRVRVRLLSGDTYEAVVTAVDPVADIATLRIQTKEPLPTLPLGRSADVRQGEFVVAMGSPFALQNTITSGIVSSAQRPARDLGLPQTNVEYIQTDAAIDFGNSGGPLVNLDGEVIGVNTMKVTAGISFAIPSDRLREFLHRGEKKNSSSGISGSQRRYIGVMMLTLSPSILAELQLREPSFPDVQHGVLIHKVILSSPAHRAGLRPGDVILAIGEQMVQNAEDVYEAVRTQSQLAVQIRRGRETLTLYVTPEVTEHHHHHH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

4ZLT , Knot

173

420

0.83

233

400

GPVGEPVASEINEASKVSSRLLTQDILFRKDRQATISLPIKLPVEDIITQTCDKITYGPLKFLDLLEKETAVLPLSTDITCPACLGRAVLVGKWECPAHVAVNESDLTVFGPNKEEHVPQFVTVQQPSDGKMQRLFFAKFLGTEESLAVLRVPGPDGHLCIQEALIHFKELSGAGVCSLWKANDSREEGLEMKQVDCLETTVLENQTCIATTLSKKIYHRLYCGERLMTGGQVSTRVLLTALGFYKRQPYTFHRVPKGMVYVHLIDSGSEDYMEYSECEEVTPGRYEDKQISYTFYTDLFQTADGEPVLASVWGTSGLKDSAYESCAFVIPTDGEEDLVPRRIMSKCYPFRLTYHPSTMTVRLDVRVEKHHGATDQGFVFLKMESGTYSEGREYYLDRVLWGEDSSTNNVLQHHHHHHHH

8GXM , Knot

154

0.79

109

149

GVTELSDAQKKQLKEQQEMQQMYDMIMQHKRAMQDMQLLWEKAVQQHQHGYDSDEEVDSELGTWEHQLRRMEMDKTREWAEQLTKMGRGKHFIGDFLPPDELEKFMETFKALKEGREPDYSEYKEFKLTVENIGYQMLMKMGWKEGEGLGSEGQ

5TNY , Knot

139

332

0.81

177

307

MAVPSPPPASPRSQYNFIADVVEKTAPAVVYIEILDRHPFLGREVPISNGSGFVVAADGLIVTNAHVVADRRRVRVRLLSGDTYEAVVTAVDPVADIATLRIQTKEPLPTLPLGRSADVRQGEFVVAMGSPFALQNTITSGIVSSAQRPARDLGLPQTNVEYIQTDAAIDFGNSGGPLVNLDGEVIGVNTMKVTAGISFAIPSDRLREFLHRGEKKNSSSGISGSQRRYIGVMMLTLSPSILAELQLREPSFPDVQHGVLIHKVILSSPAHRAGLRPGDVILAIGEQMVQNAEDVYEAVRTQSQLAVQIRRGRETLTLYVTPEVTEHHHHHH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
4ZLT_1,8GXM_1	196	4
4ZLT_1,5TNY_1	174	6
8GXM_1,5TNY_1	176	3

Pair

\(Z_2\)

Length of longest common subsequence

4ZLT_1,8GXM_1

196

4ZLT_1,5TNY_1

174

8GXM_1,5TNY_1

176

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	4ZLT_1	8GXM_1	154	103.5

Status

Protein1

Protein2

d₁/2

Query variables

4ZLT_1

8GXM_1

154

103.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM