CoV2D Browser

1ILG_1	1QFY_1	3ZSG_1	Letter	Amino acid
22	17	21	S	Serine
16	16	19	T	Threonine
17	16	25	A	Alanine
6	12	14	N	Asparagine
22	8	15	Q	Glutamine
23	26	23	E	Glutamic acid
15	15	22	I	Isoleucine
15	14	17	P	Proline
6	5	4	C	Cysteine
20	25	16	G	Glycine
40	23	43	L	Leucine
19	14	13	F	Phenylalanine
3	6	5	W	Tryptophan
11	25	22	V	Valine
17	9	19	R	Arginine
12	18	27	D	Aspartic acid
14	4	13	H	Histidine
14	11	10	M	Methionine
17	34	19	K	Lycine
7	10	15	Y	Tyrosine

1ILG_1

1QFY_1

3ZSG_1

Letter

Amino acid

Serine

Threonine

Alanine

Asparagine

Glutamine

Glutamic acid

Isoleucine

Proline

Cysteine

Glycine

Leucine

Phenylalanine

Tryptophan

Valine

Arginine

Aspartic acid

Histidine

Methionine

Lycine

Tyrosine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
1ILG , Knot	139	316	0.84	40	201	300	MKKGHHHHHHGSERTGTQPLGVQGLTEEQRMMIRELMDAQMKTFDTTFSHFKNFRLPGVLSSGCELPESLQAPSREEAAKWSQVRKDLCSLKVSLQLRGEDGSVWNYKPPADSGGKEIFSLLPHMADMSTYMFKGIISFAKVISYFRDLPIEDQISLLKGAAFELCQLRFNTVFNAETGTWECGRLSYCLEDTAGGFQQLLLEPMLKFHYMLKKLQLHEEEYVLMQAISLFSPDRPGVLQHRVVDQLQEQFAITLKSYIECNRPQPAHRFLFLKIMAMLTELRSINAQHTQRLLRIQDIHPFATPLMQELFGITGS
1QFY , Knot	136	308	0.84	40	195	294	QVTTEAPAKVVKHSKKQDENIVVNKFKPKEPYVGRCLLNTKITGDDAPGETWHMVFSTEGEVPYREGQSIGIVPDGIDKNGKPHKLRLYSIASSAIGDFGDSKTVSLCVKRLVYTNDAGEVVKGVCSNFLCDLKPGSEVKITGPVGKEMLMPKDPNATVIMLGTGTGIAPFRSFLWKMFFEKHEDYQFNGLAWLFLGVPTSSSLLYKEEFEKMKEKAPENFRLDFAVSREQVNDKGEKMYIQTRMAQYAEELWELLKKDNTFVYMCGLKGMEKGIDDIMVSLAAKDGIDWIEYKRTLKKAEQWNVEVS
3ZSG , Knot	159	362	0.86	40	224	348	GSHSQERPTFYRQELNKTIWEVPERYQNLSPVGSGAYGSVCAAFDTKTGLRVAVKKLSRPFQSIIHAKRTYRELRLLKHMKHENVIGLLDVFTPARSLEEFNDVYLVTHLMGADLNNIVKCQKLTDDHVQFLIYQILRGLKYIHSADIIHRDLKPSNLAVNEDCELKILDFGLARHTDDEMTGYVATRWYRAPEIMLNWMHYNQTVDIWSVGCIMAELLTGRTLFPGTDHIDQLKLILRLVGTPGAELLKKISSESARNYIQSLTQMPKMNFANVFIGANPLAVDLLEKMLVLDSDKRITAAQALAHAYFAQYHDPDDEPVADPYDQSFESRDLLIDEWKSLTYDEVISFVPPPLDQEEMES

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

1ILG , Knot

139

316

0.84

201

300

MKKGHHHHHHGSERTGTQPLGVQGLTEEQRMMIRELMDAQMKTFDTTFSHFKNFRLPGVLSSGCELPESLQAPSREEAAKWSQVRKDLCSLKVSLQLRGEDGSVWNYKPPADSGGKEIFSLLPHMADMSTYMFKGIISFAKVISYFRDLPIEDQISLLKGAAFELCQLRFNTVFNAETGTWECGRLSYCLEDTAGGFQQLLLEPMLKFHYMLKKLQLHEEEYVLMQAISLFSPDRPGVLQHRVVDQLQEQFAITLKSYIECNRPQPAHRFLFLKIMAMLTELRSINAQHTQRLLRIQDIHPFATPLMQELFGITGS

1QFY , Knot

136

308

0.84

195

294

QVTTEAPAKVVKHSKKQDENIVVNKFKPKEPYVGRCLLNTKITGDDAPGETWHMVFSTEGEVPYREGQSIGIVPDGIDKNGKPHKLRLYSIASSAIGDFGDSKTVSLCVKRLVYTNDAGEVVKGVCSNFLCDLKPGSEVKITGPVGKEMLMPKDPNATVIMLGTGTGIAPFRSFLWKMFFEKHEDYQFNGLAWLFLGVPTSSSLLYKEEFEKMKEKAPENFRLDFAVSREQVNDKGEKMYIQTRMAQYAEELWELLKKDNTFVYMCGLKGMEKGIDDIMVSLAAKDGIDWIEYKRTLKKAEQWNVEVS

3ZSG , Knot

159

362

0.86

224

348

GSHSQERPTFYRQELNKTIWEVPERYQNLSPVGSGAYGSVCAAFDTKTGLRVAVKKLSRPFQSIIHAKRTYRELRLLKHMKHENVIGLLDVFTPARSLEEFNDVYLVTHLMGADLNNIVKCQKLTDDHVQFLIYQILRGLKYIHSADIIHRDLKPSNLAVNEDCELKILDFGLARHTDDEMTGYVATRWYRAPEIMLNWMHYNQTVDIWSVGCIMAELLTGRTLFPGTDHIDQLKLILRLVGTPGAELLKKISSESARNYIQSLTQMPKMNFANVFIGANPLAVDLLEKMLVLDSDKRITAAQALAHAYFAQYHDPDDEPVADPYDQSFESRDLLIDEWKSLTYDEVISFVPPPLDQEEMES

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
1ILG_1,1QFY_1	178	4
1ILG_1,3ZSG_1	189	3
1QFY_1,3ZSG_1	187	5

Pair

\(Z_2\)

Length of longest common subsequence

1ILG_1,1QFY_1

178

1ILG_1,3ZSG_1

189

1QFY_1,3ZSG_1

187

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	1ILG_1	1QFY_1	108	108

Status

Protein1

Protein2

d₁/2

Query variables

1ILG_1

1QFY_1

108

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM