CoV2D Browser

1KXQ_1	2EPI_1	4CVM_1	Letter	Amino acid
14	0	16	Q	Glutamine
22	10	24	E	Glutamic acid
22	4	24	T	Threonine
40	12	34	V	Valine
30	7	83	A	Alanine
28	4	29	R	Arginine
31	7	26	D	Aspartic acid
53	5	47	G	Glycine
25	9	60	L	Leucine
12	0	2	C	Cysteine
20	15	13	K	Lycine
21	1	17	P	Proline
35	6	28	S	Serine
19	0	2	W	Tryptophan
19	2	5	Y	Tyrosine
37	3	11	N	Asparagine
9	1	16	H	Histidine
26	8	18	I	Isoleucine
9	3	8	M	Methionine
24	3	12	F	Phenylalanine

1KXQ_1

2EPI_1

4CVM_1

Letter

Amino acid

Glutamine

Glutamic acid

Threonine

Valine

Alanine

Arginine

Aspartic acid

Glycine

Leucine

Cysteine

Lycine

Proline

Serine

Tryptophan

Tyrosine

Asparagine

Histidine

Isoleucine

Methionine

Phenylalanine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
1KXQ , Knot	211	496	0.88	40	266	481	QYAPQTQSGRTSIVHLFEWRWVDIALECERYLGPKGFGGVQVSPPNENIVVTNPSRPWWERYQPVSYKLCTRSGNENEFRDMVTRCNNVGVRIYVDAVINHMCGSGAAAGTGTTCGSYCNPGSREFPAVPYSAWDFNDGKCKTASGGIESYNDPYQVRDCQLVGLLDLALEKDYVRSMIADYLNKLIDIGVAGFRIDASKHMWPGDIKAVLDKLHNLNTNWFPAGSRPFIFQEVIDLGGEAIKSSEYFGNGRVTEFKYGAKLGTVVRKWSGEKMSYLKNWGEGWGFMPSDRALVFVDNHDNQRGHGAGGSSILTFWDARLYKIAVGFMLAHPYGFTRVMSSYRWARNFVNGEDVNDWIGPPNNNGVIKEVTINADTTCGNDWVCEHRWREIRNMVWFRNVVDGQPFANWWDNGSNQVAFGRGNRGFIVFNNDDWQLSSTLQTGLPGGTYCDVISGDKVGNSCTGIKVYVSSDGTAQFSISNSAEDPFIAIHAESKL
2EPI , Knot	50	100	0.76	34	76	94	MIFMRKVVAEVSIIPLGKGASVSKYVKKAIEVFKKYDLKVETNAMGTVLEGDLDEILKAFKEAHSTVLNDVDRVVSSLKIDERKDKENTIERKLKAIGEL
4CVM , Knot	186	475	0.80	40	202	421	MLEPLRLSQLTVALDARLIGEDAVFSAVSTDSRAIGPGELFIALSGPRFDGHDYLAEVAAKGAVAALVEREVADAPLPQLLVRDTRAALGRLGALNRRKFTGPLAAMTGSSGKTTVKEMLASILRTQAGDAESVLATRGNLNNDLGVPLTLLQLAPQHRSAVIELGASRIGEIAYTVELTRPHVAIITNAGTAHVGEFGGPEKIVEAKGEILEGLAADGTAVLNLDDKAFDTWKARASGRPLLTFSLDRPQADFRAADLQRDARGCMGFRLQGVAGEAQVQLNLLGRHNVANALAAAAAAHALGVPLDGIVAGLQALQPVKGRAVAQLTASGLRVIDDSYNANPASMLAAIDILSGFSGRTVLVLGDMGELGSWAEQAHREVGAYAAGKVSALYAVGPLMAHAVQAFGATGRHFADQASLIGALATEDPTTTILIKGSRSAAMDKVVAALCGSSEESHSSVDKLAAALEHHHHHH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

1KXQ , Knot

211

496

0.88

266

481

QYAPQTQSGRTSIVHLFEWRWVDIALECERYLGPKGFGGVQVSPPNENIVVTNPSRPWWERYQPVSYKLCTRSGNENEFRDMVTRCNNVGVRIYVDAVINHMCGSGAAAGTGTTCGSYCNPGSREFPAVPYSAWDFNDGKCKTASGGIESYNDPYQVRDCQLVGLLDLALEKDYVRSMIADYLNKLIDIGVAGFRIDASKHMWPGDIKAVLDKLHNLNTNWFPAGSRPFIFQEVIDLGGEAIKSSEYFGNGRVTEFKYGAKLGTVVRKWSGEKMSYLKNWGEGWGFMPSDRALVFVDNHDNQRGHGAGGSSILTFWDARLYKIAVGFMLAHPYGFTRVMSSYRWARNFVNGEDVNDWIGPPNNNGVIKEVTINADTTCGNDWVCEHRWREIRNMVWFRNVVDGQPFANWWDNGSNQVAFGRGNRGFIVFNNDDWQLSSTLQTGLPGGTYCDVISGDKVGNSCTGIKVYVSSDGTAQFSISNSAEDPFIAIHAESKL

2EPI , Knot

100

0.76

MIFMRKVVAEVSIIPLGKGASVSKYVKKAIEVFKKYDLKVETNAMGTVLEGDLDEILKAFKEAHSTVLNDVDRVVSSLKIDERKDKENTIERKLKAIGEL

4CVM , Knot

186

475

0.80

202

421

MLEPLRLSQLTVALDARLIGEDAVFSAVSTDSRAIGPGELFIALSGPRFDGHDYLAEVAAKGAVAALVEREVADAPLPQLLVRDTRAALGRLGALNRRKFTGPLAAMTGSSGKTTVKEMLASILRTQAGDAESVLATRGNLNNDLGVPLTLLQLAPQHRSAVIELGASRIGEIAYTVELTRPHVAIITNAGTAHVGEFGGPEKIVEAKGEILEGLAADGTAVLNLDDKAFDTWKARASGRPLLTFSLDRPQADFRAADLQRDARGCMGFRLQGVAGEAQVQLNLLGRHNVANALAAAAAAHALGVPLDGIVAGLQALQPVKGRAVAQLTASGLRVIDDSYNANPASMLAAIDILSGFSGRTVLVLGDMGELGSWAEQAHREVGAYAAGKVSALYAVGPLMAHAVQAFGATGRHFADQASLIGALATEDPTTTILIKGSRSAAMDKVVAALCGSSEESHSSVDKLAAALEHHHHHH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
1KXQ_1,2EPI_1	222	3
1KXQ_1,4CVM_1	160	4
2EPI_1,4CVM_1	162	4

Pair

\(Z_2\)

Length of longest common subsequence

1KXQ_1,2EPI_1

222

1KXQ_1,4CVM_1

160

2EPI_1,4CVM_1

162

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	1KXQ_1	2EPI_1	192	113

Status

Protein1

Protein2

d₁/2

Query variables

1KXQ_1

2EPI_1

192

113

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM