CoV2D Browser

5PZK_1	2VSI_1	9KGZ_1	Letter	Amino acid
31	15	5	G	Glycine
38	18	13	T	Threonine
23	7	0	Y	Tyrosine
48	10	4	S	Serine
57	14	7	A	Alanine
27	15	23	E	Glutamic acid
15	7	6	F	Phenylalanine
13	5	0	M	Methionine
30	9	3	P	Proline
10	1	1	W	Tryptophan
35	17	4	V	Valine
42	9	0	R	Arginine
12	7	0	H	Histidine
59	19	16	L	Leucine
18	8	0	Q	Glutamine
23	28	12	I	Isoleucine
30	17	24	K	Lycine
16	8	4	N	Asparagine
26	20	3	D	Aspartic acid
21	2	0	C	Cysteine

5PZK_1

2VSI_1

9KGZ_1

Letter

Amino acid

Glycine

Threonine

Tyrosine

Serine

Alanine

Glutamic acid

Phenylalanine

Methionine

Proline

Tryptophan

Valine

Arginine

Histidine

Leucine

Glutamine

Isoleucine

Lycine

Asparagine

Aspartic acid

Cysteine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
5PZK , Knot	230	574	0.84	40	278	537	MSMSYTWTGALITPCAAEETKLPINALSNSLLRHHNLVYATTSRSASLRQKKVTFDRLQVLDDHYRDVLKEMKAKASTVKAKLLSVEEACKLTPPHSARSKFGYGAKDVRNLSSKAVNHIRSVWKDLLEDTETPIDTTIMAKNEVFCVQPEKGGRKPARLIVFPDLGVRVCEKMALYDVVSTLPQAVMGSSYGFQYSPGQRVEFLVNAWKAKKCPMGFAYDTRCFDSTVTENDIRVEESIYQCCDLAPEARQAIRSLTERLYIGGPLTNSKGQNCGYRRCRASGVLTTSCGNTLTCYLKAAAACRAAKLQDCTMLVCGDDLVVICESAGTQEDEASLRAFTEAMTRYSAPPGDPPKPEYDLELITSCSSNVSVAHDASGKRVYYLTRDPTTPLARAAWETARHTPVNSWLGNIIMYAPTLWARMILMTHFFSILLAQEQLEKALDCQIYGACYSIEPLDLPQIIQRLHGLSAFSLHSYSPGEINRVASCLRKLGVPPLRVWRHRARSVRARLLSQGGRAATCGKYLFNWAVRTKLKLTPIPAASQLDLSSWFVAGYSGGDIYHSLSRARPRWFM
2VSI , Knot	106	236	0.81	40	158	226	HMIYAGILAGGTGTRMGISNLPKQFLELGDRPILIHTIEKFVLEPSIEKIVVGVHGDWVSHAEDLVDKYLPLYKERIIITKGGADRNTSIKNIIEAIDAYRPLTPEDIVVTHDSVRPFITLRMIQDNIQLAQNHDAVDTVVEAVDTIVESTNGQFITDIPNRAHLYQGQTPQTFRCKDFMDLYGSLSDEEKEILTDACKIFVIKGKDVALAKGEYSNLKITTVTDLKIAKSMIEKD
9KGZ , Knot	52	125	0.67	28	68	112	KKIKLNIKEFKATAEGLSPEEKELWDKFAEKLKAELNNKIINLGEKIEIEEELKTPTKSIKITFSLELVSEDTFKATLKLEIKGKETIVEEETVEFKAGETVKLTIKLPDGKTFTLELKLEATKI

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

5PZK , Knot

230

574

0.84

278

537

MSMSYTWTGALITPCAAEETKLPINALSNSLLRHHNLVYATTSRSASLRQKKVTFDRLQVLDDHYRDVLKEMKAKASTVKAKLLSVEEACKLTPPHSARSKFGYGAKDVRNLSSKAVNHIRSVWKDLLEDTETPIDTTIMAKNEVFCVQPEKGGRKPARLIVFPDLGVRVCEKMALYDVVSTLPQAVMGSSYGFQYSPGQRVEFLVNAWKAKKCPMGFAYDTRCFDSTVTENDIRVEESIYQCCDLAPEARQAIRSLTERLYIGGPLTNSKGQNCGYRRCRASGVLTTSCGNTLTCYLKAAAACRAAKLQDCTMLVCGDDLVVICESAGTQEDEASLRAFTEAMTRYSAPPGDPPKPEYDLELITSCSSNVSVAHDASGKRVYYLTRDPTTPLARAAWETARHTPVNSWLGNIIMYAPTLWARMILMTHFFSILLAQEQLEKALDCQIYGACYSIEPLDLPQIIQRLHGLSAFSLHSYSPGEINRVASCLRKLGVPPLRVWRHRARSVRARLLSQGGRAATCGKYLFNWAVRTKLKLTPIPAASQLDLSSWFVAGYSGGDIYHSLSRARPRWFM

2VSI , Knot

106

236

0.81

158

226

HMIYAGILAGGTGTRMGISNLPKQFLELGDRPILIHTIEKFVLEPSIEKIVVGVHGDWVSHAEDLVDKYLPLYKERIIITKGGADRNTSIKNIIEAIDAYRPLTPEDIVVTHDSVRPFITLRMIQDNIQLAQNHDAVDTVVEAVDTIVESTNGQFITDIPNRAHLYQGQTPQTFRCKDFMDLYGSLSDEEKEILTDACKIFVIKGKDVALAKGEYSNLKITTVTDLKIAKSMIEKD

9KGZ , Knot

125

0.67

112

KKIKLNIKEFKATAEGLSPEEKELWDKFAEKLKAELNNKIINLGEKIEIEEELKTPTKSIKITFSLELVSEDTFKATLKLEIKGKETIVEEETVEFKAGETVKLTIKLPDGKTFTLELKLEATKI

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
5PZK_1,2VSI_1	190	3
5PZK_1,9KGZ_1	236	3
2VSI_1,9KGZ_1	142	4

Pair

\(Z_2\)

Length of longest common subsequence

5PZK_1,2VSI_1

190

5PZK_1,9KGZ_1

236

2VSI_1,9KGZ_1

142

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	5PZK_1	2VSI_1	205	141.5

Status

Protein1

Protein2

d₁/2

Query variables

5PZK_1

2VSI_1

205

141.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM