CoV2D Browser

6RNS_1	1YVX_1	1HKX_1	Letter	Amino acid
7	14	5	Q	Glutamine
39	56	9	L	Leucine
6	15	6	F	Phenylalanine
5	34	8	P	Proline
4	9	3	W	Tryptophan
9	25	4	Y	Tyrosine
13	43	9	R	Arginine
4	14	5	N	Asparagine
12	10	9	H	Histidine
15	29	6	K	Lycine
13	51	8	S	Serine
9	40	11	T	Threonine
15	38	7	V	Valine
21	29	13	E	Glutamic acid
13	33	10	G	Glycine
6	23	12	I	Isoleucine
38	54	8	A	Alanine
15	25	8	D	Aspartic acid
5	14	2	C	Cysteine
3	14	4	M	Methionine

6RNS_1

1YVX_1

1HKX_1

Letter

Amino acid

Glutamine

Leucine

Phenylalanine

Proline

Tryptophan

Tyrosine

Arginine

Asparagine

Histidine

Lycine

Serine

Threonine

Valine

Glutamic acid

Glycine

Isoleucine

Alanine

Aspartic acid

Cysteine

Methionine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
6RNS , Knot	111	252	0.81	40	157	239	ARSLLPLSTSLDHRSKEELHQDCLVLATAKHSRELNEDVSADVEERFHLGLFTDRATLYRMIDIEGKGHLENGHPELFHQLMLWKGDLKGVLQTAAERGELTDNLVAMAPAAGYHVWLWAVEAFAKQLCFQDQYVKAASHLLSIHKVYEAVELLKSNHFYREAIAIAKARLRPEDPVLKDLYLSWGTVLERDGHYAVAAKCYLGATCAYDAAKVLAKKGDAASLRTAAELAAIVGEDELSASLALRCAQELL
1YVX , Knot	227	570	0.84	40	257	530	SMSYSWTGALITPCSPEEEKLPINPLSNSLLRYHNKVYCTTSKSASLRAKKVTFDRMQVLDAYYDSVLKDIKLAASKVSARLLTLEEACQLTPPHSARSKYGFGAKEVRSLSGRAVNHIKSVWKDLLEDSQTPIPTTIMAKNEVFCVDPTKGGKKAARLIVYPDLGVRVCEKMALYDVTQKLPQAVMGASYGFQYSPAQRVEFLLKAWAEKKDPMGFSYDTRCFDSTVTERDIRTEESIYQACSLPEEARTAIHSLTERLYVGGPMFNSKGQSCGYRRCRASGVLTTSMGNTITCYVKALAACKAAGIVAPTMLVCGDDLVVISESQGTEEDERNLRAFTEAMTRYSAPPGDPPRPEYDLELITSCSSNVSVALGPQGRRRYYLTRDPTTPIARAAWETVRHSPVNSWLGNIIQYAPTIWVRMVLMTHFFSILMAQDTLDQNLNFEMYGSVYSVSPLDLPAIIERLHGLDAFSLHTYTPHELTRVASALRKLGAPPLRAWKSRARAVRASLISRGGRAAVCGRYLFNWAVKTKLKLTPLPEARLLDLSSWFTVGAGGGDIYHSVSRARPR
1HKX , Knot	76	147	0.86	40	123	143	GPHMTTIEDEDTKVRKQEIIKVTEQLIEAISNGDFESYTKMCDPGMTAFEPEALGNLVEGLDFHRFYFENLWSRNSKPVHTTILNPHIHLMGDESACIAYIRITQYLDAGGIPRTAQSEETRVWHRRDGKWQIVHFHRSGAPSVLPH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

6RNS , Knot

111

252

0.81

157

239

ARSLLPLSTSLDHRSKEELHQDCLVLATAKHSRELNEDVSADVEERFHLGLFTDRATLYRMIDIEGKGHLENGHPELFHQLMLWKGDLKGVLQTAAERGELTDNLVAMAPAAGYHVWLWAVEAFAKQLCFQDQYVKAASHLLSIHKVYEAVELLKSNHFYREAIAIAKARLRPEDPVLKDLYLSWGTVLERDGHYAVAAKCYLGATCAYDAAKVLAKKGDAASLRTAAELAAIVGEDELSASLALRCAQELL

1YVX , Knot

227

570

0.84

257

530

SMSYSWTGALITPCSPEEEKLPINPLSNSLLRYHNKVYCTTSKSASLRAKKVTFDRMQVLDAYYDSVLKDIKLAASKVSARLLTLEEACQLTPPHSARSKYGFGAKEVRSLSGRAVNHIKSVWKDLLEDSQTPIPTTIMAKNEVFCVDPTKGGKKAARLIVYPDLGVRVCEKMALYDVTQKLPQAVMGASYGFQYSPAQRVEFLLKAWAEKKDPMGFSYDTRCFDSTVTERDIRTEESIYQACSLPEEARTAIHSLTERLYVGGPMFNSKGQSCGYRRCRASGVLTTSMGNTITCYVKALAACKAAGIVAPTMLVCGDDLVVISESQGTEEDERNLRAFTEAMTRYSAPPGDPPRPEYDLELITSCSSNVSVALGPQGRRRYYLTRDPTTPIARAAWETVRHSPVNSWLGNIIQYAPTIWVRMVLMTHFFSILMAQDTLDQNLNFEMYGSVYSVSPLDLPAIIERLHGLDAFSLHTYTPHELTRVASALRKLGAPPLRAWKSRARAVRASLISRGGRAAVCGRYLFNWAVKTKLKLTPLPEARLLDLSSWFTVGAGGGDIYHSVSRARPR

1HKX , Knot

147

0.86

123

143

GPHMTTIEDEDTKVRKQEIIKVTEQLIEAISNGDFESYTKMCDPGMTAFEPEALGNLVEGLDFHRFYFENLWSRNSKPVHTTILNPHIHLMGDESACIAYIRITQYLDAGGIPRTAQSEETRVWHRRDGKWQIVHFHRSGAPSVLPH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
6RNS_1,1YVX_1	176	4
6RNS_1,1HKX_1	164	3
1YVX_1,1HKX_1	198	3

Pair

\(Z_2\)

Length of longest common subsequence

6RNS_1,1YVX_1

176

6RNS_1,1HKX_1

164

1YVX_1,1HKX_1

198

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	6RNS_1	1YVX_1	196	139.5

Status

Protein1

Protein2

d₁/2

Query variables

6RNS_1

1YVX_1

196

139.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM