CoV2D Browser

8XRA_1	1XTZ_1	4JLM_1	Letter	Amino acid
10	1	7	W	Tryptophan
14	11	12	H	Histidine
22	21	13	I	Isoleucine
43	21	28	L	Leucine
19	10	11	P	Proline
32	17	28	S	Serine
17	11	12	F	Phenylalanine
36	7	15	T	Threonine
17	21	11	A	Alanine
19	11	13	R	Arginine
43	22	13	G	Glycine
36	21	17	K	Lycine
12	1	7	M	Methionine
25	20	11	D	Aspartic acid
12	9	13	Q	Glutamine
40	12	13	N	Asparagine
12	2	2	C	Cysteine
41	17	29	E	Glutamic acid
19	7	12	Y	Tyrosine
28	22	13	V	Valine

8XRA_1

1XTZ_1

4JLM_1

Letter

Amino acid

Tryptophan

Histidine

Isoleucine

Leucine

Proline

Serine

Phenylalanine

Threonine

Alanine

Arginine

Glycine

Lycine

Methionine

Aspartic acid

Glutamine

Asparagine

Cysteine

Glutamic acid

Tyrosine

Valine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
8XRA , Knot	199	497	0.82	40	248	466	DQICIGYHANNSTETVDTILERNVTVTHAKDILEKTHNGKLCKLNGIPPLELGDCSIAGWLLGNPECDRLLSVPEWSYIMEKENPRDGLCYPGSFNDYEELKHLLSSVKHFEKVKILPKDRWTQHTTTGGSRACAVSGNPSFFRNMVWLTKKGSNYPVAKGSYNNTSGEQMLIIWGVHHPNDETEQRTLYQNVGTYVSVGTSTLNKRSTPDIATRPKVNGLGSRMEFSWTLLDMWDTINFESTGNLIAPEYGFKISKRGSSGIMKTEGTLENCETKCQTPLGAINTTLPFHNVHPLTIGECPKYVKSEKLVLATGLRNVPQIESRGLFGAIAGFIEGGWQGMVDGWYGYHHSNDQGSGYAADKESTQKAFDGITNKVNSVIEKMNTQFEAVGKEFSNLERRLENLNKKMEDGFLDVWTYNAELLVLMENERTLDFHDSNVKNLYDKVRMQLRDNVKELGNGCFEFYHKCDDECMNSVKNGTYDYPKYEEESKLNRNE
1XTZ , Knot	113	264	0.79	40	155	250	MAAGVPKIDALESLGNPLEDAKRAAAYRAVDENLKFDDHKIIGIGSGSTVVYVAERIGQYLHDPKFYEVASKFICIPTGFQSRNLILDNKLQLGSIEQYPRIDIAFDGADEVDENLQLIKGGGACLFQEKLVSTSAKTFIVVADSRKKSPKHLGKNWRQGVPIEIVPSSYVRVKNDLLEQLHAEKVDIRQGGSAKAGPVVTDNNNFIIDADFGEISDPRKLHREIKLLVGVVETGLFIDNASKAYFGNSDGSVEVTEKHHHHHH
4JLM , Knot	126	280	0.84	40	186	268	MGSSHHHHHHSSGLVPRGSHMATPPKRSSPSFSASSEGTRIKKISIEGNIAAGKSTFVNILKQLSEDWEVVPEPVARWSNVQSTQDEFEELTMEQKNGGNVLQMMYEKPERWSFTFQTYACLSRIRAQLASLNGKLKDAEKPVLFFERSVYSDRYIFASNLYESESMNETEWTIYQDWHDWMNNQFGQSLELDGIIYLQATPETCLHRIYLRGRNEEQGIPLEYLEKLHYKHESWLLHRTLKTNFDYLQEVPILTLDVNEDFKDKYESLVEKVKEFLSTL

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

8XRA , Knot

199

497

0.82

248

466

DQICIGYHANNSTETVDTILERNVTVTHAKDILEKTHNGKLCKLNGIPPLELGDCSIAGWLLGNPECDRLLSVPEWSYIMEKENPRDGLCYPGSFNDYEELKHLLSSVKHFEKVKILPKDRWTQHTTTGGSRACAVSGNPSFFRNMVWLTKKGSNYPVAKGSYNNTSGEQMLIIWGVHHPNDETEQRTLYQNVGTYVSVGTSTLNKRSTPDIATRPKVNGLGSRMEFSWTLLDMWDTINFESTGNLIAPEYGFKISKRGSSGIMKTEGTLENCETKCQTPLGAINTTLPFHNVHPLTIGECPKYVKSEKLVLATGLRNVPQIESRGLFGAIAGFIEGGWQGMVDGWYGYHHSNDQGSGYAADKESTQKAFDGITNKVNSVIEKMNTQFEAVGKEFSNLERRLENLNKKMEDGFLDVWTYNAELLVLMENERTLDFHDSNVKNLYDKVRMQLRDNVKELGNGCFEFYHKCDDECMNSVKNGTYDYPKYEEESKLNRNE

1XTZ , Knot

113

264

0.79

155

250

MAAGVPKIDALESLGNPLEDAKRAAAYRAVDENLKFDDHKIIGIGSGSTVVYVAERIGQYLHDPKFYEVASKFICIPTGFQSRNLILDNKLQLGSIEQYPRIDIAFDGADEVDENLQLIKGGGACLFQEKLVSTSAKTFIVVADSRKKSPKHLGKNWRQGVPIEIVPSSYVRVKNDLLEQLHAEKVDIRQGGSAKAGPVVTDNNNFIIDADFGEISDPRKLHREIKLLVGVVETGLFIDNASKAYFGNSDGSVEVTEKHHHHHH

4JLM , Knot

126

280

0.84

186

268

MGSSHHHHHHSSGLVPRGSHMATPPKRSSPSFSASSEGTRIKKISIEGNIAAGKSTFVNILKQLSEDWEVVPEPVARWSNVQSTQDEFEELTMEQKNGGNVLQMMYEKPERWSFTFQTYACLSRIRAQLASLNGKLKDAEKPVLFFERSVYSDRYIFASNLYESESMNETEWTIYQDWHDWMNNQFGQSLELDGIIYLQATPETCLHRIYLRGRNEEQGIPLEYLEKLHYKHESWLLHRTLKTNFDYLQEVPILTLDVNEDFKDKYESLVEKVKEFLSTL

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
8XRA_1,1XTZ_1	185	4
8XRA_1,4JLM_1	178	4
1XTZ_1,4JLM_1	157	6

Pair

\(Z_2\)

Length of longest common subsequence

8XRA_1,1XTZ_1

185

8XRA_1,4JLM_1

178

1XTZ_1,4JLM_1

157

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	8XRA_1	1XTZ_1	178	133

Status

Protein1

Protein2

d₁/2

Query variables

8XRA_1

1XTZ_1

178

133

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM