CoV2D Browser

8ACW_1	5YKD_1	6GCP_1	Letter	Amino acid
24	25	12	P	Proline
32	57	35	A	Alanine
17	18	10	Q	Glutamine
19	20	14	I	Isoleucine
33	27	25	S	Serine
3	9	1	W	Tryptophan
20	31	13	R	Arginine
13	12	17	N	Asparagine
46	44	24	L	Leucine
28	10	10	K	Lycine
17	18	7	F	Phenylalanine
28	27	13	T	Threonine
11	12	6	Y	Tyrosine
24	24	10	D	Aspartic acid
30	31	15	E	Glutamic acid
16	20	13	H	Histidine
48	32	27	V	Valine
5	6	7	C	Cysteine
41	45	22	G	Glycine
13	11	7	M	Methionine

8ACW_1

5YKD_1

6GCP_1

Letter

Amino acid

Proline

Alanine

Glutamine

Isoleucine

Serine

Tryptophan

Arginine

Asparagine

Leucine

Lycine

Phenylalanine

Threonine

Tyrosine

Aspartic acid

Glutamic acid

Histidine

Valine

Cysteine

Glycine

Methionine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
8ACW , Knot	188	468	0.82	40	228	436	MGSSHHHHHHSSGLEVLFQGPHMITIKKGLDLPIAGTPSQVISDGKAIKKVALLGEEYVGMRPTMHVRVGDEVKKAQILFEDKKNPGVKFTSPVSGKVVEINRGAKRVLQSVVIEVAGDDQVTFDKFEANQLASLNRDAIKTQLVESGLWTAFRTRPFSKVPAIDSTSEAIFVTAMDTNPLAAEPTVVINEQSEAFVAGLDVLSALTTGKVYVCKKGTSLPRSQQPNVEEHVFDGPHPAGLAGTHMHFLYPVSADHVAWSINYQDVIAVGQLFLTGELYTQRVVSLAGPVVNKPRLVRTVMGASLEQLVDSEIMPGEVRIISGSVLSGTKATGPHAYLGRYHLQVSVLREGRDKELFGWAMPGKNKFSVTRSFLGHLFKGQVYNMTTTTNGSDRSMVPIGNYEKVMPLDMEPTLLLRDLCAGDSDSAVRLGALELDEEDLALCTFVCPGKYEYGQLLRECLDKIEKEG
5YKD , Knot	199	479	0.85	40	244	450	MSLLIRGATVVTHEESYRADVLCANGLIQAIGENLETPSGCDVLDGGGQYLMPGGIDPHTHMQLPFMGTVASEDFFSGTAAGLAGGTTSIIDFVIPNPRQSLLEAFHTWRGWAQKSAADYGFHVAITWWSDEVAREMGELVAQHGVNSFKHFMAYKNAIMAADDTLVASFERCLELGAVPTVHAENGELVFHLQQKLLAQGLTGPEAHPLSRPPQVEGEAASRAIRIAETLGTPLYLVHISSREALDEIAYARAKGQPVYGEVLAGHLLLDDSVYRHPDWATAAGYVMSPPFRPVEHQEALWRGLQSGNLHTTATDHCCFCAEQKAMGRDDFSKIPNGTAGIEDRMALLWDAGVNSGRLSMHEFVALTSTNTAKIFNLFPRKGAIRVGADADLVLWDPQGSRTLSAATHHQRVDFNIFEGRTVRGIPSHTISQGKLLWAAGDLRAEPGAGRYVERPAYPSVYEVLGRRAERQRPVAVER
6GCP , Knot	127	288	0.83	40	179	275	MGSSHHHHHHSSGLVPRGSHMEAPAAVVTGAAKRIGRAIAVKLHQTGYRVVIHYHNSAEAAVSLADELNKERSNTAVVCQADLTNSNVLPASCEEIINSCFRAFGRCDVLVNNASAFYPTPLVQGDHEDNSNGKTVETQVAELIGTNAIAPFLLTMSFAQRQKGTNPNCTSSNLSIVNLCDAMVDQPCMAFSLYNMGKHALVGLTQSAALELAPYGIRVNGVAPGVSLLPVAMGEEEKDKWRRKVPLGRREASAEQIADAVIFLVSGSAQYITGSIIKVDGGLSLVHA

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

8ACW , Knot

188

468

0.82

228

436

MGSSHHHHHHSSGLEVLFQGPHMITIKKGLDLPIAGTPSQVISDGKAIKKVALLGEEYVGMRPTMHVRVGDEVKKAQILFEDKKNPGVKFTSPVSGKVVEINRGAKRVLQSVVIEVAGDDQVTFDKFEANQLASLNRDAIKTQLVESGLWTAFRTRPFSKVPAIDSTSEAIFVTAMDTNPLAAEPTVVINEQSEAFVAGLDVLSALTTGKVYVCKKGTSLPRSQQPNVEEHVFDGPHPAGLAGTHMHFLYPVSADHVAWSINYQDVIAVGQLFLTGELYTQRVVSLAGPVVNKPRLVRTVMGASLEQLVDSEIMPGEVRIISGSVLSGTKATGPHAYLGRYHLQVSVLREGRDKELFGWAMPGKNKFSVTRSFLGHLFKGQVYNMTTTTNGSDRSMVPIGNYEKVMPLDMEPTLLLRDLCAGDSDSAVRLGALELDEEDLALCTFVCPGKYEYGQLLRECLDKIEKEG

5YKD , Knot

199

479

0.85

244

450

MSLLIRGATVVTHEESYRADVLCANGLIQAIGENLETPSGCDVLDGGGQYLMPGGIDPHTHMQLPFMGTVASEDFFSGTAAGLAGGTTSIIDFVIPNPRQSLLEAFHTWRGWAQKSAADYGFHVAITWWSDEVAREMGELVAQHGVNSFKHFMAYKNAIMAADDTLVASFERCLELGAVPTVHAENGELVFHLQQKLLAQGLTGPEAHPLSRPPQVEGEAASRAIRIAETLGTPLYLVHISSREALDEIAYARAKGQPVYGEVLAGHLLLDDSVYRHPDWATAAGYVMSPPFRPVEHQEALWRGLQSGNLHTTATDHCCFCAEQKAMGRDDFSKIPNGTAGIEDRMALLWDAGVNSGRLSMHEFVALTSTNTAKIFNLFPRKGAIRVGADADLVLWDPQGSRTLSAATHHQRVDFNIFEGRTVRGIPSHTISQGKLLWAAGDLRAEPGAGRYVERPAYPSVYEVLGRRAERQRPVAVER

6GCP , Knot

127

288

0.83

179

275

MGSSHHHHHHSSGLVPRGSHMEAPAAVVTGAAKRIGRAIAVKLHQTGYRVVIHYHNSAEAAVSLADELNKERSNTAVVCQADLTNSNVLPASCEEIINSCFRAFGRCDVLVNNASAFYPTPLVQGDHEDNSNGKTVETQVAELIGTNAIAPFLLTMSFAQRQKGTNPNCTSSNLSIVNLCDAMVDQPCMAFSLYNMGKHALVGLTQSAALELAPYGIRVNGVAPGVSLLPVAMGEEEKDKWRRKVPLGRREASAEQIADAVIFLVSGSAQYITGSIIKVDGGLSLVHA

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
8ACW_1,5YKD_1	134	5
8ACW_1,6GCP_1	155	14
5YKD_1,6GCP_1	165	4

Pair

\(Z_2\)

Length of longest common subsequence

8ACW_1,5YKD_1

134

8ACW_1,6GCP_1

155

5YKD_1,6GCP_1

165

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	8ACW_1	5YKD_1	161	156.5

Status

Protein1

Protein2

d₁/2

Query variables

8ACW_1

5YKD_1

161

156.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM