CoV2D Browser

8VFR_1	6RVA_1	8JDT_1	Letter	Amino acid
3	0	6	W	Tryptophan
8	0	17	H	Histidine
41	6	43	L	Leucine
13	3	15	K	Lycine
6	1	8	M	Methionine
29	3	44	V	Valine
45	6	47	A	Alanine
29	6	25	R	Arginine
13	1	18	N	Asparagine
6	6	11	C	Cysteine
31	8	47	G	Glycine
16	1	16	I	Isoleucine
19	4	13	F	Phenylalanine
9	3	6	Y	Tyrosine
25	5	27	S	Serine
21	3	31	T	Threonine
26	5	22	D	Aspartic acid
12	2	22	Q	Glutamine
25	3	29	E	Glutamic acid
33	5	24	P	Proline

8VFR_1

6RVA_1

8JDT_1

Letter

Amino acid

Tryptophan

Histidine

Leucine

Lycine

Methionine

Valine

Alanine

Arginine

Asparagine

Cysteine

Glycine

Isoleucine

Phenylalanine

Tyrosine

Serine

Threonine

Aspartic acid

Glutamine

Glutamic acid

Proline

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
8VFR , Knot	172	410	0.84	40	214	389	MISNSSAESISAPPNDSTIPHLAIDPFSLDFFDDPYPDQQTLRDAGPVVYLDKWNVYGVARYAEVHAVLNDPTTFCSSRGVGLSDFKKEKPWRPPSLILEADPPAHTRPRAVLSKVLSPATMKTIRDGFAAAADAKVDELLQRGCIDAIADLAEAYPLSVFPDAMGLKQEGREHLLPYAGLVFNAFGPPNELRQTAIERSAPHQAYVNEQCQRPNLAPGGFGACIHAFTDTGEITPDEAPLLVRSLLSGALQETVNGIGAAVYCLARFPGELQRLRSDPTLARNAFEEAVRFESPVQTFFRTTTREVELGGAVIGEGEKVLMFLGSANRDPRRWSDPDLYDITRKTSGHVGFGSGVHMCVGQLVARLEGEVMLSALARKVAAIDIDGPVKRRFNNTLRGLESLPVKLTPA
6RVA , Knot	39	71	0.78	36	63	69	GGPETLCGAELVDALQFVCGDRGFYFNKPTGYGSSSRRAPQTGIVDECCFRSCDLRRLDMYCAPLKPAKSA
8JDT , Knot	190	471	0.82	40	236	441	WSHPQFEKGSQGGLSQDFVEALKAVVGSPHVSTASAVREQHGHDESMHRCQPPDAVVWPQNVDQVSRVASLCYNQGVPIIPFGTGTGVEGGVCAVQGGVCINLTHMDQITELNTEDFSVVVEPGVTRKALNTHLRDSGLWFPVDPGADASLCGMAATGASGTNAVRYGTMRDNVINLEVVLPDGRLLHTAGRGRHYRKSAAGYNLTGLFVGSEGTLGIITSTTLRLHPAPEATVAATCAFPSVQAAVDSTVQILQAAVPVARIEFLDDVMMDACNRHSKLNCPVAPTLFLEFHGSQQTLAEQLQRTEAITQDNGGSHFSWAKEAEKRNELWAARHNAWYAALALSPGSKAYSTDVCVPISRLPEILVETKEEIKASKLTGAIVGHVGDGNFHCILLVDPDDAEEQRRVKAFAENLGRRALALGGTCTGEHGIGLGKRQLLQEEVGPVGVETMRQLKNTLDPRGLMNPGKVL

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

8VFR , Knot

172

410

0.84

214

389

MISNSSAESISAPPNDSTIPHLAIDPFSLDFFDDPYPDQQTLRDAGPVVYLDKWNVYGVARYAEVHAVLNDPTTFCSSRGVGLSDFKKEKPWRPPSLILEADPPAHTRPRAVLSKVLSPATMKTIRDGFAAAADAKVDELLQRGCIDAIADLAEAYPLSVFPDAMGLKQEGREHLLPYAGLVFNAFGPPNELRQTAIERSAPHQAYVNEQCQRPNLAPGGFGACIHAFTDTGEITPDEAPLLVRSLLSGALQETVNGIGAAVYCLARFPGELQRLRSDPTLARNAFEEAVRFESPVQTFFRTTTREVELGGAVIGEGEKVLMFLGSANRDPRRWSDPDLYDITRKTSGHVGFGSGVHMCVGQLVARLEGEVMLSALARKVAAIDIDGPVKRRFNNTLRGLESLPVKLTPA

6RVA , Knot

0.78

GGPETLCGAELVDALQFVCGDRGFYFNKPTGYGSSSRRAPQTGIVDECCFRSCDLRRLDMYCAPLKPAKSA

8JDT , Knot

190

471

0.82

236

441

WSHPQFEKGSQGGLSQDFVEALKAVVGSPHVSTASAVREQHGHDESMHRCQPPDAVVWPQNVDQVSRVASLCYNQGVPIIPFGTGTGVEGGVCAVQGGVCINLTHMDQITELNTEDFSVVVEPGVTRKALNTHLRDSGLWFPVDPGADASLCGMAATGASGTNAVRYGTMRDNVINLEVVLPDGRLLHTAGRGRHYRKSAAGYNLTGLFVGSEGTLGIITSTTLRLHPAPEATVAATCAFPSVQAAVDSTVQILQAAVPVARIEFLDDVMMDACNRHSKLNCPVAPTLFLEFHGSQQTLAEQLQRTEAITQDNGGSHFSWAKEAEKRNELWAARHNAWYAALALSPGSKAYSTDVCVPISRLPEILVETKEEIKASKLTGAIVGHVGDGNFHCILLVDPDDAEEQRRVKAFAENLGRRALALGGTCTGEHGIGLGKRQLLQEEVGPVGVETMRQLKNTLDPRGLMNPGKVL

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
8VFR_1,6RVA_1	197	3
8VFR_1,8JDT_1	160	4
6RVA_1,8JDT_1	213	3

Pair

\(Z_2\)

Length of longest common subsequence

8VFR_1,6RVA_1

197

8VFR_1,8JDT_1

160

6RVA_1,8JDT_1

213

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	8VFR_1	6RVA_1	158	92

Status

Protein1

Protein2

d₁/2

Query variables

8VFR_1

6RVA_1

158

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM