CoV2D Browser

3QMO_1	1IBQ_1	4LCW_1	Letter	Amino acid
33	25	16	V	Valine
30	14	16	Q	Glutamine
38	35	17	G	Glycine
35	13	10	K	Lycine
37	29	16	T	Threonine
6	3	9	W	Tryptophan
27	20	15	Y	Tyrosine
27	1	14	R	Arginine
38	11	21	E	Glutamic acid
34	13	12	I	Isoleucine
14	0	7	M	Methionine
34	48	15	S	Serine
39	11	14	P	Proline
30	23	14	A	Alanine
25	29	14	D	Aspartic acid
13	2	4	C	Cysteine
60	22	25	L	Leucine
37	15	10	F	Phenylalanine
29	8	9	N	Asparagine
24	3	13	H	Histidine

3QMO_1

1IBQ_1

4LCW_1

Letter

Amino acid

Valine

Glutamine

Glycine

Lycine

Threonine

Tryptophan

Tyrosine

Arginine

Glutamic acid

Isoleucine

Methionine

Serine

Proline

Alanine

Aspartic acid

Cysteine

Leucine

Phenylalanine

Asparagine

Histidine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
3QMO , Knot	242	610	0.84	40	287	572	MLFRAVLLCAALGLSQAANHHHHHHPCCSNPCQNRGECMSTGFDQYKCDCTRTGFYGENCTTPEFLTRIKLLLKPTPNTVHYILTHFKGVWNIVNNIPFLRSLIMKYVLTSRSYLIDSPPTYNVHYGYKSWEAFSNLSYYTRALPPVADDCPTPMGVKGNKELPDSKEVLEKVLLRREFIPDPQGSNMMFAFFAQHFTHQFFKTDHKRGPGFTRGLGHGVDLNHIYGETLDRQHKLRLFKDGKLKYQVIGGEVYPPTVKDTQVEMIYPPHIPENLQFAVGQEVFGLVPGLMMYATIWLREHNRVCDILKQEHPEWGDEQLFQTSRLILIGETIKIVIEDYVQHLSGYHFKLKFDPELLFNQQFQYQNRIASEFNTLYHWHPLLPDTFNIEDQEYSFKQFLYNNSILLEHGLTQFVESFTRQIAGRVAGGRNVPIAVQAVAKASIDQSREMKYQSLNEYRKRFSLKPYTSFEELTGEKEMAAELKALYSDIDVMELYPALLVEKPRPDAIFGETMVELGAPFSLKGLMGNPICSPQYWKPSTFGGEVGFKIINTASIQSLICNNVKGCPFTSFNVQDPQPTKTATIAASASHSRLDDINPTVLIKRRSTEL
1IBQ , Knot	131	325	0.77	38	166	296	SKGSAVTTPQNNDEEYLTPVTVGKSTLHLDFDTGSADLWVFSDELPSSEQTGHDLYTPSSSATKLSGYSWDISYGDGSSASGDVYRDTVTVGGVTTNKQAVEAASKISSEFVQDTANDGLLGLAFSSINTVQPKAQTTFFDTVKSQLDSPLFAVQLKHDAPGVYDFGYIDDSKYTGSITYTDADSSQGYWGFSTDGYSIGDGSSSSSGFSAIADTGTTLILLDDEIVSAYYEQVSGAQESYEAGGYVFSCSTDLPDFTVVIGDYKAVVPGKYINYAPVSTGSSTCYGGIQSNSGLGLSILGDVFLKSQYVVFNSEGPKLGFAAQA
4LCW , Knot	128	271	0.88	40	195	261	MRTHSLRYFRLGVSDPIHGVPEFISVGYVDSHPITTYDSVTRQAEPRAPWMAENLAPDHWERYTQLLRGWQQMFKVELKRLQRHYNHSGSHTYQRMIGCELLEDGSTTGFLQYAYDGQDFLIFNKDTLSWLAVDNVAHTIKQAWEANQHELLYQKNWLEEECIAWLKRFLEYGKDTLQRTEPPLVRVNRKETFPGVTALFCKAHGFYPPEIYMTWMKNGEEIVQEIDYGDILPSGDGTYQAWASIELDPQSSNLYSCHVEHSGVHMVLQVP

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

3QMO , Knot

242

610

0.84

287

572

MLFRAVLLCAALGLSQAANHHHHHHPCCSNPCQNRGECMSTGFDQYKCDCTRTGFYGENCTTPEFLTRIKLLLKPTPNTVHYILTHFKGVWNIVNNIPFLRSLIMKYVLTSRSYLIDSPPTYNVHYGYKSWEAFSNLSYYTRALPPVADDCPTPMGVKGNKELPDSKEVLEKVLLRREFIPDPQGSNMMFAFFAQHFTHQFFKTDHKRGPGFTRGLGHGVDLNHIYGETLDRQHKLRLFKDGKLKYQVIGGEVYPPTVKDTQVEMIYPPHIPENLQFAVGQEVFGLVPGLMMYATIWLREHNRVCDILKQEHPEWGDEQLFQTSRLILIGETIKIVIEDYVQHLSGYHFKLKFDPELLFNQQFQYQNRIASEFNTLYHWHPLLPDTFNIEDQEYSFKQFLYNNSILLEHGLTQFVESFTRQIAGRVAGGRNVPIAVQAVAKASIDQSREMKYQSLNEYRKRFSLKPYTSFEELTGEKEMAAELKALYSDIDVMELYPALLVEKPRPDAIFGETMVELGAPFSLKGLMGNPICSPQYWKPSTFGGEVGFKIINTASIQSLICNNVKGCPFTSFNVQDPQPTKTATIAASASHSRLDDINPTVLIKRRSTEL

1IBQ , Knot

131

325

0.77

166

296

SKGSAVTTPQNNDEEYLTPVTVGKSTLHLDFDTGSADLWVFSDELPSSEQTGHDLYTPSSSATKLSGYSWDISYGDGSSASGDVYRDTVTVGGVTTNKQAVEAASKISSEFVQDTANDGLLGLAFSSINTVQPKAQTTFFDTVKSQLDSPLFAVQLKHDAPGVYDFGYIDDSKYTGSITYTDADSSQGYWGFSTDGYSIGDGSSSSSGFSAIADTGTTLILLDDEIVSAYYEQVSGAQESYEAGGYVFSCSTDLPDFTVVIGDYKAVVPGKYINYAPVSTGSSTCYGGIQSNSGLGLSILGDVFLKSQYVVFNSEGPKLGFAAQA

4LCW , Knot

128

271

0.88

195

261

MRTHSLRYFRLGVSDPIHGVPEFISVGYVDSHPITTYDSVTRQAEPRAPWMAENLAPDHWERYTQLLRGWQQMFKVELKRLQRHYNHSGSHTYQRMIGCELLEDGSTTGFLQYAYDGQDFLIFNKDTLSWLAVDNVAHTIKQAWEANQHELLYQKNWLEEECIAWLKRFLEYGKDTLQRTEPPLVRVNRKETFPGVTALFCKAHGFYPPEIYMTWMKNGEEIVQEIDYGDILPSGDGTYQAWASIELDPQSSNLYSCHVEHSGVHMVLQVP

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
3QMO_1,1IBQ_1	179	4
3QMO_1,4LCW_1	190	3
1IBQ_1,4LCW_1	193	3

Pair

\(Z_2\)

Length of longest common subsequence

3QMO_1,1IBQ_1

179

3QMO_1,4LCW_1

190

1IBQ_1,4LCW_1

193

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	3QMO_1	1IBQ_1	208	156.5

Status

Protein1

Protein2

d₁/2

Query variables

3QMO_1

1IBQ_1

208

156.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM