CoV2D Browser

4USX_1	3DXC_1	3MQE_1	Letter	Amino acid
37	15	32	V	Valine
0	6	12	C	Cysteine
56	6	37	G	Glycine
8	10	18	H	Histidine
12	3	34	I	Isoleucine
40	5	37	T	Threonine
1	2	6	W	Tryptophan
56	17	25	A	Alanine
5	6	26	R	Arginine
7	4	35	K	Lycine
2	7	36	F	Phenylalanine
7	3	27	Y	Tyrosine
31	4	30	N	Asparagine
17	7	39	P	Proline
13	3	25	D	Aspartic acid
15	8	29	Q	Glutamine
6	7	38	E	Glutamic acid
16	12	55	L	Leucine
7	3	13	M	Methionine
35	12	33	S	Serine

4USX_1

3DXC_1

3MQE_1

Letter

Amino acid

Valine

Cysteine

Glycine

Histidine

Isoleucine

Threonine

Tryptophan

Alanine

Arginine

Lycine

Phenylalanine

Tyrosine

Asparagine

Proline

Aspartic acid

Glutamine

Glutamic acid

Leucine

Methionine

Serine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
4USX , Knot	134	371	0.71	38	145	306	MASMTGGQQMGRGSMAPTTPNGGKPSQDLTLVGAASGPVALHNVAPGTASTDAVNVGQLGAVTTGLGGGAAIDPKTGAVTAPSYTVYNADGTTSNVGNVGAAIDAINSTGIKYFHANSTKPDSQALGADSVAIGPNAVANNAGDVALGSGAVTSQAGGTLSETINGVTYSFAGTTPIGTVSVGAPGVERTITNVAAGRIGQSSTDAINGSQLYGTNQSIEALTDKMNSLGNTVANTLGSGASYNPQTGAVNGPANSGGVVTPTVIQEAANKWVSANPSTYVAPVATGTNGMAVGSGAVSTGQNSVALGTNASDGGRSNVVSVGAPGAERQVTNVAAGTQATDAVNLGQMNGANSSSVDKLAAALEHHHHHH
3DXC , Knot	70	140	0.82	40	112	133	APKNELVQKFQVYYLGNVPVAKPVGVDVINGALESVLSSSSREQWTPSHVSVAPATLTILHQQTEAVLGECRVRFLSFLAVGRDVHTFAFIMAAGPASFCCHMFWCEPNAASLSEAVQAACMLRYQKCLDARSQHHHHHH
3MQE , Knot	231	587	0.83	40	282	552	ANPCCSNPCQNRGECMSTGFDQYKCDCTRTGFYGENCTTPEFLTRIKLLLKPTPNTVHYILTHFKGVWNIVNNIPFLRSLIMKYVLTSRSYLIDSPPTYNVHYGYKSWEAFSNLSYYTRALPPVADDCPTPMGVKGNKELPDSKEVLEKVLLRREFIPDPQGSNMMFAFFAQHFTHQFFKTDHKRGPGFTRGLGHGVDLNHIYGETLDRQHKLRLFKDGKLKYQVIGGEVYPPTVKDTQVEMIYPPHIPENLQFAVGQEVFGLVPGLMMYATIWLREHNRVCDILKQEHPEWGDEQLFQTSRLILIGETIKIVIEDYVQHLSGYHFKLKFDPELLFNQQFQYQNRIASEFNTLYHWHPLLPDTFNIEDQEYSFKQFLYNNSILLEHGLTQFVESFTRQIAGRVAGGRNVPIAVQAVAKASIDQSREMKYQSLNEYRKRFSLKPYTSFEELTGEKEMAAELKALYSDIDVMELYPALLVEKPRPDAIFGETMVELGAPFSLKGLMGNPICSPQYWKPSTFGGEVGFKIINTASIQSLICNNVKGCPFTSFNVQDPQPTKTATINASASHSRLDDINPTVLIKRRSTEL

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

4USX , Knot

134

371

0.71

145

306

MASMTGGQQMGRGSMAPTTPNGGKPSQDLTLVGAASGPVALHNVAPGTASTDAVNVGQLGAVTTGLGGGAAIDPKTGAVTAPSYTVYNADGTTSNVGNVGAAIDAINSTGIKYFHANSTKPDSQALGADSVAIGPNAVANNAGDVALGSGAVTSQAGGTLSETINGVTYSFAGTTPIGTVSVGAPGVERTITNVAAGRIGQSSTDAINGSQLYGTNQSIEALTDKMNSLGNTVANTLGSGASYNPQTGAVNGPANSGGVVTPTVIQEAANKWVSANPSTYVAPVATGTNGMAVGSGAVSTGQNSVALGTNASDGGRSNVVSVGAPGAERQVTNVAAGTQATDAVNLGQMNGANSSSVDKLAAALEHHHHHH

3DXC , Knot

140

0.82

112

133

APKNELVQKFQVYYLGNVPVAKPVGVDVINGALESVLSSSSREQWTPSHVSVAPATLTILHQQTEAVLGECRVRFLSFLAVGRDVHTFAFIMAAGPASFCCHMFWCEPNAASLSEAVQAACMLRYQKCLDARSQHHHHHH

3MQE , Knot

231

587

0.83

282

552

ANPCCSNPCQNRGECMSTGFDQYKCDCTRTGFYGENCTTPEFLTRIKLLLKPTPNTVHYILTHFKGVWNIVNNIPFLRSLIMKYVLTSRSYLIDSPPTYNVHYGYKSWEAFSNLSYYTRALPPVADDCPTPMGVKGNKELPDSKEVLEKVLLRREFIPDPQGSNMMFAFFAQHFTHQFFKTDHKRGPGFTRGLGHGVDLNHIYGETLDRQHKLRLFKDGKLKYQVIGGEVYPPTVKDTQVEMIYPPHIPENLQFAVGQEVFGLVPGLMMYATIWLREHNRVCDILKQEHPEWGDEQLFQTSRLILIGETIKIVIEDYVQHLSGYHFKLKFDPELLFNQQFQYQNRIASEFNTLYHWHPLLPDTFNIEDQEYSFKQFLYNNSILLEHGLTQFVESFTRQIAGRVAGGRNVPIAVQAVAKASIDQSREMKYQSLNEYRKRFSLKPYTSFEELTGEKEMAAELKALYSDIDVMELYPALLVEKPRPDAIFGETMVELGAPFSLKGLMGNPICSPQYWKPSTFGGEVGFKIINTASIQSLICNNVKGCPFTSFNVQDPQPTKTATINASASHSRLDDINPTVLIKRRSTEL

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
4USX_1,3DXC_1	147	6
4USX_1,3MQE_1	193	3
3DXC_1,3MQE_1	230	4

Pair

\(Z_2\)

Length of longest common subsequence

4USX_1,3DXC_1

147

4USX_1,3MQE_1

193

3DXC_1,3MQE_1

230

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	4USX_1	3DXC_1	121	86.5

Status

Protein1

Protein2

d₁/2

Query variables

4USX_1

3DXC_1

121

86.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM