CoV2D Browser

2AFM_1	7KQR_1	8ZYW_1	Letter	Amino acid
28	21	23	S	Serine
16	25	20	R	Arginine
15	3	10	N	Asparagine
19	19	20	D	Aspartic acid
22	24	19	P	Proline
7	6	16	M	Methionine
15	10	13	F	Phenylalanine
12	10	2	Y	Tyrosine
23	33	17	A	Alanine
19	20	31	E	Glutamic acid
17	9	17	I	Isoleucine
10	5	15	K	Lycine
2	3	3	C	Cysteine
16	10	9	H	Histidine
7	5	2	W	Tryptophan
13	23	19	V	Valine
16	10	25	Q	Glutamine
16	27	21	G	Glycine
44	35	26	L	Leucine
12	18	13	T	Threonine

2AFM_1

7KQR_1

8ZYW_1

Letter

Amino acid

Serine

Arginine

Asparagine

Aspartic acid

Proline

Methionine

Phenylalanine

Tyrosine

Alanine

Glutamic acid

Isoleucine

Lycine

Cysteine

Histidine

Tryptophan

Valine

Glutamine

Glycine

Leucine

Threonine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
2AFM , Knot	142	329	0.83	40	203	313	ASAWPEEKNYHQPAILNSSALRQIAEGTSISEMWQNDLQPLLIERYPGSPGSYAARQHIMQRIQRLQADWVLEIDTFLSQTPYGYRSFSNIISTLNPTAKRHLVLACHYDSKYFSHWNNRVFVGATDSAVPCAMMLELARALDKKLLSLKTVSDSKPDLSLQLIFFDGEEAFLHWSPQDSLYGSRHLAAKMASTPHPPGARGTSQLHGMDLLVLLDLIGAPNPTFPNFFPNSARWFERLQAIEHELHELGLLKDHSLEGRYFQNYSYGGVIQDDHIPFLRRGVPVLHLIPSPFPEVWHTMDDNEENLDESTIDNLNKILQVFVLEYLHL
7KQR , Knot	133	316	0.80	40	168	292	GHMNTGTGTVLTELPDHGRWDFGDFPYGLEPLTLPEPGSLEAADSGSVPAEFTLTCRHIAAIAAGGGPAERVQPADSSDRLYWFRWITGHQVTFILWQLLSRELARLPEEGPERDAALKAMTRYVRGYCAMLLYTGSMPRTVYGDVIRPSMFLQHPGFSGTWAPDHKPVQALFRGKKLPCVRDSADLAQAVHVYQVIHAGIAARMVPSGRSLLQEASVPSGVQHPDVLGVVYDNYFLTLRSRPSSRDVVAQLLRRLTAIALDVKDNALYPDGREAGSELPEELTRPEVTGHERDFLAILSEVAEEATGSPALASDR
8ZYW , Knot	138	321	0.82	40	193	302	MDDEDNKCDCPPPGLPLWMGTFADLMSLLMCFFVLLLSFSEMDVLKFKQIAGSMKFAFGVQNQLEVKDIPKGTSIIAQEFRPGRPEPTPIDVIMQQTMDITQQTLEFHEGESDRAGGTKRDEGKLTGGQSPATSTQNNESAEADMQQQQSKEMSQEMETLMESIKKALEREIEQGAIEVENLGQQIVIRMREKGAFPEGSAFLQPKFRPLVRQIAELVKDVPGIVRVSGHTDNRPLDSELYRSNWDLSSQRAVSVAQEMEKVRGFSHQRLRVRGMADTEPLLPNDSDDNRALNRRVEISIMQGEPLYSEEVPVIQHHHHHH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

2AFM , Knot

142

329

0.83

203

313

ASAWPEEKNYHQPAILNSSALRQIAEGTSISEMWQNDLQPLLIERYPGSPGSYAARQHIMQRIQRLQADWVLEIDTFLSQTPYGYRSFSNIISTLNPTAKRHLVLACHYDSKYFSHWNNRVFVGATDSAVPCAMMLELARALDKKLLSLKTVSDSKPDLSLQLIFFDGEEAFLHWSPQDSLYGSRHLAAKMASTPHPPGARGTSQLHGMDLLVLLDLIGAPNPTFPNFFPNSARWFERLQAIEHELHELGLLKDHSLEGRYFQNYSYGGVIQDDHIPFLRRGVPVLHLIPSPFPEVWHTMDDNEENLDESTIDNLNKILQVFVLEYLHL

7KQR , Knot

133

316

0.80

168

292

GHMNTGTGTVLTELPDHGRWDFGDFPYGLEPLTLPEPGSLEAADSGSVPAEFTLTCRHIAAIAAGGGPAERVQPADSSDRLYWFRWITGHQVTFILWQLLSRELARLPEEGPERDAALKAMTRYVRGYCAMLLYTGSMPRTVYGDVIRPSMFLQHPGFSGTWAPDHKPVQALFRGKKLPCVRDSADLAQAVHVYQVIHAGIAARMVPSGRSLLQEASVPSGVQHPDVLGVVYDNYFLTLRSRPSSRDVVAQLLRRLTAIALDVKDNALYPDGREAGSELPEELTRPEVTGHERDFLAILSEVAEEATGSPALASDR

8ZYW , Knot

138

321

0.82

193

302

MDDEDNKCDCPPPGLPLWMGTFADLMSLLMCFFVLLLSFSEMDVLKFKQIAGSMKFAFGVQNQLEVKDIPKGTSIIAQEFRPGRPEPTPIDVIMQQTMDITQQTLEFHEGESDRAGGTKRDEGKLTGGQSPATSTQNNESAEADMQQQQSKEMSQEMETLMESIKKALEREIEQGAIEVENLGQQIVIRMREKGAFPEGSAFLQPKFRPLVRQIAELVKDVPGIVRVSGHTDNRPLDSELYRSNWDLSSQRAVSVAQEMEKVRGFSHQRLRVRGMADTEPLLPNDSDDNRALNRRVEISIMQGEPLYSEEVPVIQHHHHHH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
2AFM_1,7KQR_1	175	4
2AFM_1,8ZYW_1	156	5
7KQR_1,8ZYW_1	169	3

Pair

\(Z_2\)

Length of longest common subsequence

2AFM_1,7KQR_1

175

2AFM_1,8ZYW_1

156

7KQR_1,8ZYW_1

169

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	2AFM_1	7KQR_1	118	113

Status

Protein1

Protein2

d₁/2

Query variables

2AFM_1

7KQR_1

118

113

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM