CoV2D Browser

3CWC_1	4XMA_1	2LLT_1	Letter	Amino acid
7	35	2	Y	Tyrosine
56	31	7	A	Alanine
23	34	12	E	Glutamic acid
22	42	4	T	Threonine
12	49	9	K	Lycine
7	9	2	M	Methionine
6	29	5	F	Phenylalanine
12	20	0	P	Proline
19	21	0	R	Arginine
24	41	8	D	Aspartic acid
11	25	3	Q	Glutamine
18	73	5	S	Serine
5	1	1	C	Cysteine
29	46	1	I	Isoleucine
36	51	11	L	Leucine
2	8	1	W	Tryptophan
28	35	9	V	Valine
10	45	5	N	Asparagine
45	53	6	G	Glycine
11	10	2	H	Histidine

3CWC_1

4XMA_1

2LLT_1

Letter

Amino acid

Tyrosine

Alanine

Glutamic acid

Threonine

Lycine

Methionine

Phenylalanine

Proline

Arginine

Aspartic acid

Glutamine

Serine

Cysteine

Isoleucine

Leucine

Tryptophan

Valine

Asparagine

Glycine

Histidine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
3CWC , Knot	160	383	0.82	40	194	358	SNAMKIVIAPDSYKESLSALEVATAIEQGFREIWPDADYLKLPLADGGEGTVEAMVEATAGRIVHVEVTGPLGHRVNAFYGLSGDARSAFIEMAAASGLEQVPPAQRDPLKTTSWGTGELIRHALDAGVEHIIIGIGGSATNDGGAGMVQALGARLRDAQGNDIAQGGIGLETLASIDISGLDKRLSACHIEVACDVTNPLTGKEGASAVFGPQKGATPEMIERLDTALTRYAHLIARDLHVDVLDLAGGGAAGGMGAALYAFCGAQLRRGIEIVTDALHLEACLADADLVITGEGRIDSQTIHGKVPIGVANIAKRYNKPVIGIAGSLTADVSVVHEHGLDAVFSVIYTICTLEDALKNASENVRMTARNVAATLKAGQQLR
4XMA , Knot	256	658	0.84	40	261	596	ISPIFQGGSYQLNNKSIDISSLLLDKLSGESQTVVMKFKADKPNSLQALFGLSNSKAGFKNNYFSIFMRDSGEIGVEIRDAQKGINYLFSRPASLWGKHKGQAVENTLVFVSDSKDKTYTMYVNGIEVFSETVDTFLPISNINGIDKATLGAVNREGKEHYLAKGSIDEISLFNKAISDQEVSTIPLSNPFQLIFQSGDSTQANYFRIPTLYTLSSGRVLSSIDARYGGTHDSKSKINIATSYSDDNGKTWSEPIFAMKFNDYEEQLVYWPRDNKLKNSQISGSASFIDSSIVEDKKSGKTILLADVMPAGIGNNNANKADSGFKEINGHYYLKLKKNGDNDFRYTVRENGVVYNETTNKPTNYTINDKYEVLEGGKSLTVEQYSVDFDSGSLRERHNGKQVPMNVFYKDSLFKVTPTNYIAMTTSQNRGESWEQFKLLPPFLGEKHNGTYLCPGQGLALGSSNRLIFATYTSGELTYLISDDSGQTWKKSSASIPFKNATAEAQMVELRDGVIRTFFRTTTGKIAYMTSRDSGETWSKVSYIDGIQQTSYGTQVSAIKYSQLIDGKEAVILSTPNSRSGRKGGQLVVGLVNKEDDSIDWKYHYGIDLPSYGYAYSAITELPNHHIGVLFEKYDSWSRNELHLSNVVQYIDLEINDLT
2LLT , Knot	49	93	0.79	36	74	89	GSELETAMETLINVFHAHSGKEGDKYKLSKKELKELLQTELSGFLDAQKDVDAVDKVMKELDENGDGEVDFQEYVVLVAALTVACNNFFWENS

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

3CWC , Knot

160

383

0.82

194

358

SNAMKIVIAPDSYKESLSALEVATAIEQGFREIWPDADYLKLPLADGGEGTVEAMVEATAGRIVHVEVTGPLGHRVNAFYGLSGDARSAFIEMAAASGLEQVPPAQRDPLKTTSWGTGELIRHALDAGVEHIIIGIGGSATNDGGAGMVQALGARLRDAQGNDIAQGGIGLETLASIDISGLDKRLSACHIEVACDVTNPLTGKEGASAVFGPQKGATPEMIERLDTALTRYAHLIARDLHVDVLDLAGGGAAGGMGAALYAFCGAQLRRGIEIVTDALHLEACLADADLVITGEGRIDSQTIHGKVPIGVANIAKRYNKPVIGIAGSLTADVSVVHEHGLDAVFSVIYTICTLEDALKNASENVRMTARNVAATLKAGQQLR

4XMA , Knot

256

658

0.84

261

596

ISPIFQGGSYQLNNKSIDISSLLLDKLSGESQTVVMKFKADKPNSLQALFGLSNSKAGFKNNYFSIFMRDSGEIGVEIRDAQKGINYLFSRPASLWGKHKGQAVENTLVFVSDSKDKTYTMYVNGIEVFSETVDTFLPISNINGIDKATLGAVNREGKEHYLAKGSIDEISLFNKAISDQEVSTIPLSNPFQLIFQSGDSTQANYFRIPTLYTLSSGRVLSSIDARYGGTHDSKSKINIATSYSDDNGKTWSEPIFAMKFNDYEEQLVYWPRDNKLKNSQISGSASFIDSSIVEDKKSGKTILLADVMPAGIGNNNANKADSGFKEINGHYYLKLKKNGDNDFRYTVRENGVVYNETTNKPTNYTINDKYEVLEGGKSLTVEQYSVDFDSGSLRERHNGKQVPMNVFYKDSLFKVTPTNYIAMTTSQNRGESWEQFKLLPPFLGEKHNGTYLCPGQGLALGSSNRLIFATYTSGELTYLISDDSGQTWKKSSASIPFKNATAEAQMVELRDGVIRTFFRTTTGKIAYMTSRDSGETWSKVSYIDGIQQTSYGTQVSAIKYSQLIDGKEAVILSTPNSRSGRKGGQLVVGLVNKEDDSIDWKYHYGIDLPSYGYAYSAITELPNHHIGVLFEKYDSWSRNELHLSNVVQYIDLEINDLT

2LLT , Knot

0.79

GSELETAMETLINVFHAHSGKEGDKYKLSKKELKELLQTELSGFLDAQKDVDAVDKVMKELDENGDGEVDFQEYVVLVAALTVACNNFFWENS

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
3CWC_1,4XMA_1	147	5
3CWC_1,2LLT_1	174	4
4XMA_1,2LLT_1	211	4

Pair

\(Z_2\)

Length of longest common subsequence

3CWC_1,4XMA_1

147

3CWC_1,2LLT_1

174

4XMA_1,2LLT_1

211

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	3CWC_1	4XMA_1	218	170.5

Status

Protein1

Protein2

d₁/2

Query variables

3CWC_1

4XMA_1

218

170.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM