CoV2D Browser

2XHU_1	2HQY_1	5AIG_1	Letter	Amino acid
55	24	18	A	Alanine
26	24	8	D	Aspartic acid
18	8	3	Q	Glutamine
18	7	3	H	Histidine
14	18	8	F	Phenylalanine
31	10	4	P	Proline
23	15	2	Y	Tyrosine
42	19	9	R	Arginine
31	16	8	G	Glycine
25	22	8	I	Isoleucine
50	8	2	S	Serine
15	17	5	N	Asparagine
20	8	3	C	Cysteine
12	11	8	M	Methionine
41	16	10	T	Threonine
9	4	4	W	Tryptophan
32	12	8	V	Valine
29	21	10	E	Glutamic acid
59	27	3	L	Leucine
29	18	1	K	Lycine

2XHU_1

2HQY_1

5AIG_1

Letter

Amino acid

Alanine

Aspartic acid

Glutamine

Histidine

Phenylalanine

Proline

Tyrosine

Arginine

Glycine

Isoleucine

Serine

Asparagine

Cysteine

Methionine

Threonine

Tryptophan

Valine

Glutamic acid

Leucine

Lycine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
2XHU , Knot	232	579	0.85	40	275	537	ASMSYTWTGALITPCAAEESKLPINPLSNSLLRHHNMVYATTSRSASLRQKKVTFDRLQVLDDHYRDVLKEMKAKASTVKAKLLSIEEACKLTPPHSAKSKFGYGAKDVRNLSSRAVNHIRSVWEDLLEDTETPIDTTIMAKSEVFCVQPEKGGRKPARLIVFPDLGVRVCEKMALYDVVSTLPQAVMGSSYGFQYSPKQRVEFLVNTWKSKKCPMGFSYDTRCFDSTVTESDIRVEESIYQCCDLAPEARQAIRSLTERLYIGGPLTNSKGQNCGYRRCRASGVLTTSCGNTLTCYLKATAACRAAKLQDCTMLVNGDDLVVICESAGTQEDAAALRAFTEAMTRYSAPPGDPPQPEYDLELITSCSSNVSVAHDASGKRVYYLTRDPTTPLARAAWETARHTPINSWLGNIIMYAPTLWARMILMTHFFSILLAQEQLEKALDCQIYGACYSIEPLDLPQIIERLHGLSAFTLHSYSPGEINRVASCLRKLGVPPLRTWRHRARSVRAKLLSQGGRAATCGRYLFNWAVRTKLKLTPIPAASQLDLSGWFVAGYSGGDIYHSLSRARPRLEHHHHHH
2HQY , Knot	135	305	0.84	40	191	293	MIPFKDITLADRDTITAFTMKSDRRNCDLSFSNLCSWRFLYDTQFAVIDDFLVFKFWAGEQLAYMMPVGNGDLKAVLRKLIEDADKEKHNFCMLGVCSNMRADLEAILPERFIFTEDRAYADYIYLRSDLATLKGKKFQAKRNHINRFRNTYPDYEYTPITPDRIQECLDLEAEWCKVNNCDQQEGTGNERRALIYALHNFEALGLTGGILHVNGKIVAFTFGMPINHETFGVHVEKADTSIDGAYAMINYEFANRIPEQYIYINREEDLGIEGLRKAKLSYQPVTILEKYMACLKDHPMDMVRW
5AIG , Knot	65	125	0.83	40	101	123	MTPIETVTAFIAHWNSGDMEAMYDLCAEDVVWHNIPMEPIAGKPAMRAAVEGFMANVSQCDWQVHAIAANGATVLTERTDGFTFTNGRRATIRVMGTFECDAERRIIAWRDYFDMLEFQREFAGA

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

2XHU , Knot

232

579

0.85

275

537

ASMSYTWTGALITPCAAEESKLPINPLSNSLLRHHNMVYATTSRSASLRQKKVTFDRLQVLDDHYRDVLKEMKAKASTVKAKLLSIEEACKLTPPHSAKSKFGYGAKDVRNLSSRAVNHIRSVWEDLLEDTETPIDTTIMAKSEVFCVQPEKGGRKPARLIVFPDLGVRVCEKMALYDVVSTLPQAVMGSSYGFQYSPKQRVEFLVNTWKSKKCPMGFSYDTRCFDSTVTESDIRVEESIYQCCDLAPEARQAIRSLTERLYIGGPLTNSKGQNCGYRRCRASGVLTTSCGNTLTCYLKATAACRAAKLQDCTMLVNGDDLVVICESAGTQEDAAALRAFTEAMTRYSAPPGDPPQPEYDLELITSCSSNVSVAHDASGKRVYYLTRDPTTPLARAAWETARHTPINSWLGNIIMYAPTLWARMILMTHFFSILLAQEQLEKALDCQIYGACYSIEPLDLPQIIERLHGLSAFTLHSYSPGEINRVASCLRKLGVPPLRTWRHRARSVRAKLLSQGGRAATCGRYLFNWAVRTKLKLTPIPAASQLDLSGWFVAGYSGGDIYHSLSRARPRLEHHHHHH

2HQY , Knot

135

305

0.84

191

293

MIPFKDITLADRDTITAFTMKSDRRNCDLSFSNLCSWRFLYDTQFAVIDDFLVFKFWAGEQLAYMMPVGNGDLKAVLRKLIEDADKEKHNFCMLGVCSNMRADLEAILPERFIFTEDRAYADYIYLRSDLATLKGKKFQAKRNHINRFRNTYPDYEYTPITPDRIQECLDLEAEWCKVNNCDQQEGTGNERRALIYALHNFEALGLTGGILHVNGKIVAFTFGMPINHETFGVHVEKADTSIDGAYAMINYEFANRIPEQYIYINREEDLGIEGLRKAKLSYQPVTILEKYMACLKDHPMDMVRW

5AIG , Knot

125

0.83

101

123

MTPIETVTAFIAHWNSGDMEAMYDLCAEDVVWHNIPMEPIAGKPAMRAAVEGFMANVSQCDWQVHAIAANGATVLTERTDGFTFTNGRRATIRVMGTFECDAERRIIAWRDYFDMLEFQREFAGA

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
2XHU_1,2HQY_1	192	4
2XHU_1,5AIG_1	224	4
2HQY_1,5AIG_1	176	3

Pair

\(Z_2\)

Length of longest common subsequence

2XHU_1,2HQY_1

192

2XHU_1,5AIG_1

224

2HQY_1,5AIG_1

176

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	2XHU_1	2HQY_1	202	152

Status

Protein1

Protein2

d₁/2

Query variables

2XHU_1

2HQY_1

202

152

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM