CoV2D Browser

1ZOB_1	4RCZ_1	7PDO_1	Letter	Amino acid
33	18	24	R	Arginine
8	14	5	Q	Glutamine
24	32	20	E	Glutamic acid
25	41	12	I	Isoleucine
15	11	8	F	Phenylalanine
2	7	4	W	Tryptophan
9	14	5	N	Asparagine
27	16	21	D	Aspartic acid
12	8	4	Y	Tyrosine
50	24	31	A	Alanine
5	4	2	C	Cysteine
8	6	9	H	Histidine
52	34	44	L	Leucine
11	33	6	K	Lycine
23	26	17	S	Serine
22	22	24	T	Threonine
27	41	31	V	Valine
47	34	31	G	Glycine
14	9	6	M	Methionine
19	21	22	P	Proline

1ZOB_1

4RCZ_1

7PDO_1

Letter

Amino acid

Arginine

Glutamine

Glutamic acid

Isoleucine

Phenylalanine

Tryptophan

Asparagine

Aspartic acid

Tyrosine

Alanine

Cysteine

Histidine

Leucine

Lycine

Serine

Threonine

Valine

Glycine

Methionine

Proline

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
1ZOB , Knot	179	433	0.83	40	217	401	MSLNDDATFWRNARHHLVRYGGTFEPMIIERAKGSFVYDADGRAILDFTSGQMSAVLGHCHPEIVSVIGEYAGKLDHLFSEMLSRPVVDLATRLANITPPGLDRALLLSTGAESNEAAIRMAKLVTGKYEIVGFAQSWHGMTGAAASATYSAGRKGVGPAAVGSFAIPAPFTYRPRFERNGAYDYLAELDYAFDLIDRQSSGNLAAFIAEPILSSGGIIELPDGYMAALKRKCEARGMLLILDEAQTGVGRTGTMFACQRDGVTPDILTLSKTLGAGLPLAAIVTSAAIEERAHELGYLFYTTHVSDPLPAAVGLRVLDVVQRDGLVARANVMGDRLRRGLLDLMERFDCIGDVRGRGLLLGVEIVKDRRTKEPADGLGAKITRECMNLGLSMNIVQLPGMGGVFRIAPPLTVSEDEIDLGLSLLGQAIERAL
4RCZ , Knot	171	415	0.82	40	226	391	MAWPKVQPEVNIGVVGHVDHGKTTLVQAITGIWTSKHSEELKRGMTIKLGYAETNIGVCESCKKPEAYVTEPSCKSCGSDDEPKFLRRISFIDAPGHEVLMATMLSGAALMDGAILVVAANEPFPQPQTREHFVALGIIGVKNLIIVQNKVDVVSKEEALSQYRQIKQFTKGTWAENVPIIPVSALHKINIDSLIEGIEEYIKTPYRDLSQKPVMLVIRSFDVNKPGTQFNELKGGVIGGSIIQGLFKVDQEIKVLPGLRVEKQGKVSYEPIFTKISSIRFGDEEFKEAKPGGLVAIGTYLDPSLTKADNLLGSIITLADAEVPVLWNIRIKYNLLERVVGAKEMLKVDPIRAKETLMLSVGSSTTLGIVTSVKKDEIEVELRRPVAVWSNNIRTVISRQIAGRWRMIGWGLVEI
7PDO , Knot	137	326	0.81	40	171	303	MTLVPDLTATDLARHRWLTDNSWTRPTWTVAELEAAKAGRTISVVLPALNEEETVGGVVETIRPLLGGLVDELIVLDSGSTDDTEIRAMAAGARVISREVALPEVAPQPGKGEVLWRSLAATTGDIIVFIDSDLIDPDPMFVPKLVGPLLLSEGVHLVKGFYRRPLKTSGSEDAHGGGRVTELVARPLLAALRPELTCVLQPLGGEYAGTRELLMSVPFAPGYGVEIGLLVDTYDRLGLDAIAQVNLGVRAHRNRPLTDLAAMSRQVIATLFSRCGVPDSGVGLTQFFADGDGFSPRTSEVSLVDRPPMNTLRGKLAAALEHHHHH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

1ZOB , Knot

179

433

0.83

217

401

MSLNDDATFWRNARHHLVRYGGTFEPMIIERAKGSFVYDADGRAILDFTSGQMSAVLGHCHPEIVSVIGEYAGKLDHLFSEMLSRPVVDLATRLANITPPGLDRALLLSTGAESNEAAIRMAKLVTGKYEIVGFAQSWHGMTGAAASATYSAGRKGVGPAAVGSFAIPAPFTYRPRFERNGAYDYLAELDYAFDLIDRQSSGNLAAFIAEPILSSGGIIELPDGYMAALKRKCEARGMLLILDEAQTGVGRTGTMFACQRDGVTPDILTLSKTLGAGLPLAAIVTSAAIEERAHELGYLFYTTHVSDPLPAAVGLRVLDVVQRDGLVARANVMGDRLRRGLLDLMERFDCIGDVRGRGLLLGVEIVKDRRTKEPADGLGAKITRECMNLGLSMNIVQLPGMGGVFRIAPPLTVSEDEIDLGLSLLGQAIERAL

4RCZ , Knot

171

415

0.82

226

391

MAWPKVQPEVNIGVVGHVDHGKTTLVQAITGIWTSKHSEELKRGMTIKLGYAETNIGVCESCKKPEAYVTEPSCKSCGSDDEPKFLRRISFIDAPGHEVLMATMLSGAALMDGAILVVAANEPFPQPQTREHFVALGIIGVKNLIIVQNKVDVVSKEEALSQYRQIKQFTKGTWAENVPIIPVSALHKINIDSLIEGIEEYIKTPYRDLSQKPVMLVIRSFDVNKPGTQFNELKGGVIGGSIIQGLFKVDQEIKVLPGLRVEKQGKVSYEPIFTKISSIRFGDEEFKEAKPGGLVAIGTYLDPSLTKADNLLGSIITLADAEVPVLWNIRIKYNLLERVVGAKEMLKVDPIRAKETLMLSVGSSTTLGIVTSVKKDEIEVELRRPVAVWSNNIRTVISRQIAGRWRMIGWGLVEI

7PDO , Knot

137

326

0.81

171

303

MTLVPDLTATDLARHRWLTDNSWTRPTWTVAELEAAKAGRTISVVLPALNEEETVGGVVETIRPLLGGLVDELIVLDSGSTDDTEIRAMAAGARVISREVALPEVAPQPGKGEVLWRSLAATTGDIIVFIDSDLIDPDPMFVPKLVGPLLLSEGVHLVKGFYRRPLKTSGSEDAHGGGRVTELVARPLLAALRPELTCVLQPLGGEYAGTRELLMSVPFAPGYGVEIGLLVDTYDRLGLDAIAQVNLGVRAHRNRPLTDLAAMSRQVIATLFSRCGVPDSGVGLTQFFADGDGFSPRTSEVSLVDRPPMNTLRGKLAAALEHHHHH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
1ZOB_1,4RCZ_1	149	4
1ZOB_1,7PDO_1	130	5
4RCZ_1,7PDO_1	155	4

Pair

\(Z_2\)

Length of longest common subsequence

1ZOB_1,4RCZ_1

149

1ZOB_1,7PDO_1

130

4RCZ_1,7PDO_1

155

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	1ZOB_1	4RCZ_1	146	144

Status

Protein1

Protein2

d₁/2

Query variables

1ZOB_1

4RCZ_1

146

144

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM