CoV2D Browser

2QRL_1	7UJQ_1	2AHO_1	Letter	Amino acid
14	6	14	N	Asparagine
4	5	4	C	Cysteine
9	10	14	Q	Glutamine
26	17	41	I	Isoleucine
17	10	11	F	Phenylalanine
28	13	21	P	Proline
19	11	26	S	Serine
25	9	22	T	Threonine
24	17	41	V	Valine
37	24	24	A	Alanine
22	13	16	D	Aspartic acid
23	12	6	H	Histidine
35	30	34	L	Leucine
5	2	8	M	Methionine
9	11	8	Y	Tyrosine
23	14	18	R	Arginine
19	23	32	E	Glutamic acid
24	17	34	G	Glycine
26	19	33	K	Lycine
5	5	7	W	Tryptophan

2QRL_1

7UJQ_1

2AHO_1

Letter

Amino acid

Asparagine

Cysteine

Glutamine

Isoleucine

Phenylalanine

Proline

Serine

Threonine

Valine

Alanine

Aspartic acid

Histidine

Leucine

Methionine

Tyrosine

Arginine

Glutamic acid

Glycine

Lycine

Tryptophan

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
2QRL , Knot	167	394	0.84	40	228	367	MGHHHHHHHHHHSSGHIEGRHMAAVTLHLRAETKPLEARAALTPTTVKKLIAKGFKIYVEDSPQSTFNINEYRQAGAIIVPAGSWKTAPRDRIIIGLKEMPETDTFPLVHEHIQFAHCYKDQAGWQNVLMRFIKGHGTLYDLEFLENDQGRRVAAFGFYAGFAGAALGVRDWAFKQTHSDDEDLPAVSPYPNEKALVKDVTKDYKEALATGARKPTVLIIGALGRCGSGAIDLLHKVGIPDANILKWDIKETSRGGPFDEIPQADIFINCIYLSKPIAPFTNMEKLNNPNRRLRTVVDVSADTTNPHNPIPIYTVATVFNKPTVLVPTTAGPKLSVISIDHLPSLLPREASEFFSHDLLPSLELLPQRKTAPVWVRAKKLFDRHCARVKRSSRL
7UJQ , Knot	122	268	0.84	40	176	261	TRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKIINTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIVAREYYSEADASHCIQQILEAVLHCHQMGVVHRNLKPENLLLASKLKGAAVKLADFGLAIEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILLVGYPPFWDEDQHRLYKQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHR
2AHO , Knot	171	414	0.83	40	226	390	AWPKVQPEVNIGVVGHVDHGKTTLVQAITGIWTSKHSEELKRGMTIKLGYAETNIGVCESCKKPEAYVTEPSCKSCGSDDEPKFLRRISFIDAPGHEVLMATMLSGAALMDGAILVVAANEPFPQPQTREHFVALGIIGVKNLIIVQNKVDVVSKEEALSQYRQIKQFTKGTWAENVPIIPVSALHKINIDSLIEGIEEYIKTPYRDLSQKPVMLVIRSFDVNKPGTQFNELKGGVIGGSIIQGLFKVDQEIKVLPGLRVEKQGKVSYEPIFTKISSIRFGDEEFKEAKPGGLVAIGTYLDPSLTKADNLLGSIITLADAEVPVLWNIRIKYNLLERVVGAKEMLKVDPIRAKETLMLSVGSSTTLGIVTSVKKDEIEVELRRPVAVWSNNIRTVISRQIAGRWRMIGWGLVEI

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

2QRL , Knot

167

394

0.84

228

367

MGHHHHHHHHHHSSGHIEGRHMAAVTLHLRAETKPLEARAALTPTTVKKLIAKGFKIYVEDSPQSTFNINEYRQAGAIIVPAGSWKTAPRDRIIIGLKEMPETDTFPLVHEHIQFAHCYKDQAGWQNVLMRFIKGHGTLYDLEFLENDQGRRVAAFGFYAGFAGAALGVRDWAFKQTHSDDEDLPAVSPYPNEKALVKDVTKDYKEALATGARKPTVLIIGALGRCGSGAIDLLHKVGIPDANILKWDIKETSRGGPFDEIPQADIFINCIYLSKPIAPFTNMEKLNNPNRRLRTVVDVSADTTNPHNPIPIYTVATVFNKPTVLVPTTAGPKLSVISIDHLPSLLPREASEFFSHDLLPSLELLPQRKTAPVWVRAKKLFDRHCARVKRSSRL

7UJQ , Knot

122

268

0.84

176

261

TRFTEEYQLFEELGKGAFSVVRRCVKVLAGQEYAAKIINTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGHHYLIFDLVTGGELFEDIVAREYYSEADASHCIQQILEAVLHCHQMGVVHRNLKPENLLLASKLKGAAVKLADFGLAIEVEGEQQAWFGFAGTPGYLSPEVLRKDPYGKPVDLWACGVILYILLVGYPPFWDEDQHRLYKQIKAGAYDFPSPEWDTVTPEAKDLINKMLTINPSKRITAAEALKHPWISHR

2AHO , Knot

171

414

0.83

226

390

AWPKVQPEVNIGVVGHVDHGKTTLVQAITGIWTSKHSEELKRGMTIKLGYAETNIGVCESCKKPEAYVTEPSCKSCGSDDEPKFLRRISFIDAPGHEVLMATMLSGAALMDGAILVVAANEPFPQPQTREHFVALGIIGVKNLIIVQNKVDVVSKEEALSQYRQIKQFTKGTWAENVPIIPVSALHKINIDSLIEGIEEYIKTPYRDLSQKPVMLVIRSFDVNKPGTQFNELKGGVIGGSIIQGLFKVDQEIKVLPGLRVEKQGKVSYEPIFTKISSIRFGDEEFKEAKPGGLVAIGTYLDPSLTKADNLLGSIITLADAEVPVLWNIRIKYNLLERVVGAKEMLKVDPIRAKETLMLSVGSSTTLGIVTSVKKDEIEVELRRPVAVWSNNIRTVISRQIAGRWRMIGWGLVEI

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
2QRL_1,7UJQ_1	156	4
2QRL_1,2AHO_1	138	4
7UJQ_1,2AHO_1	170	4

Pair

\(Z_2\)

Length of longest common subsequence

2QRL_1,7UJQ_1

156

2QRL_1,2AHO_1

138

7UJQ_1,2AHO_1

170

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	2QRL_1	7UJQ_1	136	114

Status

Protein1

Protein2

d₁/2

Query variables

2QRL_1

7UJQ_1

136

114

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM