CoV2D Browser

8IMI_1	1CPQ_1	5NIW_1	Letter	Amino acid
3	2	3	C	Cysteine
16	4	10	M	Methionine
57	5	18	F	Phenylalanine
86	2	21	R	Arginine
50	10	36	D	Aspartic acid
6	2	19	H	Histidine
70	3	26	I	Isoleucine
61	12	16	K	Lycine
79	4	36	S	Serine
47	2	32	N	Asparagine
83	10	30	E	Glutamic acid
57	2	27	Y	Tyrosine
74	5	45	V	Valine
94	31	57	A	Alanine
56	7	42	T	Threonine
88	8	49	L	Leucine
66	3	25	P	Proline
5	1	10	W	Tryptophan
58	2	22	Q	Glutamine
80	14	57	G	Glycine

8IMI_1

1CPQ_1

5NIW_1

Letter

Amino acid

Cysteine

Methionine

Phenylalanine

Arginine

Aspartic acid

Histidine

Isoleucine

Lycine

Serine

Asparagine

Glutamic acid

Tyrosine

Valine

Alanine

Threonine

Leucine

Proline

Tryptophan

Glutamine

Glycine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
8IMI , Knot	385	1136	0.79	40	294	928	MPIKGTSGSNIARPRFYNTVMVETIEGANAEERYFNPGELSSMAGFFNDAQRRLAIVQILTTNAEAIVSRAAGRIFTGGSPMAFSVQQANRQKDAEKERVSARVVQAESEQPIGNEVVIEDKGGFLERLKSFFSYGGAEVETPGFRPIPIAVYGPERMQKSLRDLDWFLRYVNYSLVAGDSNMILLNCLGLREILEKACSIDATIVAVQEMRRAATGYLKSNDDKELVGSYFDVIIRSLNADKSDTPADVVRPSSPDRAGLVLPAIYALAGQSRPAFKMSRTLTSAEKERVVRAAYRQVFERDILAYGQSISYLDSKVKNGEISVKEFIRLLGKSELYRKQFFEPFINSRVLELAFKHFLGRAPESRTEVQNYYSIVAAQGLGGLVDALVDGEEYGRIFGEDTVPFIRDLGQEAQPSWNWGAAYSLYNYAAPRRKVPQFITLYADYVKPLPNQHPYGSGNDPLEIQFGAIFKSETKAPSARPAPIGKDVQRILIRSGNPITNERGNPAGGISDKTSLSPQIFKLTQDNRRIRGKSGKGSLITNAGAGSVEVNVQAVIRAAYQQVFGRQLYEGQHLSVSEIKLENGEISVKEFVRDLATSEIFRKLYWQNFYVCKSIEYIHRRLLGRPTYGRDETNRYYDLAFKKGFAGVVNAILDTMEYAEVFGDDVVPYERYVTPAGLNLRKLRAGTVPTLPSFEETPKFIEKGTAPDRALPQIRSAINQGVSKKRDQRKIFSTVGIQTSLASRTEFDALIRAAYRQVFERDMDSYRITEVFSVLETKLRNREITTKEFIQALASSDLYRKQFFEPYPPTKNVELSLKHLLGRATKDQAELRKYNQIIATQGFKPFINAILDSKEYGEVFGDGTVPYNRYPTLPAANFPNTEILYNQLTKQSAEVVVPSFKPVTSPRGMDMSQTPLMLQAMGDIAEAEQEVALQKPLFIQKGKALRGAEGDPYTIGTRRSPKPIFWVPQGGTNPTEFQNVIRAAYRQVFERDVPDYQRLSYPESRLKNGEISMREFIRQLAESDLYRKQFYEPYPNTKVIELLTKHFLGRAPQDQAEIQRYNRILAGKGLKVAIEEVLNSDEYTQLFGEDVVPFKRYPTLPTGTYLASVATNDEMIQQSGSSYSPSYAGYSYPFS
1CPQ , Knot	60	129	0.75	40	90	120	ADTKEVLEAREAYFKSLGGSMKAMTGVAKAFDAEAAKVEAAKLEKILATDVAPLFPAGTSSTDLPGQTEAKAAIWANMDDFGAKGKAMHEAGGAVIAAANAGDGAAFGAALQKLGGTCKACHDDYREED
5NIW , Knot	233	581	0.85	40	268	545	GIEASLLTDPKDVSGRTVDYIIAGGGLVGLTTAAKLTENPNISVLVIESGSYESDRGPIIEDLNAYGDIFGSSVDHAYETVELATNNQTALVRSGNGLGGSTLINGGTWTRPHKAQVDSWETVFGNEGWNWDNVAAYSLQAERARAPNAKQIAAGHYFNTSCHGVNGTVHAGPRDTGDDYSPIVKALMSAVEDRGVPTKKDFGCGDPHGVSMFPNTLHEDQVRSDAAREWLLPNYQRPNLQVLTGQYVGKVLLSQNGTTPRAVGVEFGTHKGNTHNVYAKHEVLLAAGSAVSPTILEYSGIGMKSILEPLGIDTVVDLPVGLNLQDQTTATVRSRITSAGAGQGQAAWFATFNETFGDYSEKAHELLNTKLEQWAEEAVARGGFHNTTALLIQYENYRDWIVNHNVAYSELFLDTAGVASFDVWDLLPFTRGYVHILDKDPYLHHFAYDPQYFLNELDLLGQAAATQLARNISNSGAMQTYFAGETIPGDNLAYDADLSAWTEYIPYHFRPNYHGVGTCSMMPKEMGGVVDNAARVYGVQGLRVIDGSIPPTQVSSHVMTVFYAMALKISDAILEDYASMQ

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

8IMI , Knot

385

1136

0.79

294

928

MPIKGTSGSNIARPRFYNTVMVETIEGANAEERYFNPGELSSMAGFFNDAQRRLAIVQILTTNAEAIVSRAAGRIFTGGSPMAFSVQQANRQKDAEKERVSARVVQAESEQPIGNEVVIEDKGGFLERLKSFFSYGGAEVETPGFRPIPIAVYGPERMQKSLRDLDWFLRYVNYSLVAGDSNMILLNCLGLREILEKACSIDATIVAVQEMRRAATGYLKSNDDKELVGSYFDVIIRSLNADKSDTPADVVRPSSPDRAGLVLPAIYALAGQSRPAFKMSRTLTSAEKERVVRAAYRQVFERDILAYGQSISYLDSKVKNGEISVKEFIRLLGKSELYRKQFFEPFINSRVLELAFKHFLGRAPESRTEVQNYYSIVAAQGLGGLVDALVDGEEYGRIFGEDTVPFIRDLGQEAQPSWNWGAAYSLYNYAAPRRKVPQFITLYADYVKPLPNQHPYGSGNDPLEIQFGAIFKSETKAPSARPAPIGKDVQRILIRSGNPITNERGNPAGGISDKTSLSPQIFKLTQDNRRIRGKSGKGSLITNAGAGSVEVNVQAVIRAAYQQVFGRQLYEGQHLSVSEIKLENGEISVKEFVRDLATSEIFRKLYWQNFYVCKSIEYIHRRLLGRPTYGRDETNRYYDLAFKKGFAGVVNAILDTMEYAEVFGDDVVPYERYVTPAGLNLRKLRAGTVPTLPSFEETPKFIEKGTAPDRALPQIRSAINQGVSKKRDQRKIFSTVGIQTSLASRTEFDALIRAAYRQVFERDMDSYRITEVFSVLETKLRNREITTKEFIQALASSDLYRKQFFEPYPPTKNVELSLKHLLGRATKDQAELRKYNQIIATQGFKPFINAILDSKEYGEVFGDGTVPYNRYPTLPAANFPNTEILYNQLTKQSAEVVVPSFKPVTSPRGMDMSQTPLMLQAMGDIAEAEQEVALQKPLFIQKGKALRGAEGDPYTIGTRRSPKPIFWVPQGGTNPTEFQNVIRAAYRQVFERDVPDYQRLSYPESRLKNGEISMREFIRQLAESDLYRKQFYEPYPNTKVIELLTKHFLGRAPQDQAEIQRYNRILAGKGLKVAIEEVLNSDEYTQLFGEDVVPFKRYPTLPTGTYLASVATNDEMIQQSGSSYSPSYAGYSYPFS

1CPQ , Knot

129

0.75

120

ADTKEVLEAREAYFKSLGGSMKAMTGVAKAFDAEAAKVEAAKLEKILATDVAPLFPAGTSSTDLPGQTEAKAAIWANMDDFGAKGKAMHEAGGAVIAAANAGDGAAFGAALQKLGGTCKACHDDYREED

5NIW , Knot

233

581

0.85

268

545

GIEASLLTDPKDVSGRTVDYIIAGGGLVGLTTAAKLTENPNISVLVIESGSYESDRGPIIEDLNAYGDIFGSSVDHAYETVELATNNQTALVRSGNGLGGSTLINGGTWTRPHKAQVDSWETVFGNEGWNWDNVAAYSLQAERARAPNAKQIAAGHYFNTSCHGVNGTVHAGPRDTGDDYSPIVKALMSAVEDRGVPTKKDFGCGDPHGVSMFPNTLHEDQVRSDAAREWLLPNYQRPNLQVLTGQYVGKVLLSQNGTTPRAVGVEFGTHKGNTHNVYAKHEVLLAAGSAVSPTILEYSGIGMKSILEPLGIDTVVDLPVGLNLQDQTTATVRSRITSAGAGQGQAAWFATFNETFGDYSEKAHELLNTKLEQWAEEAVARGGFHNTTALLIQYENYRDWIVNHNVAYSELFLDTAGVASFDVWDLLPFTRGYVHILDKDPYLHHFAYDPQYFLNELDLLGQAAATQLARNISNSGAMQTYFAGETIPGDNLAYDADLSAWTEYIPYHFRPNYHGVGTCSMMPKEMGGVVDNAARVYGVQGLRVIDGSIPPTQVSSHVMTVFYAMALKISDAILEDYASMQ

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
8IMI_1,1CPQ_1	228	4
8IMI_1,5NIW_1	120	5
1CPQ_1,5NIW_1	202	4

Pair

\(Z_2\)

Length of longest common subsequence

8IMI_1,1CPQ_1

228

8IMI_1,5NIW_1

120

1CPQ_1,5NIW_1

202

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	8IMI_1	1CPQ_1	366	203

Status

Protein1

Protein2

d₁/2

Query variables

8IMI_1

1CPQ_1

366

203

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM