CoV2D Browser

8YIG_1	1BGJ_1	8QMH_1	Letter	Amino acid
98	36	0	A	Alanine
84	39	0	R	Arginine
89	19	0	D	Aspartic acid
32	4	4	C	Cysteine
69	15	0	Q	Glutamine
122	28	0	V	Valine
101	4	0	N	Asparagine
124	34	0	E	Glutamic acid
15	6	0	W	Tryptophan
66	16	0	Y	Tyrosine
75	34	2	G	Glycine
181	46	0	L	Leucine
45	6	0	M	Methionine
81	17	0	P	Proline
86	20	0	S	Serine
99	20	0	T	Threonine
43	8	0	H	Histidine
103	18	0	I	Isoleucine
118	12	0	K	Lycine
90	12	0	F	Phenylalanine

8YIG_1

1BGJ_1

8QMH_1

Letter

Amino acid

Alanine

Arginine

Aspartic acid

Cysteine

Glutamine

122

Valine

101

Asparagine

124

Glutamic acid

Tryptophan

Tyrosine

Glycine

181

Leucine

Methionine

Proline

Serine

Threonine

Histidine

103

Isoleucine

118

Lycine

Phenylalanine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
8YIG , Knot	598	1721	0.86	40	366	1476	EDVEIKPRGYQLRLVDHLTKSNGIVYLPTGSGKTFVAILVLKRFSQDFDKPIESGGKRALFMCNTVELARQQAMAVRRCTNFKVGFYVGEQGVDDWTRGMWSDEIKKNQVLVGTAQVFLDMVTQTYVALSSLSVVIIDECHHGTGHHPFREFMRLFTIANQTKLPRVVGLTGVLIKGNEITNVATKLKELEITYRGNIITVSDTKEMENVMLYATKPTEVMVSFPHQEQVLTVTRLISAEIEKFYVSLDLMNIGVQPIRRSKSLQCLRDPSKKSFVKQLFNDFLYQMKEYGIYAASIAIISLIVEFDIKRRQAETLSVKLMHRTALTLCEKIRHLLVQKLQDMTYDDDDDNVNTEEVIMNFSTPKVQRFLMSLKVSFADKDPKDICCLVFVERRYTCKCIYGLLLNYIQSTPELRNVLTPQFMVGRNNISPDFESVLERKWQKSAIQQFRDGNANLMICSSVLEEGIDVQACNHVFILDPVKTFNMYVQSKGRARTTEAKFVLFTADKEREKTIQQIYQYRKAHNDIAEYLKDRVLEKTEPELYEIKGHFQDDIDPFTNENGAVLLPNNALAILHRYCQTIPTDAFGFVIPWFHVLQEDERDRIFGVSAKGKHVISINMPVNCMLRDTIYSDPMDNVKTAKISAAFKACKVLYSLGELNERFVPKTLKERVASIADVHFEHWNKYGDSVTATVNKADKSKDRTYKTECPLEFYDALPRVGEICYAYEIFLEPQFESCEYTEHMYLNLQTPRNYAILLRNKLPRLAEMPLFSNQGKLHVRVANAPLEVIIQNSEQLELLHQFHGMVFRDILKIWHPFFVLDRRSKENSYLVVPLILGAGEQKCFDWELMTNFRRLPQSHGSNVQQREQQPAPRPEDFEGKIVTQWYANYDKPMLVTKVHRELTPLSYMEKNQQDKTYYEFTMSKYGNRIGDVVHKDKFMIEVRDLTEQLTFYVHNRGKFNAKSKAKMKVILIPELCFNFNFPGDLWLKLIFLPSILNRMYFLLHAEALRKRFNTYLNLHLLPFNGTDYMPRPLEIDYSLKRNVDPLGNVIPTEDIEEPKSLLEPMPTKSIEASVANLEITEFENPWQKYMEPVDLSRNLLSTYPVELDYYYHFSVGNVCEMNEMDFEDKEYWAKNQFHMPTGNIYGNRTPAKTNANVPALMPSKPTVRGKVKPLLILQKTVSKEHITPAEQGEFLAAITASSAADVFDMERLEILGNSFLKLSATLYLASKYSDWNEGTLTEVKSKLVSNRNLLFCLIDADIPKTLNTIQFTPRYTWLPPGISLPHNVLALWRENPEFAKIIGPHNLRDLALGDEESLVKGNCSDINYNRFVEGCRANGQSFYAGADFSSEVNFCVGLVTIPNKVIADTLEALLGVIVKNYGLQHAFKMLEYFKICRADIDKPLTQLLNLELGGKKMRANVNTTEIDGFLINHYYLEKNLGYTFKDRRYLLQALTHPSYPTNRITGSYQELEFIGNAILDFLISAYIFENNTKMNPGALTDLRSALVNNTTLACICVRHRLHFFILAENAKLSEIISKFVNFQESQGHRVTNYVRILLEEADVQPTPLDLDDELDMTELPHANKCISQEAEKGVPPKGEFNMSTNVDVPKALGDVLEALIAAVYLDCRDLQRTWEVIFNLFEPELQEFTRKVPINHIRQLVEHKHAKPVFSSPIVEGETVMVSCQFTCMEKTIKVYGFGSNKDQAKLSAAKHALQQLSKCDA
1BGJ , Knot	163	394	0.82	40	215	371	MKTQVAIIGAGPSGLLLGQLLHKAGIDNVILERQTPDYVLGRIRAGVLEQGMVDLLREAGVDRRMARDGLVHEGVEIAFAGQRRRIDLKRLSGGKTVTVYGQTEVTRDLMEAREASGATTVYQAAEVRLHDLQGERPYVTFERDGERLRLDCDYIAGCDGFRGISRQSIPAERLKVFERVYPFGWLGLLADTPPVSHELIYANHPRGFALCSQRSATRSRYYVQVPLTEKVEDWSDERFWTELKARLPAEVAEKLVTGPSLEKSIAPLRSFVVEPMQHGRLFLAGDAAHIVPPTGAKGLNLAASDVSTLYRLLLKAYREGRGELLERYSAICLRRIWKAERFSWWMTSVLHRFPDTDAFSQRIQQTELEYYLGSEAGLATIAENYVGLPYEEIE
8QMH , Knot	3	6	0.29	4	3	3	GGCCCC

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

8YIG , Knot

598

1721

0.86

366

1476

EDVEIKPRGYQLRLVDHLTKSNGIVYLPTGSGKTFVAILVLKRFSQDFDKPIESGGKRALFMCNTVELARQQAMAVRRCTNFKVGFYVGEQGVDDWTRGMWSDEIKKNQVLVGTAQVFLDMVTQTYVALSSLSVVIIDECHHGTGHHPFREFMRLFTIANQTKLPRVVGLTGVLIKGNEITNVATKLKELEITYRGNIITVSDTKEMENVMLYATKPTEVMVSFPHQEQVLTVTRLISAEIEKFYVSLDLMNIGVQPIRRSKSLQCLRDPSKKSFVKQLFNDFLYQMKEYGIYAASIAIISLIVEFDIKRRQAETLSVKLMHRTALTLCEKIRHLLVQKLQDMTYDDDDDNVNTEEVIMNFSTPKVQRFLMSLKVSFADKDPKDICCLVFVERRYTCKCIYGLLLNYIQSTPELRNVLTPQFMVGRNNISPDFESVLERKWQKSAIQQFRDGNANLMICSSVLEEGIDVQACNHVFILDPVKTFNMYVQSKGRARTTEAKFVLFTADKEREKTIQQIYQYRKAHNDIAEYLKDRVLEKTEPELYEIKGHFQDDIDPFTNENGAVLLPNNALAILHRYCQTIPTDAFGFVIPWFHVLQEDERDRIFGVSAKGKHVISINMPVNCMLRDTIYSDPMDNVKTAKISAAFKACKVLYSLGELNERFVPKTLKERVASIADVHFEHWNKYGDSVTATVNKADKSKDRTYKTECPLEFYDALPRVGEICYAYEIFLEPQFESCEYTEHMYLNLQTPRNYAILLRNKLPRLAEMPLFSNQGKLHVRVANAPLEVIIQNSEQLELLHQFHGMVFRDILKIWHPFFVLDRRSKENSYLVVPLILGAGEQKCFDWELMTNFRRLPQSHGSNVQQREQQPAPRPEDFEGKIVTQWYANYDKPMLVTKVHRELTPLSYMEKNQQDKTYYEFTMSKYGNRIGDVVHKDKFMIEVRDLTEQLTFYVHNRGKFNAKSKAKMKVILIPELCFNFNFPGDLWLKLIFLPSILNRMYFLLHAEALRKRFNTYLNLHLLPFNGTDYMPRPLEIDYSLKRNVDPLGNVIPTEDIEEPKSLLEPMPTKSIEASVANLEITEFENPWQKYMEPVDLSRNLLSTYPVELDYYYHFSVGNVCEMNEMDFEDKEYWAKNQFHMPTGNIYGNRTPAKTNANVPALMPSKPTVRGKVKPLLILQKTVSKEHITPAEQGEFLAAITASSAADVFDMERLEILGNSFLKLSATLYLASKYSDWNEGTLTEVKSKLVSNRNLLFCLIDADIPKTLNTIQFTPRYTWLPPGISLPHNVLALWRENPEFAKIIGPHNLRDLALGDEESLVKGNCSDINYNRFVEGCRANGQSFYAGADFSSEVNFCVGLVTIPNKVIADTLEALLGVIVKNYGLQHAFKMLEYFKICRADIDKPLTQLLNLELGGKKMRANVNTTEIDGFLINHYYLEKNLGYTFKDRRYLLQALTHPSYPTNRITGSYQELEFIGNAILDFLISAYIFENNTKMNPGALTDLRSALVNNTTLACICVRHRLHFFILAENAKLSEIISKFVNFQESQGHRVTNYVRILLEEADVQPTPLDLDDELDMTELPHANKCISQEAEKGVPPKGEFNMSTNVDVPKALGDVLEALIAAVYLDCRDLQRTWEVIFNLFEPELQEFTRKVPINHIRQLVEHKHAKPVFSSPIVEGETVMVSCQFTCMEKTIKVYGFGSNKDQAKLSAAKHALQQLSKCDA

1BGJ , Knot

163

394

0.82

215

371

MKTQVAIIGAGPSGLLLGQLLHKAGIDNVILERQTPDYVLGRIRAGVLEQGMVDLLREAGVDRRMARDGLVHEGVEIAFAGQRRRIDLKRLSGGKTVTVYGQTEVTRDLMEAREASGATTVYQAAEVRLHDLQGERPYVTFERDGERLRLDCDYIAGCDGFRGISRQSIPAERLKVFERVYPFGWLGLLADTPPVSHELIYANHPRGFALCSQRSATRSRYYVQVPLTEKVEDWSDERFWTELKARLPAEVAEKLVTGPSLEKSIAPLRSFVVEPMQHGRLFLAGDAAHIVPPTGAKGLNLAASDVSTLYRLLLKAYREGRGELLERYSAICLRRIWKAERFSWWMTSVLHRFPDTDAFSQRIQQTELEYYLGSEAGLATIAENYVGLPYEEIE

8QMH , Knot

0.29

GGCCCC

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
8YIG_1,1BGJ_1	173	4
8YIG_1,8QMH_1	363	2
1BGJ_1,8QMH_1	214	2

Pair

\(Z_2\)

Length of longest common subsequence

8YIG_1,1BGJ_1

173

8YIG_1,8QMH_1

363

1BGJ_1,8QMH_1

214

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	8YIG_1	1BGJ_1	554	337.5

Status

Protein1

Protein2

d₁/2

Query variables

8YIG_1

1BGJ_1

554

337.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM