CoV2D Browser

8GUB_1	2BWI_1	6LJH_1	Letter	Amino acid
45	13	16	F	Phenylalanine
60	6	27	S	Serine
60	20	16	D	Aspartic acid
49	7	9	Q	Glutamine
77	21	22	E	Glutamic acid
51	34	39	G	Glycine
41	9	6	M	Methionine
72	17	29	K	Lycine
42	28	22	T	Threonine
19	4	3	W	Tryptophan
60	12	8	R	Arginine
35	15	16	H	Histidine
56	34	32	V	Valine
52	23	20	P	Proline
43	13	7	Y	Tyrosine
46	33	25	A	Alanine
57	14	11	N	Asparagine
32	1	15	C	Cysteine
72	12	30	I	Isoleucine
127	24	33	L	Leucine

8GUB_1

2BWI_1

6LJH_1

Letter

Amino acid

Phenylalanine

Serine

Aspartic acid

Glutamine

Glutamic acid

Glycine

Methionine

Lycine

Threonine

Tryptophan

Arginine

Histidine

Valine

Proline

Tyrosine

Alanine

Asparagine

Cysteine

Isoleucine

127

Leucine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
8GUB , Knot	404	1096	0.86	40	345	985	MSYYHHHHHHDYDIPTTENLYFQGAMGSMPPRPSSGELWGIHLMPPRILVECLLPNGMIVTLECLREATLITIKHELFKEARKYPLHQLLQDESSYIFVSVTQEAEREEFFDETRRLCDLRLFQPFLKVIEPVGNREEKILNREIGFAIGMPVCEFDMVKDPEVQDFRRNILNVCKEAVDLRDLNSPHSRAMYVYPPNVESSPELPKHIYNKLDKGQIIVVIWVIVSPNNDKQKYTLKINHDCVPEQVIAEAIRKKTRSMLLSSEQLKLCVLEYQGKYILKVCGCDEYFLEKYPLSQYKYIRSCIMLGRMPNLMLMAKESLYSQLPMDCFTMPSYSRRISTATPYMNGETSTKSLWVINSALRIKILCATYVNVNIRDIDKIYVRTGIYHGGEPLCDNVNTQRVPCSNPRWNEWLNYDIYIPDLPRAARLCLSICSVKGRKGAKEEHCPLAWGNINLFDYTDTLVSGKMALNLWPVPHGLEDLLNPIGVTGSNPNKETPCLELEFDWFSSVVKFPDMSVIEEHANWSVSREAGFSYSHAGLSNRLARDNELRENDKEQLKAISTRDPLSEITEQEKDFLWSHRHYCVTIPEILPKLLLSVKWNSRDEVAQMYCLVKDWPPIKPEQAMELLDCNYPDPMVRGFAVRCLEKYLTDDKLSQYLIQLVQVLKYEQYLDNLLVRFLLKKALTNQRIGHFFFWHLKSEMHNKTVSQRFGLLLESYCRACGMYLKHLNRQVEAMEKLINLTDILKQEKKDETQKVQMKFLVEQMRRPDFMDALQGFLSPLNPAHQLGNLRLEECRIMSSAKRPLWLNWENPDIMSELLFQNNEIIFKNGDDLRQDMLTLQIIRIMENIWQNQGLDLRMLPYGCLSIGDCVGLIEVVRNSHTIMQIQCKGGLKGALQFNSHTLHQWLKDKNKGEIYDAAIDLFTRSCAGYCVATFILGIGDRHNSNIMVKDDGQLFHIDFGHFLDHKKKKFGYKRERVPFVLTQDFLIVISKGAQECTKTREFERFQEMCYKAYLAIRQHANLFINLFSMMLGSGMPELQSFDDIAYIRKTLALDKTEQEALEYFMKQMNDARHGGWTTKMDWIFHTIKQHALN
2BWI , Knot	140	340	0.80	40	195	317	AAGAAPVDISTLPRVKVDLVKPPFVHAHDQVAKTGPRVVEFTMTIEEKKLVIDREGTEIHAMTFNGSVPGPLMVVHENDYVELRLINPDTNTLLHNIDFHAATGALGGGALTQVNPGEETTLRFKATKPGVFVYHCAPEGMVPWHVTSGMNGAIMVLPRDGLKDEKGQPLTYDKIYYVGEQDFYVPKDEAGNYKKYETPGEAYEDAVKAMRTLTPTHIVFNGAVGALTGDHALTAAVGERVLVVHSQANRDTRPHLIGGHGDYVWATGKFRNPPDLDQETWLIPGGTAGAAFYTFRQPGVYAYVNHNLIEAFELGAAGHFKVTGEWNDDLMTSVVKPASM
6LJH , Knot	164	386	0.84	40	215	359	MAQKAPGVITCKAAVVWESSGPVVLEEIRVDPPKASEVRIKMLCASLCHTDVLCTKGFPIPLFPRIPGHEGVGVIESIGKDAKGLKPGDIVMPLYLGECGQCLNCKTGKTNLCHVYPPSFSGLMNDGTSRMSIARTGESIYHFASCSTWTEYAVADCNYVLKINPKISYPHASFLSCGFTTGFGATWRETQVSKGSSVAVFGIGTVGLGVIKGAQLQGASKIIGVDVNQYKAAKGKVFGMTDFINPKDHPDKSVSELVKELTHGLGVDHCFECTGVPSLLNEALEASKIGIGTVVPIGAGGEASVAINSLILFSGRTLKFTAFGGVRTQSDLPVIIDKCLNKEIQLDELLTHEIHLDNIQEAFEILKKPDCVKILIKFLEHHHHHH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

8GUB , Knot

404

1096

0.86

345

985

MSYYHHHHHHDYDIPTTENLYFQGAMGSMPPRPSSGELWGIHLMPPRILVECLLPNGMIVTLECLREATLITIKHELFKEARKYPLHQLLQDESSYIFVSVTQEAEREEFFDETRRLCDLRLFQPFLKVIEPVGNREEKILNREIGFAIGMPVCEFDMVKDPEVQDFRRNILNVCKEAVDLRDLNSPHSRAMYVYPPNVESSPELPKHIYNKLDKGQIIVVIWVIVSPNNDKQKYTLKINHDCVPEQVIAEAIRKKTRSMLLSSEQLKLCVLEYQGKYILKVCGCDEYFLEKYPLSQYKYIRSCIMLGRMPNLMLMAKESLYSQLPMDCFTMPSYSRRISTATPYMNGETSTKSLWVINSALRIKILCATYVNVNIRDIDKIYVRTGIYHGGEPLCDNVNTQRVPCSNPRWNEWLNYDIYIPDLPRAARLCLSICSVKGRKGAKEEHCPLAWGNINLFDYTDTLVSGKMALNLWPVPHGLEDLLNPIGVTGSNPNKETPCLELEFDWFSSVVKFPDMSVIEEHANWSVSREAGFSYSHAGLSNRLARDNELRENDKEQLKAISTRDPLSEITEQEKDFLWSHRHYCVTIPEILPKLLLSVKWNSRDEVAQMYCLVKDWPPIKPEQAMELLDCNYPDPMVRGFAVRCLEKYLTDDKLSQYLIQLVQVLKYEQYLDNLLVRFLLKKALTNQRIGHFFFWHLKSEMHNKTVSQRFGLLLESYCRACGMYLKHLNRQVEAMEKLINLTDILKQEKKDETQKVQMKFLVEQMRRPDFMDALQGFLSPLNPAHQLGNLRLEECRIMSSAKRPLWLNWENPDIMSELLFQNNEIIFKNGDDLRQDMLTLQIIRIMENIWQNQGLDLRMLPYGCLSIGDCVGLIEVVRNSHTIMQIQCKGGLKGALQFNSHTLHQWLKDKNKGEIYDAAIDLFTRSCAGYCVATFILGIGDRHNSNIMVKDDGQLFHIDFGHFLDHKKKKFGYKRERVPFVLTQDFLIVISKGAQECTKTREFERFQEMCYKAYLAIRQHANLFINLFSMMLGSGMPELQSFDDIAYIRKTLALDKTEQEALEYFMKQMNDARHGGWTTKMDWIFHTIKQHALN

2BWI , Knot

140

340

0.80

195

317

AAGAAPVDISTLPRVKVDLVKPPFVHAHDQVAKTGPRVVEFTMTIEEKKLVIDREGTEIHAMTFNGSVPGPLMVVHENDYVELRLINPDTNTLLHNIDFHAATGALGGGALTQVNPGEETTLRFKATKPGVFVYHCAPEGMVPWHVTSGMNGAIMVLPRDGLKDEKGQPLTYDKIYYVGEQDFYVPKDEAGNYKKYETPGEAYEDAVKAMRTLTPTHIVFNGAVGALTGDHALTAAVGERVLVVHSQANRDTRPHLIGGHGDYVWATGKFRNPPDLDQETWLIPGGTAGAAFYTFRQPGVYAYVNHNLIEAFELGAAGHFKVTGEWNDDLMTSVVKPASM

6LJH , Knot

164

386

0.84

215

359

MAQKAPGVITCKAAVVWESSGPVVLEEIRVDPPKASEVRIKMLCASLCHTDVLCTKGFPIPLFPRIPGHEGVGVIESIGKDAKGLKPGDIVMPLYLGECGQCLNCKTGKTNLCHVYPPSFSGLMNDGTSRMSIARTGESIYHFASCSTWTEYAVADCNYVLKINPKISYPHASFLSCGFTTGFGATWRETQVSKGSSVAVFGIGTVGLGVIKGAQLQGASKIIGVDVNQYKAAKGKVFGMTDFINPKDHPDKSVSELVKELTHGLGVDHCFECTGVPSLLNEALEASKIGIGTVVPIGAGGEASVAINSLILFSGRTLKFTAFGGVRTQSDLPVIIDKCLNKEIQLDELLTHEIHLDNIQEAFEILKKPDCVKILIKFLEHHHHHH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
8GUB_1,2BWI_1	188	4
8GUB_1,6LJH_1	178	6
2BWI_1,6LJH_1	162	4

Pair

\(Z_2\)

Length of longest common subsequence

8GUB_1,2BWI_1

188

8GUB_1,6LJH_1

178

2BWI_1,6LJH_1

162

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	8GUB_1	2BWI_1	368	237

Status

Protein1

Protein2

d₁/2

Query variables

8GUB_1

2BWI_1

368

237

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM