CoV2D Browser

1GLG_1	7FZM_1	7UZH_1	Letter	Amino acid
31	14	35	K	Lycine
7	6	21	F	Phenylalanine
5	2	6	W	Tryptophan
43	6	43	A	Alanine
31	11	36	D	Aspartic acid
15	2	18	Q	Glutamine
3	2	9	H	Histidine
10	1	31	P	Proline
12	10	52	S	Serine
6	6	33	R	Arginine
22	4	16	N	Asparagine
24	5	49	L	Leucine
7	2	25	Y	Tyrosine
26	17	51	V	Valine
0	2	6	C	Cysteine
12	9	45	E	Glutamic acid
21	11	50	G	Glycine
16	8	39	I	Isoleucine
6	5	22	M	Methionine
12	12	30	T	Threonine

1GLG_1

7FZM_1

7UZH_1

Letter

Amino acid

Lycine

Phenylalanine

Tryptophan

Alanine

Aspartic acid

Glutamine

Histidine

Proline

Serine

Arginine

Asparagine

Leucine

Tyrosine

Valine

Cysteine

Glutamic acid

Glycine

Isoleucine

Methionine

Threonine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
1GLG , Knot	132	309	0.81	38	166	285	ADTRIGVTIYKYDDNFMSVVRKAIEQDAKAAPDVQLLMNDSQNDQSKQNDQIDVLLAKGVKALAINLVDPAAAGTVIEKARGQNVPVVFFNKEPSRKALDSYDKAYYVGTDSKESGIIQGDLIAKHWAANQGWDLNKDGQIQFVLLKGEPGHPDAEARTTYVIKELNDKGIKTEQLQLDTAMWDTAQAKDKMDAWLSGPNANKIEVVIANNDAMAMGAVEALKAHNKSSIPVFGVDALPEALALVKSGALAGTVLNDANNQAKATFDLAKNLADGKGAADGTNWKIDNKVVRVPYVGVDKDNLAEFSKK
7FZM , Knot	69	135	0.83	40	104	129	GSHMCDAFVGTWKLVSSENFDDYMKEVGVGFATRKVAGMAKPNMIISVNGDVITIKSESTFKNTEISFILGQEFDEVTADDRKVKSTITLDGGVLVHVQKWDGKSTTIKRKREDDKLVVECVMKGVTSTRVYERA
7UZH , Knot	241	617	0.83	40	272	573	MDFSKLPKIRDEDKESTFGYVHGVSGPVVTACDMAGAAMYELVRVGHSELVGEIIRLEGDMATIQVYEETSGVSVGDPVLRTGKPLSVELGPGIMGAIFDGIQRPLSDISSQTQSIYIPRGVNVSALSRDIKWEFIPSKNLRVGSHITGGDIYGIVNENSLIKHKIMLPPRSRGSVTYIAPPGNYDASDVVLELEFEGVKEKLSMVQVWPVRQVRPVTEKLPANHPLLTGQRVLDALFPCVQGGTTAIPGAFGCGKTVISQSLSKYSNSDVIIYVGCGERGNEMSEVLRDFPELTMEVDGKVESIMKRTALVANTSNMPVAAREASIYTGITLSEYFRDMGYHVSMMADSTSRWAEALREISGRLAEMPADSGYPAYLGARLASFYERAGRVKCLGNPEREGSVSIVGAVSPPGGDFSDPVTSATLGIVQVFWGLDKKLAQRKHFPSVNWLISYSKYMRALDEYYDKHFTEFVPLRTKAKEILQEEEDLAEIVQLVGKASLAETDKITLEVAKLIKDDFLQQNGYTPYDRFCPFYKTVGMLSNMISFYDMARRAVETTAQSDNKITWSIIREHMGEILYKLSSMKFKDPVKDGEAKIKADYAQLLEDMQNAFRSLED

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

1GLG , Knot

132

309

0.81

166

285

ADTRIGVTIYKYDDNFMSVVRKAIEQDAKAAPDVQLLMNDSQNDQSKQNDQIDVLLAKGVKALAINLVDPAAAGTVIEKARGQNVPVVFFNKEPSRKALDSYDKAYYVGTDSKESGIIQGDLIAKHWAANQGWDLNKDGQIQFVLLKGEPGHPDAEARTTYVIKELNDKGIKTEQLQLDTAMWDTAQAKDKMDAWLSGPNANKIEVVIANNDAMAMGAVEALKAHNKSSIPVFGVDALPEALALVKSGALAGTVLNDANNQAKATFDLAKNLADGKGAADGTNWKIDNKVVRVPYVGVDKDNLAEFSKK

7FZM , Knot

135

0.83

104

129

GSHMCDAFVGTWKLVSSENFDDYMKEVGVGFATRKVAGMAKPNMIISVNGDVITIKSESTFKNTEISFILGQEFDEVTADDRKVKSTITLDGGVLVHVQKWDGKSTTIKRKREDDKLVVECVMKGVTSTRVYERA

7UZH , Knot

241

617

0.83

272

573

MDFSKLPKIRDEDKESTFGYVHGVSGPVVTACDMAGAAMYELVRVGHSELVGEIIRLEGDMATIQVYEETSGVSVGDPVLRTGKPLSVELGPGIMGAIFDGIQRPLSDISSQTQSIYIPRGVNVSALSRDIKWEFIPSKNLRVGSHITGGDIYGIVNENSLIKHKIMLPPRSRGSVTYIAPPGNYDASDVVLELEFEGVKEKLSMVQVWPVRQVRPVTEKLPANHPLLTGQRVLDALFPCVQGGTTAIPGAFGCGKTVISQSLSKYSNSDVIIYVGCGERGNEMSEVLRDFPELTMEVDGKVESIMKRTALVANTSNMPVAAREASIYTGITLSEYFRDMGYHVSMMADSTSRWAEALREISGRLAEMPADSGYPAYLGARLASFYERAGRVKCLGNPEREGSVSIVGAVSPPGGDFSDPVTSATLGIVQVFWGLDKKLAQRKHFPSVNWLISYSKYMRALDEYYDKHFTEFVPLRTKAKEILQEEEDLAEIVQLVGKASLAETDKITLEVAKLIKDDFLQQNGYTPYDRFCPFYKTVGMLSNMISFYDMARRAVETTAQSDNKITWSIIREHMGEILYKLSSMKFKDPVKDGEAKIKADYAQLLEDMQNAFRSLED

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
1GLG_1,7FZM_1	168	3
1GLG_1,7UZH_1	186	3
7FZM_1,7UZH_1	194	4

Pair

\(Z_2\)

Length of longest common subsequence

1GLG_1,7FZM_1

168

1GLG_1,7UZH_1

186

7FZM_1,7UZH_1

194

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	1GLG_1	7FZM_1	116	84.5

Status

Protein1

Protein2

d₁/2

Query variables

1GLG_1

7FZM_1

116

84.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM