CoV2D Browser

1UBT_1	1IQF_1	6NCX_1	Letter	Amino acid
7	15	33	R	Arginine
12	17	24	K	Lycine
16	16	36	V	Valine
31	13	31	A	Alanine
23	22	44	G	Glycine
11	11	31	D	Aspartic acid
15	19	51	E	Glutamic acid
14	13	36	I	Isoleucine
19	13	43	L	Leucine
6	5	6	M	Methionine
22	6	28	P	Proline
10	11	42	S	Serine
10	8	32	Y	Tyrosine
16	7	22	N	Asparagine
7	9	19	Q	Glutamine
8	5	23	H	Histidine
11	12	23	F	Phenylalanine
15	20	21	T	Threonine
3	4	13	W	Tryptophan
11	9	16	C	Cysteine

1UBT_1

1IQF_1

6NCX_1

Letter

Amino acid

Arginine

Lycine

Valine

Alanine

Glycine

Aspartic acid

Glutamic acid

Isoleucine

Leucine

Methionine

Proline

Serine

Tyrosine

Asparagine

Glutamine

Histidine

Phenylalanine

Threonine

Tryptophan

Cysteine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
1UBT , Knot	120	267	0.83	40	183	259	LMGPRRPSVVYLHNAECTGCSESVLRAFEPYIDTLILDTLSLDYHETIMAAAGDAAEAALEQAVNSPHGFIAVVEGGIPTAANGIYGKVANHTMLDICSRILPKAQAVIAYGTCATFGGVQAAKPNPTGAKGVNDALKHLGVKAINIAGCPPNPYNLVGTIVYYLKNKAAPELDSLNRPTMFFGQTVHEQCPRLPHFDAGEFAPSFESEEARKGWCLYELGCKGPVTMNNCPKIKFNQTNWPVDAGHPCIGCSEPDFWDAMTPFYQN
1IQF , Knot	109	235	0.84	40	171	227	IVGGQECKDGECPWQALLINEENEGFCGGTILSEFYILTAAHCLYQAKRFKVRVGDRNTEQEEGGEAVHEVEVVIKHNRFTKETYDFDIAVLRLKTPITFRMNVAPACLPERDWAESTLMTQKTGIVSGFGRTHEKGRQSTRLKMLEVPYVDRNSCKLSSSFIITQNMFCAGYDTKQEDACQGDSGGPHVTRFKDTYFVTGIVSWGEGCARKGKYGIYTKVTAFLKWIDRSMKTR
6NCX , Knot	230	574	0.84	40	267	537	MIRTFETHKIRKTAELSSALWNFHTIGTQGEEAVIQAPVPGCWENYPDTVSYRGQASYSREFEAKGNIRLEFKGVSHTASVLVDGKPVGSHYNAYTPFDVVLKDIRPGIHQLEVIADNSFGPDSALHVPNDYQSYGGISRGVVLEELGEAYLSWIHFTPFLRKDGWYGKAEICVRNLSSGRLDGSVEVEIGKNSFAVLPIVLEGEEEKSFSTEELPCPWAECWSPESPVLYLITAVLRTADGAADDIIDRVGFREIRTEGKDILLNGRKLRIKGFCRHEDHPQFGCALPFSAMQHDLMLIKDLGANSIRTVHYPNDELFLDLCDEQGILVWEENHARGLSEENMRNPHFKQQCGDCIREMITAHYNHPSIYIWGILNECASDTEYGRECYSEQYELIKSLDPYRPRSSASCRFKTDICLGYPEVVSYNIYPKWYHDVPVEDYLDELYQWIQNESEGTGKPFLITEIGAGAIYGYRTPAHVKWSEEYQVQALKEQLQAVFSREGCSGVYIWQFCDVRVCDSWFGSRPRTMNNKGIVDEYRRPKLAYEVVKDSYRSLGNYFENLYFQSGSHHHHHH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

1UBT , Knot

120

267

0.83

183

259

LMGPRRPSVVYLHNAECTGCSESVLRAFEPYIDTLILDTLSLDYHETIMAAAGDAAEAALEQAVNSPHGFIAVVEGGIPTAANGIYGKVANHTMLDICSRILPKAQAVIAYGTCATFGGVQAAKPNPTGAKGVNDALKHLGVKAINIAGCPPNPYNLVGTIVYYLKNKAAPELDSLNRPTMFFGQTVHEQCPRLPHFDAGEFAPSFESEEARKGWCLYELGCKGPVTMNNCPKIKFNQTNWPVDAGHPCIGCSEPDFWDAMTPFYQN

1IQF , Knot

109

235

0.84

171

227

IVGGQECKDGECPWQALLINEENEGFCGGTILSEFYILTAAHCLYQAKRFKVRVGDRNTEQEEGGEAVHEVEVVIKHNRFTKETYDFDIAVLRLKTPITFRMNVAPACLPERDWAESTLMTQKTGIVSGFGRTHEKGRQSTRLKMLEVPYVDRNSCKLSSSFIITQNMFCAGYDTKQEDACQGDSGGPHVTRFKDTYFVTGIVSWGEGCARKGKYGIYTKVTAFLKWIDRSMKTR

6NCX , Knot

230

574

0.84

267

537

MIRTFETHKIRKTAELSSALWNFHTIGTQGEEAVIQAPVPGCWENYPDTVSYRGQASYSREFEAKGNIRLEFKGVSHTASVLVDGKPVGSHYNAYTPFDVVLKDIRPGIHQLEVIADNSFGPDSALHVPNDYQSYGGISRGVVLEELGEAYLSWIHFTPFLRKDGWYGKAEICVRNLSSGRLDGSVEVEIGKNSFAVLPIVLEGEEEKSFSTEELPCPWAECWSPESPVLYLITAVLRTADGAADDIIDRVGFREIRTEGKDILLNGRKLRIKGFCRHEDHPQFGCALPFSAMQHDLMLIKDLGANSIRTVHYPNDELFLDLCDEQGILVWEENHARGLSEENMRNPHFKQQCGDCIREMITAHYNHPSIYIWGILNECASDTEYGRECYSEQYELIKSLDPYRPRSSASCRFKTDICLGYPEVVSYNIYPKWYHDVPVEDYLDELYQWIQNESEGTGKPFLITEIGAGAIYGYRTPAHVKWSEEYQVQALKEQLQAVFSREGCSGVYIWQFCDVRVCDSWFGSRPRTMNNKGIVDEYRRPKLAYEVVKDSYRSLGNYFENLYFQSGSHHHHHH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
1UBT_1,1IQF_1	168	4
1UBT_1,6NCX_1	174	4
1IQF_1,6NCX_1	176	4

Pair

\(Z_2\)

Length of longest common subsequence

1UBT_1,1IQF_1

168

1UBT_1,6NCX_1

174

1IQF_1,6NCX_1

176

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	1UBT_1	1IQF_1	97	90

Status

Protein1

Protein2

d₁/2

Query variables

1UBT_1

1IQF_1

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM