CoV2D Browser

5QGQ_1	1NZC_1	8ROQ_1	Letter	Amino acid
9	6	39	I	Isoleucine
3	3	31	M	Methionine
14	11	57	P	Proline
4	10	64	S	Serine
8	7	63	Y	Tyrosine
13	13	56	D	Aspartic acid
9	3	12	H	Histidine
23	18	66	L	Leucine
12	15	25	K	Lycine
9	15	49	F	Phenylalanine
11	6	73	T	Threonine
0	5	17	W	Tryptophan
10	7	44	R	Arginine
11	14	62	G	Glycine
18	16	53	V	Valine
6	12	80	N	Asparagine
4	0	5	C	Cysteine
11	18	33	E	Glutamic acid
14	14	66	A	Alanine
7	4	42	Q	Glutamine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
5QGQ , Knot	92	196	0.82	38	147	187	SMLDDAKARLRKYDIGGKYSHLPYNKYSVLLPLVAKEGKLHLLFTVRSEKLRRAPGEVCFPGGKRDPTDMDDAATALREAQEEVGLRPHQVEVVCCLVPCLIDTDTLITPFVGLIDHNFQAQPNPAEVKDVFLVPLAYFLHPQVHDQHYVTRLGHRFINHIFEYTNPEDGVTYQIKGMTANLAVLVAFIILEKKPT
1NZC , Knot	94	197	0.84	38	149	194	MTENFFGKTLAARPVEAIPGMLEFDIPVHGDNRGWFKENFQKEKMLPLGFPESFFAEGKLQNNVSFSRKNVLRGLHAEPWDKYISVADGGKVLGTWVDLREGETFGNTYQTVIDASKSIFVPRGVANGFQVLSDFVAYSYLVNDYWALELKPKYAFVNYADPSLDIKWENLEEAEVSEADENHPFLKDVKPLRKEDL
8ROQ , Knot	345	937	0.84	40	309	847	MAALTPDLTTATPRLQYFHIAGPGTREYLSEDLQQFISATGSYFDLKNKFRQTVVAPTRNVTTEKAQRLQIRFYPIQTDDTSTGYRVRYNINVGDGWVLDMGSTYFDIKGILDRGPSFKPYCGTAYNPLAPKESMFNNWSETAPGQNVSASGQLSNVYTNTSTTKDTTAAQVTKISGVFPNPNQGPGINPLRQVENANTGVLGRFAKSQYNYAYGAYVKPVAADGSQSLTQTPYWIMNNAGTEYLGAVAVEDYTNSLSYPDTMIVPPPEDYDDYNIGTTRALRPNYIGFRDNFINLLYHDSGVCSGTLNSERSGMNVVVELPDRNTELSYQYMLADMMSRHHYFALWNQAVDQYDPEVRVFSNDGYEEGAPSYAFNPEAVGAGEGYGPDLSQIKLYTNNTAANDKNTAVTNATTNFYFGTVPSYEIDISATQRRNFIMANIAEYLPDRYKFSISGFDATSVAPTTYEYMNKRVPLTNVVDMFTNVGARWSIDQMDNVNPFNHHRNWGLKYRSQLLGNSRYVNFHIQVPQKFFAIKNLLLLSGSYTYEWVLRKDPNMILQSSLGNDLRADGASIIYNEVNLMANFMPMDHNTSNQLELMLRNATNDQTFVDYLGAKNALYSVPAGSTALTINIPARTWEGMRGWSFTRIKAAETPQLGAQYDVNFKYSGSIAYSDGGFYLSHTFRNMSILFDTSINWPGNDRLLTPNMFEIKRSVALDTEGFTMSQCDITKDWYLIQMATNYNFVYNGYRFWPDRQYFHYDFLRNFDPMTRQGPNFALPGLFDLVSYTPTTDNSGEQPSQEAVRNNSGFIAPRSWPVWSAHQGESWPANWPYPLCGQQAIQPGQVLSYKKFLCDNYLWTIPFSSDFMYMGELTDLGQNPMYTNNSHSMVINFELDPMDDPTYVYMLYGVFDTVRVNQPERNVLAMAYFRTPFATGNAV

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

5QGQ , Knot

196

0.82

147

187

SMLDDAKARLRKYDIGGKYSHLPYNKYSVLLPLVAKEGKLHLLFTVRSEKLRRAPGEVCFPGGKRDPTDMDDAATALREAQEEVGLRPHQVEVVCCLVPCLIDTDTLITPFVGLIDHNFQAQPNPAEVKDVFLVPLAYFLHPQVHDQHYVTRLGHRFINHIFEYTNPEDGVTYQIKGMTANLAVLVAFIILEKKPT

1NZC , Knot

197

0.84

149

194

MTENFFGKTLAARPVEAIPGMLEFDIPVHGDNRGWFKENFQKEKMLPLGFPESFFAEGKLQNNVSFSRKNVLRGLHAEPWDKYISVADGGKVLGTWVDLREGETFGNTYQTVIDASKSIFVPRGVANGFQVLSDFVAYSYLVNDYWALELKPKYAFVNYADPSLDIKWENLEEAEVSEADENHPFLKDVKPLRKEDL

8ROQ , Knot

345

937

0.84

309

847

MAALTPDLTTATPRLQYFHIAGPGTREYLSEDLQQFISATGSYFDLKNKFRQTVVAPTRNVTTEKAQRLQIRFYPIQTDDTSTGYRVRYNINVGDGWVLDMGSTYFDIKGILDRGPSFKPYCGTAYNPLAPKESMFNNWSETAPGQNVSASGQLSNVYTNTSTTKDTTAAQVTKISGVFPNPNQGPGINPLRQVENANTGVLGRFAKSQYNYAYGAYVKPVAADGSQSLTQTPYWIMNNAGTEYLGAVAVEDYTNSLSYPDTMIVPPPEDYDDYNIGTTRALRPNYIGFRDNFINLLYHDSGVCSGTLNSERSGMNVVVELPDRNTELSYQYMLADMMSRHHYFALWNQAVDQYDPEVRVFSNDGYEEGAPSYAFNPEAVGAGEGYGPDLSQIKLYTNNTAANDKNTAVTNATTNFYFGTVPSYEIDISATQRRNFIMANIAEYLPDRYKFSISGFDATSVAPTTYEYMNKRVPLTNVVDMFTNVGARWSIDQMDNVNPFNHHRNWGLKYRSQLLGNSRYVNFHIQVPQKFFAIKNLLLLSGSYTYEWVLRKDPNMILQSSLGNDLRADGASIIYNEVNLMANFMPMDHNTSNQLELMLRNATNDQTFVDYLGAKNALYSVPAGSTALTINIPARTWEGMRGWSFTRIKAAETPQLGAQYDVNFKYSGSIAYSDGGFYLSHTFRNMSILFDTSINWPGNDRLLTPNMFEIKRSVALDTEGFTMSQCDITKDWYLIQMATNYNFVYNGYRFWPDRQYFHYDFLRNFDPMTRQGPNFALPGLFDLVSYTPTTDNSGEQPSQEAVRNNSGFIAPRSWPVWSAHQGESWPANWPYPLCGQQAIQPGQVLSYKKFLCDNYLWTIPFSSDFMYMGELTDLGQNPMYTNNSHSMVINFELDPMDDPTYVYMLYGVFDTVRVNQPERNVLAMAYFRTPFATGNAV

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Newick tree

Pair	\(Z_2\)	Length of longest common subsequence
5QGQ_1,1NZC_1	154	4
5QGQ_1,8ROQ_1	190	3
1NZC_1,8ROQ_1	202	4

Status	Protein1	Protein2	d	d₁/2
Query variables	5QGQ_1	1NZC_1	73	72

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM