CoV2D Browser

1SQX_1	2AGK_1	1HNC_1	Letter	Amino acid
33	13	13	S	Serine
22	10	9	Q	Glutamine
30	17	16	E	Glutamic acid
8	1	7	M	Methionine
15	6	3	H	Histidine
17	11	9	N	Asparagine
14	11	15	F	Phenylalanine
17	6	12	Y	Tyrosine
12	8	3	C	Cysteine
32	22	10	G	Glycine
17	12	12	I	Isoleucine
45	30	27	L	Leucine
14	24	18	K	Lycine
44	11	10	A	Alanine
25	10	11	R	Arginine
24	23	15	D	Aspartic acid
30	19	5	V	Valine
18	4	12	P	Proline
24	15	7	T	Threonine
5	7	3	W	Tryptophan

1SQX_1

2AGK_1

1HNC_1

Letter

Amino acid

Serine

Glutamine

Glutamic acid

Methionine

Histidine

Asparagine

Phenylalanine

Tyrosine

Cysteine

Glycine

Isoleucine

Leucine

Lycine

Alanine

Arginine

Aspartic acid

Valine

Proline

Threonine

Tryptophan

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
1SQX , Knot	185	446	0.84	40	239	424	TATYAQALQSVPETQVSQLDNGLRVASEQSSQPTCTVGVWIDAGSRYESEKNNGAGYFVEHLAFKGTKNRPGNALEKEVESMGAHLNAYSTREHTAYYIKALSKDLPKAVELLADIVQNCSLEDSQIEKERDVILQELQENDTSMRDVVFNYLHATAFQGTPLAQSVEGPSENVRKLSRADLTEYLSRHYKAPRMVLAAAGGLEHRQLLDLAQKHFSGLSGTYDEDAVPTLSPCRFTGSQICHREDGLPLAHVAIAVEGPGWAHPDNVALQVANAIIGHYDCTYGGGAHLSSPLASIAATNKLCQSFQTFNICYADTGLLGAHFVCDHMSIDDMMFVLQGQWMRLCTSATESEVLRGKNLLRNALVSHLDGTTPVCEDIGRSLLTYGRRIPLAEWESRIAEVDARVVREVCSKYFYDQCPAVAGFGPIEQLPDYNRIRSGMFWLRF
2AGK , Knot	115	260	0.82	40	168	249	TKFIGCIDLHNGEVKQIVGGTLTSKKEDVPKTNFVSQHPSSYYAKLYKDRDVQGCHVIKLGPNNDDAAREALQESPQFLQVGGGINDTNCLEWLKWASKVIVTSWLFTKEGHFQLKRLERLTELCGKDRIVVDLSCRKTQDGRWIVAMNKWQTLTDLELNADTFRELRKYTNEFLIHAADVEGLCGGIDELLVSKLFEWTKDYDDLKIVYAGGAKSVDDLKLVDELSHGKVDLTFGSSLDIFGGNLVKFEDCCRWNEKQG
1HNC , Knot	101	217	0.83	40	153	209	PMTLGYWNIRGLAHSIRLLLEYTDSSYEEKKYTMGDAPDYDRSQWLNEKFKLGLDFPNLPYLIDGTHKITQSNAILRYIARKHNLCGESEKEQIREDILENQFMDSRMQLAKLCYDPDFEKLKPEYLQALPEMLKLYSQFLGKQPWFLGDKITFVDFIAYDVLERNQVFEPSCLDAFPNLKDFISRFEGLEKISAYMKSSRFLPRPVFTKMAVFGNK

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

1SQX , Knot

185

446

0.84

239

424

TATYAQALQSVPETQVSQLDNGLRVASEQSSQPTCTVGVWIDAGSRYESEKNNGAGYFVEHLAFKGTKNRPGNALEKEVESMGAHLNAYSTREHTAYYIKALSKDLPKAVELLADIVQNCSLEDSQIEKERDVILQELQENDTSMRDVVFNYLHATAFQGTPLAQSVEGPSENVRKLSRADLTEYLSRHYKAPRMVLAAAGGLEHRQLLDLAQKHFSGLSGTYDEDAVPTLSPCRFTGSQICHREDGLPLAHVAIAVEGPGWAHPDNVALQVANAIIGHYDCTYGGGAHLSSPLASIAATNKLCQSFQTFNICYADTGLLGAHFVCDHMSIDDMMFVLQGQWMRLCTSATESEVLRGKNLLRNALVSHLDGTTPVCEDIGRSLLTYGRRIPLAEWESRIAEVDARVVREVCSKYFYDQCPAVAGFGPIEQLPDYNRIRSGMFWLRF

2AGK , Knot

115

260

0.82

168

249

TKFIGCIDLHNGEVKQIVGGTLTSKKEDVPKTNFVSQHPSSYYAKLYKDRDVQGCHVIKLGPNNDDAAREALQESPQFLQVGGGINDTNCLEWLKWASKVIVTSWLFTKEGHFQLKRLERLTELCGKDRIVVDLSCRKTQDGRWIVAMNKWQTLTDLELNADTFRELRKYTNEFLIHAADVEGLCGGIDELLVSKLFEWTKDYDDLKIVYAGGAKSVDDLKLVDELSHGKVDLTFGSSLDIFGGNLVKFEDCCRWNEKQG

1HNC , Knot

101

217

0.83

153

209

PMTLGYWNIRGLAHSIRLLLEYTDSSYEEKKYTMGDAPDYDRSQWLNEKFKLGLDFPNLPYLIDGTHKITQSNAILRYIARKHNLCGESEKEQIREDILENQFMDSRMQLAKLCYDPDFEKLKPEYLQALPEMLKLYSQFLGKQPWFLGDKITFVDFIAYDVLERNQVFEPSCLDAFPNLKDFISRFEGLEKISAYMKSSRFLPRPVFTKMAVFGNK

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Pair	\(Z_2\)	Length of longest common subsequence
1SQX_1,2AGK_1	179	3
1SQX_1,1HNC_1	198	4
2AGK_1,1HNC_1	169	3

Pair

\(Z_2\)

Length of longest common subsequence

1SQX_1,2AGK_1

179

1SQX_1,1HNC_1

198

2AGK_1,1HNC_1

169

Newick tree

Status	Protein1	Protein2	d	d₁/2
Query variables	1SQX_1	2AGK_1	159	125

Status

Protein1

Protein2

d₁/2

Query variables

1SQX_1

2AGK_1

159

125

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM