CoV2D Browser

4XLQ_1	9LDT_1	1UYS_1	Letter	Amino acid
19	12	39	T	Threonine
26	36	52	V	Valine
22	20	52	A	Alanine
17	15	43	D	Aspartic acid
43	36	60	L	Leucine
4	8	17	M	Methionine
18	12	34	P	Proline
34	20	60	E	Glutamic acid
22	26	57	G	Glycine
6	12	9	H	Histidine
19	24	51	I	Isoleucine
16	23	39	S	Serine
21	11	49	R	Arginine
0	5	2	C	Cysteine
5	8	29	Q	Glutamine
5	7	25	Y	Tyrosine
9	17	33	N	Asparagine
17	26	40	K	Lycine
10	7	32	F	Phenylalanine
1	6	14	W	Tryptophan

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
4XLQ , Knot	133	314	0.81	38	169	293	MLESKLKAPVFTATTQGDHYGEFVLEPLERGFGVTLGNPLRRILLSSIPGTAVTSVYIEDVLHEFSTIPGVKEDVVEIILNLKELVVRFLDPKMASTTLILRAEGPKEVRAGDFTPSADVEIMNPDLHIATLEEGGKLYMEVRVDRGVGYVPAERHGIKDRINAIPVDAIFSPVRRVAFQVEDTRLGQRTDLDKLTLRIWTDGSVTPLEALNQAVAILKEHLNYFANPEASLLPTPEVSKGEKRESAEEDLDLPLEELGLSTRVLHSLKEEGIESVRALLALNLKDLRNIPGIGERSLEEIRQALAKKGFTLKE
9LDT , Knot	143	332	0.83	42	198	319	XATLKDQLIHNLLKEEHVPHNKITVVGVGAVGMACAISILMKELADEIALVDVMEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSRLVVITAGARQQEGESRLNLVQRNVNIFKFIIPNIVKYSPNCKLLVVSNPVDILTYVAWKISGFPKNRVIGSGCNLDSARFRYLMGERLGVHPLSCHGWILGEHGDSSVPVWSGVNVAGVSLKNLHPELGTDADKEHWKAVHKEVVDSAYEVIKLKGYTSWAIGLSVADLAESIMKNLRRVHPISTMIKGLYGIKENVFLSVPCILGQNGISDVVKVTLTPEEEAHLKKSADTLWGIQKELQF
1UYS , Knot	289	737	0.86	40	287	676	PIATPYPVKEWLQPKRYKAHLMGTTYVYDFPELFRQASSSQWKNFSADVKLTDDFFISNELIEDENGELTEVEREPGANAIGMVAFKITVKTPEYPRGRQFVVVANDITFKIGSFGPQEDEFFNKVTEYARKRGIPRIYLAANSGARIGMAEEIVPLFQVAWNDAANPDKGFQYLYLTSEGMETLKKFDKENSVLTERTVINGEERFVIKTIIGSEDGLGVECLRGSGLIAGATSRAYHDIFTITLVTCRSVGIGAYLVRLGQRAIQVEGQPIILTGAPAINKMLGREVYTSNLQLGGTQIMYNNGVSHLTAVDDLAGVEKIVEWMSYVPAKRNMPVPILETKDTWDRPVDFTPTNDETYDVRWMIEGRETESGFEYGLFDKGSFFETLSGWAKGVVVGRARLGGIPLGVIGVETRTVENLIPADPANPNSAETLIQEPGQVWHPNSAFKTAQAINDFNNGEQLPMMILANWRGFSGGQRDMFNEVLKYGSFIVDALVDYKQPIIIYIPPTGELRGGSWVVVDPTINADQMEMYADVNARAGVLEPQGMVGIKFRREKLLDTMNRLDDKYRELRSQLSNKSLAPEVHQQISKQLADRERELLPIYGQISLQFADLHDRSSRMVAKGVISKELEWTEARRFFFWRLRRRLNEEYLIKRLSHQVGEASRLEKIARIRSWYPASVDHEDDRQVATWIEENYKTLDDKLKGLKLESFAQDLAKKIRSDHDNAIDGLSEVIK

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

4XLQ , Knot

133

314

0.81

169

293

MLESKLKAPVFTATTQGDHYGEFVLEPLERGFGVTLGNPLRRILLSSIPGTAVTSVYIEDVLHEFSTIPGVKEDVVEIILNLKELVVRFLDPKMASTTLILRAEGPKEVRAGDFTPSADVEIMNPDLHIATLEEGGKLYMEVRVDRGVGYVPAERHGIKDRINAIPVDAIFSPVRRVAFQVEDTRLGQRTDLDKLTLRIWTDGSVTPLEALNQAVAILKEHLNYFANPEASLLPTPEVSKGEKRESAEEDLDLPLEELGLSTRVLHSLKEEGIESVRALLALNLKDLRNIPGIGERSLEEIRQALAKKGFTLKE

9LDT , Knot

143

332

0.83

198

319

XATLKDQLIHNLLKEEHVPHNKITVVGVGAVGMACAISILMKELADEIALVDVMEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSRLVVITAGARQQEGESRLNLVQRNVNIFKFIIPNIVKYSPNCKLLVVSNPVDILTYVAWKISGFPKNRVIGSGCNLDSARFRYLMGERLGVHPLSCHGWILGEHGDSSVPVWSGVNVAGVSLKNLHPELGTDADKEHWKAVHKEVVDSAYEVIKLKGYTSWAIGLSVADLAESIMKNLRRVHPISTMIKGLYGIKENVFLSVPCILGQNGISDVVKVTLTPEEEAHLKKSADTLWGIQKELQF

1UYS , Knot

289

737

0.86

287

676

PIATPYPVKEWLQPKRYKAHLMGTTYVYDFPELFRQASSSQWKNFSADVKLTDDFFISNELIEDENGELTEVEREPGANAIGMVAFKITVKTPEYPRGRQFVVVANDITFKIGSFGPQEDEFFNKVTEYARKRGIPRIYLAANSGARIGMAEEIVPLFQVAWNDAANPDKGFQYLYLTSEGMETLKKFDKENSVLTERTVINGEERFVIKTIIGSEDGLGVECLRGSGLIAGATSRAYHDIFTITLVTCRSVGIGAYLVRLGQRAIQVEGQPIILTGAPAINKMLGREVYTSNLQLGGTQIMYNNGVSHLTAVDDLAGVEKIVEWMSYVPAKRNMPVPILETKDTWDRPVDFTPTNDETYDVRWMIEGRETESGFEYGLFDKGSFFETLSGWAKGVVVGRARLGGIPLGVIGVETRTVENLIPADPANPNSAETLIQEPGQVWHPNSAFKTAQAINDFNNGEQLPMMILANWRGFSGGQRDMFNEVLKYGSFIVDALVDYKQPIIIYIPPTGELRGGSWVVVDPTINADQMEMYADVNARAGVLEPQGMVGIKFRREKLLDTMNRLDDKYRELRSQLSNKSLAPEVHQQISKQLADRERELLPIYGQISLQFADLHDRSSRMVAKGVISKELEWTEARRFFFWRLRRRLNEEYLIKRLSHQVGEASRLEKIARIRSWYPASVDHEDDRQVATWIEENYKTLDDKLKGLKLESFAQDLAKKIRSDHDNAIDGLSEVIK

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Newick tree

Pair	\(Z_2\)	Length of longest common subsequence
4XLQ_1,9LDT_1	159	4
4XLQ_1,1UYS_1	162	5
9LDT_1,1UYS_1	175	5

Status	Protein1	Protein2	d	d₁/2
Query variables	4XLQ_1	9LDT_1	114	110

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM