CoV2D Browser

1ZOP_1	2VZM_1	3UFH_1	Letter	Amino acid
13	24	75	T	Threonine
12	49	96	A	Alanine
12	28	41	E	Glutamic acid
15	11	26	F	Phenylalanine
4	33	44	P	Proline
6	8	29	Y	Tyrosine
16	32	50	D	Aspartic acid
11	21	72	S	Serine
0	6	4	W	Tryptophan
9	32	78	G	Glycine
5	7	44	N	Asparagine
1	2	26	C	Cysteine
7	8	18	Q	Glutamine
4	18	36	H	Histidine
15	13	36	I	Isoleucine
17	52	57	L	Leucine
21	4	55	K	Lycine
4	45	20	R	Arginine
11	30	57	V	Valine
4	13	10	M	Methionine

Protein code \(c\)	LZ-complexity \(\mathrm{LZ}(w)\)	Length \(n=\|w\|\)	\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)	\(p_w(1)\)	\(p_w(2)\)	\(p_w(3)\)	Sequence \(w=f(c)\)
1ZOP , Knot	87	187	0.81	38	130	181	CIKGNVDLVFLFDGSMSLQPDEFQKILDFMKDVMKKLSNTSYQFAAVQFSTSYKTEFDFSDYVKRKDPDALLKHVKHMLLLTNTFGAINYVATEVFREELGARPDATKVLIIITDGEATDSGNIDAAKDIIRYIIGIGKHFQTKESQETLHKFASKPASEFVKILDTFEKLKDLFTELQKKIYVIEG
2VZM , Knot	177	436	0.82	40	213	397	MGSSHHHHHHSSGLVPRGSHMRRTQQGTTASPPVLDLGALGQDFAADPYPTYARLRAEGPAHRVRTPEGNEVWLVVGYDRARAVLADPRFSKDWRNSTTPLTEAEAALNHNMLESDPPRHTRLRKLVAREFTMRRVELLRPRVQEIVDGLVDAMLAAPDGRADLMESLAWPLPITVISELLGVPEPDRAAFRVWTDAFVFPDDPAQAQTAMAEMSGYLSRLIDSKRGQDGEDLLSALVRTSDEDGSRLTSEELLGMAHILLVAGHETTVNLIANGMYALLSHPDQLAALRADMTLLDGAVEEMLRYEGPVESATYRFPVEPVDLDGTVIPAGDTVLVVLADAHRTPERFPDPHRFDIRRDTAGHLAFGHGIHFCIGAPLARLEARIAVRALLERCPDLALDVSPGELVWYPNPMIRGLKALPIRWRRGREAGRRTG
3UFH , Knot	320	874	0.82	40	283	758	MSKKLLSVLFGASLAALALSPTAFAADQGGSDGKDGEDGKPGPVGLDISQATTLKATLEDVKIDNGTVSVDIVLTNANGVPVTGLEQYAQINAIGLGIAKLTPESGKGYKTPQWVSYINSVKAADPARSLANYSYTDGKDSAGNPITKEVKFTPGDAIQANIESSCKTTCLTVVDSGVYRYTFQTNLSTLPAIEGLDLTYDPTLIHRITLELQTDGSKDAKLVNSHIDFLPSDNFRVAKETETRTVVDLEANCIKCHSTNYSDTSSTAKPLALHGGRRIGIANCQVCHTSYSKDPETGSPLDMGAMVHAIHKGTYAMVGYSGTAYDFSGTMAKAAAESGYPQYREGKDVSERVTLPVSIGNCQSCHSTDDKGPVDAASFKHHKGLACASCHMSGFNPVDNSEWLTPPEGQKDRGFVGNYFHYYATPEIDGIPGVNLVHVFQNGGCASCHAEQGEEGSAKYHLAKANATKLLRTEYAYKLENGTFDVAKGELTFTVNWHSDVAPHQDPKVKEFWVSLTAFNGTEYTMGPRPSNGTLGRSENRISVNLAKVETNANLTAVPNGSKVTYTLTGIKAVIGTSSVPYKQIVSIGKGFMDGKLLICANSAELDPTMDAAIDCSNTEAPIYEVIVGSNKASFSADASNVTARSIVISEAKCANCHGEKADFSASHALTHAADKPDNSCGTCHSAVPNTAVALADGSCVACHNGAPAHSKKPFERGFDFKVMIHQIHADTRSVRRLTTDAATFPENPANCAACHDKGQLSLATLGNKPAFLASTGEYSPTVAACASCHATTATDSAVIGHFETNGGVYNAAAGTYTPGSETCATCHGEGKSFGVDKVHPVKYKGELKLEGKPIPNPLLGLDSTRTGHHHHHH

Protein code \(c\)

LZ-complexity \(\mathrm{LZ}(w)\)

Length \(n=|w|\)

\(\frac{\mathrm{LZ}(w)}{n /\log_{20} n}\)

\(p_w(1)\)

\(p_w(2)\)

\(p_w(3)\)

Sequence \(w=f(c)\)

1ZOP , Knot

187

0.81

130

181

CIKGNVDLVFLFDGSMSLQPDEFQKILDFMKDVMKKLSNTSYQFAAVQFSTSYKTEFDFSDYVKRKDPDALLKHVKHMLLLTNTFGAINYVATEVFREELGARPDATKVLIIITDGEATDSGNIDAAKDIIRYIIGIGKHFQTKESQETLHKFASKPASEFVKILDTFEKLKDLFTELQKKIYVIEG

2VZM , Knot

177

436

0.82

213

397

MGSSHHHHHHSSGLVPRGSHMRRTQQGTTASPPVLDLGALGQDFAADPYPTYARLRAEGPAHRVRTPEGNEVWLVVGYDRARAVLADPRFSKDWRNSTTPLTEAEAALNHNMLESDPPRHTRLRKLVAREFTMRRVELLRPRVQEIVDGLVDAMLAAPDGRADLMESLAWPLPITVISELLGVPEPDRAAFRVWTDAFVFPDDPAQAQTAMAEMSGYLSRLIDSKRGQDGEDLLSALVRTSDEDGSRLTSEELLGMAHILLVAGHETTVNLIANGMYALLSHPDQLAALRADMTLLDGAVEEMLRYEGPVESATYRFPVEPVDLDGTVIPAGDTVLVVLADAHRTPERFPDPHRFDIRRDTAGHLAFGHGIHFCIGAPLARLEARIAVRALLERCPDLALDVSPGELVWYPNPMIRGLKALPIRWRRGREAGRRTG

3UFH , Knot

320

874

0.82

283

758

MSKKLLSVLFGASLAALALSPTAFAADQGGSDGKDGEDGKPGPVGLDISQATTLKATLEDVKIDNGTVSVDIVLTNANGVPVTGLEQYAQINAIGLGIAKLTPESGKGYKTPQWVSYINSVKAADPARSLANYSYTDGKDSAGNPITKEVKFTPGDAIQANIESSCKTTCLTVVDSGVYRYTFQTNLSTLPAIEGLDLTYDPTLIHRITLELQTDGSKDAKLVNSHIDFLPSDNFRVAKETETRTVVDLEANCIKCHSTNYSDTSSTAKPLALHGGRRIGIANCQVCHTSYSKDPETGSPLDMGAMVHAIHKGTYAMVGYSGTAYDFSGTMAKAAAESGYPQYREGKDVSERVTLPVSIGNCQSCHSTDDKGPVDAASFKHHKGLACASCHMSGFNPVDNSEWLTPPEGQKDRGFVGNYFHYYATPEIDGIPGVNLVHVFQNGGCASCHAEQGEEGSAKYHLAKANATKLLRTEYAYKLENGTFDVAKGELTFTVNWHSDVAPHQDPKVKEFWVSLTAFNGTEYTMGPRPSNGTLGRSENRISVNLAKVETNANLTAVPNGSKVTYTLTGIKAVIGTSSVPYKQIVSIGKGFMDGKLLICANSAELDPTMDAAIDCSNTEAPIYEVIVGSNKASFSADASNVTARSIVISEAKCANCHGEKADFSASHALTHAADKPDNSCGTCHSAVPNTAVALADGSCVACHNGAPAHSKKPFERGFDFKVMIHQIHADTRSVRRLTTDAATFPENPANCAACHDKGQLSLATLGNKPAFLASTGEYSPTVAACASCHATTATDSAVIGHFETNGGVYNAAAGTYTPGSETCATCHGEGKSFGVDKVHPVKYKGELKLEGKPIPNPLLGLDSTRTGHHHHHH

Let \(P_w(n)\) be the set of distinct subwords (intervals) in a word \(w\). Let \(p_w(n)\) be the cardinality of \(P_w(n)\). Let \(f(c)\) be the sequence in FASTA with 4-symbol Protein Data Bank code \(c\).

Newick tree

Pair	\(Z_2\)	Length of longest common subsequence
1ZOP_1,2VZM_1	181	3
1ZOP_1,3UFH_1	185	4
2VZM_1,3UFH_1	154	6

Status	Protein1	Protein2	d	d₁/2
Query variables	1ZOP_1	2VZM_1	161	114.5

In notation analogous to [Theorem 16, Kjos-Hanssen, Niraula and Yoon (2022)],
\[ \delta= \alpha \mathrm{min} + (1-\alpha) \mathrm{max}= \begin{cases} d &\alpha=0,\\ d_1/2 &\alpha=1/2 \end{cases} \]

CoV2D BrowserTM

Newick tree

CoV2D Browser^TM