MMseqs2 icon indicating copy to clipboard operation
MMseqs2 copied to clipboard

Mmseqs generates a PSSM file with a different sequence than the input sequence

Open etiur opened this issue 1 year ago • 5 comments

I don't know if I'm doing something wrong a some flag I'm leaving out, please help me.

Expected Behavior

I have a fasta file I want to generate a PSSM from, here is an example fasta

EH1(72) MLLPETRNLLDLMDAATRGGRPRLETLPHAVGRKAVDKMSEDGEADPPEVAEVANGGFAGPASEIRFRRYRPLGEAAGLLPTLIYYHGGGFVIGNIETHDSTCRRLANKSRCQVISIDYRLAPEHPFPAPIDDGIAAFRHIRDNAESFGADAARLAVGGDSAGGAMAAVVCQACRDAGETGPAFQMLIYPATDSSRESASRVAFAEGYFLSKALMDWFWEAYVPEDTDLTDLRLSPLLATDFTGLPPAFVLTAGYDPLRDEGRAYADRLIEAGIKTTYVNYPGTIHGFFSLTRFLSQGLKANDEAAAVMGAHFGT

First I create an database of the fasta file and a database for the search database with this command. mmseqs createdb {input_file} {output_index}

Then I follow the steps mentioned in the user guide to create a PSSM f"mmseqs search {query_db} {search_db} {pssm_filename.out} tmp -e {evalue} --num-iterations {num_iterations} --max-seqs {max_seqs} -s {sensitivity} -a"

f"mmseqs result2profile {query_db} {search_db} {pssm_filename}.out {pssm_filename}.profile"

f"mmseqs profile2pssm {pssm_filename}.profile {pssm_filename}"

Then a pssm file is generated with a PSSM like matrix for each sequence in the initial fasta file (the order seems to be random and doesn't follow the order of the input fasta file)

Context

Providing context helps us come up with a solution and improve our documentation for the future.

Here is the PSSM generated for the example fasta . The second column of a standard PSSM generated by PSIBlast corresponds to the aminoacids of the input fasta however the PSSM generated by Mmseqs changes the sequences somehow.

My questions are:

  • What is the Cns column?
  • Shouldn't it have the same sequence as the input fasta sequence because otherwise how could you map the PSSM generated with the sequence it comes from?

I don't know if it si a bug or if I'm missing some flag to make the sequences equal

Pos Cns A C D E F G H I K L M N P Q R S T V W Y 0 M -2 0 -3 -2 0 -3 -1 1 -1 1 6 -2 -2 0 -2 -1 -1 0 0 0 1 L -2 0 -3 -3 0 -3 -2 1 -3 3 1 -3 -2 -2 -3 -2 -1 0 0 0 2 L -2 0 -3 -3 0 -3 -2 1 -3 4 1 -3 -3 -2 -3 -2 -1 0 0 0 3 P -2 -2 -1 -1 -3 -2 -2 -3 -2 -3 -3 -2 8 -2 -3 -1 -2 -2 -2 -2 4 E -1 -2 0 4 -3 4 0 -3 0 -4 -3 0 -2 0 -2 -1 -2 -3 -1 -2 5 T 3 0 -1 -1 -2 0 -1 -1 -1 -2 -2 0 -1 -1 -2 0 3 0 -1 -1 6 R -2 -3 -2 -1 -2 -2 0 -3 1 -3 -2 0 -2 0 6 -1 -2 -3 -1 -1 7 N -2 -2 0 0 -2 -1 0 -3 0 -3 -2 5 -2 0 4 0 -1 -3 -2 -1 8 V -2 0 -3 -3 0 -3 -3 1 -3 3 0 -3 -3 -2 -3 -3 -2 3 -1 -1 9 L -2 -1 -4 -3 0 -3 -3 1 -3 4 0 -3 -3 -2 -3 -3 -2 0 0 -1 10 D -2 -3 5 4 -3 -1 0 -3 0 -4 -3 0 -2 0 -1 -1 -2 -3 -2 -2 11 L -2 -1 -4 -4 0 -4 -3 1 -3 4 0 -4 -3 -3 -3 -3 -2 0 -1 -1 12 L -2 -1 -4 -3 0 -3 -2 1 -2 4 4 -3 -3 -2 -2 -3 -2 0 0 -1 13 D -2 -3 6 0 -3 -1 -1 -3 -1 -4 -4 1 -2 -1 -2 -1 -2 -3 -3 -3 14 A 2 -1 -1 -1 -2 0 -1 -2 3 -2 -2 -1 -1 0 0 0 -1 -1 -2 -1 15 A 3 0 -2 -2 -2 3 -2 -2 -2 -2 -2 -1 -2 -2 -2 0 -1 -1 -2 -2 16 T 0 -1 -1 -1 -2 -1 -1 -2 -1 -2 -2 0 -2 -1 2 1 3 -1 -2 -1 17 Q -2 -3 3 0 -3 -2 0 -3 0 -3 -2 0 -2 4 3 -1 -2 -3 -2 -2 18 G -2 -2 -2 -3 4 5 -2 -2 -3 -2 -2 -1 -3 -3 -3 -1 -2 -2 0 0 19 G 2 -1 -2 -3 -2 5 -2 -3 -2 -3 -3 -1 -2 -2 -3 0 -2 -2 -2 -2 20 R -2 -2 -2 -1 -2 -2 -1 -1 3 -2 -2 -1 -2 0 4 -2 -1 1 -2 -1 21 P -2 -2 -2 -2 -3 -2 -2 -3 -2 -3 -3 -2 8 -2 -3 -2 -2 -3 -3 -3 22 S 1 -1 -2 -2 -2 -1 -1 -2 -1 -3 -2 -1 4 -1 2 2 -1 -2 -2 -2 23 M -2 -1 -3 -3 0 -3 -2 3 -2 2 5 -2 -3 -2 -3 -2 2 0 -1 -1 24 E -2 -2 0 3 -2 -2 4 -2 -1 -2 -2 0 -1 0 -1 -1 3 -2 -2 0 25 T -1 -1 -1 2 -2 -2 -1 -1 -1 -2 -2 0 -1 -1 -2 1 4 -1 -2 -1 26 L -2 0 -3 -3 0 -3 -2 0 -2 4 3 -2 -2 -2 -3 1 -1 0 -1 -1 27 P -1 -1 -2 -2 -3 -2 -2 -2 -2 -3 -3 -1 6 -2 -2 1 2 -2 -2 -2 28 I -3 -1 -3 -3 -1 -3 4 3 -2 0 -1 -2 3 -2 -3 -3 -2 2 -2 0 29 E 0 -2 2 3 -3 -2 0 -2 0 -3 -2 0 -2 3 -1 -1 -1 -2 -2 -2 30 E 0 -1 2 3 -2 -2 -1 0 -1 -1 -2 -1 -2 0 -2 -1 -1 1 -2 -1 31 A 3 0 -2 -2 -2 2 -2 -2 -2 -2 -2 -2 -2 -2 -2 0 -1 -1 -2 -2 32 R -3 -3 -2 -1 -2 -3 0 -3 0 -2 -2 -1 -3 0 6 -2 -2 -3 -1 -1 33 K -2 -2 -1 2 -2 -2 0 -3 4 -2 -2 0 -1 0 0 -1 -2 -3 -2 -1 34 A 2 0 -1 -2 -2 2 -1 -2 -1 -2 -2 3 -2 -1 -2 1 -1 -2 -2 -2 35 A 1 0 -3 -1 -1 -2 -1 0 -1 0 4 -2 -2 2 -2 -1 -1 1 -1 -1 36 D 0 -2 5 0 0 -2 0 -2 -1 -2 -3 0 -2 -2 -3 -1 -2 -2 0 4 37 E -2 -3 2 3 -2 -2 0 -3 2 -3 -2 0 -2 0 2 -1 -2 -3 -2 -2 38 G 1 -1 -2 -2 -1 3 -2 -2 -2 -1 3 -1 -2 -2 -2 1 -1 -2 -1 -1 39 R -2 -1 -2 -2 0 -2 -1 -1 0 2 0 -1 -3 -1 4 1 -1 -1 -1 -1 40 A 3 0 -1 1 -1 -1 -1 2 -1 -1 -1 -2 -2 -1 -2 -1 -1 0 -1 -1 41 D 0 -1 2 -2 0 -2 -2 0 -2 1 3 -1 -3 -2 -2 -2 -2 2 -1 -1 42 L -3 -1 -3 -4 4 2 -2 0 -3 4 0 -3 -4 -3 -3 -3 -2 0 0 0 43 D -2 -2 3 1 -2 -2 -1 -2 0 -1 3 0 -2 2 -1 1 -1 -2 -2 -1 44 A 3 0 -2 -2 -2 1 -2 -2 -1 -2 -2 -2 3 -2 -2 -1 -1 -1 -2 -2 45 D -3 -2 3 0 -2 -2 -1 -3 3 -3 -2 0 -2 0 2 -1 1 -3 -2 -2 46 P 0 -2 -2 -2 -3 -2 -2 -3 -2 -3 -2 -2 7 -2 -3 -1 -1 -2 -3 -2 47 P 0 -2 -2 0 -3 -2 -1 -3 0 -3 -2 -2 6 -1 2 -2 -2 -3 -2 -2 48 E 0 -2 0 4 -3 -2 -1 -3 0 -2 -2 -1 -2 1 2 -1 1 -2 -2 -1 49 V -2 -1 -3 -3 -1 0 -2 2 -3 1 0 1 -3 -3 -3 -2 1 3 -2 -1 50 A 2 -1 -2 -2 -2 0 -2 -1 0 -2 -1 -2 -2 1 -2 -1 1 1 -2 -2 51 E -2 -2 1 3 -3 0 -1 -3 0 -3 -2 1 -2 0 0 2 -1 -3 -2 -2 52 I 1 0 -3 -3 -1 -3 -3 3 -3 0 0 -3 -3 -3 -3 -2 0 3 -2 -1 53 R 0 -1 -2 -1 -1 -2 3 -2 0 0 -1 -1 -3 3 2 1 -1 -2 -1 -1 54 D 0 -2 4 3 -3 -2 -1 -3 -1 -3 -2 2 -2 0 -2 1 -1 -3 -2 -2 55 R -2 -2 -2 0 -1 0 -1 0 0 1 -1 -2 -3 1 3 -2 -2 0 -2 -2 56 T 0 -1 -2 -1 -2 2 -1 0 -1 -2 -1 -1 -2 2 -2 1 2 -1 -2 -2 57 I 0 -1 -4 -3 2 -3 -3 4 -3 0 0 -3 -3 -3 -3 -2 -2 1 -1 0 58 P 0 -2 1 -1 -3 -3 -2 -3 -1 -3 -3 -1 6 -2 -3 0 -2 -3 -3 -2 59 G -1 -2 -2 -3 -2 5 -2 -3 -2 -3 -2 -1 -3 -2 -3 0 -2 0 -1 -2 60 P 0 -2 -2 -2 -3 -3 -2 -3 -1 -3 -3 -2 7 -2 -3 -1 -2 -3 -2 -2 61 G 1 -1 -1 0 -2 3 -1 -3 -1 -3 -2 3 -3 -1 -2 0 -2 -3 -2 -2 62 G -1 -2 -2 -2 -3 5 -2 -4 -2 -4 -3 -1 -3 -2 -3 1 -2 -4 -2 -3 63 E -1 -2 3 3 -3 -3 -1 -3 -1 -3 -2 1 3 1 -2 -1 -2 -3 -2 -2 64 I -3 -1 -3 -4 0 -5 -3 5 -3 2 0 -4 -4 -3 -4 -3 -2 2 -1 -1 65 P -2 -2 -2 -1 -2 -3 3 -3 2 0 -1 -1 4 -1 3 -2 -2 -3 -2 -1 66 V 0 -1 -3 -3 1 -3 -3 2 -3 1 0 -3 -4 -3 -3 -2 1 2 -2 -1 67 R -3 -3 -2 -1 -3 -3 -1 -3 1 -1 -2 -1 -3 0 6 -2 -2 -3 -2 -2 68 I -2 -1 -3 -3 -1 -4 -3 3 -2 1 0 -3 -3 -2 2 -3 -2 2 -2 -2 69 Y -3 -2 -3 -3 1 -4 0 0 -2 -1 -1 -3 -4 -2 -2 -3 -3 -1 2 8 70 R -2 -2 -2 -1 -3 -3 3 -3 0 -3 -2 0 -2 0 5 -1 4 -2 -2 -1 71 P -2 -3 -2 -2 -4 0 -3 -4 -1 -4 -3 -2 8 -2 -3 -2 -2 -3 -3 -4 72 V 0 -1 -2 0 -2 -3 -2 0 -1 1 0 -2 -3 -1 3 -2 -2 2 -2 -2 73 G 0 -2 -1 2 -4 4 -2 -4 -1 -4 -3 -1 -3 1 -2 -1 -2 -4 -2 -3 74 D 0 -2 4 2 -3 -1 -2 -2 -1 -2 1 -1 1 -1 -2 -1 1 0 -3 -3 75 G 1 -2 -1 0 -3 2 -2 -3 1 -1 -2 -1 0 -1 -1 0 1 -2 -2 -3 76 A 3 -1 0 0 -3 0 -2 -2 -1 -3 -2 -1 0 -1 -2 0 2 -1 -3 -3 77 G 0 -2 2 -1 -4 3 -2 -3 1 -1 -2 0 0 1 -1 0 -2 -3 -3 -3 78 P -2 -2 1 0 -3 0 -2 -2 1 -1 -2 1 4 -1 -1 -1 0 0 -3 -3 79 L -1 -2 -3 -3 1 0 1 0 -2 3 0 -2 -3 -2 -2 0 0 -1 -1 -1 80 P -2 -3 -2 -2 -4 -4 -3 -3 -2 -4 -3 -3 8 -2 -3 -2 -2 -3 -4 -4 81 V 0 -1 -3 -2 -2 0 -3 1 -2 0 -1 -2 -3 0 -3 -1 3 3 -2 -2 82 L -3 -2 -4 -4 0 -5 -4 3 -4 3 1 -4 -4 -3 -4 -4 -2 2 -2 -2 83 L -1 -2 -4 -4 -1 -5 -4 2 -3 3 2 -4 -4 -3 -4 -3 -2 3 -2 0 84 Y -4 -3 -4 -3 3 -5 2 -2 -3 -2 -2 -3 -4 -2 -3 -3 -3 -3 3 8 85 F -4 -3 -4 -4 5 -5 -2 1 -4 1 -1 -4 -4 -3 -4 -4 -3 -1 0 5 86 H -3 -3 -2 -1 0 -4 8 -4 -2 -4 -3 0 -3 0 -2 -2 -3 -4 -1 2 87 G -2 -3 -2 -3 -4 6 -3 -4 -2 -4 0 -1 -3 -2 -4 -2 -3 -4 -2 -4 88 G -1 -3 -2 -3 -4 6 -3 -5 -2 -5 -4 -1 -3 -3 -3 0 -3 -4 -2 -4 89 G 1 -2 -2 -3 -4 5 -3 -4 -2 -4 -3 -1 -2 -2 -3 0 -2 -3 -2 -4 90 F -4 3 -4 -4 5 -4 0 -2 -4 -2 -2 -4 -4 -3 -4 -4 -4 -2 10 4 91 V 0 -2 -3 -3 -2 -4 0 1 -2 0 -1 -3 -3 -2 0 -1 0 4 -3 -2 92 I 0 -2 -3 -3 1 0 -3 3 -2 1 -1 1 -3 -3 -3 -2 0 0 -2 -2 93 G -2 0 -2 -3 0 5 -3 -4 -2 -4 -4 -1 -3 -3 -1 -2 -3 -4 -2 -3 94 S -2 -3 3 0 -4 0 -2 -4 -1 -4 -3 2 -2 -1 0 4 0 -4 -3 -3 95 L -1 -3 -3 -2 -2 -1 -3 0 0 2 -1 -3 5 -2 0 -3 -2 0 -2 -3 96 E 0 -3 4 4 0 -3 -2 -3 1 -2 -3 0 -2 0 0 0 -1 -2 -3 -2 97 T -2 -2 1 1 -4 -1 -2 -3 -1 -3 -2 -1 0 -1 0 3 4 -2 -3 -3 98 H -3 1 0 -1 -1 -3 8 -4 -1 -4 -3 -1 -3 1 -2 -1 -3 -2 -1 3 99 D -2 -4 5 0 -4 -3 0 -2 0 -1 -3 1 -2 -1 4 -2 -2 -4 -3 -1 100 G -1 -3 0 0 0 2 0 -3 0 -3 -3 1 2 -1 0 1 0 -2 -2 0 101 L -1 -2 -3 0 2 -4 -3 1 -2 2 2 -3 -2 -2 -3 -2 1 0 -1 -2 102 C 0 7 -3 -3 -3 0 -4 -1 -3 0 0 -3 -3 -3 -4 0 1 -2 -3 -4 103 R 1 1 0 0 -4 0 0 -3 0 -2 -3 -2 -2 1 4 1 -2 -3 -3 -3 104 R 0 -3 -1 0 -1 -3 1 0 0 -1 0 0 -3 0 4 -1 -2 0 -2 0 105 L -2 -2 -4 -4 0 -5 -4 2 -3 4 1 -4 -4 -3 -4 -4 -2 0 -1 0 106 A 3 2 -2 -2 -3 -1 -3 -2 -2 -3 -2 -2 -2 -2 -1 3 -1 -2 -2 -3 107 N -1 -3 1 2 -3 -1 2 -3 0 -1 -2 3 -3 2 1 0 -2 -3 -2 0 108 A 0 -3 0 0 0 -1 0 -1 0 0 0 -2 -3 2 1 -1 0 0 -2 -2 109 A 1 3 -2 -2 -3 0 -3 -2 -2 0 1 0 -3 -2 -3 1 2 -1 -2 -3 110 G -2 -4 0 0 -4 4 0 0 0 -3 -3 3 -1 0 1 -2 -2 -3 -2 -3 111 A 2 5 0 -3 0 0 -3 1 -2 0 2 -3 -3 -2 -1 -1 -2 -1 -1 -2 112 V 0 -2 -3 0 -2 0 -2 1 0 -1 -1 -2 -1 1 2 -2 0 2 -2 -3 113 V 0 1 -4 -4 -2 -3 -4 1 -3 0 0 -4 -4 -3 -4 -3 0 5 -2 -2 114 V -2 2 -5 -4 2 -4 -3 2 -3 2 0 -4 -4 -4 -4 -3 -2 3 -1 1 115 S 0 -2 -2 -2 -2 0 -2 -1 -2 0 0 0 0 0 -3 4 0 1 -2 -3 116 V -2 -2 -4 -4 -2 -4 -4 3 -3 0 -1 -4 3 -3 -4 -3 -2 4 -2 -3 117 D -1 -4 6 1 -4 0 1 -4 -1 -4 -4 1 -3 -1 -3 -2 -2 -4 -3 -3 118 Y -4 -3 -4 -3 1 -3 0 -2 -3 -2 -2 -3 -4 -2 -3 -3 -3 -3 1 8 119 R -2 -4 -3 -1 -3 -3 0 -4 0 -3 -3 -1 0 0 6 -2 -2 -4 -2 -3 120 L -4 -2 -4 -4 0 -4 -3 0 -1 4 4 -4 -4 -2 -1 -3 -2 -1 -2 -2 121 A 3 -2 -2 -2 -2 0 -2 -2 -2 -3 1 -2 1 -2 -3 0 -1 -2 -2 1 122 P -2 -4 -2 -2 -4 -2 -3 -4 -1 -4 -4 -3 8 -2 0 -2 -2 -4 -3 -4 123 E -2 -4 2 6 -4 -2 -1 -4 0 -4 -3 -1 -2 0 -1 -1 0 -4 -3 -3 124 H -1 -3 -1 -2 1 0 7 -3 -2 -3 -2 2 -3 -1 -2 -2 -2 -1 -1 2 125 P -4 0 -2 -1 0 -3 -2 -3 2 -1 -3 -2 6 0 2 -2 -2 -2 -3 -3 126 F -2 -3 -4 -4 7 -3 -1 -1 -3 0 -1 -3 -4 -3 -1 -3 -3 -2 0 5 127 P -3 -3 -3 -2 -4 -3 -3 -4 -2 -3 0 -3 8 -2 -1 -2 -2 -4 -4 -4 128 A 4 -1 0 0 -3 -1 -3 -2 -2 -3 -2 -2 -2 -2 -3 0 -1 0 -3 -3 129 A 3 -2 -3 -2 1 3 -3 -3 -2 -3 -2 -2 1 -2 -3 -1 -2 -2 -2 -2 130 V -2 -2 -4 -4 -1 -4 -4 2 -3 2 1 -4 2 -3 -3 -3 0 3 -3 -2 131 D -4 -4 5 4 -4 -3 0 -4 0 -4 -3 0 -3 0 1 -1 -2 -4 -4 -3 132 D -2 -4 7 0 -4 -2 -2 -4 -2 -4 -4 0 -3 -2 -3 -1 -2 -4 -4 -4 133 C 1 7 -3 -3 -3 0 -3 0 -2 -2 -2 -3 -3 -3 -3 1 0 0 -3 -3 134 L -1 -2 -3 -1 0 -3 0 2 0 2 0 -3 -4 -2 1 -2 0 1 -2 1 135 A 2 2 0 0 -3 -2 1 -3 2 -3 -2 0 -3 -1 -1 1 -1 -2 -3 -2 136 A 3 -1 -3 -2 -3 0 -3 -1 -2 -2 -2 -3 -3 -2 -3 0 -1 2 -3 -3 137 Y -2 -2 -4 -3 2 -4 -1 0 -3 1 -1 -3 -4 -3 -3 -2 1 -1 4 6 138 R -1 2 0 0 -3 -3 -1 -3 0 0 0 2 -3 1 4 -2 0 -3 -3 -3 139 W 0 -2 -4 -1 0 -1 0 -3 -3 -2 -2 -4 -4 -3 -3 -3 -3 -2 12 0 140 L 0 -1 -4 -3 -1 -4 -3 1 -3 3 0 -3 -3 -3 -3 -1 1 2 -2 -2 141 L 0 1 -3 -2 -1 -3 -2 1 -2 3 1 -1 -3 2 -1 0 0 0 -2 0 142 D 0 -2 3 2 -3 -2 -2 -1 0 -3 -2 1 -2 1 -1 0 -2 -3 -3 -3 143 N -4 -3 0 0 -3 -2 3 -4 0 -4 -2 6 -3 1 0 -1 0 -4 -3 -2 144 A 3 -1 -3 -2 -3 0 -2 0 -1 -2 -1 -2 -2 -2 1 -1 0 -1 -2 -2 145 A 1 -2 0 1 -3 0 0 0 0 -2 -2 -2 2 -2 -2 1 0 0 -3 -2 146 A 1 -2 0 1 0 -2 0 -3 0 -3 -2 0 -2 2 -1 2 0 -2 -3 -2 147 L -4 -3 -3 0 4 0 -2 0 -2 2 0 -3 -3 1 -2 -1 -3 0 5 2 148 G -3 -3 0 -2 -3 5 -2 -4 0 -1 -3 1 1 1 0 -2 -3 -4 -3 -3 149 G 0 -2 -3 -3 -1 1 -2 2 -2 0 -1 -3 -3 0 -3 -1 0 1 -2 3 150 D -1 -4 6 1 -4 -3 -2 -4 -1 -4 -3 0 2 0 -2 -2 -3 -2 -4 -3 151 P 1 -2 -2 -2 -3 -3 -2 -3 0 -3 -3 0 7 -2 -2 0 0 -1 -3 -3 152 N -1 -3 0 0 -3 1 1 -3 0 -4 -3 3 1 0 0 1 1 -3 -3 -2 153 R -4 -4 -1 1 0 -3 0 -3 2 -2 -2 2 2 0 5 -2 -1 -4 -3 -2 154 I -2 -2 -4 -3 0 -5 -4 4 -3 2 1 -4 -3 -3 -3 -4 -2 1 -2 -2 155 A 1 2 -3 -3 3 0 -3 0 -2 -2 -1 -3 -2 -3 -3 -2 0 2 -2 -1 156 V -3 -2 -4 -3 -1 -5 -4 3 -3 1 1 -4 -3 -3 -3 -4 -2 4 -3 -2 157 G 1 3 -2 -3 -2 4 -3 -3 -2 -1 1 -2 -2 -3 -3 0 -2 -2 -3 -3 158 G -2 -3 -2 -3 -3 6 -3 -5 -2 -5 -4 -2 -2 -3 -3 -2 -3 -4 -2 -3 159 D -4 -4 6 2 -3 -3 3 -4 -1 -5 -4 0 -2 -1 -2 -2 0 -4 -4 -2 160 S -1 -1 -1 -1 -3 -2 -2 -3 -1 -4 -2 -1 -1 -1 -2 6 0 -3 -2 -2 161 A 4 -1 -3 -2 -2 -2 -3 -2 -2 -3 -2 -3 -2 -2 -2 0 -1 -1 -2 -2 162 G -2 -3 -2 -3 -3 5 -3 -5 -2 -5 -4 -2 -3 -3 -3 -2 -3 -4 -2 -3 163 G 0 -3 -2 -3 -3 5 -3 -5 -3 -5 -4 -2 -3 -3 -3 -2 -3 -4 -2 -3 164 N -1 1 -1 -2 -2 2 1 -4 -2 -4 -3 5 -3 -2 -2 0 -2 -4 4 2 165 L -4 -2 -4 -3 0 -5 1 0 -3 4 3 -1 -4 -3 -3 -4 -2 0 -2 -1 166 A 2 -1 -2 -2 -3 -2 -2 -2 -2 0 -2 -2 -2 -2 -2 3 2 -2 -3 -2 167 A 2 -2 -3 -3 -1 -3 -3 1 -2 2 -1 -3 -3 -3 -3 -2 0 0 -3 -2 168 V 1 -2 -3 -2 -2 -1 -3 0 -2 -1 0 -3 -3 -3 -3 0 0 4 -3 -2 169 V -1 -2 -3 -3 0 -4 -3 0 -3 1 -1 -3 -3 -3 -3 -2 3 3 -2 -2 170 L 0 4 -3 0 -2 -3 -3 -1 -2 2 2 0 -3 -2 -3 1 -2 0 -3 -2 171 L -1 -3 -2 0 -2 -1 3 1 -1 2 0 -2 -3 4 -2 -3 -2 0 -3 -2 172 A 0 -2 0 -1 -2 0 0 -2 -1 -1 3 0 -3 0 3 -2 0 -1 5 -2 173 L 1 2 -3 -2 -2 -3 -3 0 -2 2 1 -3 -3 -2 0 0 -1 0 -3 -2 174 R -4 1 -2 -1 -3 -4 0 -1 4 -4 -3 -1 -2 0 6 -1 -2 -3 -3 -2 175 D 0 -3 6 1 -4 -3 -2 -3 -1 -2 -3 0 -2 0 1 -2 -2 -1 -4 -3 176 E 0 -3 0 3 -3 0 3 0 0 -4 -3 0 -2 0 0 0 -2 -1 -3 -2 177 G -2 -3 0 -2 -3 4 2 -1 0 -2 -3 0 0 -2 -2 -1 -3 -3 -3 -3 178 L 0 -3 1 1 0 0 0 0 0 1 -1 0 -3 0 0 -3 -1 0 -3 -2 179 P 0 -3 0 -2 -3 -1 -2 -1 -1 -2 -3 0 5 -2 1 0 0 -1 -3 0 180 L -2 -3 -3 -1 -2 2 -2 -1 0 2 2 -2 0 4 0 -3 -3 -2 -3 -2 181 P -2 -3 -3 -2 0 -1 -3 -1 -2 -1 -3 -3 8 -3 -3 -3 -3 -1 -3 -2 182 A 3 1 1 -1 -3 -1 -2 -2 0 -2 -2 0 -2 -2 0 -1 0 -1 3 -2 183 A 2 1 -3 -3 3 0 -2 -2 0 0 -2 -3 -3 -2 0 -2 0 -2 -2 0 184 Q 1 -2 -2 0 -3 0 -1 -3 -1 -1 -2 -2 0 6 -1 0 -1 -1 -3 -2 185 V 0 -2 -4 -3 1 -4 -3 1 -3 2 0 0 -3 -3 0 -3 -3 3 5 -1 186 L 0 3 -4 -3 -1 -3 -3 0 -3 4 0 -4 -3 -3 -4 -1 -3 -1 -2 -2 187 I -4 -2 -4 -4 1 -5 -3 5 -4 2 1 -4 0 -4 -4 -4 -2 1 -2 -1 188 Y -3 -2 -3 -2 2 -3 0 -3 -2 -3 -2 -2 -3 -2 -3 3 -2 -3 4 7 189 P -1 -3 -3 -2 -4 0 -3 -3 -2 -4 -4 -3 8 -2 -4 -2 0 -3 -4 -4 190 W 1 -2 0 -3 1 0 -3 -1 -3 0 -2 -3 -3 -2 -3 0 0 1 8 -1 191 T 0 -1 -3 -2 0 -3 -2 -1 -2 -1 -2 -2 -3 -2 -3 0 5 1 -2 -2 192 D -4 -3 6 0 -4 -1 0 -4 -2 -5 -4 0 -3 -1 0 -1 0 -4 -4 -3 193 L 0 1 -1 -2 -1 -1 0 -1 -3 2 4 -2 -3 -2 -3 1 -2 -1 -2 -2 194 S 0 -2 0 0 -2 0 -1 -2 -1 -1 -2 0 -3 0 2 2 1 -1 -2 0 195 N 0 -2 -3 -2 0 1 -2 -2 -2 0 2 2 0 -2 1 -2 -1 -1 4 1 196 T 0 -2 1 3 -3 -1 -1 -3 0 -4 -3 0 -3 1 0 1 3 -2 -3 -3 197 G -1 -2 -2 -1 -3 3 3 -3 -2 -2 -3 1 0 -2 -3 1 2 -3 -3 0 198 P 0 -2 1 1 -3 0 -2 0 -2 0 0 -2 4 0 -3 0 -2 -1 -3 -3 199 S 0 -1 0 -1 -4 -2 -1 -3 -1 -4 -3 0 -3 -1 1 5 -1 -3 -4 -3 200 R -2 -2 -3 -2 -1 0 3 0 -1 -2 3 -2 -3 -1 3 -1 0 1 -2 3 201 R -1 -3 0 2 -3 -1 -1 0 0 0 -2 0 -3 3 2 0 -2 0 -3 0 202 A 1 -2 0 2 -3 0 -1 -3 0 -2 -3 -1 2 -1 1 1 1 -2 -3 0 203 F -3 4 -2 -3 3 0 -2 0 0 0 -2 4 -3 -2 0 -2 0 -2 -2 -1 204 A 1 1 1 -2 -3 1 -2 -2 0 -1 1 1 -3 -2 -2 0 1 -1 -3 -3 205 E -1 -3 3 3 -4 0 -1 -2 0 -4 -3 0 -2 0 1 0 -2 -3 -4 -4 206 G 0 -3 2 0 -3 4 -2 0 -2 -2 -3 -1 0 -2 0 0 -3 -1 -3 -4 207 Y 0 -2 -1 0 1 -3 0 -2 -2 0 1 -3 2 -2 -3 -1 0 -2 0 6 208 F -3 -2 -1 -3 4 0 -3 0 0 2 4 -3 1 -3 -3 -4 -3 -1 -2 -1 209 L -3 -1 -5 -4 0 -1 -3 1 -3 4 1 -4 -4 -3 -1 -4 -1 0 -2 -2 210 T 0 1 0 -2 -3 -3 -2 -2 -2 0 -2 0 1 -2 0 0 3 0 -3 -3 211 R 0 -2 -3 -2 -3 -1 2 0 2 -3 -2 0 -3 1 3 0 -1 0 -3 -2 212 A 2 1 0 1 -3 -1 -2 0 1 -3 -3 -2 2 -1 -2 0 0 -2 -3 -3 213 L 1 -2 0 0 -2 0 -2 1 -2 1 0 0 0 -2 0 -1 0 -1 -3 -3 214 M -3 -1 -1 -4 -1 -1 -3 2 -3 2 6 -4 -4 -2 -1 -3 -2 0 -2 -2 215 E -2 -3 3 3 -3 0 -2 -3 0 0 -3 0 0 1 0 -2 0 -3 -3 -3 216 W -4 -2 -5 -1 2 -4 -2 -1 0 -1 -2 -4 0 -2 -3 -4 -3 1 10 3 217 F 0 -2 -5 -4 7 -4 -2 1 -4 0 1 -4 -4 -3 -4 -1 -3 -1 3 0 218 R 0 -2 0 -2 2 -1 -2 0 -2 0 1 -2 -4 0 2 -2 0 0 6 2 219 D 0 -2 3 0 -3 2 -2 -4 -2 -4 -4 0 0 1 0 0 -2 -3 4 -3 220 H 0 4 -3 -2 -2 0 6 -1 -2 0 0 -2 0 2 -2 -2 -2 0 -3 -1 221 Y -4 -2 -5 -3 4 -4 0 -2 -1 0 0 -3 -4 -2 -3 -1 -3 -2 0 7 222 L -3 -1 -5 -4 1 -4 -3 0 -1 4 0 -4 -4 -3 -3 -4 -2 1 -1 2 223 P 0 -3 0 0 -4 1 -2 -3 1 -2 -3 2 4 0 0 0 -1 -3 -3 -3 224 N 0 -2 0 2 -4 0 -1 -4 0 -4 -3 3 -3 1 1 0 0 -3 -3 -3 225 D -1 -2 3 0 -4 2 -2 -4 -2 -2 -3 2 3 -1 0 0 0 -3 -4 -3 226 A 2 -1 0 3 -3 -2 -2 0 -1 -3 -2 -2 -3 -1 0 0 1 0 -3 -3 227 D -2 -3 6 1 -4 -2 -2 -3 -2 -4 -4 0 1 -1 0 -2 0 -1 -4 -4 228 A 1 -2 -4 -2 -2 -1 -3 0 0 1 2 -3 2 -2 2 -2 -2 0 4 -2 229 A 1 -2 0 1 -3 -2 -2 0 0 -1 -2 0 -3 0 0 1 1 -2 -3 -3 230 D 0 -3 5 1 -4 -2 3 -4 -1 -5 -4 3 -3 0 -2 -1 -2 -4 -4 -2 231 P 0 -2 -3 -3 0 -3 0 -2 -3 -1 0 -3 6 -2 -3 -2 -3 -1 6 0 232 R -4 -3 0 0 0 -3 0 -2 1 0 0 -2 -4 -1 5 -1 -1 -3 -2 2 233 A 2 -1 -4 -3 0 -1 -3 1 -2 0 0 -3 -3 -3 -3 -2 -2 2 -3 -2 234 S 0 -1 -2 -1 -4 -1 -2 -3 -1 -4 -3 0 -2 -1 -2 6 0 -3 -4 -3 235 P -3 -3 -3 -2 -5 -3 -3 -4 -2 -4 -4 -3 8 -2 -3 -2 -3 -3 -4 -4 236 L -1 -1 -4 -4 -1 -2 -4 2 -3 4 0 0 -4 -3 -3 -3 -3 2 -3 -2 237 L -4 -3 -4 -3 2 -4 2 0 0 2 2 -3 -4 0 2 -1 -3 -2 -1 4 238 A 3 -1 -3 -2 -3 3 0 -1 -2 -3 -3 0 -3 -2 -3 0 0 -2 -3 -3 239 Q -1 -2 1 2 -3 0 -2 -2 0 -3 -2 -1 2 3 -1 0 1 0 -3 -2 240 D -3 -4 6 0 0 -2 0 -4 0 -5 -4 2 -3 -1 -2 0 -2 -4 -3 -3 241 L -3 -2 0 -4 3 -4 -3 0 -3 4 1 -4 -4 -3 -3 -4 -3 0 -1 -1 242 S 1 -1 -3 -2 -3 -1 1 -3 -1 -3 -2 1 0 -1 0 3 2 -2 -3 -2 243 G -1 -3 1 -3 -4 6 -3 -4 -2 -5 -4 0 -3 -2 0 -2 -3 -4 -3 -3 244 L -2 2 -5 -4 2 -4 -4 0 -3 4 2 -4 -4 -3 -4 -4 -3 0 -1 -1 245 P 1 -3 -3 -2 -4 0 -3 -4 -2 -4 -3 -3 7 -2 -3 -2 -2 -3 -3 -4 246 P -3 -3 -3 0 -5 -3 -3 -4 -2 -4 -4 -3 8 -2 -1 -2 -3 -4 -3 -4 247 A 3 -1 -4 -3 0 0 0 0 -2 0 1 -3 -3 -2 -3 -1 1 0 -2 -2 248 L -4 1 -5 -4 2 -4 -3 1 -4 3 0 -4 -4 -3 -4 -4 -1 -1 4 3 249 V -3 -2 -5 -4 2 -4 -4 3 -4 1 -1 -4 -4 -4 -4 -4 -2 4 -2 -1 250 Q 0 1 -3 -2 0 -3 3 2 -2 0 1 -2 -3 3 -2 -2 1 0 -2 -1 251 T 0 -1 -3 -3 -3 -2 -3 0 -2 -2 -2 -2 -2 -2 -3 0 4 3 -3 -3 252 G 2 1 -2 -3 -4 4 -3 -3 -2 -4 -3 -1 -2 -2 -3 2 -2 -2 -2 -3 253 G -3 -3 3 2 -3 3 -2 -4 -2 -4 -3 -1 -2 -2 -3 0 2 -3 -2 0 254 F -2 -3 1 0 4 -1 1 -2 0 -1 -2 -2 -3 -2 1 0 0 -3 0 2 255 D -4 -4 6 4 -4 -3 -2 -4 -1 -5 -4 0 -2 -1 -2 -2 -3 -4 -3 -3 256 P -1 1 -3 -3 -3 -4 1 2 -3 -1 3 -3 6 -3 -3 -2 -3 1 -3 -2 257 L -4 -2 -5 -4 0 -5 -4 0 -3 5 2 -4 -4 -3 -3 -4 -3 -1 -1 -2 258 R -4 0 -4 -1 0 -4 -2 -1 -1 3 -1 -3 -3 0 4 -3 -3 -2 -1 0 259 D -3 -4 6 0 -4 -2 -2 -4 -2 -5 -4 1 -2 -2 -3 0 -2 -5 -4 -4 260 D -3 -4 5 4 -4 -2 -2 -4 -1 -4 -4 1 -2 1 -2 -2 -3 -4 -3 -3 261 G 1 -2 -2 -3 -4 5 -3 -3 -2 -4 -3 -1 -2 -2 -3 1 1 -3 -3 -4 262 R -3 -3 0 2 0 -3 1 1 0 0 0 -2 -3 -1 2 -3 -1 0 -2 0 263 A 2 -2 -3 -1 1 -2 -3 -1 0 0 -1 -2 -2 -2 3 -2 0 -1 -2 -2 264 Y -2 -2 -4 -4 2 -4 -1 -1 -2 0 2 -3 -3 -3 0 -3 -3 0 0 7 265 A 4 -1 -3 -3 -3 1 1 -2 -2 -1 -2 1 -2 -2 -3 0 0 -1 -3 -3 266 D 0 -3 2 2 0 -2 1 -3 2 -3 0 2 -2 1 0 -2 -3 -3 -3 -2 267 R -1 1 -2 -1 0 -3 0 -4 4 -3 -3 0 -2 1 5 -2 -2 -4 -3 -2 268 L 1 -2 -4 -4 -1 -3 -4 0 -3 4 3 -4 -2 -3 -3 -3 -2 -1 4 -2 269 R 0 -3 -2 0 -3 -3 0 0 2 -1 -2 -2 -2 2 4 -2 -2 -1 -3 -2 270 A 2 -2 0 3 -4 -2 -2 -3 0 -3 -3 -1 -1 2 1 0 0 -3 -3 -3 271 A 4 -1 -2 0 -3 -1 -3 -2 -1 -3 -2 -2 -1 0 -2 -1 0 -2 -3 -3 272 G -2 -3 -3 -4 -4 6 -4 -4 -3 -5 -4 -1 -2 -3 -4 -2 -3 -4 -3 -4 273 V -2 4 -3 -4 -2 -3 -4 1 -3 -1 -1 1 -3 -3 -4 0 -1 5 -3 -2 274 P 0 -3 1 0 -4 -2 0 -3 0 -4 -3 -2 6 -1 1 0 0 -3 -4 -3 275 V 0 -1 -3 -3 -3 -3 -4 0 -2 -1 -2 -3 -2 -3 -3 -1 3 4 -3 -2 276 T 0 -2 1 3 -3 -2 -2 -2 -1 -3 0 0 -2 -1 -2 1 3 0 -3 0 277 L -3 -2 -3 -1 2 -4 0 1 -3 3 0 -3 -3 -3 0 -1 -2 -1 -1 3 278 H 0 -2 2 0 -2 -3 3 -1 -1 0 -2 -1 -2 0 0 0 -2 0 -3 0 279 V -3 5 1 -2 0 -3 -3 -1 -1 -2 -2 1 0 -2 2 0 0 2 -3 -2 280 Y -4 -2 -3 -1 3 -4 1 -2 -3 -2 -2 0 -4 -3 -3 -3 0 -3 8 7 281 P 0 -3 3 2 -4 0 1 -3 -1 -4 -4 -1 6 -2 -3 -2 -2 -4 -4 -3 282 G -2 -3 1 2 -4 5 1 -4 -2 -4 -4 0 -2 0 -3 1 -2 -4 -3 -3 283 M -3 -2 -3 -2 -2 0 -3 0 -2 2 4 -3 -3 3 -3 -3 0 1 -2 -2 284 I 0 -1 -3 -4 0 -3 -3 4 -3 0 1 0 -3 -4 -4 0 -2 1 4 -1 285 H -4 -3 -2 -2 -2 -3 9 -4 -2 -4 -3 0 -3 -1 -1 -2 -3 -5 -3 0 286 G 0 -2 -3 -3 -3 5 -3 -1 -2 -2 -3 -2 -3 -3 -3 -2 -2 2 -3 -3 287 F -4 -3 -4 -4 7 -4 -2 -1 -4 -1 -1 -4 -4 -4 -4 -4 -1 -2 7 2 288 H 0 -2 -3 -2 2 -3 4 1 -2 1 1 -2 -3 1 -2 -2 0 0 -2 0 289 S 0 -1 -1 -2 -2 0 -2 -3 -1 0 -2 2 -2 -2 -2 3 0 -3 6 -1 290 M -3 -2 -4 -3 4 -4 -2 0 -2 2 6 -3 -3 -2 -3 -3 -2 -1 -1 0 291 A 2 -1 -2 -2 0 1 -2 -2 -1 -2 -2 -1 -2 -2 1 1 0 -2 -2 -2 292 R -2 -3 0 -1 -4 2 -2 -4 1 -3 -3 -1 4 -1 4 -2 0 -4 -3 -3 293 A 2 -1 -3 -3 2 -2 -3 1 -2 1 2 -3 -2 -3 -3 -2 -2 1 -2 -1 294 L -3 -1 -4 -4 -1 -4 -4 2 -3 3 2 -4 -3 -3 -3 -3 -2 2 -2 -2 295 D -2 -2 4 1 -4 -2 -2 -3 -1 -4 -4 0 6 -1 -2 1 -2 -4 -4 -3 296 E 0 -2 0 4 -4 -2 -1 -2 0 -3 -2 -1 2 4 -1 -1 -1 0 -3 -2 297 G 2 -1 -2 -2 -4 5 -3 -3 -2 -4 -3 -1 -2 -3 -3 -1 -2 -3 -3 -3 298 R -3 -3 -2 -1 -3 -3 -1 -2 2 0 -1 -1 -2 2 5 -2 -2 -2 -3 -2 299 Q 0 -2 -1 1 -3 -2 -1 -2 1 -2 -2 -1 -2 4 1 0 0 0 -3 -2 300 A 3 -1 -3 -2 2 -2 -3 -1 -2 -1 3 -3 -2 -2 -2 -1 -1 0 -2 -1 301 I 0 4 -2 -2 -2 -3 -2 2 -1 1 -1 1 -2 1 1 -2 -1 1 -2 -2 302 D -3 -3 6 3 -4 -3 -1 -4 0 -4 -4 0 -1 -1 1 0 -2 -4 -4 -3 303 E -3 -3 2 5 -3 -3 -1 0 1 -3 -3 -1 -1 2 0 -1 -2 -2 -3 -2 304 A 2 -1 -3 -2 -2 -2 -3 3 -2 0 3 -3 -2 -2 -2 -1 -1 0 -3 -2 305 A 3 -1 -2 -2 -3 1 -2 -1 -2 -2 -2 -1 -1 -2 -2 1 1 0 -3 -2 306 A 3 0 -1 -1 -3 -1 -2 -2 -1 -2 -2 -1 -1 -2 -2 3 0 -1 -3 -2 307 V 1 -1 -3 -3 4 -2 -2 0 -3 -1 -1 -3 -2 -3 -3 -2 -2 3 -1 0 308 L -3 -1 -4 -3 0 -4 -3 0 -3 5 3 -4 -3 -3 -3 -3 -2 0 -1 -1 309 Q -2 -2 -1 0 -3 4 0 -3 0 -3 -2 0 -1 4 -1 -1 -1 -3 -2 -2 310 A 2 -1 -1 0 -3 -1 -1 -2 3 -2 -2 -1 -1 0 0 0 -1 -1 -2 -1 311 H -2 -3 -1 0 -2 -2 7 -3 0 -2 -1 0 -2 4 0 -1 -1 -3 -1 0 312 F -4 -2 -4 -4 7 -3 -1 0 -4 0 0 -3 -4 -4 -3 -3 -2 -1 1 3 313 G -1 -2 -1 -2 -3 6 -2 -4 -2 -4 -3 0 -2 -2 -2 0 -2 -3 -1 -3 314 T -1 0 -1 -1 -1 -1 -1 0 -1 -1 -1 0 -1 -1 -1 0 5 0 -1 -1

Your Environment

  • Operating system and version: Ubuntu 22.04.4 LTS
  • I'm Using MMseqs2 Version: 15.6f452 installed with bioconda

etiur avatar May 26 '24 14:05 etiur

Cns is not the sequence but the profile consensus sequence. The easiest way to match them together should be to use the non db output mode (profile2pssm --db-output 0) and match them to the original sequence based on the database key (first column in the db .lookup file, second is the accession).

milot-mirdita avatar May 26 '24 18:05 milot-mirdita

Thank you very much for answering so fast. Just another doubt I have. Does this change the scores calculated for the specific position compared to a Psiblast PSSM? I don't know if it is correct but besides counting the frequencies of each amino acid in that position to calculate the score, PSSMs also add a pseudo count that depends on the identity of the aminoacid in that position because it is based on blossum62, so if the position is not the initial one but rather a consensus the pseudocount will differ right?

etiur avatar May 29 '24 06:05 etiur

MMseqs2 does implement its own profile scoring with its own pseudo-count logic. Therefore, it should not be compared with Psi-blast profiles.

milot-mirdita avatar May 29 '24 06:05 milot-mirdita

Is there anywhere where I can find how you calculate the score? Does this score represent evolutionary conservation well?

etiur avatar May 29 '24 07:05 etiur

The PSSMCalculator computes the profiles: https://github.com/soedinglab/MMseqs2/blob/25fc2108e0da107de5da157d68e5e7d8274a69ea/src/alignment/PSSMCalculator.cpp#L153

It works well for our purposes (homology detection). I don't know if it will work for your purposes.

milot-mirdita avatar May 30 '24 17:05 milot-mirdita