Résumé du nettoyage :
Taille finale de l'assemblage : 36 contigs avec une taille de 147753 pb.
Liste des contigs retenus dans l'assemblage final : - contig00001 : 5131pb
- contig00003(*) : 101198pb
- contig00025 : 1065pb
- contig00034 : 679pb
- contig00064 : 602pb
- contig00134 : 838pb
- contig00158 : 1013pb
- contig00176 : 4014pb
- contig00189 : 568pb
- contig00207 : 837pb
- contig00212 : 644pb
- contig00239 : 523pb
- contig00241 : 12166pb
- contig00242 : 1469pb
- contig00243 : 1225pb
- contig00244 : 826pb
- contig00246 : 500pb
- contig00250 : 1119pb
- contig00254 : 527pb
- contig00262 : 802pb
- contig00276 : 555pb
- contig00277 : 510pb
- contig00278 : 661pb
- contig00285 : 924pb
- contig00292 : 542pb
- contig00295 : 698pb
- contig00302 : 507pb
- contig00318 : 963pb
- contig00336 : 660pb
- contig00346 : 674pb
- contig00359 : 815pb
- contig00399 : 779pb
- contig00422 : 1554pb
- contig00437 : 588pb
- contig00453 : 698pb
- contig00486 : 879pb
(*) Contigs d'éxtremités.
Fichiers fasta & qual résultats : validated_contigs.fasta, validated_contigs.qual, Données en entrée issue de l'assemblage :
Données en entrée :
- file : pool1.MID2.clean.sff
- 22835, 22835 lectures (*)
- 8910233, 8899364 bases (*)
* : premier chiffre correspond au nombre de lectures/bases présentes dans le fichier sff et le second chiffre correspond au nombre de lectures/bases utilisées après trimming des primers, de la qualité... (cf doc Roche: GS_FLX_Software_Manual.pdf)
Informations générales sur l'assemblage :
- 17424, 76.30% lectures alignées
- 6687225, 75.14% bases alignées
- 0.89%, 59299 pourcentage du nombre total de différences
- 16648 lectures assemblées
- 772 lectures partiellement assemblées
- 4954 singletons
- 10 lectures matches à plusieurs endroit
- 451 lectures abérantes
- 0 lectures trop courte
Large contig :
- 265 contigs
- 323982 bases
- 1222 de taille moyenne des contigs
- 1283 taille du N50
- 101198 taille maximale
- 303121, 93.56% (nombre et pourcentage) bases dont la qualité est supérieure à 40
- 20861, 6.44% (nombre et pourcentage) bases dont la qualité est inférieure à 39
Tout les contig :
1. Décontamination des contigs :
Nombre de contaminations contre la banque 'ecoliK12_DH10B 2010-03-26 ' : 129
Options utilisées :
blastall : -p blastn -d /bank/blastdb/ecoliK12_DH10B -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigecoliK12_DH10B.m8
Nombre de contaminations contre la banque 'ecoli536 2010-03-26 ' : 87
Options utilisées :
blastall : -p blastn -d /bank/blastdb/ecoli536 -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigecoli536.m8
Nombre de contaminations contre la banque 'genbank_phage 176 ' : 4
Options utilisées :
blastall : -p blastn -d /bank/blastdb/genbank_phage -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigphage.m8
Nombre de contaminations contre la banque 'Saccharomyces_cerevisiae 2010-03-26 ' : 0
Options utilisées :
blastall : -p blastn -d /bank/blastdb/Saccharomyces_cerevisiae -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
Fichiers fasta & qual décontaminés : 454LargeContigs.decontaminated.fasta, 454LargeContigs.decontaminated.qual.
2. Tri des contigs selon leurs profondeurs :
Liste des contigs ayant une profondeur comprise entre 5 et 100X :
- contig00001 : profondeur de 57.0 (longueur du contig gapé : 5957 pb, somme des longueurs des lectures : 342358 pb avec 789 de lectures assemblées.)
- contig00003 : profondeur de 46.0 (longueur du contig gapé : 116080 pb, somme des longueurs des lectures : 5442079 pb avec 12129 de lectures assemblées.)
- contig00025 : profondeur de 5.0 (longueur du contig gapé : 1091 pb, somme des longueurs des lectures : 5614 pb avec 14 de lectures assemblées.)
- contig00034 : profondeur de 8.0 (longueur du contig gapé : 721 pb, somme des longueurs des lectures : 6348 pb avec 16 de lectures assemblées.)
- contig00064 : profondeur de 10.0 (longueur du contig gapé : 633 pb, somme des longueurs des lectures : 6822 pb avec 17 de lectures assemblées.)
- contig00134 : profondeur de 6.0 (longueur du contig gapé : 854 pb, somme des longueurs des lectures : 5592 pb avec 15 de lectures assemblées.)
- contig00158 : profondeur de 6.0 (longueur du contig gapé : 1059 pb, somme des longueurs des lectures : 6623 pb avec 17 de lectures assemblées.)
- contig00176 : profondeur de 5.0 (longueur du contig gapé : 4159 pb, somme des longueurs des lectures : 21295 pb avec 55 de lectures assemblées.)
- contig00189 : profondeur de 5.0 (longueur du contig gapé : 589 pb, somme des longueurs des lectures : 3027 pb avec 7 de lectures assemblées.)
- contig00207 : profondeur de 6.0 (longueur du contig gapé : 880 pb, somme des longueurs des lectures : 6105 pb avec 17 de lectures assemblées.)
- contig00212 : profondeur de 5.0 (longueur du contig gapé : 669 pb, somme des longueurs des lectures : 3371 pb avec 9 de lectures assemblées.)
- contig00239 : profondeur de 6.0 (longueur du contig gapé : 543 pb, somme des longueurs des lectures : 3478 pb avec 10 de lectures assemblées.)
- contig00241 : profondeur de 47.0 (longueur du contig gapé : 13961 pb, somme des longueurs des lectures : 661536 pb avec 1491 de lectures assemblées.)
- contig00242 : profondeur de 5.0 (longueur du contig gapé : 1595 pb, somme des longueurs des lectures : 8431 pb avec 23 de lectures assemblées.)
- contig00243 : profondeur de 6.0 (longueur du contig gapé : 1375 pb, somme des longueurs des lectures : 9513 pb avec 25 de lectures assemblées.)
- contig00244 : profondeur de 9.0 (longueur du contig gapé : 912 pb, somme des longueurs des lectures : 8759 pb avec 22 de lectures assemblées.)
- contig00246 : profondeur de 15.0 (longueur du contig gapé : 568 pb, somme des longueurs des lectures : 8597 pb avec 22 de lectures assemblées.)
- contig00250 : profondeur de 5.0 (longueur du contig gapé : 1155 pb, somme des longueurs des lectures : 5817 pb avec 16 de lectures assemblées.)
- contig00254 : profondeur de 6.0 (longueur du contig gapé : 535 pb, somme des longueurs des lectures : 3469 pb avec 10 de lectures assemblées.)
- contig00262 : profondeur de 5.0 (longueur du contig gapé : 829 pb, somme des longueurs des lectures : 4174 pb avec 12 de lectures assemblées.)
- contig00276 : profondeur de 15.0 (longueur du contig gapé : 635 pb, somme des longueurs des lectures : 9734 pb avec 22 de lectures assemblées.)
- contig00277 : profondeur de 7.0 (longueur du contig gapé : 515 pb, somme des longueurs des lectures : 3931 pb avec 10 de lectures assemblées.)
- contig00278 : profondeur de 8.0 (longueur du contig gapé : 703 pb, somme des longueurs des lectures : 5850 pb avec 16 de lectures assemblées.)
- contig00285 : profondeur de 8.0 (longueur du contig gapé : 991 pb, somme des longueurs des lectures : 8147 pb avec 20 de lectures assemblées.)
- contig00292 : profondeur de 5.0 (longueur du contig gapé : 549 pb, somme des longueurs des lectures : 2851 pb avec 8 de lectures assemblées.)
- contig00295 : profondeur de 5.0 (longueur du contig gapé : 711 pb, somme des longueurs des lectures : 4020 pb avec 11 de lectures assemblées.)
- contig00302 : profondeur de 12.0 (longueur du contig gapé : 538 pb, somme des longueurs des lectures : 6530 pb avec 17 de lectures assemblées.)
- contig00318 : profondeur de 7.0 (longueur du contig gapé : 1038 pb, somme des longueurs des lectures : 7338 pb avec 20 de lectures assemblées.)
- contig00336 : profondeur de 7.0 (longueur du contig gapé : 684 pb, somme des longueurs des lectures : 4827 pb avec 12 de lectures assemblées.)
- contig00346 : profondeur de 5.0 (longueur du contig gapé : 683 pb, somme des longueurs des lectures : 4007 pb avec 11 de lectures assemblées.)
- contig00359 : profondeur de 15.0 (longueur du contig gapé : 958 pb, somme des longueurs des lectures : 14758 pb avec 38 de lectures assemblées.)
- contig00399 : profondeur de 9.0 (longueur du contig gapé : 817 pb, somme des longueurs des lectures : 7473 pb avec 19 de lectures assemblées.)
- contig00422 : profondeur de 5.0 (longueur du contig gapé : 1585 pb, somme des longueurs des lectures : 8264 pb avec 23 de lectures assemblées.)
- contig00437 : profondeur de 6.0 (longueur du contig gapé : 613 pb, somme des longueurs des lectures : 3760 pb avec 12 de lectures assemblées.)
- contig00453 : profondeur de 5.0 (longueur du contig gapé : 720 pb, somme des longueurs des lectures : 3975 pb avec 11 de lectures assemblées.)
- contig00486 : profondeur de 9.0 (longueur du contig gapé : 966 pb, somme des longueurs des lectures : 9323 pb avec 23 de lectures assemblées.)
Fichiers fasta & qual résultant du trie par la profondeur : 454LargeContigs.decontaminated.fasta.depth.sorted, 454LargeContigs.decontaminated.qual.depth.sorted.
3. Information sur les contigs d'extrémités :
Le vecteur trouvé dans les contigs suivant : contig00003.
Fichier fasta résultat avec le vecteur masqué : 454LargeContigs.decontaminated.screen