Résumé du nettoyage :
Taille finale de l'assemblage : 5 contigs avec une taille de 32256 pb.
Liste des contigs retenus dans l'assemblage final : - contig00001 : 9566pb
- contig00009(*) : 10719pb
- contig00011 : 5940pb
- contig00014 : 2928pb
- contig00021(*) : 3103pb
(*) Contigs d'éxtremités.
Fichiers fasta & qual résultats : validated_contigs.fasta, validated_contigs.qual, Données en entrée issue de l'assemblage :
Données en entrée :
- file : pool3.RL7.clean.sff
- 3205, 3205 lectures (*)
- 1414110, 1410687 bases (*)
* : premier chiffre correspond au nombre de lectures/bases présentes dans le fichier sff et le second chiffre correspond au nombre de lectures/bases utilisées après trimming des primers, de la qualité... (cf doc Roche: GS_FLX_Software_Manual.pdf)
Informations générales sur l'assemblage :
- 1784, 55.66% lectures alignées
- 762924, 54.08% bases alignées
- 0.92%, 6982 pourcentage du nombre total de différences
- 1693 lectures assemblées
- 73 lectures partiellement assemblées
- 1410 singletons
- 18 lectures matches à plusieurs endroit
- 11 lectures abérantes
- 0 lectures trop courte
Large contig :
- 13 contigs
- 44043 bases
- 3387 de taille moyenne des contigs
- 9118 taille du N50
- 11877 taille maximale
- 43582, 98.95% (nombre et pourcentage) bases dont la qualité est supérieure à 40
- 461, 1.05% (nombre et pourcentage) bases dont la qualité est inférieure à 39
Tout les contig :
1. Décontamination des contigs :
Nombre de contaminations contre la banque 'genbank_phage 176 ' : 2
Options utilisées :
blastall : -p blastn -d /bank/blastdb/genbank_phage -e 1e-5 -F 'F' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigphage.m8
Nombre de contaminations contre la banque 'ecoliDH1 - generate manually ' : 7
Options utilisées :
blastall : -p blastn -d /bank/blastdb/ecoliDH1 -e 1e-5 -F 'F' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigecoliDH1.m8
Nombre de contaminations contre la banque 'Saccharomyces_cerevisiae 2010-06-17 ' : 0
Options utilisées :
blastall : -p blastn -d /bank/blastdb/Saccharomyces_cerevisiae -e 1e-5 -F 'F' -b 150
filtre : --pci 95 --pcq 95
Nombre de contaminations contre la banque 'ecoli536 2010-06-24 ' : 2
Options utilisées :
blastall : -p blastn -d /bank/blastdb/ecoli536 -e 1e-5 -F 'F' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigecoli536.m8
Nombre de contaminations contre la banque 'ecoliK12_DH10B 2010-06-24 ' : 8
Options utilisées :
blastall : -p blastn -d /bank/blastdb/ecoliK12_DH10B -e 1e-5 -F 'F' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigecoliK12_DH10B.m8
Fichiers fasta & qual décontaminés : 454LargeContigs.decontaminated.fasta, 454LargeContigs.decontaminated.qual.
2. Tri des contigs selon leurs profondeurs :
Liste des contigs ayant une profondeur comprise entre 5 et 100X :
- contig00001 : profondeur de 17.0 (longueur du contig gapé : 10239 pb, somme des longueurs des lectures : 178187 pb avec 390 de lectures assemblées.)
- contig00009 : profondeur de 19.0 (longueur du contig gapé : 12624 pb, somme des longueurs des lectures : 242249 pb avec 524 de lectures assemblées.)
- contig00011 : profondeur de 14.0 (longueur du contig gapé : 6380 pb, somme des longueurs des lectures : 92989 pb avec 199 de lectures assemblées.)
- contig00014 : profondeur de 20.0 (longueur du contig gapé : 3161 pb, somme des longueurs des lectures : 65397 pb avec 144 de lectures assemblées.)
- contig00021 : profondeur de 22.0 (longueur du contig gapé : 9711 pb, somme des longueurs des lectures : 216131 pb avec 461 de lectures assemblées.)
Fichiers fasta & qual résultant du trie par la profondeur : 454LargeContigs.decontaminated.fasta.depth.sorted, 454LargeContigs.decontaminated.qual.depth.sorted.
3. Information sur les contigs d'extrémités :
Le vecteur trouvé dans les contigs suivant : contig00009, contig00021.
Fichier fasta résultat avec le vecteur masqué : 454LargeContigs.decontaminated.screen