Résumé du nettoyage :
Taille finale de l'assemblage : 12 contigs avec une taille de 164436 pb.
Liste des contigs retenus dans l'assemblage final : - contig00001 : profondeur de 22.0(longueur du contig : 5770 pb, somme des longueurs des lectures : 128554 pb avec 328 de lectures assemblées.)
- contig00002 : profondeur de 47.0(longueur du contig : 2495 pb, somme des longueurs des lectures : 119733 pb avec 274 de lectures assemblées.)
- contig00003 : profondeur de 18.0(longueur du contig : 57835 pb, somme des longueurs des lectures : 1097789 pb avec 2824 de lectures assemblées.)
- contig00006 : profondeur de 5.0(longueur du contig : 880 pb, somme des longueurs des lectures : 4590 pb avec 11 de lectures assemblées.)
- contig00008 : profondeur de 5.0(longueur du contig : 1123 pb, somme des longueurs des lectures : 6039 pb avec 16 de lectures assemblées.)
- contig00020 : profondeur de 18.0(longueur du contig : 60327 pb, somme des longueurs des lectures : 1103973 pb avec 2714 de lectures assemblées.)
- contig00024(*) : profondeur de 19.0(longueur du contig : 5626 pb, somme des longueurs des lectures : 108891 pb avec 279 de lectures assemblées.)
- contig00048 : profondeur de 5.0(longueur du contig : 827 pb, somme des longueurs des lectures : 4145 pb avec 11 de lectures assemblées.)
- contig00061(*) : profondeur de 20.0(longueur du contig : 15348 pb, somme des longueurs des lectures : 318658 pb avec 791 de lectures assemblées.)
- contig00078 : profondeur de 18.0(longueur du contig : 34208 pb, somme des longueurs des lectures : 632798 pb avec 1590 de lectures assemblées.)
- contig00084 : profondeur de 6.0(longueur du contig : 1021 pb, somme des longueurs des lectures : 6697 pb avec 17 de lectures assemblées.)
- contig00149 : profondeur de 14.0(longueur du contig : 938 pb, somme des longueurs des lectures : 13648 pb avec 35 de lectures assemblées.)
(*) Contigs d'éxtremités.
Fichiers fasta & qual résultats : validated_contigs.fasta, validated_contigs.qual, Données en entrée issue de l'assemblage :
Données en entrée :
- file : pool1.MID4.clean.sff
- 12774, 12774 lectures (*)
- 4696283, 4688750 bases (*)
* : premier chiffre correspond au nombre de lectures/bases présentes dans le fichier sff et le second chiffre correspond au nombre de lectures/bases utilisées après trimming des primers, de la qualité... (cf doc Roche: GS_FLX_Software_Manual.pdf)
Informations générales sur l'assemblage :
- 9771, 76.49% lectures alignées
- 3536679, 75.43% bases alignées
- 0.99%, 35118 pourcentage du nombre total de différences
- 9458 lectures assemblées
- 313 lectures partiellement assemblées
- 2826 singletons
- 1 lectures matches à plusieurs endroit
- 176 lectures abérantes
- 0 lectures trop courte
Large contig :
- 111 contigs
- 254786 bases
- 2295 de taille moyenne des contigs
- 31457 taille du N50
- 55907 taille maximale
- 243412, 95.54% (nombre et pourcentage) bases dont la qualité est supérieure à 40
- 11374, 4.46% (nombre et pourcentage) bases dont la qualité est inférieure à 39
Tout les contig :
1. Décontamination des contigs :
Nombre de contaminations contre la banque 'ecoli536 2010-03-26 ' : 7
Options utilisées :
blastall : -p blastn -d /bank/blastdb/ecoli536 -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigecoli536.m8
Nombre de contaminations contre la banque 'ecoliK12_DH10B 2010-03-26 ' : 14
Options utilisées :
blastall : -p blastn -d /bank/blastdb/ecoliK12_DH10B -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigecoliK12_DH10B.m8
Nombre de contaminations contre la banque 'genbank_phage 176 ' : 2
Options utilisées :
blastall : -p blastn -d /bank/blastdb/genbank_phage -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
454LargeContigs.contamination_search.contigphage.m8
Nombre de contaminations contre la banque 'Saccharomyces_cerevisiae 2010-03-26 ' : 0
Options utilisées :
blastall : -p blastn -d /bank/blastdb/Saccharomyces_cerevisiae -e 1e-5 -F 'T' -b 150
filtre : --pci 95 --pcq 95
Fichiers fasta & qual décontaminés : 454LargeContigs.decontaminated.fasta, 454LargeContigs.decontaminated.qual.
2. Tri des contigs selon leurs profondeurs :
Liste des contigs ayant une profondeur comprise entre 5 et 100X :
- contig00001 : profondeur de 22.0(longueur du contig : 5770 pb, somme des longueurs des lectures : 128554 pb avec 328 de lectures assemblées.)
- contig00002 : profondeur de 47.0(longueur du contig : 2495 pb, somme des longueurs des lectures : 119733 pb avec 274 de lectures assemblées.)
- contig00003 : profondeur de 18.0(longueur du contig : 57835 pb, somme des longueurs des lectures : 1097789 pb avec 2824 de lectures assemblées.)
- contig00006 : profondeur de 5.0(longueur du contig : 880 pb, somme des longueurs des lectures : 4590 pb avec 11 de lectures assemblées.)
- contig00008 : profondeur de 5.0(longueur du contig : 1123 pb, somme des longueurs des lectures : 6039 pb avec 16 de lectures assemblées.)
- contig00020 : profondeur de 18.0(longueur du contig : 60327 pb, somme des longueurs des lectures : 1103973 pb avec 2714 de lectures assemblées.)
- contig00024 : profondeur de 19.0(longueur du contig : 5626 pb, somme des longueurs des lectures : 108891 pb avec 279 de lectures assemblées.)
- contig00048 : profondeur de 5.0(longueur du contig : 827 pb, somme des longueurs des lectures : 4145 pb avec 11 de lectures assemblées.)
- contig00061 : profondeur de 20.0(longueur du contig : 15348 pb, somme des longueurs des lectures : 318658 pb avec 791 de lectures assemblées.)
- contig00078 : profondeur de 18.0(longueur du contig : 34208 pb, somme des longueurs des lectures : 632798 pb avec 1590 de lectures assemblées.)
- contig00084 : profondeur de 6.0(longueur du contig : 1021 pb, somme des longueurs des lectures : 6697 pb avec 17 de lectures assemblées.)
- contig00149 : profondeur de 14.0(longueur du contig : 938 pb, somme des longueurs des lectures : 13648 pb avec 35 de lectures assemblées.)
Fichiers fasta & qual résultant du trie par la profondeur : 454LargeContigs.decontaminated.fasta.depth.sorted, 454LargeContigs.decontaminated.qual.depth.sorted.
3. Information sur les contigs d'extrémités :
Le vecteur trouvé dans les contigs suivant : contig00024, contig00061.
Fichier fasta résultat avec le vecteur masqué : 454LargeContigs.decontaminated.screen