Através da utilização como query de cada uma das sequências proteicas presentes em cada feature do tipo CDS e com recurso à ferramenta do NCBI BLAST (basic local alignment search tool), é possível analisar homologais, isto é regiões de similaridade entre proteínas da espécie em estudo.
Para tal, no Biopython, a nossa script presente no programa homologiasblast.py permitiu identificar todas as features que são do tipo CDS do ficheiro sequence.gb contendo apenas a região em estudo, isto é locus_tag de 2366 a 2581. A fim de se obter a correspondente sequência de aminoácidos que constituem a proteína, a cada feature do tipo CDS identificada destacou-se o qualifier translation e assim o conjunto de proteínas encontradas foram utilizadas individualmente como uma sequência query na ferramenta BLAST.
Numa fase final, cada sequência query é corrida na base de dados da NCBI BLAST.Por fim, obtém-se o ficheiro homologiasblast.xml com o resultado das homologias em análise.
Salienta-se que devido ao tempo necessário para executar todas as features, fizemos a análise de homologias apenas para uma feature.
Script Homologiasblast:
www.dropbox.com/s/wd5kxwmoset76pj/homologiasblast.py?dl=0
Resultado das homologias:
www.dropbox.com/s/ym6cgoxx6hhj0ko/homologiasblast.rar?dl=0