V Uday Kumar Reddy, Rajashree Shettar e Vidya Niranjan
A invenção de novas técnicas de computação, como a computação em nuvem e em grid, reduziu o custo da computação através da partilha ideal de recursos. No entanto, muitas aplicações não são completamente migradas para estas novas tecnologias, principalmente devido à relutância dos cientistas em partilhar os dados através da Internet por razões de segurança. Embora o custo do hardware tenha sido reduzido drasticamente, poucas aplicações requerem um elevado poder de processamento para processar ou analisar grandes dados científicos. Também devido ao elevado custo necessário para adquirir recursos computacionais, muitas das aplicações científicas ainda não se concretizaram completamente. Uma dessas aplicações é a sequenciação de nova geração (NGS), que terá de lidar com terabytes de dados do genoma, o que exigirá um elevado poder computacional. Consequentemente, é necessário um supercomputador para processar dados com eficiência.
Neste artigo, foi proposta a utilização do middleware de grid de código aberto Berkeley Open Infrastructure for Network Computing (BOINC) para permitir a montagem de novo utilizando um cluster de máquinas desktop no paradigma mestre e voluntário. O paradigma pode ser estabelecido em laboratórios de informática normais, o que elimina as preocupações de largura de banda e segurança da utilização de métodos de computação em nuvem e em rede na Internet. Este paradigma cria um supercomputador virtual nos laboratórios para processar dados.