Aneta Sawikowska
Análises de dados abrangentes para dados lc-ms de alto rendimento são apresentadas. Métodos de análise estatística e integração para experimentos multifatoriais são mostrados. Conjuntos de dados de exemplo vêm de estudos sobre a resposta de cereais à infecção por patógenos e cevada (Hordeum vulgare) sob estresse de seca. Metabólitos primários, metabólitos secundários e proteínas foram analisados.
O pré-processamento, análise e visualização dos dados foram feitos no sistema R. As análises estatísticas foram realizadas usando procedimentos no pacote Genstat. Métodos de integração de dados ômicos e visualização por redes são apresentados.
As redes de correlação e redes de correlação diferencial foram construídas para comparar relações entre metabólitos e proteínas sob diferentes condições. Traços são representados por nós, linhas (arestas) correspondem a correlações entre os pares de traços. Módulos - clusters com traços altamente correlacionados são detectados. Hubs, que são traços com muitas conexões (correlações com outros traços) são indicados.
A análise de rede de correlação foi feita usando o pacote WGCNA em R, a matriz de correlação de Pearson foi transformada em uma matriz de adjacência usando uma função de potência. Os módulos foram detectados por clustering. Redes de correlação diferencial foram criadas usando o teste baseado na transformação Z de Fisher, com correção de Bonferroni. A visualização das redes foi realizada no Cytoscape.
Os algoritmos podem ser adaptados a quaisquer dados lc-ms de alto rendimento.