Fiocruz disponibiliza Plataforma de Ciência de Dados Aplicada à Saúde

Marcel Pedroso, coordenador da Plataforma de Ciência de Dados em Saúde.
Por Ivanildo Santos 27 de outubro de 2016

Marcel Pedroso, coordenador da Plataforma de Ciência de Dados em Saúde. Pesquisadores e profissionais de saúde ganharam uma nova ferramenta para analisar grandes volumes de dados e conjuntos de informações sobre a área. A Plataforma de Ciência de Dados aplicada à Saúde é uma iniciativa do Icict/Fiocruz que disponibiliza para a comunidade científica e gestores um serviço online de armazenamento, gestão e análise de dados em saúde, possibilitando o uso de estratégicas como análise visual, mineração de dados, big data, aprendizagem de máquina, dentre outras.

“É um serviço de computação científica voltado para o setor de saúde”, explica o coordenador da plataforma, Marcel Pedroso, do Laboratório de Informação em Saúde (Lis/Icict). A partir de parcerias com o Laboratório Nacional de Computação Científica (LNCC) e a Dell EMC, o projeto utiliza conceitos de processamento distribuído, tornando a plataforma uma área de trabalho de alta capacidade para análise de dados.

A interface é dividida em três eixos: Análise visual, voltada para indexação, extração e análise visual de dados, por meio de ferramentas livres como Elasticsearch e Kibana; Mineração de Dados e Análise Preditiva, que permitirá ao pesquisador a conexão aos dados via R Studio Server; e Data Science Lab, que será uma área colaborativa para troca de experiências para inovação e aprendizagem na área de ciência de dados.

“Na prática, a plataforma permitirá aos pesquisadores uma capacidade avançada para processamento de algoritmos para análise desses grandes volumes de dados, não só da área de saúde, mas também de outras fontes como o IBGE, INPE, dentre outras, que sejam públicas e estejam disponíveis”, explica Pedroso. Além disso, os dados que já se encontram disponíveis passaram por tratamento de modelagem e indexação. No nível individual, os dados disponibilizados são anonimizados.

“A plataforma permitirá mais agilidade para a pesquisa, pois conta com um hardware bastante robusto e suporte constante”, aponta Jefferson Lima, tecnologista do Centro de Tecnologia da Informação e Comunicação (Ctic/Icict) e responsável pela governança de dados na plataforma. Sua instalação foi viabilizada por meio de parcerias e fomento do Programa de Indução à Pesquisa e Desenvolvimento Tecnológico (PIPDT/Icict) e FAPERJ.

Além da infraestrutura, a plataforma também tem o objetivo de ser um espaço para capacitação e especialização para a área de ciência de dados aplicada à saúde. Haverá uma equipe de referência composta por profissionais de diversas áreas, conforme a própria característica desse campo. “A Ciência de Dados é um campo de interseção entre a Estatística, a Computação e a área de interesse, no nosso caso, a saúde”, descreve o coordenador. Os membros receberão curso de capacitação com reconhecimento internacional e há previsão de abertura de um curso de especialização dessa área a ser oferecido pela Gestão Acadêmica do Icict.

A interface para a plataforma está disponível no site do projeto em bigdata.icict.fiocruz.br. Para acessar a plataforma, os interessados deverão realizar um cadastro no sistema, informando e-mail e criando uma senha de acesso. Saiba como foi o Seminário do Centro de Estudos sobre Ciência de Dados aplicada à Saúde no link e no menu lateral.

Fonte: Fiocruz