A capacidade de coletar quantidades maciças de dados a baixo custo usando Hadoop é uma coisa. Ser capaz de gerenciar todos esses dados juntos é outra história. Com essa questão em mente, a Hortonworks anunciou essa semana a atualização do streaming analytics Hortonworks DataFlow (HDF) com o objetivo de tratar uma ampla gama de questões envolvendo o gerenciamento empresarial de dados.

Hadoop
HDF 2.0 agora possui uma interface de usuário melhorada que reforça a integração entre a plataforma de streaming analytics, que é baseada na engine de roteamento  de dados Apache Nifi e no software de mensagens Apache Kafka e nas ferramentas Apache Ambari para o gerenciamento de implementações do Hadoop. O Apache Nifi em si é baseado no software de streaming analytics Onyara, que a Hortonworks adquiriu em 2015.

Além disso, a Hortonworks anunciou que o HDF 2.0 foi integrado com o software Apache Ranger para garantir o acesso aos dados no Hadoop. A empresa revelou também que desenvolveu o Apache MiNiFi, uma implementação do Apache Nifi que foi otimizado para processar o streaming analytics em um gateway de Internet das Coisas (IoT), enquanto, ao mesmo tempo, certifica oficialmente mais de 150 conectores HDF 2.0 de terceiros.

Jamie Engesser, VP e Gerente Geral de produtos emergentes da Hortonworks, afirma que uma abordagem verdadeiramente abrangente para Big Data exige uma capacidade de processar e gerenciar dados, tanto diâmica como estaticamente. O HDF agora estende a capacidade da Hortonworks para processar dados por todo o caminho até a ponta. Essa abordagem, acrescenta Engesser, também serve para limitar a quantidade da largura de banda de rede que precisa ser alocada a um projeto de Internet das coisas.

“Agora as organizações podem realmente priorizar quais dados precisam ser enviados por toda a rede”, diz Engesser.

O HDF 2.0 é um exemplo de como o streaming analytics passará a ser aplicado a estratégias de Big Data, tanto dentro como fora do Hadoop. O próximo desafio que as organizações de TI enfrentarão será determinar até que ponto este software open source de streaming analytics pode complementar ou evitar investimentos anteriores em aplicações analíticas por toda a empresa.


Fonte: IT Business Edge

Share This