Latest Posts





Blog Language

Latest Posts

Because the potential storage capability of a Hadoop cluster is so very large, you need some means to track both the data contained on the cluster and the data feeds moving data into and out of it. In addition, you need to consider the locations where data might reside on the cluster—that is, in HDFS, Hive, HBase, or Impala. Knowing you should track your data only spawns more questions, however: What type of reporting might be required and in what format? Is a dashboard needed to post the status of data at any given moment? Are graphs or tables helpful to show the state of a data source for a given time period, such as the days in a week?  This article will help you sort out the answers to those questions by demonstrating how to build a range of simple reports using HDFS- and Hive-based data. Although you may end up using completely different tools, reporting methods, and data content to construct the reports for your real-world data, the building blocks presented here will provide insight into the tasks on Hadoop that apply to many other scenarios as well.

We’ll demonstrate the full use of Hunk (the Hadoop version of Splunk) by a list of articles, starting by this one that will show you how to source the software , how to install it and run it ,and a next articles is coming to show how to use it,  how to create reports , how to deal. Some basic errors and their solutions will be presented along with some simple dashboards to monitor the data.

Continue...


                SAP, le leader mondial des logiciels d'entreprise, a fondé une solution innovante répondant au problème de la manipulation et de l'analyse de gros volumes de données. Par le biais de 1500 professionnels, SAP a donné naissance à ce qui est aujourd'hui la solution ayant la plus grande croissance dans les 40 dernières années de l'entreprise. En conséquence d'une innovation collaborative avec Intel Corporation - qui a écrit des directions basées HANA dans leur dernière génération de puces, en attribuant 400 ingénieurs au projet - le logiciel et le matériel se sont donc améliorés pour fournir une augmentation de vitesse inégalée pour l'analyse complexe de plusieurs milliards d’enregistrements de données. Parce que l'innovation SAP HANA a été conçue depuis le début pour utiliser les « chipsets » de nouvelle génération et des principales architectures mémoire, elle produit un niveau de performance qui dépasse considérablement celui des systèmes de gestion de bases de données classiques.

           

Continue...


Les entreprises ont toujours compté sur la technologie pour innover et améliorer la productivité. Mais au cours des dernières années, nous avons vu une explosion des technologies telles que les applications mobiles, les réseaux sociaux et les Big Data, menant ainsi à la création d'énormes opportunités et menaces. Les consommateurs sont de plus en plus disposés à acheter des biens et services par le biais des canaux numériques. Par exemple, presque plus de 50 pour cent de services de voyages en transport aérien sont maintenant achetés en ligne.

 Mais en plus de cela, nous voyons le numérique utilisé pour automatiser des activités intensives qui étaient précédemment manuelles. Peut-être plus fondamentalement, de nouvelles tendances émergent offrant des propositions de valeur différenciées pour les clients, ou plus radicalement une structure inférieure des coûts. Alors, quand vous mettez ces différentes tendances ensemble, vous pouvez voir que le numérique devient un sujet primordial pour la plupart des cadres.

Continue...