L’émergence de la data science
Les trois facteurs qui expliquent le développement de la data science:
Le coût du stockage
Celui-ci ne cesse de diminuer et constitue de moins en moins un critère pertinent pour les entreprises. Les solutions de Cloud Computing permettent en outre une gestion des données élastique et en fonction des besoins réels des entreprises.
Les réseaux à très haut débit (THD)
Avec le développement du THD et l’avènement du Cloud Computing, le lieu de stockage des données n’a plus vraiment d’importance. Elles sont désormais stockées à des endroits physiques distincts, et parfois non identifiés. Ainsi, quel utilisateur sait où se trouvent réellement ses photos postées sur Facebook ou ses messages sur Google Mail?
L’analyse de données à large échelle et le calcul distribué haute performance
Parmi ces solutions technologiques liées au Big Data, l’une des références est la plateforme Hadoop (Apache Foundation) permettant le développement et à la gestion d’applications distribuées adressant des quantités de données énormes et évolutives.