Компания VMware объявила о создании проекта с открытым кодом Serengeti, в рамках которого платформа распределенной обработки данных Hadoop будет оптимизирована для исполнения в виртуальных средах. Как обещают в компании, проект упростит организацию облачных сервисов на основе различных дистрибутивов Hadoop, работающих в виртуальных машинах VMware. В компании обещают, что Serengeti позволит эластично масштабировать кластеры Hadoop на виртуальных машинах и обеспечит высокую готовность и оптимальное использование аппаратных ресурсов. Hadoop будет оптимизирована для исполнения под управлением облачной системы виртуализации VMware vSphere. Уже сейчас поддерживаются дистрибутивы Hadoop, предлагаемые компаниями Cloudera, MapR, IBM и Greenplum. В VMware обещают, что Serengeti будет непрерывно совершенствоваться — планируется добавлять поддержку других дистрибутивов и новых возможностей. Serengeti будет распространяться по лицензии Apache 2.0. Как считают в VMware, виртуализованные дистрибутивы Hadoop больше всего подойдут для компаний, тестирующих платформу на кластерах с числом узлом меньше 20.
Источник