22 октября 2013

Релиз стабильной версии Apache Hadoop 2.x

Релиз стабильной версии Apache Hadoop 2.x

Hadoop MapReduce 2.0

На днях - 15.10.2013 - состоялся релиз стабильной версии (Generally Available, GA) версии Apache Hadoop 2.x.

Об одном из, безусловно, самых инновационных изменений - вычислительном фреймворке YARN - я уже подробно писал. Кроме этого, к нововведениям Apache Hadoop 2.2.0 относятся:

  • HDFS:
    • высокая доступность HDFS (напомню, что узел имен NameNode в Hadoop 1.x был единой точкой отказа);
    • возможность создания федераций HDFS;
    • мгновенные снимки (snapshots) HDFS;
    • доступ по протоколу сетевого доступа к файловым системам NFSv3, Network File System.
  • Совместимость:
    • бинарная совместимость с приложениям созданными под Hadoop 1.x;
    • существенное количество интеграционных тестов с элементами экосистемы Hadoop.
  • Другое:
    • поддержка запуска Hadoop на OS Windows.

Happy Data Mining!

Автор статьи

,
DS/ML Preacher, Microsoft MVP && Coffee Addicted