Alin ang mas mahusay na matuto ng spark o Hadoop?
Alin ang mas mahusay na matuto ng spark o Hadoop?

Video: Alin ang mas mahusay na matuto ng spark o Hadoop?

Video: Alin ang mas mahusay na matuto ng spark o Hadoop?
Video: How to install Spark on Windows 2024, Mayo
Anonim

Hindi, hindi sapilitan matuto ng Hadoop una sa matuto ng Spark ngunit pangunahing kaalaman sa Hadoop at ang HDFS ay magdaragdag ng kalamangan sa iyong pag-aaral ng Spark . Spark ay isang umuusbong na teknolohiya at ito ay isang buzz sa merkado. Pag-aaral Spark ay magiging kapaki-pakinabang para sa iyong karera bilang Spark ang mga propesyonal ay mas gusto sa industriya.

Ang dapat ding malaman ay, alin ang mas mahusay na Hadoop o spark?

Hadoop ay dinisenyo upang pangasiwaan ang batch processing nang mahusay samantalang Spark ay idinisenyo upang pangasiwaan ang real-time na data nang mahusay. Hadoop ay isang high latency computingframework, na walang interactive na mode samantalang Spark ay isang mababang latency computing at maaaring magproseso ng data nang interactive.

Sa tabi sa itaas, mas mahusay ba ang spark kaysa sa MapReduce? Pangunahing Pagkakaiba sa Pagitan MapReduce vs Apache Spark MapReduce ay mahigpit na nakabatay sa disk habang ang Apache Spark gumagamit ng memorya at maaaring gumamit ng disk para sa pagproseso. Spark ay nakakapagsagawa ng mga batch-processing na trabaho sa pagitan ng 10 hanggang 100 beses na mas mabilis kaysa sa ang MapReduce Bagama't ang parehong mga tool ay ginagamit para sa pagproseso ng Big Data.

Kasunod nito, ang tanong, kailangan bang matutunan ang Hadoop para sa spark?

Hindi, ayaw mo kailangang matuto ng Hadoop sa learnSpark . Spark ay isang malayang proyekto. Ngunit pagkatapos ng YARNAnd Hadoop 2.0, Spark naging tanyag dahil Spark maaaring tumakbo sa ibabaw ng HDFS kasama ng iba pa Hadoop mga bahagi. Hadoop ay isang balangkas kung saan isinusulat mo ang MapReduce ng trabaho sa pamamagitan ng pagmamana ng mga klase sa Java.

Ang Apache spark ba ay nagkakahalaga ng pag-aaral?

1) Alamin ang Apache Spark upang magkaroon ng Mas Mataas na Access sa Big Data Data na nagpapakita ng interes ang mga siyentipiko sa pakikipagtulungan Spark dahil sa kakayahan nitong mag-imbak ng data resident inmemory na tumutulong sa pagpapabilis ng makina pag-aaral mga workload hindi tulad ngHadoop MapReduce.

Inirerekumendang: