Ano ang Impala sa malaking data?
Ano ang Impala sa malaking data?

Video: Ano ang Impala sa malaking data?

Video: Ano ang Impala sa malaking data?
Video: tutorial #4 ((Ata or tinta)ng kubutan o malaking pusit,mabisang pain lalo na sa gabi. 2024, Nobyembre
Anonim

Impala ay isang open source na massively parallel processing query engine sa itaas ng mga clustered system tulad ng Apache Hadoop. Nilikha ito batay sa Dremel paper ng Google. Ito ay isang interactive na SQL tulad ng query engine na tumatakbo sa ibabaw ng Hadoop Distributed File System (HDFS). Impala gumagamit ng HDFS bilang pinagbabatayan nitong imbakan.

Tungkol dito, ano ang Impala at pugad?

Apache Pugad ay isang epektibong pamantayan para sa SQL-in-Hadoop. Impala ay isang open source SQL query engine na binuo pagkatapos ng Google Dremel. Cloudera Impala ay isang SQL engine para sa pagproseso ng data na nakaimbak sa HBase at HDFS. Impala gamit Pugad megastore at maaaring i-query ang Pugad mga talahanayan nang direkta.

Higit pa rito, alin ang mas magandang pugad o Impala? Apache Pugad maaaring hindi perpekto para sa interactive na computing samantalang Impala ay sinadya para sa interactive na computing. Pugad ay batch based Hadoop MapReduce samantalang Impala ay higit pa tulad ng MPP database. Pugad sumusuporta sa mga kumplikadong uri ngunit Impala ay hindi. Apache Pugad ay fault tolerant samantalang Impala hindi sumusuporta sa fault tolerance.

Tinanong din, bakit natin ginagamit ang Impala?

Impala sumusuporta sa pagpoproseso ng in-memory na data, ibig sabihin, ina-access/nasusuri nito ang data na iyon ay na nakaimbak sa mga node ng data ng Hadoop nang walang paggalaw ng data. Kaya mo i-access ang data gamit ang Impala gamit Mga query na parang SQL. Impala nagbibigay ng mas mabilis na pag-access para sa data sa HDFS kung ihahambing sa iba pang mga SQL engine.

Ano ang isang pugad sa malaking data?

Apache Pugad ay isang datos warehouse system para sa datos pagbubuod at pagsusuri at para sa pagtatanong ng malaki datos system sa open-source na Hadoop platform. Kino-convert nito ang mga query na tulad ng SQL sa mga trabahong MapReduce para sa madaling pagpapatupad at pagproseso ng napakalaking volume ng datos.

Inirerekumendang: