Talaan ng mga Nilalaman:

Paano ko mapapabuti ang pagganap ng aking sqoop?
Paano ko mapapabuti ang pagganap ng aking sqoop?

Video: Paano ko mapapabuti ang pagganap ng aking sqoop?

Video: Paano ko mapapabuti ang pagganap ng aking sqoop?
Video: How to Speed Up Windows 10 Performance (Tagalog) Paano Pabilisin ang mabagal na PC Settings Solution 2024, Mayo
Anonim

Upang ma-optimize pagganap , itakda ang bilang ng mga gawain sa mapa sa isang halaga na mas mababa kaysa ang maximum na bilang ng mga koneksyon na ang mga suporta sa database. Pagkontrol ang dami ng paralelismo na Sqoop ay gagamitin upang maglipat ng data ay ang pangunahing paraan upang makontrol ang load sa iyong database.

Kaugnay nito, ano ang mangyayari kung nabigo ang sqoop sa pagitan ng isang proseso?

Isang tipikal Sqoop Ang trabaho na nag-ingest ng data mula sa isang source database papunta sa HDFS ay kokopyahin ang data sa isang target na direktoryo. Ang nakopyang file ay tatanggalin kung nabigo ang sqoop nang hindi nakumpleto.

Maaaring magtanong din, paano mo makakamit ang parallelism sa sqoop? Pagkontrol Paralelismo . Sqoop nag-import ng data nang magkatulad mula sa karamihan ng mga mapagkukunan ng database. Maaari mong tukuyin ang bilang ng mga gawain sa mapa (parallel na mga proseso) na gagamitin upang maisagawa ang pag-import sa pamamagitan ng paggamit ng -m o --num-mappers na argumento. Ang bawat isa sa mga argumentong ito ay tumatagal ng isang integer na halaga na tumutugma sa antas ng paralelismo upang magpatrabaho

Dahil dito, paano ko mapapabuti ang pagganap ng aking query sa Hive?

Nasa ibaba ang listahan ng mga kasanayan na maaari naming sundin upang i-optimize ang Mga Query sa Hive

  1. Paganahin ang Compression sa Hive.
  2. Optimize Joins.
  3. Iwasan ang Global Sorting sa Hive.
  4. Paganahin ang Tez Execution Engine.
  5. Optimize LIMIT operator.
  6. Paganahin ang Parallel Execution.
  7. Paganahin ang Mapreduce Strict Mode.
  8. Single Reduce para sa Multi Group BY.

Paano gumagana ang sqoop split?

Maaari itong magamit upang mapahusay ang pagganap ng pag-import sa pamamagitan ng pagkamit ng higit na paralelismo. Sqoop lumilikha mga hati batay sa mga halaga sa isang partikular na hanay ng talahanayan na tinukoy ng -- hati -ng user sa pamamagitan ng import command. Kung hindi ito magagamit, ang pangunahing key ng talahanayan ng pag-input ay ginagamit upang lumikha ng mga hati.

Inirerekumendang: