Talaan ng mga Nilalaman:

Maaari ba akong magpatakbo ng Python sa Hadoop?
Maaari ba akong magpatakbo ng Python sa Hadoop?

Video: Maaari ba akong magpatakbo ng Python sa Hadoop?

Video: Maaari ba akong magpatakbo ng Python sa Hadoop?
Video: Howto install hadoop on Ubuntu 2024, Nobyembre
Anonim

Na may pagpipilian sa pagitan ng mga programming language tulad ng Java, Scala at sawa para sa Hadoop ecosystem, ginagamit ng karamihan sa mga developer sawa dahil sa mga sumusuportang library nito para sa mga gawain ng data analytics. Hadoop nagbibigay-daan ang streaming sa user na lumikha at isagawa Map/Reduce ang mga trabaho gamit ang anumang script o executable bilang mapper o/at reducer.

Katulad nito, tinanong, paano kumonekta ang Python sa Hadoop?

Pagkonekta ng Hadoop HDFS sa Python

  1. Hakbang1: Tiyaking gumagana nang tama ang Hadoop HDFS. Buksan ang Terminal/Command Prompt, tingnan kung gumagana ang HDFS sa pamamagitan ng paggamit ng mga sumusunod na command: start-dfs.sh.
  2. Hakbang 2: I-install ang libhdfs3 library.
  3. Hakbang 3: I-install ang hdfs3 library.
  4. Step4: Suriin kung matagumpay ang koneksyon sa HDFS.

Katulad nito, ano ang Hadoop sa Python? sawa ay isang pangkalahatang layunin sa pagbuo ng kumpletong programming language na maaaring magamit upang gawin ang halos lahat ng bagay sa mundo ng programming. Hadoop ay isang malaking data framework na nakasulat sa Java upang harapin ang malalaking volume ng data. Mayroong maraming mga online na institusyon na Hadoop kasama sawa mga kurso tulad ng: Analytixlabs. Edureka.

Kasunod nito, ang tanong ay, paano ako magpapatakbo ng isang Python MapReduce program sa Hadoop?

Pagsusulat ng Programang Hadoop MapReduce Sa Python

  1. Pagganyak.
  2. Kung ano ang gusto naming gawin.
  3. Mga kinakailangan.
  4. Python MapReduce Code. Hakbang sa mapa: mapper.py. Bawasan ang hakbang: reducer.py.
  5. Pagpapatakbo ng Python Code sa Hadoop. I-download ang halimbawang data ng pag-input. Kopyahin ang lokal na halimbawang data sa HDFS.
  6. Pinahusay na Mapper at Reducer code: gamit ang Python iterators at generators. mapper.py. reducer.py.

Ano ang Hadoop Streaming jar?

Hadoop Ang pamamahagi ay nagbibigay ng isang Java utility na tinatawag na Pag-stream ng Hadoop . Ito ay nakabalot sa isang banga file. Sa Pag-stream ng Hadoop , maaari tayong lumikha at magpatakbo ng mga trabaho sa Map Reduce gamit ang isang executable na script. Pag-stream ng Hadoop ay isang utility na kasama ng Hadoop pamamahagi. Maaari itong magamit upang magsagawa ng mga programa para sa pagsusuri ng malaking data.

Inirerekumendang: