Paano ko pagsasamahin ang mga frame ng data ng Panda?
Paano ko pagsasamahin ang mga frame ng data ng Panda?

Video: Paano ko pagsasamahin ang mga frame ng data ng Panda?

Video: Paano ko pagsasamahin ang mga frame ng data ng Panda?
Video: Data Science with Python! Filtering Data with pandas 2024, Nobyembre
Anonim

Para makasali sa mga ito DataFrames , mga panda nagbibigay ng maramihang mga function tulad ng concat(), pagsamahin (), join(), atbp. Sa seksyong ito, magsasanay kang gumamit pagsamahin () ang gamit ng mga panda . Mapapansin mo na ang DataFrames ay ngayon pinagsanib sa isang solong Balangkas ng mga datos batay sa mga karaniwang halaga na nasa column ng id ng parehong DataFrames.

Habang pinapanatili itong nakikita, paano mo pinagsasama-sama ang mga frame ng data?

Tukuyin ang sumali i-type ang command na "paano". Isang kaliwa sumali , o umalis pagsamahin , pinapanatili ang bawat hilera mula sa kaliwa balangkas ng mga datos . Resulta mula sa kaliwa- sumali o kaliwa- pagsamahin ng dalawa mga dataframe sa mga Panda. Mga hilera sa kaliwa balangkas ng mga datos na walang katumbas sumali halaga sa kanan balangkas ng mga datos ay naiwan sa mga halaga ng NaN.

Higit pa rito, paano ko idaragdag ang isang Dataframe sa isa pang Dataframe sa Python? Pandas dataframe . dugtungan () function ay ginagamit sa dugtungan mga hilera ng iba balangkas ng mga datos hanggang sa dulo ng ibinigay balangkas ng mga datos , nagbabalik ng bago balangkas ng mga datos bagay. Wala sa orihinal ang mga column mga dataframe ay idinaragdag bilang mga bagong column at ang mga bagong cell ay nilalagyan ng halaga ng NaN. ignore_index: Kung Tama, huwag gamitin ang mga label ng index.

Kung isasaalang-alang ito, ano ang pagkakaiba sa pagitan ng pagsasama at pagsali sa mga panda?

Balangkas ng mga datos. sumali () mga pamamaraan bilang isang maginhawang paraan upang ma-access ang mga kakayahan ng mga panda . sumali (df2) palagi sumasali sa pamamagitan ng index ng df2, ngunit df1. pagsamahin (df2) maaari sumali sa isa o higit pang column ng df2 (default) o sa index ng df2 (na may right_index=True).

Ang NaN ba ay isang panda?

Para ma-detect NaN mga halaga mga panda gumagamit ng alinman. isna() o. ay walang bisa(). Ang NaN ang mga halaga ay minana mula sa katotohanan na mga panda ay binuo sa ibabaw ng numpy, habang ang mga pangalan ng dalawang function ay nagmula sa R's DataFrames, na ang istraktura at functionality mga panda sinubukang gayahin.

Inirerekumendang: