Programiranje

Pandas 1.0 prinaša velike prelomne spremembe

Pandas, knjižnica za analizo podatkov za Python, je končno dosegla kandidata za izdajo 1.0. Pandas 1.0 odstrani veliko zastarelih funkcij in zahteva Python 3.6 ali novejši.

Pandas je bil ustvarjen za enostavno delo s podatki v strukturiranih oblikah, kot so tabele, matrike in podatki o časovnih vrstah. Pandas zasenči večino funkcionalnosti R-jevih podatkovnih okvirjev in dobro sodeluje z drugimi znanstvenimi računalniškimi knjižnicami v svetu Pythona.

Ustvarjalci Pandas s Pandami 1.0 uvajajo množico lomljivih sprememb, ki že nekaj časa delujejo. Tukaj je pregled najpomembnejših in kako ravnati z njimi naprej.

Pandas zahteva Python 3.6.1 ali novejšo različico

Največja sprememba v Pandas 1.0 je opustitev podpore za vse različice Pythona prej kot Python 3.6.1. Pandas je opustil podporo za Python 2 in se od leta 2019 zavezal izključno k Pythonu 3, zato gre večinoma za izboljšanje obstoječe politike.

Projekt ima tudi novo politiko podpore za prihodnje različice Pandas. Kakršen koli padec podpore za različico Pythona bo uveden v glavnih novih različicah Pandas (2.0, 3.0 itd.). Manjše izdaje bodo funkcije opuščale, ne pa tudi odstranjevale; glavne izdaje bodo odstranile funkcije.

Pandasova nova vrednost NA

Prejšnje različice Pandas so uporabljale različne vrste za predstavitev manjkajočih podatkov, odvisno od vrste vsebnika - enega za tipe datuma in časa, enega za predmete itd. Vsi ti so združeni v en sam tip manjkajočih podatkov, imenovan NA. Trenutno je podpora za NA omejena na nekaj vrst predmetov in velja za eksperimentalno, zato je še ne bi smeli uporabljati v proizvodnji.

API nezdružljivosti

Zaradi številnih sprememb Pandas 1.0 so nekateri API-ji Pandas zdaj nezdružljivi. To vključuje spremembe vedenja številnih pogostih elementov:

  • The DataFrame tip
  • pandas.array
  • arrays.IntegerArray

Mnoge od teh nezdružljivosti bodo sprožile opozorila, vendar je najbolje, da obstoječe skripte Pandas preizkusite vzporedno s svojimi kolegi Pandas 1.0, da vidite, kako delujejo.

Zastarele funkcije v Pandas 1.0

Pandasova dokumentacija navaja vse funkcije, ki jih je treba opustiti, vendar jih v Pandas 1.0 ne odstranite. Nekateri so bili preprosto preimenovani ali reorganizirani, na primer preskusni modul, drugi pa spremenijo uporabo nekaterih funkcijskih parametrov. V nekaj primerih, na primer pri Series.item () in Index.item (), funkcije so bile rešene iz opustitve in bodo še naprej na voljo.

Če uporabljate različico Pandas prej kot 0,25, ustvarjalci Pandas priporočajo selitev na Pandas 0,25najprej, poskrbite, da se bo vsa koda, odvisna od Pande, obnašala po pričakovanjih,potem selitev na Pandas 1.0. S tem želimo zagotoviti, da bo označena vsaka koda, ki uporablja zastarelo funkcionalnost.

Funkcije odstranjene v Pandas 1.0

Nekatere ključne funkcije Pandas so bile v Pandas 1.0 popolnoma odstranjene:

  • SparseSeries in SparseDataFrame. Uporaba Serije ali DataFrame z redke vrednosti namesto tega.
  • Registracija enote Matplotlib. To preprečuje, da bi Matplotlib pri uvozu Pand prizadel.
  • Številne druge funkcije, ki so bile prej zastarele.

Še enkrat, to je še en razlog, da kandidata za izdajo Pandas 1.0 preizkusite vzporedno z obstoječo namestitvijo Pandas in zagotovite, da se vaši skripti obnašajo, kot je predvideno.

Namestitev Pandas 1.0

Pande 1.0 lahko namestite neposredno v Python z upraviteljem paketov Pip s tipkanjem pip namestite pande. Pandas 1.0 je na voljo tudi kot del distribucije Anaconda Python za znanstveno računalništvo.

V vseh primerih je najbolje, da Pande namestite v navidezno okolje, še posebej, če želite teste Pandas 1.0 izvajati vzporedno s prejšnjimi različicami.

$config[zx-auto] not found$config[zx-overlay] not found