Scikit-learn è considerato, ormai da anni, uno dei principali moduli Python per le applicazioni di data science e machine learning. Nonostante ciò, la versione 1.0 (quella, quindi, che dovrebbe rappresentare la prima versione stabile di questo progetto) è stata rilasciata soltanto pochi giorni fa.
Le modifiche introdotte non sono troppo significative, ma riguardano soprattutto la correzione di alcuni bug, qualche nuova funzionalità e alcune ottimizzazioni. A tutto ciò, si aggiunge un lavoro di pulizia e revisione del codice.
In questo articolo riassumeremo le principali novità.
Le nuove funzionalità di scikit-learn 1.0
L'ultima versione di scikit-learn permette di creare funzioni B-spline tramite la classe preprocessing.SplineTransformer
. Si tratta sostanzialmente di funzioni polinomiali particolarmente utili in problemi di approssimazione, regressione e interpolazione, che evitano alcune complicazioni di natura numerica tipici delle curve polinomiali di alto grado.
Un altro importante aggiornamento introdotto con scikit-learn 1.0 riguarda il OneHotEncoder
, utilizzato molto spesso come preprocessing dell'output nei problemi di classificazione multi-classe. Il nuovo aggiornamento permette di agire su vari parametri aggiuntivi, ad esempio per rimuovere la prima classe ottenuta dalla codifica (drop='first'
) o per gestire i valori sconosciuti (handle_unknown='ignore'
), cosa che si rivela particolarmente utile in fase di inferenza.
Integrazione con pandas e altre migliorie
L'ultima versione di scikit-learn ha aggiunto altri miglioramenti in termini di integrazione con pandas. La versione 1.0 migliora infatti la gestione dei nomi delle colonne dei dataframe, che dovrebbe rendere più agevole il lavoro con questo tipo di strutture dati.
Sono state riviste significativamente anche le definizioni delle funzioni, assegnando nomi più significativi ai parametri, in modo da rendere più leggibile il codice. Ciò dovrebbe essere particolarmente vantaggioso per i nuovi utenti.
Infine, le prestazioni generali di scikit-learn sono state migliorate grazie ad alcune ottimizzazioni. Questo ha un impatto significativo, ad esempio, sui metodi della classe PolynomialFeatures
, così come su molte altre funzioni che richiedono generalmente calcoli abbastanza complessi.
Come aggiornare scikit-learn alla versione 1.0
Per passare alla nuova versione di scikit-learn, possiamo sfruttare pip:
pip install -U scikit-learn
Per ogni ulteriore informazione, rimandiamo chi volesse approfondire alla pagina ufficiale della documentazione di scikit-learn, dedicata alle novità introdotte con la versione 1.0