Automazione: il futuro della data science e del machine learning?

L'apprendimento automatico è stato uno dei più grandi progressi nella storia dell'informatica ed è ora considerato in grado di svolgere un ruolo importante nel campo dei big data e dell'analisi. L'analisi dei big data è una sfida enorme dal punto di vista aziendale. Ad esempio, attività come la comprensione del gran numero di formati di dati diversi, l'analisi della preparazione dei dati e il filtraggio dei dati ridondanti possono richiedere molte risorse. Il reclutamento di specialisti di data scientist è una proposta costosa e non un mezzo per raggiungere un fine per ogni azienda. Gli esperti ritengono che l'apprendimento automatico possa automatizzare molte delle attività associate all'analisi, sia di routine che complesse. Il machine learning automatizzato può liberare risorse significative che potrebbero essere utilizzate per lavori più complessi e innovativi. Il machine learning sembra muoversi sempre in questa direzione.

Automazione nel contesto della tecnologia dell'informazione

Nell'IT, l'automazione è la connessione di diversi sistemi e software, che consente loro di svolgere compiti specifici senza alcun intervento umano. Nell'IT, i sistemi automatizzati possono eseguire lavori sia semplici che complessi. Un esempio di un lavoro semplice potrebbe essere l'integrazione di moduli con PDF e l'invio di documenti al destinatario corretto, mentre la fornitura di backup fuori sede potrebbe essere un esempio di un lavoro complesso.

Per svolgere correttamente il tuo lavoro, devi programmare o dare istruzioni chiare al sistema automatizzato. Ogni volta che è necessario un sistema automatizzato per modificare l'ambito del suo lavoro, il programma o il set di istruzioni deve essere aggiornato da qualcuno. Sebbene il sistema automatizzato sia efficace nel suo lavoro, possono verificarsi errori per una serie di motivi. Quando si verificano errori, è necessario identificare e correggere la causa principale. Chiaramente, per fare il suo lavoro, un sistema automatizzato dipende completamente dall'uomo. Più complessa è la natura del lavoro, maggiore è la probabilità di errori e problemi.

Un esempio comune di automazione nel settore IT è l'automazione dei test delle interfacce utente basate sul web. I casi di test vengono inseriti nello script di automazione e l'interfaccia utente viene testata di conseguenza. (Per ulteriori informazioni sull'applicazione pratica del machine learning, vedere Machine Learning e Hadoop in Next Generation Fraud Detection.)

L'argomento a favore dell'automazione è che esegue attività di routine e ripetibili e consente ai dipendenti di svolgere attività più complesse e creative. Tuttavia, si sostiene anche che l'automazione abbia escluso un gran numero di compiti o ruoli precedentemente svolti dagli esseri umani. Ora, con l'ingresso del machine learning in vari settori, l'automazione può aggiungere una nuova dimensione.

Il futuro del machine learning automatizzato?

L'essenza dell'apprendimento automatico è la capacità di un sistema di apprendere continuamente dai dati ed evolversi senza l'intervento umano. L'apprendimento automatico è in grado di agire come un cervello umano. Ad esempio, i motori di raccomandazione sui siti di e-commerce possono valutare le preferenze e i gusti unici di un utente e fornire consigli sui prodotti e servizi più appropriati tra cui scegliere. Data questa capacità, l'apprendimento automatico è considerato l'ideale per automatizzare attività complesse associate a big data e analisi. Ha superato i principali limiti dei sistemi automatizzati tradizionali che non consentono l'intervento umano su base regolare. Esistono diversi casi di studio che dimostrano la capacità dell'apprendimento automatico di eseguire complesse attività di analisi dei dati, che verranno discussi più avanti in questo documento.

Come già notato, l'analisi dei big data è una proposta impegnativa per le aziende, che può essere parzialmente delegata ai sistemi di apprendimento automatico. Dal punto di vista aziendale, questo può portare molti vantaggi, come liberare risorse di data science per attività più creative e mission-critical, carichi di lavoro più elevati, meno tempo per completare le attività ed efficacia dei costi.

Argomento di studio

Nel 2015, i ricercatori del MIT hanno iniziato a lavorare su uno strumento di data science in grado di creare modelli di dati predittivi da grandi quantità di dati grezzi utilizzando una tecnica chiamata algoritmi di sintesi delle funzionalità profonde. Gli scienziati affermano che l'algoritmo può combinare le migliori caratteristiche dell'apprendimento automatico. Secondo gli scienziati, lo hanno testato su tre diversi set di dati e stanno espandendo i test per includerne altri. In un documento che sarà presentato alla International Conference on Data Science and Analytics, i ricercatori James Max Kanter e Kalyan Veeramachaneni hanno affermato: "Utilizzando un processo di tuning automatizzato, ottimizziamo l'intero percorso senza il coinvolgimento umano, consentendogli di generalizzare a diversi set di dati".

Diamo un'occhiata alla complessità del compito: l'algoritmo ha la cosiddetta capacità di autoregolazione, con l'aiuto della quale è possibile ottenere o estrarre informazioni o valori da dati grezzi (come età o sesso), dopodiché dati predittivi si possono creare modelli L'algoritmo utilizza funzioni matematiche complesse e una teoria della probabilità chiamata Gaussian Copula. È quindi facile comprendere il livello di complessità che l'algoritmo può gestire. Questa tecnica ha anche vinto premi in concorsi.

L'apprendimento automatico potrebbe sostituire i compiti a casa

Si discute in tutto il mondo che l'apprendimento automatico potrebbe sostituire molti lavori perché svolge compiti con l'efficienza del cervello umano. In effetti, c'è una certa preoccupazione che l'apprendimento automatico sostituirà gli scienziati dei dati e sembra esserci una base per tale preoccupazione.

Per l'utente medio che non ha capacità di analisi dei dati ma ha esigenze analitiche di vario grado nella vita quotidiana, non è possibile utilizzare computer in grado di analizzare enormi volumi di dati e fornire dati di analisi. Tuttavia, le tecniche di elaborazione del linguaggio naturale (NLP) possono superare questa limitazione insegnando ai computer ad accettare ed elaborare il linguaggio umano naturale. In questo modo, l'utente medio non ha bisogno di funzioni o competenze analitiche sofisticate.

IBM ritiene che la necessità di data scientist possa essere ridotta al minimo o eliminata attraverso il suo prodotto, la Watson Natural Language Analytics Platform. Secondo Marc Atschuller, vicepresidente di analisi e business intelligence di Watson, "Con un sistema cognitivo come Watson, fai semplicemente la tua domanda o, se non hai una domanda, carica semplicemente i tuoi dati e Watson può guardarli e dedurre ciò che potresti voler sapere. "

Conclusione

L'automazione è il prossimo passo logico nell'apprendimento automatico e stiamo già sperimentando gli effetti nella nostra vita quotidiana: siti di e-commerce, suggerimenti di amici di Facebook, suggerimenti di rete LinkedIn e classifiche di ricerca di Airbnb. Considerando gli esempi forniti, non c'è dubbio che ciò possa essere attribuito alla qualità dell'output prodotto dai sistemi di machine learning automatizzati. Nonostante tutte le sue qualità e benefici, l'idea che l'apprendimento automatico causi un'enorme disoccupazione sembra una reazione un po' eccessiva. Le macchine hanno sostituito gli umani in molte parti della nostra vita per decenni, ma gli umani si sono evoluti e si sono adattati per rimanere rilevanti nel settore. Secondo l'opinione, l'apprendimento automatico, nonostante tutte le sue interruzioni, è solo un'altra ondata a cui le persone si adatteranno.


Tempo di pubblicazione: 03 agosto-2021