Kaip įgalinti duomenų mokslininką krašto kompiuterijos ir AI eroje


Danas Warneris, LGN generalinis direktorius ir vienas iš įkūrėjų, aptaria, kaip duomenų mokslininkai gali būti įgalinti pažangių kompiuterių ir AI eroje

Kaip įgalinti savo duomenų mokslininkus krašto kompiuterijos ir dirbtinio intelekto įvaizdžio eroje

Duomenims nuolat tobulėjant, tai valdantys mokslininkai negali pasiekti sėkmės vieni.

Jau kurį laiką duomenų mokslininko pareigos buvo viena iš labiausiai sužadintų vaidmenų technologijų ir, tiesą sakant, verslo srityse. Nesunku suprasti, kodėl – kai organizacijos atsibunda iš, regis, neriboto duomenų potencialo, jos suprato, kad joms reikia žmonių, galinčių išgauti, analizuoti ir interpretuoti didelius duomenų kiekius. Paklausa yra tokia, kad vis kalbama apie duomenų mokslininko trūkumą, ypač labiau patyrusių, vyresnių pareigų.

Tačiau, nepaisant viso šio dėmesio, kiek veiksmingi yra tie duomenų mokslininkai ir kiek jie iš tikrųjų jaučiasi įgalioti? Tai aktualus klausimas, kylantis tuo metu, kai tiek daug duomenų nepanaudojama. Ar įmonės, žinodamos, kad turi geriau panaudoti savo duomenis, samdo duomenų mokslininkus visiškai nesuprasdamos, kaip geriausiai panaudoti talentą?

Galbūt geriau į tai pažvelgti būtų paklausti, ar įmonės žino, kaip geriau panaudoti savo duomenis – ar jos samdo duomenų mokslininkus ir tikisi, kad jie darys stebuklus, ar įmonės užtikrina, kad ne tik turėtų reikiamų talentų, bet ir kad jie maitina šias komandas tinkamais duomenimis?

Kaip pradėti duomenų mokslo karjerą

Norėdami pradėti duomenų mokslo mėnesį, šiame straipsnyje bus nagrinėjama, kaip galite pradėti duomenų mokslo karjerą, ir į pagrindinius veiksnius, į kuriuos reikia atsižvelgti. Skaitykite čia

Šiukšlės į vidų, šiukšlės lauk

Daugelis gali manyti, kad duomenų mokslininko darbas yra rasti tinkamus duomenis, tačiau jie klysta. Galiausiai duomenų mokslininkai gali dirbti tik su tuo, kas jiems duota, lygiai taip pat, kaip pardavėjas gali tiek daug nuveikti su prastu produktu, arba Formulės 1 vairuotojas gali pasiekti tiek daug su vidutiniu automobiliu.

Kokie tada yra teisingi duomenys? Akivaizdu, kad tai skiriasi įvairiose įmonėse, tačiau iš esmės yra keletas principų, kuriais bus vadovaujamasi geri duomenys, neatsižvelgiant į organizacinį poreikį. Pirma, jis turi būti šviežias – tai reiškia, kad jis turi atspindėti realų pasaulį, koks jis yra tuo metu. Viskas keičiasi taip greitai, kad daug duomenų greitai tampa nereikšmingi. Kuo labiau ji sustingsta, tuo mažesnė jo vertė.

Taigi, jei duomenų mokslininkas dirba su senais duomenimis, kai yra naujesnės informacijos, įžvalgos, kurias jis gali išgauti, bus mažiau susijusios su aplinka, kurioje veikia įmonė.

Antra, tai turi būti tiesioginiai duomenys – vadinasi, jie turi būti iš realaus pasaulio, o ne mokomieji duomenys, o ne išgalvoti. Kodėl? Kadangi realus pasaulis yra netvarkingas, skleidžiantis anomalijas, apie kurias niekas niekada nebūtų pagalvojęs, sukuriamos kliūtys, kurių modeliai ir, tiesą sakant, duomenų mokslininkai, iškėlę išvalytų mokymo duomenų, negalės apdoroti.

Kitaip tariant, jei organizacija savo duomenų mokslininkus ir jų modelius maitina pasenusiais, neprisijungusiais duomenimis, geriausia, ko įmonė gali tikėtis, yra nereikšmingos, ribotos įžvalgos.

Kodėl kraštas yra kita duomenų mokslininkų riba

Tai reiškia, kad įmonės turi rasti būdą, kaip nuolat tiekti savo duomenų mokslininkus gyvais, evoliuciniais duomenimis, realiuoju laiku iš realaus pasaulio. Kaip jie tai daro? Su krašto skaičiavimu.

Krašto skaičiavimo nereikia pristatyti – per pastaruosius kelerius metus daiktų interneto įrenginiams išaugus, vis daugiau duomenų apdorojama tinklų pakraščiuose. Jutikliai ant visko, nuo vėjo turbinų ir traktorių iki šaldytuvų ir gatvių lempų, nuolat fiksuoja duomenis. Tai tikra, tiesioginė, netvarkinga ir būtent prie to duomenų mokslininkai turi dirbti.

Įmonės turi įgalinti savo duomenų mokslininkus, suteikdamos jiems mokymo duomenis ir našumo metriką iš krašto. Tada jie gali tai panaudoti informuodami savo AI modelius, kurie, savo ruožtu, yra diegiami kraštiniuose įrenginiuose. Šios realios aplinkos suteikia duomenų mokslininkams svarbios informacijos apie tai, kaip jų modeliai atlaiko anomalijas ir variacijas, kurių negalima atkurti laboratorijose ar bandymų aplinkoje. Bent jau iš pradžių modeliai gali veikti prastai – tai geras dalykas, nes duomenų mokslininkams suteikiama į ką įsigilinti, suprasti, kas išėjo, apie ką jie nepagalvojo.

Nepaisant to, ar modeliai veikia gerai, ar prastai, duomenis reikia pasiekti, išvalyti, anotuoti ir galiausiai grąžinti į modelį, kad būtų galima nuolat juos treniruoti. Tai grįžtamasis ryšys, kuris turi veikti ir toliau, kad sistemos galėtų tobulėti ir prisitaikyti. Tačiau tai turi būti protingas duomenų išgavimas – jokia sistema negali valdyti visų renkamų duomenų jutiklių, todėl labai svarbu turėti būdą atpažinti ir gauti svarbiausius duomenis iš krašto.

Be to, duomenų mokslininkai turi turėti galimybę perskirstyti jutiklius ir mašinas, kad ištirtų, iš naujo atvaizduotų ir analizuotų duomenų šaltinius, painiojančius AI modelius. Kad ir kokiu būdu duomenys buvo renkami, kad ir koks būtų automatizuotas procesas, tam tikru momentu jis buvo priklausomas nuo žmogaus mąstymo, prielaidų ir prielaidų. Jie galėjo būti pagrįsti tuo metu turimais duomenimis ir įrodymais, tačiau tai gali būti nebetinkama norint surinkti reikiamus duomenis. Čia labai svarbu, kad duomenų mokslininkai išliktų veiksmingi ir dirbtų su svarbiausia informacija, kad būtų galima pakeisti renkamus duomenis.

Mokyti mašininio mokymosi modelius, kad jie būtų pasirengę ateičiai

Skaitmeninėms naujovėms vis spartėjant, tiriame, kaip mašininio mokymosi modelius galima išmokyti taip, kad jie būtų parengti ateičiai. Skaitykite čia

Nauja aktyvaus mokymosi paradigma

Galų gale, visa tai rodo perėjimą nuo senosios paradigmos rinkti didelius mokymo duomenų rinkinius, segmentuoti, lavinti modelį ir matyti, kas atsitiks, ir link naujos paradigmos – aktyvaus mokymosi, kai dirbtinio intelekto modeliai mokosi, kaip susidoroti su realiame pasaulyje, o duomenų mokslininkai turi teisę dirbti efektyviai. Tai darydami jie bus geriau pasirengę rinkti įžvalgas ir informaciją, reikalingą jų organizacijoms suteikti tikrą konkurencinį pranašumą vis labiau perpildytose, duomenimis pagrįstose rinkose.

Parašyta Danas Warnerisgeneralinis direktorius ir vienas iš įkūrėjų LGN