Duomenų gavybos darbas apima internetą, naudojant tokias priemones kaip Nutch ir kita atitinkama programinė įranga.
Darbe taip pat yra daug žiniatinklio grandžių, naudojant python ir kitus susijusius įrankius, rūpinantis skirtingomis situacijomis - tinklalapyje naudojami scenarijai, tokie kaip javascripts arba ajax.
Didelė duomenų analizė naudojant priemones, pvz., Hadoop, taip pat yra šio darbo dalis.
Daugumoje duomenų saugojimo tikslų mes naudojame MongoDB duomenų bazę. Todėl reikalavimas, kad duomenų gavybos kūrėjas gerai žinotų MongoDB savarankišką naudojimą ir integruotų jį su kitomis programomis.
Be kitų MongoDB, darbas taip pat apima ir kitas didelių duomenų bazes, reikalingas problemoms spręsti.
Duomenų gavybos darbas taip pat apima trečiosios šalies API dokumentacijos skaitymą ir integravimą į įmonės nuosavybės programą.
Darbas taip pat apima rašymo kodavimą, pagrįstą statistinėmis sąvokomis, todėl tikimasi, kad duomenų gavybos kūrėjas gerai išmanys statistiką.
Kitas reikalavimas, kad bet kuris kandidatas, norintis gauti šią užduotį, yra žinių valdymo programinės įrangos, pvz., Git, ir susijusių temų žinios, nes mes jas plačiai naudojame.
Ubuntu versija Linux yra naudojama mūsų įmonėje visai programinės įrangos kūrimui. Todėl tikimasi, kad jį naudosite labai gerai.
Jūs neturite žinoti visų pirmiau minėtų temų. Bet jūs turėjote bent jau tam tikrą laiką turėti python koderį, kad įsitikintumėte, jog tikrai esate aistringas duomenų gavybos kūrėjas.
Jei pirmiau pateiktas mūsų duomenų gavybos darbo vietos aprašymas jus domina, prašome kreiptis į jį toliau.