Jako jeden z nejvýkonnějších programovacích rámců s otevřeným zdrojovým kódem je Hadoop důležitým nástrojem pro každého, kdo doufá, že najde práci s velkými daty. Pokud si chcete osvojit své dovednosti Hadoop nebo se naučit, jak je zvládnout, je vaší nejlepší možností absolvovat online kurz. Pokud to nemáte k dispozici, podívejte se na bezplatné online návody a použijte referenční materiály k řešení konkrétních problémů. Jakmile získáte základy, procvičte si malé sady dat z reálného světa a zdokonalte své dovednosti.
Kroky
Metoda 1 ze 2: Absolvování kurzů a používání výukových programů
Krok 1. Zaregistrujte se do Cloudera na 6dílný kurz a interaktivní výukové programy
Cloudera vám poskytuje příklady ze skutečného světa, které můžete procvičovat v prostředí pouze pro čtení, takže si nemusíte dělat starosti, že uděláte velké chyby. Nabízejí také analytické nástroje, které vám pomohou experimentovat s dotazováním na data, a také bezplatné živé demo s názvem Cloudera Live, které vám pomůže naučit se prostředí Hadoop.
Přestože vás kompletní, hloubkový kurz s certifikací bude stát 295 $, bude to rozhodně stát za to, pokud tyto dovednosti používáte ve své práci. Používání kurzu Cloudera vám pomůže chytit chyby a ušetřit čas, díky čemuž se rychle zaplatí
Krok 2. Vyzkoušejte bezplatné online kurzy prostřednictvím služby Cloudera, pokud již znáte základy
Pokud máte zkušenosti s Hadoop a chcete jen osvěžení, možná nebudete muset vydělávat peníze za 6dílný kurz. Místo toho se podívejte na bezplatné online kurzy na webových stránkách Univerzity Cloudera.
Existují zdroje pro administrátory, vývojáře a analytiky dat, takže bez ohledu na to, jaká je vaše role, měli byste být schopni najít vhodný kurz
Krok 3. Pokud chcete více teorie, absolvujte univerzitní kurz na Coursera
Coursera je známý a uznávaný zdroj kurzů programování. Přestože jsou pokyny obecně teoretičtější a neobsahují tolik běžících příkladů, můžete si je procvičit a tutoriál využít k získání praktických zkušeností.
- Tento kurz najdete online na
- Náklady se liší mezi kurzy, ale Coursera také nabízí možnost finanční pomoci těm, kteří mají nárok.
Krok 4. Navštivte bezplatný kurz na Big Data University a získejte cenově výhodnou možnost
Pokud nechcete platit za online kurz, Big Data University je skvělá volba. Mají dvoudílný kurz, který se zaměřuje nejprve na základy Hadoop, poté na programování pomocí Hadoop a online formát usnadňuje jít vlastním tempem.
- Tyto kurzy najdete na
- Nabízejí mnoho výukových programů v angličtině, japonštině, španělštině, portugalštině a ruštině.
Krok 5. Pokud potřebujete bezplatné specifické školení, vyhledejte na YouTube návody
Existují tisíce videí, která vysvětlují Hadoop a jak jej používat. Široká škála videí vám poskytuje flexibilitu a navíc je zdarma. Pokud narazíte na konkrétní problém, vyhledejte na YouTube video, které vás celým procesem provede.
Návody pro Hadoop by také měly být poměrně snadno k nalezení, protože „hadoop“je jedinečný vyhledávací výraz
Krok 6. Pokud chcete cvičit s virtuálním příkladem, použijte bezplatné výukové programy Yahoo
Tyto návody jsou rozděleny do 7 modulů a od samého začátku vás poučí o instalaci a provozu Hadoopu. Pokud jsou trochu rezaví, je to skvělá volba pro oprášení konkrétních dovedností.
Krok 7. Podrobné a bezplatné pokyny naleznete v dokumentu IBM Open Source
Toto je neuvěřitelně důkladný dokument s otevřeným zdrojovým kódem PDF vytvořený školící iniciativou IBM. Provede vás Hadoopem opatrně, krok za krokem a poskytne jasné písemné pokyny.
Tyto pokyny také fungují dobře, když jsou spárovány s živou ukázkou, jako je Cloudera
Metoda 2 ze 2: Přechod na aplikaci v reálném světě
Krok 1. Zeptejte se, zda můžete implementovat Hadoop v práci a procvičovat skutečná data
Požádejte svého šéfa nebo nadřízeného nebo si s nimi promluvte jeden o druhém, jak tyto nové dovednosti přenést na pracoviště. To je zvláště důležité, pokud vaše společnost zaplatila za jakékoli školení nebo online kurzy.
Čím dříve začnete implementovat dovednosti, které jste se naučili, tím dříve je budete schopni zvládnout
Krok 2. Hledejte jednoduché projekty, na kterých si procvičíte své dovednosti
Vyberte si projekty, které jsou relativně jednoduché a s nízkým rizikem, jako je počítání a hodnocení počtu interakcí na jednoho zákaznického agenta, jako jsou e-maily a chatové relace.
- Některé další aplikace pro skutečná data zahrnují skenování weblogů na chyby nebo sledování kanálů sociálních médií na vnímání značky.
- Můžete také cvičit s ukázkovými daty z webů, jako je https://www.kaggle.com/datasets nebo
Krok 3. Pravidelně kontrolujte svůj kód pomocí malých podmnožin, abyste vyřešili případné chyby
Před spuštěním celé sady dat vezměte menší testovací datovou sadu na místní počítač a spusťte ji v několika různých režimech. Můžete jej například iterativně spustit v režimu Local Jobrunner Mode, dále v režimu Pseudo-Distributed a poté v režimu Full-Distributed.
- To vám umožní rozpoznat všechny nedostatky nebo chyby dříve, než se rozšíří v celé datové sadě.
- Místní režim Jobrunner vám umožňuje lokálně testovat a ladit vaši mapu a redukovat kód, pseudodistribuovaný režim napodobuje produkční prostředí a plně distribuovaný režim se dívá na váš skutečný produkční klastr.
Krok 4. Využijte 1letou bezplatnou zkušební verzi k procvičení v prostředí virtuálního počítače
Společnosti jako Amazon a Microsoft nabízejí placené předplatné pro své cvičné služby Hadoop. Virtuální počítač Amazonu se nazývá Amazon Web Service (AWS) a služba Microsoftu se nazývá Microsoft Azure. U obou služeb je váš první rok zdarma, když zadáte informace o své kreditní kartě.
Nezapomeňte předplatné po 1 roce zrušit, abyste se vyhnuli účtování poplatků
Tipy
- Mějte na paměti, že Hadoop je specializovanější programovací jazyk s úzkým použitím. Určitě vám to poskytne výhodu ve světě velkých dat, ale stát se programátorem není vždy nutné.
- Můžete si také přečíst knihy a články o Hadoopu, například Hadoop: The Definitive Guide, 3. vydání od Toma Whitea.