Nástrojů pro data mining existuje celá řada. Od klasických desktopových, přes programovací jazyky, až po cloudové varianty. V tomto kurzu se naučíme pracovat se zavedenou cloudovou data miningovou platformou BigML, která poskytuje své služby již 8 let. Má implementované všechny hlavní DM techniky a vyznačuje se velmi přívětivým uživatelským rozhraním, což není v této oblasti zcela běžné.
- Vymezení pojmu machine learning, příbuzné termíny (data mining, AI, data science, …)
- Vymezení pojmu machine learning, příbuzné termíny (data mining, AI, data science, …)
- Typický postup řešení machine learning úlohy
- Data, typy dat, datová kvalita
- Nástroje pro machine learning, specifika cloudových platforem
- Příprava dat obecně
- Příprava dat v platformě BigML (sampling, transformace, filtrování, feature engineering – flatline editor)
- Machine learning techniky
- Predikce pomocí vytvořených modelů, využití modelů
- Interpretace a evaluace
- Pokročilé možnosti BigML – WhizzML, fusions
Schopnost základní analýzy dat alespoň v tabulkovém procesoru (MS Excel).