In diesem Kurs lernen Sie, wie Sie Daten aus Websites extrahieren können. Das Hauptwerkzeug wird die Beautiful Soup (BS 4) Bibliothek sein. Besonders für Menschen, die mit Daten arbeiten, ist es wichtig, eigene Datensätze erstellen zu können. Oft sind wir auf Datensätze von anderen angewiesen. Dieser Kurs soll allen "Datenenthusiasten" zeigen, wie man Daten in Excel-Dateien scrapen und speichern kann.
Nachdem wir die Grundlagen behandelt haben, wird sich dieser Kurs auf 3 verschiedene Projekte konzentrieren. Wir beginnen mit einem Einsteigerprojekt. Danach geht es weiter mit einem Projekt für Fortgeschrittene und zum Schluss wird ein Thema für "Profis" behandelt. Die Voraussetzung für diesen Kurs sind Grundkenntnisse in der Python Programmierung. Da wir keine sehr schwierigen Python Themen behandeln werden, müsst ihr kein Profi sein. Die wichtigste Eigenschaft ist, dass ihr neugierig seid, das Web Scraping und Data Mining zu erlernen. Ihr solltet bereit sein, Zeit zu investieren, um die Konzepte zu erlernen, die in diesem Kurs vermittelt werden.
Nach diesem Kurs werdet ihr das Wissen und die Erfahrung haben, um Ihre eigenen Daten zu scrapen und eigene Datensätze zu erstellen. Mit Hilfe der Ressourcen aus dem Kurs werdet ihr über Dokumente verfügen, die für eigene Projekte hinzugezogen werden können. Wenn Sie eine Frage haben oder ein Konzept für Sie keinen Sinn ergibt, könnt ihr die Fragen jederzeit im QnA Forum stellen. Entweder der Dozent oder andere Teilnehmende werden die Frage beantworten. Dank der Gemeinschaft werdet ihr nie das Gefühl haben, allein zu lernen.
Haftungsausschluss: Ich unterrichte Web Scraping als Tutor für Bildungszwecke und um den eingeschrieben Teilnehmern das Programmieren beizubringen. Die erste Regel des Web Scraping lautet: schade einer bestimmten Website nicht. Die zweite Regel beim Webcrawling lautet: Schädige NICHT eine bestimmte Website. Ich bitte jeden einzelnen Teilnehmer dieses Kurses, das erlernte Wissen (Web Scraping) nicht unrechtmäßig zu gebrauchen. Weiterhin distanziere ich mich ausdrücklich von jeglichen Vorhaben, was die Schädigung einer bestimmten Webseite verursachen könnte.