update starting pages
Browse files- src/_quarto.yml +4 -2
- src/about.qmd +0 -5
- src/index.qmd +25 -54
- src/quarto-lokal.qmd +79 -0
src/_quarto.yml
CHANGED
@@ -7,10 +7,12 @@ website:
|
|
7 |
search: true
|
8 |
collapse-level: 3
|
9 |
contents:
|
10 |
-
- section: "
|
11 |
contents:
|
12 |
- href: index.qmd
|
13 |
-
text:
|
|
|
|
|
14 |
- section: "Webscraping Made Easy"
|
15 |
contents:
|
16 |
- section: "Aufbau eines Webscraping-Prozesses"
|
|
|
7 |
search: true
|
8 |
collapse-level: 3
|
9 |
contents:
|
10 |
+
- section: "Erste Schritte"
|
11 |
contents:
|
12 |
- href: index.qmd
|
13 |
+
text: "Willkommen"
|
14 |
+
- href: quarto-lokal.qmd
|
15 |
+
text: "Quarto lokal"
|
16 |
- section: "Webscraping Made Easy"
|
17 |
contents:
|
18 |
- section: "Aufbau eines Webscraping-Prozesses"
|
src/about.qmd
DELETED
@@ -1,5 +0,0 @@
|
|
1 |
-
---
|
2 |
-
title: "About"
|
3 |
-
---
|
4 |
-
|
5 |
-
About this site
|
|
|
|
|
|
|
|
|
|
|
|
src/index.qmd
CHANGED
@@ -1,78 +1,49 @@
|
|
1 |
---
|
2 |
-
title: "
|
3 |
---
|
4 |
|
5 |
-
|
6 |
-
You can also use Quarto to write [books](https://quarto.org/docs/books/), create [dashboards](https://quarto.org/docs/dashboards/), and embed web applications with [Observable](https://quarto.org/docs/interactive/ojs/) and [Shinylive](https://quarto.org/docs/blog/posts/2022-10-25-shinylive-extension/).
|
7 |
|
8 |
-
##
|
9 |
|
10 |
-
|
11 |
-
There are a couple of important files which you should pay attention to:
|
12 |
|
13 |
-
|
14 |
-
often unless you need to add additional system dependencies or modify the Quarto version.
|
15 |
-
- `requirements.txt`: This is where you should include any Python dependencies which you need for your website.
|
16 |
-
These are installed when the Dockerfile builds.
|
17 |
-
- The `src` directory contains the source files for the Quarto website. You can include Jupyter notebooks or markdown (`.qmd` or `.md`) files.
|
18 |
-
- `src/_quarto.yml` defines the navigation for your website. If you want to add new pages or reorganize the existing ones, you'll need to change this file.
|
19 |
|
|
|
20 |
|
21 |
-
|
22 |
|
23 |
-
|
24 |
-
2. **Install Quarto**: In order to render your Quarto site without Docker, we recommend installing Quarto by following the instructions on the [official Quarto website](https://quarto.org/docs/get-started/).
|
25 |
-
3. **Install Quarto VS Code extension**: The [Quarto VS Code Extension](https://quarto.org/docs/tools/vscode.html) includes a number of productivity tools including YAML Autocomplete, a preview button, and a visual editor. Quarto works great with VS Code, but the extension does make it easier to get the most out of Quarto.
|
26 |
-
4. **Edit the site**: The website files are contained in the `src` directory, and the site navigation is defined in `src/_quarto.yml`. Try editing these files and either clicking the "Preview" button in VS Code, or calling `quarto preview src` from the command line.
|
27 |
-
5. **Learn more about Quarto**: You can do a lot of things with Quarto, and they are all documented on the [Quarto Website](https://quarto.org/guide/). In particular, you may be interested in:
|
28 |
|
29 |
-
|
30 |
-
- Building Static [Dashboards](https://quarto.org/docs/dashboards/)
|
31 |
-
- How to write [books](https://quarto.org/docs/books/index.html) and [manuscripts](https://quarto.org/docs/manuscripts/)
|
32 |
-
- Reproducible [presentations](https://quarto.org/docs/presentations/)
|
33 |
-
- Including [Observable](https://quarto.org/docs/interactive/ojs/) or [Shiny](https://quarto.org/docs/interactive/shiny/) applications in your Quarto site
|
34 |
|
35 |
-
|
36 |
-
It can take a couple of minutes for the Space to deploy to Hugging Face after the Docker build process completes. Two see your changes you will need to do two things:
|
37 |
|
38 |
-
|
39 |
-
|
40 |
-
|
41 |
|
42 |
-
|
43 |
|
44 |
-
|
45 |
-
By default, if you include a code chunk in your document, Quarto will execute that code and include the output in the rendered document.
|
46 |
-
This is great for reproducibility and for creating documents that are always up-to-date.
|
47 |
-
For example you can include code which generates a plot like this:
|
48 |
|
49 |
-
|
50 |
-
import seaborn as sns
|
51 |
-
import matplotlib.pyplot as plt
|
52 |
|
53 |
-
|
54 |
-
tips = sns.load_dataset("tips")
|
55 |
-
# Create a seaborn plot
|
56 |
-
sns.set_style("whitegrid")
|
57 |
-
g = sns.lmplot(x="total_bill", y="tip", data=tips, aspect=2)
|
58 |
-
g = g.set_axis_labels("Total bill (USD)", "Tip").set(xlim=(0, 60), ylim=(0, 12))
|
59 |
|
60 |
-
|
61 |
-
plt.show()
|
62 |
-
```
|
63 |
|
64 |
-
|
65 |
|
66 |
-
|
67 |
-
For example we can include the maximum tip value in the `tips` data frame like this: ``{python} tips['tip'].max()``.
|
68 |
-
You can control [code execution](https://quarto.org/docs/computations/execution-options.html), or [freeze code output](https://quarto.org/docs/projects/code-execution.html#freeze) to capture the output of long running computations.
|
69 |
|
|
|
70 |
|
71 |
-
|
72 |
|
73 |
-
|
74 |
-
we've implemented the Hugging Face [Open-Source AI Cookbook](https://github.com/huggingface/cookbook) in Quarto.
|
75 |
-
The Open-Source AI Cookbook is a collection of notebooks illustrating practical aspects of building AI applications and solving various machine learning tasks using open-source tools and models.
|
76 |
-
You can read more about it, or contribute your own Notebook on the [Github Repo](https://github.com/huggingface/cookbook)
|
77 |
|
|
|
78 |
|
|
|
|
1 |
---
|
2 |
+
title: "Willkommen"
|
3 |
---
|
4 |
|
5 |
+
Herzlich willkommen zum Webscraping Workshop! In diesem Workshop lernen Sie, wie Sie Daten aus dem Web extrahieren und analysieren können. Egal, ob Sie Anfänger oder Fortgeschrittener sind, dieser Workshop bietet Ihnen wertvolle Einblicke und praktische Erfahrungen.
|
|
|
6 |
|
7 |
+
## Navigation auf der Quarto-Webseite 🧭
|
8 |
|
9 |
+
Unsere Quarto-Webseite ist so strukturiert, dass Sie sich leicht zurechtfinden und dem Workshop effizient folgen können.
|
|
|
10 |
|
11 |
+
### Links: Überblick 🗂️
|
|
|
|
|
|
|
|
|
|
|
12 |
|
13 |
+
Auf der linken Seite finden Sie eine Übersicht aller Inhalte und Module des Workshops. Diese Navigationsleiste ermöglicht es Ihnen, schnell zu den verschiedenen Kapiteln und Abschnitten zu springen, die Sie interessieren.
|
14 |
|
15 |
+
### Rechts: Seitenübersicht 📋
|
16 |
|
17 |
+
Auf der rechten Seite finden Sie eine Übersicht der aktuellen Seite. Diese Seitenübersicht hilft Ihnen, den Überblick über die Struktur und die Unterthemen des aktuellen Kapitels zu behalten. Sie können leicht zwischen den Abschnitten navigieren, ohne die Hauptseite zu verlassen.
|
|
|
|
|
|
|
|
|
18 |
|
19 |
+
### Links oben: Suchfunktion 🔍
|
|
|
|
|
|
|
|
|
20 |
|
21 |
+
Oben links befindet sich die Suchfunktion. Hier können Sie nach spezifischen Themen, Begriffen oder Kapiteln suchen, um schnell die Informationen zu finden, die Sie benötigen. Geben Sie einfach ein Stichwort ein, und die Suchfunktion zeigt Ihnen relevante Ergebnisse aus dem gesamten Workshop.
|
|
|
22 |
|
23 |
+
---
|
24 |
+
|
25 |
+
## Workshop-Inhalte 📚
|
26 |
|
27 |
+
### Einleitung 🚀
|
28 |
|
29 |
+
Wir beginnen mit einer Einführung in die Grundlagen des Webscrapings, einschließlich der wichtigsten Konzepte und Werkzeuge, die Sie benötigen.
|
|
|
|
|
|
|
30 |
|
31 |
+
### Tools und Technologien 🛠️
|
|
|
|
|
32 |
|
33 |
+
Erfahren Sie mehr über die verschiedenen Tools und Technologien, die im Webscraping verwendet werden, wie zum Beispiel BeautifulSoup, Scrapy und Selenium.
|
|
|
|
|
|
|
|
|
|
|
34 |
|
35 |
+
### Praktische Übungen ✍️
|
|
|
|
|
36 |
|
37 |
+
Setzen Sie Ihr Wissen in die Praxis um! Durch praktische Übungen und Projekte können Sie das Gelernte anwenden und wertvolle Erfahrungen sammeln.
|
38 |
|
39 |
+
### Weiterführende Themen 🔍
|
|
|
|
|
40 |
|
41 |
+
Entdecken Sie weiterführende Themen wie das Scraping von APIs, das Management großer Datenmengen und ethische Überlegungen beim Webscraping.
|
42 |
|
43 |
+
---
|
44 |
|
45 |
+
Wir hoffen, dass Sie viel Spaß und Erfolg beim Lernen und Anwenden des Webscrapings haben! Wenn Sie Fragen haben oder Unterstützung benötigen, zögern Sie nicht, sich an uns zu wenden.
|
|
|
|
|
|
|
46 |
|
47 |
+
---
|
48 |
|
49 |
+
Viel Erfolg und willkommen zum Workshop! 🎉
|
src/quarto-lokal.qmd
ADDED
@@ -0,0 +1,79 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
title: "Quarto lokal"
|
3 |
+
---
|
4 |
+
|
5 |
+
|
6 |
+
## Quarto lokal starten 🚀
|
7 |
+
|
8 |
+
Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.
|
9 |
+
|
10 |
+
### Schritt 1: Repository klonen 🖥️
|
11 |
+
|
12 |
+
1. **Öffne dein Terminal oder die Eingabeaufforderung**: Dies ist notwendig, um die folgenden Befehle einzugeben.
|
13 |
+
2. **Führe den folgenden Befehl aus, um das Repository zu klonen**:
|
14 |
+
```bash
|
15 |
+
git clone https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025
|
16 |
+
```
|
17 |
+
📂 Dies erstellt eine lokale Kopie des Repositories auf deinem Computer.
|
18 |
+
|
19 |
+
### Schritt 2: In das Repository-Verzeichnis wechseln 📁
|
20 |
+
|
21 |
+
1. **Navigiere in das Verzeichnis**, in dem du das Repository geklont hast:
|
22 |
+
```bash
|
23 |
+
cd CDL-Webscraping-Workshop-2025
|
24 |
+
```
|
25 |
+
🔄 Jetzt befindest du dich im Verzeichnis des Projekts.
|
26 |
+
|
27 |
+
### Schritt 3: Quarto installieren 🛠️
|
28 |
+
|
29 |
+
#### Installation auf Windows:
|
30 |
+
|
31 |
+
1. **Besuche die Quarto-Download-Seite**: Gehe zu [Quarto Download Seite](https://quarto.org/docs/download/index.html) und lade die Installationsdatei herunter.
|
32 |
+
2. **Lade die Installationsdatei herunter**: Wähle die Datei `quarto-1.6.39-win.msi` für Windows und speichere sie auf deinem Computer.
|
33 |
+
3. **Führe die Installationsdatei aus**: Doppelklicke auf die heruntergeladene Datei und folge den Anweisungen des Installationsassistenten.
|
34 |
+
4. **Überprüfe die Installation**: Öffne dein Terminal oder die Eingabeaufforderung und führe den Befehl `quarto --version` aus, um sicherzustellen, dass Quarto korrekt installiert wurde.
|
35 |
+
|
36 |
+
#### Installation auf Linux:
|
37 |
+
|
38 |
+
1. **Lade das Quarto-Tarball herunter**:
|
39 |
+
```bash
|
40 |
+
wget https://github.com/quarto-dev/quarto-cli/releases/download/v1.6.39/quarto-1.6.39-linux-arm64.deb
|
41 |
+
```
|
42 |
+
2. **Installiere das Tarball-Paket**:
|
43 |
+
```bash
|
44 |
+
sudo dpkg -i quarto-1.6.39-linux-arm64.deb
|
45 |
+
```
|
46 |
+
3. **Löse eventuelle Abhängigkeiten**:
|
47 |
+
```bash
|
48 |
+
sudo apt-get install -f
|
49 |
+
```
|
50 |
+
|
51 |
+
### Schritt 4: Quarto-Website lokal starten 🌐
|
52 |
+
|
53 |
+
1. **Starte den lokalen Server**:
|
54 |
+
```bash
|
55 |
+
quarto preview
|
56 |
+
```
|
57 |
+
|
58 |
+
Du solltest die Quarto-Website jetzt lokal sehen und interagieren können. 🌟
|
59 |
+
|
60 |
+
### Schritt 5: Inhalte bearbeiten ✏️
|
61 |
+
|
62 |
+
1. **Bearbeite die Inhalte der Website** in den `.qmd` Dateien. Änderungen werden automatisch aktualisiert, wenn der lokale Server läuft.
|
63 |
+
|
64 |
+
## Erstellung einer PDF mit Quarto 📄
|
65 |
+
|
66 |
+
Um mit Quarto PDF-Dateien zu erstellen, kannst du den Befehl `quarto render -to pdf` verwenden. Hier ist eine kurze Anleitung dazu:
|
67 |
+
|
68 |
+
### Schritte zur Erstellung einer PDF mit Quarto 📋
|
69 |
+
|
70 |
+
1. **Navigiere in dein Projektverzeichnis**:
|
71 |
+
Öffne dein Terminal und navigiere in das Verzeichnis, das die Quarto-Datei enthält, die du in eine PDF umwandeln möchtest.
|
72 |
+
```bash
|
73 |
+
cd CDL-Webscraping-Workshop-2025
|
74 |
+
```
|
75 |
+
2. **Führe den Quarto-Befehl aus**:
|
76 |
+
Verwende den Befehl `quarto render` mit der Option `-to pdf`, um die gewünschte Quarto-Datei in eine PDF zu rendern.
|
77 |
+
```bash
|
78 |
+
quarto render dateiname.qmd -to pdf
|
79 |
+
```
|