bsenst commited on
Commit
8449c52
·
1 Parent(s): deaa427

update starting pages

Browse files
Files changed (4) hide show
  1. src/_quarto.yml +4 -2
  2. src/about.qmd +0 -5
  3. src/index.qmd +25 -54
  4. src/quarto-lokal.qmd +79 -0
src/_quarto.yml CHANGED
@@ -7,10 +7,12 @@ website:
7
  search: true
8
  collapse-level: 3
9
  contents:
10
- - section: "About"
11
  contents:
12
  - href: index.qmd
13
- text: About Quarto
 
 
14
  - section: "Webscraping Made Easy"
15
  contents:
16
  - section: "Aufbau eines Webscraping-Prozesses"
 
7
  search: true
8
  collapse-level: 3
9
  contents:
10
+ - section: "Erste Schritte"
11
  contents:
12
  - href: index.qmd
13
+ text: "Willkommen"
14
+ - href: quarto-lokal.qmd
15
+ text: "Quarto lokal"
16
  - section: "Webscraping Made Easy"
17
  contents:
18
  - section: "Aufbau eines Webscraping-Prozesses"
src/about.qmd DELETED
@@ -1,5 +0,0 @@
1
- ---
2
- title: "About"
3
- ---
4
-
5
- About this site
 
 
 
 
 
 
src/index.qmd CHANGED
@@ -1,78 +1,49 @@
1
  ---
2
- title: "About Quarto"
3
  ---
4
 
5
- [Quarto](https://quarto.org/) is a Markdown-based documentation system that lets you write documents in Markdown or Jupyter Notebooks, and render them to a variety of formats including HTML, PDF, PowerPoint, and more.
6
- You can also use Quarto to write [books](https://quarto.org/docs/books/), create [dashboards](https://quarto.org/docs/dashboards/), and embed web applications with [Observable](https://quarto.org/docs/interactive/ojs/) and [Shinylive](https://quarto.org/docs/blog/posts/2022-10-25-shinylive-extension/).
7
 
8
- ## Getting started with Quarto
9
 
10
- Once you've created the space, click on the `Files` tab in the top right to take a look at the files which make up this Space.
11
- There are a couple of important files which you should pay attention to:
12
 
13
- - `Dockerfile`: This contains the system setup to build and serve the Quarto site on Hugging Face. You probably won't need to change this file that
14
- often unless you need to add additional system dependencies or modify the Quarto version.
15
- - `requirements.txt`: This is where you should include any Python dependencies which you need for your website.
16
- These are installed when the Dockerfile builds.
17
- - The `src` directory contains the source files for the Quarto website. You can include Jupyter notebooks or markdown (`.qmd` or `.md`) files.
18
- - `src/_quarto.yml` defines the navigation for your website. If you want to add new pages or reorganize the existing ones, you'll need to change this file.
19
 
 
20
 
21
- ## Recommended Workflow
22
 
23
- 1. **Clone the space locally**
24
- 2. **Install Quarto**: In order to render your Quarto site without Docker, we recommend installing Quarto by following the instructions on the [official Quarto website](https://quarto.org/docs/get-started/).
25
- 3. **Install Quarto VS Code extension**: The [Quarto VS Code Extension](https://quarto.org/docs/tools/vscode.html) includes a number of productivity tools including YAML Autocomplete, a preview button, and a visual editor. Quarto works great with VS Code, but the extension does make it easier to get the most out of Quarto.
26
- 4. **Edit the site**: The website files are contained in the `src` directory, and the site navigation is defined in `src/_quarto.yml`. Try editing these files and either clicking the "Preview" button in VS Code, or calling `quarto preview src` from the command line.
27
- 5. **Learn more about Quarto**: You can do a lot of things with Quarto, and they are all documented on the [Quarto Website](https://quarto.org/guide/). In particular, you may be interested in:
28
 
29
- - All about building [websites](https://quarto.org/docs/websites/)
30
- - Building Static [Dashboards](https://quarto.org/docs/dashboards/)
31
- - How to write [books](https://quarto.org/docs/books/index.html) and [manuscripts](https://quarto.org/docs/manuscripts/)
32
- - Reproducible [presentations](https://quarto.org/docs/presentations/)
33
- - Including [Observable](https://quarto.org/docs/interactive/ojs/) or [Shiny](https://quarto.org/docs/interactive/shiny/) applications in your Quarto site
34
 
35
- ::: {.callout-warning}
36
- It can take a couple of minutes for the Space to deploy to Hugging Face after the Docker build process completes. Two see your changes you will need to do two things:
37
 
38
- 1) Wait for your space's status to go from 'Building' to 'Running'(this is visible in the status bar above the Space)
39
- 2) Force-reload the web page by holding Shift and hitting the reload button in your browser.
40
- :::
41
 
42
- ## Code Execution
43
 
44
- One of the main virtues of Quarto is that it lets you combine code and text in a single document.
45
- By default, if you include a code chunk in your document, Quarto will execute that code and include the output in the rendered document.
46
- This is great for reproducibility and for creating documents that are always up-to-date.
47
- For example you can include code which generates a plot like this:
48
 
49
- ```{python}
50
- import seaborn as sns
51
- import matplotlib.pyplot as plt
52
 
53
- # Sample data
54
- tips = sns.load_dataset("tips")
55
- # Create a seaborn plot
56
- sns.set_style("whitegrid")
57
- g = sns.lmplot(x="total_bill", y="tip", data=tips, aspect=2)
58
- g = g.set_axis_labels("Total bill (USD)", "Tip").set(xlim=(0, 60), ylim=(0, 12))
59
 
60
- plt.title("Tip by Total Bill")
61
- plt.show()
62
- ```
63
 
64
- When the website is built the Python code will run and the output will be included in the document.
65
 
66
- You can also include [inline code](https://quarto.org/docs/computations/inline-code.html) to insert computed values into text.
67
- For example we can include the maximum tip value in the `tips` data frame like this: ``{python} tips['tip'].max()``.
68
- You can control [code execution](https://quarto.org/docs/computations/execution-options.html), or [freeze code output](https://quarto.org/docs/projects/code-execution.html#freeze) to capture the output of long running computations.
69
 
 
70
 
71
- ## About the Open Source AI Cookbook
72
 
73
- To provide a realistic example of how Quarto can help you organize long-form documentation,
74
- we've implemented the Hugging Face [Open-Source AI Cookbook](https://github.com/huggingface/cookbook) in Quarto.
75
- The Open-Source AI Cookbook is a collection of notebooks illustrating practical aspects of building AI applications and solving various machine learning tasks using open-source tools and models.
76
- You can read more about it, or contribute your own Notebook on the [Github Repo](https://github.com/huggingface/cookbook)
77
 
 
78
 
 
 
1
  ---
2
+ title: "Willkommen"
3
  ---
4
 
5
+ Herzlich willkommen zum Webscraping Workshop! In diesem Workshop lernen Sie, wie Sie Daten aus dem Web extrahieren und analysieren können. Egal, ob Sie Anfänger oder Fortgeschrittener sind, dieser Workshop bietet Ihnen wertvolle Einblicke und praktische Erfahrungen.
 
6
 
7
+ ## Navigation auf der Quarto-Webseite 🧭
8
 
9
+ Unsere Quarto-Webseite ist so strukturiert, dass Sie sich leicht zurechtfinden und dem Workshop effizient folgen können.
 
10
 
11
+ ### Links: Überblick 🗂️
 
 
 
 
 
12
 
13
+ Auf der linken Seite finden Sie eine Übersicht aller Inhalte und Module des Workshops. Diese Navigationsleiste ermöglicht es Ihnen, schnell zu den verschiedenen Kapiteln und Abschnitten zu springen, die Sie interessieren.
14
 
15
+ ### Rechts: Seitenübersicht 📋
16
 
17
+ Auf der rechten Seite finden Sie eine Übersicht der aktuellen Seite. Diese Seitenübersicht hilft Ihnen, den Überblick über die Struktur und die Unterthemen des aktuellen Kapitels zu behalten. Sie können leicht zwischen den Abschnitten navigieren, ohne die Hauptseite zu verlassen.
 
 
 
 
18
 
19
+ ### Links oben: Suchfunktion 🔍
 
 
 
 
20
 
21
+ Oben links befindet sich die Suchfunktion. Hier können Sie nach spezifischen Themen, Begriffen oder Kapiteln suchen, um schnell die Informationen zu finden, die Sie benötigen. Geben Sie einfach ein Stichwort ein, und die Suchfunktion zeigt Ihnen relevante Ergebnisse aus dem gesamten Workshop.
 
22
 
23
+ ---
24
+
25
+ ## Workshop-Inhalte 📚
26
 
27
+ ### Einleitung 🚀
28
 
29
+ Wir beginnen mit einer Einführung in die Grundlagen des Webscrapings, einschließlich der wichtigsten Konzepte und Werkzeuge, die Sie benötigen.
 
 
 
30
 
31
+ ### Tools und Technologien 🛠️
 
 
32
 
33
+ Erfahren Sie mehr über die verschiedenen Tools und Technologien, die im Webscraping verwendet werden, wie zum Beispiel BeautifulSoup, Scrapy und Selenium.
 
 
 
 
 
34
 
35
+ ### Praktische Übungen ✍️
 
 
36
 
37
+ Setzen Sie Ihr Wissen in die Praxis um! Durch praktische Übungen und Projekte können Sie das Gelernte anwenden und wertvolle Erfahrungen sammeln.
38
 
39
+ ### Weiterführende Themen 🔍
 
 
40
 
41
+ Entdecken Sie weiterführende Themen wie das Scraping von APIs, das Management großer Datenmengen und ethische Überlegungen beim Webscraping.
42
 
43
+ ---
44
 
45
+ Wir hoffen, dass Sie viel Spaß und Erfolg beim Lernen und Anwenden des Webscrapings haben! Wenn Sie Fragen haben oder Unterstützung benötigen, zögern Sie nicht, sich an uns zu wenden.
 
 
 
46
 
47
+ ---
48
 
49
+ Viel Erfolg und willkommen zum Workshop! 🎉
src/quarto-lokal.qmd ADDED
@@ -0,0 +1,79 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: "Quarto lokal"
3
+ ---
4
+
5
+
6
+ ## Quarto lokal starten 🚀
7
+
8
+ Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.
9
+
10
+ ### Schritt 1: Repository klonen 🖥️
11
+
12
+ 1. **Öffne dein Terminal oder die Eingabeaufforderung**: Dies ist notwendig, um die folgenden Befehle einzugeben.
13
+ 2. **Führe den folgenden Befehl aus, um das Repository zu klonen**:
14
+ ```bash
15
+ git clone https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025
16
+ ```
17
+ 📂 Dies erstellt eine lokale Kopie des Repositories auf deinem Computer.
18
+
19
+ ### Schritt 2: In das Repository-Verzeichnis wechseln 📁
20
+
21
+ 1. **Navigiere in das Verzeichnis**, in dem du das Repository geklont hast:
22
+ ```bash
23
+ cd CDL-Webscraping-Workshop-2025
24
+ ```
25
+ 🔄 Jetzt befindest du dich im Verzeichnis des Projekts.
26
+
27
+ ### Schritt 3: Quarto installieren 🛠️
28
+
29
+ #### Installation auf Windows:
30
+
31
+ 1. **Besuche die Quarto-Download-Seite**: Gehe zu [Quarto Download Seite](https://quarto.org/docs/download/index.html) und lade die Installationsdatei herunter.
32
+ 2. **Lade die Installationsdatei herunter**: Wähle die Datei `quarto-1.6.39-win.msi` für Windows und speichere sie auf deinem Computer.
33
+ 3. **Führe die Installationsdatei aus**: Doppelklicke auf die heruntergeladene Datei und folge den Anweisungen des Installationsassistenten.
34
+ 4. **Überprüfe die Installation**: Öffne dein Terminal oder die Eingabeaufforderung und führe den Befehl `quarto --version` aus, um sicherzustellen, dass Quarto korrekt installiert wurde.
35
+
36
+ #### Installation auf Linux:
37
+
38
+ 1. **Lade das Quarto-Tarball herunter**:
39
+ ```bash
40
+ wget https://github.com/quarto-dev/quarto-cli/releases/download/v1.6.39/quarto-1.6.39-linux-arm64.deb
41
+ ```
42
+ 2. **Installiere das Tarball-Paket**:
43
+ ```bash
44
+ sudo dpkg -i quarto-1.6.39-linux-arm64.deb
45
+ ```
46
+ 3. **Löse eventuelle Abhängigkeiten**:
47
+ ```bash
48
+ sudo apt-get install -f
49
+ ```
50
+
51
+ ### Schritt 4: Quarto-Website lokal starten 🌐
52
+
53
+ 1. **Starte den lokalen Server**:
54
+ ```bash
55
+ quarto preview
56
+ ```
57
+
58
+ Du solltest die Quarto-Website jetzt lokal sehen und interagieren können. 🌟
59
+
60
+ ### Schritt 5: Inhalte bearbeiten ✏️
61
+
62
+ 1. **Bearbeite die Inhalte der Website** in den `.qmd` Dateien. Änderungen werden automatisch aktualisiert, wenn der lokale Server läuft.
63
+
64
+ ## Erstellung einer PDF mit Quarto 📄
65
+
66
+ Um mit Quarto PDF-Dateien zu erstellen, kannst du den Befehl `quarto render -to pdf` verwenden. Hier ist eine kurze Anleitung dazu:
67
+
68
+ ### Schritte zur Erstellung einer PDF mit Quarto 📋
69
+
70
+ 1. **Navigiere in dein Projektverzeichnis**:
71
+ Öffne dein Terminal und navigiere in das Verzeichnis, das die Quarto-Datei enthält, die du in eine PDF umwandeln möchtest.
72
+ ```bash
73
+ cd CDL-Webscraping-Workshop-2025
74
+ ```
75
+ 2. **Führe den Quarto-Befehl aus**:
76
+ Verwende den Befehl `quarto render` mit der Option `-to pdf`, um die gewünschte Quarto-Datei in eine PDF zu rendern.
77
+ ```bash
78
+ quarto render dateiname.qmd -to pdf
79
+ ```