Spaces:
Paused
Paused
File size: 1,623 Bytes
b1e3255 b162403 b4015e9 b162403 b4015e9 b1e3255 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 |
import streamlit as st
from datasets import load_dataset
# Funktion zum Laden und Anzeigen von Datasets
def load_and_show_dataset(dataset_name, split="train"):
try:
# Dataset von Hugging Face laden
dataset = load_dataset(dataset_name, split=split)
# Anzahl der Zeilen im Dataset anzeigen
st.write(f"Dataset: {dataset_name} - Split: {split}")
st.write(f"Total rows: {len(dataset)}")
# Die ersten 10 Zeilen des Datasets anzeigen
st.write(dataset[:10])
except Exception as e:
st.error(f"Error loading dataset: {e}")
# Streamlit-Benutzeroberfläche
st.title("Hugging Face Dataset Checker")
st.sidebar.header("Dataset Auswahl")
# Liste der Datasets
dataset_options = [
"TSOWatch/units-name-de",
"TSOWatch/tso-general",
"TSOWatch/tso-skills",
"TSOWatch/tso-units",
"TSOWatch/1001NightsPrincess",
"TSOWatch/1001NightsOilLamp",
"TSOWatch/1001NightsTreasureKnowledge",
"TSOWatch/1001NightsBesiegedCity",
"TSOWatch/1001NightsSeaSnake",
"TSOWatch/1001NightsThirdThief",
"TSOWatch/1001NightsSecondThief",
"TSOWatch/1001NightsFirstThief",
"TSOWatch/1001NightsWoodcutter"
]
# Dropdown für das Dataset auswählen
selected_dataset = st.sidebar.selectbox("Wähle ein Dataset", dataset_options)
# Dropdown für den Split auswählen
split_options = ["train", "test", "validation"]
selected_split = st.sidebar.selectbox("Wähle einen Split", split_options)
# Lade und zeige das ausgewählte Dataset
if st.button("Lade Dataset"):
load_and_show_dataset(selected_dataset, selected_split)
|