Spaces:

yonikremer
/

grouped-sampling-demo

Paused

File size: 1,796 Bytes

826e275
 
7a75a15
 
826e275
 
 
d73a8e9
826e275
6e4f775
7a75a15
826e275
e0bb50d
49efed6
b598d9f
826e275
6e4f775
49efed6
6e4f775
943d773
826e275
 
 
49efed6
826e275
 
49efed6
826e275
 
 
49efed6
0e07a66
49efed6
0e07a66
d73a8e9
826e275
 
 
49efed6
b1dd47e
826e275
 
 
b1dd47e
0499581
 
 
 
 
d73a8e9
 
 
b1dd47e
49efed6
 
9c8dd72

"""
The Streamlit app for the project demo.
In the demo, the user can write a prompt
 and the model will generate a response using the grouped sampling algorithm.
"""

import streamlit as st
from torch.cuda import CudaError

from available_models import AVAILABLE_MODELS
from hanlde_form_submit import on_form_submit


st.title("דגימה בקבוצות - שימוש יעיל במודלי שפה סיבתיים")

with st.form("request_form"):
    selected_model_name: str = st.selectbox(
        label="בחרו מודל",
        options=AVAILABLE_MODELS,
        help="llama-30b-hf generates better texts but is slower",
    )

    output_length: int = st.number_input(
        label="כמות המילים המקסימלית בפלט - בין 1 ל-4096",
        min_value=1,
        max_value=4096,
        value=5,
    )

    submitted_prompt: str = st.text_area(
        label="הקלט לאלוגריתם (באנגלית בלבד)",
        value="Instruction: Answer in yes or no.\n"
              "Question: Is the sky blue?\n"
              "Answer: ",
        max_chars=2048,
    )

    submitted: bool = st.form_submit_button(
        label="צור טקסט",
        disabled=False,
    )

    if submitted:
        try:
            output = on_form_submit(
                selected_model_name,
                output_length,
                submitted_prompt,
            )
        except CudaError as e:
            st.error("Out of memory. Please try a smaller model, shorter prompt, or a smaller output length.")
        except (ValueError, TypeError, RuntimeError) as e:
            st.error(e)
        else:
            st.write(f"Generated text: {output}")


with open("user_instructions_hebrew.md", "r") as fh:
    long_description = fh.read()
st.markdown(long_description)